古之立大事者,不惟有超世之才,亦必有坚忍不拔之志。

 分类:大数据与AI

数据挖掘之特征工程

数据挖掘之特征工程
转自《特征工程以及特征工程的方法》 什么是特征工程 有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。通过总结...

3天前 8℃ 0评论 0喜欢

流计算框架 Flink 与 Storm 的性能对比

流计算框架 Flink 与 Storm 的性能对比
转自美团技术团队流计算框架 Flink 与 Storm 的性能对比 1. 背景 Apache Flink 和 Apache Storm 是当前业界广泛使用的两个分布式实时计算框架。其中 Apache Storm(以下简称“Storm”)在美团点评实时计算业...

3天前 7℃ 0评论 0喜欢

转·百度智能磁盘故障预测

转·百度智能磁盘故障预测
磁盘故障预测是业界可谓是经久不衰的热门话题,其实除了百度、国内的腾讯、阿里、奇虎360、国外的IBM都做过磁盘故障预测的研究。 百度于2014年与南开大学联合发布了一篇论文《Proactive Drive Failure Prediction for Large Scal...

6天前 14℃ 0评论 0喜欢

认识任务调度系统和工作流框架

认识任务调度系统和工作流框架
在大型系统中,任务调度是一项基础性的需求。对于一些需要重复、定时执行或者耗时比较长的任务经常会被剥离出来单独处理,而随着任务规模与复杂性的上升,任务调度系统也就随需而生。设计良好的任务调度系统具备可靠性及伸缩性,它可以管理并监控任务的执行流程,以保证任务的正确执行。当前,分布式...

11个月前 (05-06) 1113℃ 1评论 1喜欢