本节书摘来异步社区《驾驭大数据》一书中的第3章,第3.10节,作者: 【美】Bill Franks 译者: 黄海 , 车皓阳 , 王悦 , 等 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。
3.10 本章小结
驾驭大数据
以下是本章的主要内容。
- 虽然各行各业都有广泛的大数据源,但它们仍有一些共同的主题。虽然目的不同,但各行各业都使用了相同的底层技术,如RFID。
- 许多大数据源都有隐私问题,我们一定要始终慎重对待这个问题。
- 车载信息服务数据可以针对汽车保险政策提供更好的定价策略。但是,我们收集的车载数据也有可能会使交通管理和道路规划发生革命性的改变。
- 文本数据是最大的,也是应用最广泛的一类大数据源。一般来说,我们关心的是如何从文本中提取到重要的事实,然后如何使用这些事实作为其他分析流程的输入。
- 时间和位置数据的影响力越来越大。为了在某个时间和地点给客户提供针对性的信息,公司必须要利用更复杂的信息。
- 在零售业和制造业,RFID数据开始支持新的分析应用,从库存分析到欺诈分析,再到员工绩效分析。
- 智能电网不但能使电力公司更好地管理电网,而且消费者也可以更好地控制自己的用电量。
- 使用RFID标签跟踪筹码可以帮助赌场更准确地跟踪玩家的活动,同时降低付款错误和作弊的次数。
- 传感器数据可以提供关于发动机和设备性能的有力信息,还能用来更方便地诊断问题,更快地开发解决问题的程序。
- 视频游戏制造商可以使用遥测数据更好地定位微交易,改善游戏流程,通过游戏风格对玩家进行分群。
社交网络数据滋生出很多种新的客户评价方法。在电信业,社交网络分析已经把焦点从账户盈利分析转向了社交网络盈利分析。