作品介绍

大数据预测


作者:埃里克西格尔     整理日期:2014-04-15 12:12:04

2020年的一天,在你驱车前往公司的路上,导航系统通过预测交通流量,会自动帮你选择一条最合适的交通路线;车内推荐系统会根据你的饮食习惯预测你可能会喜欢吃什么,并推荐沿途的早餐店;你的电子社交助理已经为你自动选择了你可能感兴趣的社交网信息;当车内系统预测到你驾车有些分心时,座椅会自动震动进行提醒……
  以上这些情景不是科幻大片独有的,它们有的已经或会在未来的某一天成为现实。而这一切所倚靠的就是预测分析技术。
  大数据时代下,作为其核心,预测分析已在商业和社会中得到广泛应用。随着越来越多的数据被记录和整理,未来预测分析必定会成为所有领域的关键技术。
  作为预测分析领域的专家,埃里克西格尔博士深谙预测分析界已经实现和正在发生的事情、面临的问题和将来可能的前景。在《大数据预测》一书中,他结合预测分析的应用实例,对其进行了深入、细致且全面的解读。
  关于预测分析,你想了解的全部,你的生活以及这个世界会因为预测分析改变到什么程度,《大数据预测》都会告诉你。
  作者简介:
  埃里克西格尔博士
  PredictionImpact,Inc.董事长,发起成立世界预测分析大会,并担任主席;《预测分析时报》执行编辑;哥伦比亚大学前计算机科学教授。
  目录:
  序言
前言
导论
第一章升空!预测开始发威
开始实践
人人爱预言,虽然不精确
防护预测
价值100万美元的无声革命
个性化的危险
预测分析程序的安装:迂回和拖延
运行过程中
基本要素是:观察
行动就是决策
危险的启动序 言
  前 言 
  导 论 
  第一章 升空!预测开始发威 
    开始实践
    人人爱预言,虽然不精确
    防护预测
    价值100万美元的无声革命
    个性化的危险
    预测分析程序的安装:迂回和拖延
    运行过程中
    基本要素是:观察
    行动就是决策
    危险的启动
    呼叫休斯敦,我们有麻烦了
    能做到的小模型
    休斯敦,发射
    热情的科学家
    让预测走入内心
  第二章 权力越大,责任越大:惠普、目标超市和警察会窥探你的秘密
    目标超市的预测及其预测目标
    意味深长的停顿
    我的15分钟
    曝光于聚光灯下
    你无法禁锢那些可传送的东西
    法律与秩序:政策、政治和监管
    数据之战
    数据挖掘并不是“攫取”数据
    惠普自我学习
    洞悉员工还是侵犯隐私
    辞职风险:我不干了!
    洞见:辞职背后的因素
    危险品
    领先者不必辞职
    预测犯罪,提前杜绝犯罪
    数据犯罪和犯罪数据
    无法测量的机器风险
    偏见的轮回
    好的预测,坏的预测
    力量源泉
  第三章 数据效应:彩虹之后的饕餮  
    数据情感和情感数据
    预测博客中的情绪
    焦虑指数
    将情绪可视化
    要把钱投到正确的地方
    灵感与汗水
    在数据里寻宝
    一切都数据化
    把所有舱门都封死:信息太多了
    坏的大灰狼
    彩虹之末
    预测之汁
    遥远、奇特和惊人的洞察力
    关系并不意味着因果
    情感的因果关系
    一图胜千言
    验证情感和被验证的情感
    偶遇与创新
    来自博客圈的投资建议
    金钱让世界转动
    将所有内容都放在一起
  第四章 学习的机器:大通银行对房产抵押风险的预测分析  
    男孩与银行的相遇
    银行面临着风险
    预测抵御风险
    风险业务
    学习机器
    创建机器学习
    从负面经验中学习
    机器学习是如何运作的
    你可以决定决策树的规模
    计算机,为自己编程吧
    学吧,宝贝
    越大越好
    过度学习:假设太多
    归纳之谜
    机器学习的艺术和科学
    感觉真实:测试数据
    去粗取精是艺术
    在大通银行应用分类—回归决策树
    摇钱树
    回归——为何显微镜无法观察到宇宙碰撞
    后续
  第五章 集团效应:Netflix、众包以及增压预测
    非正式火箭科学家
    黑马
    思想外包:集思广益
    众包如星火燎原
    生于忧患
    联合国
    元学习
    两个预测模型的组合
    好戏在后头
    集体信息
    群体和模型的智慧
    一袋子模型
    集体智慧开始发威
    泛化悖论:过犹不及
    挑战极限
  第六章 “沃森”和《危险边缘》节目 
    文本分析
    英语的爱恨情仇
    在理解问题之后就要回答
    终极知识源泉
    人工智能悖论
    学习回答问题
    学人走路 学人说话
    更好的捕鼠器
    应答机器
    投机取巧的《危险边缘》
    从证据中寻找答案
    基础知识,亲爱的“沃森”
    证据如山
    用组合模型来判断证据
    组合模型的组合
    机器学习使语言处理成为可能
    自信但不自负
    需要速度
    双面危险——“沃森”会赢吗?
    《危险边缘》的惶恐
    为了胜利
    比赛之后:荣誉、嘉奖和崇拜
    非对称性IBM人工智能
    对的预测
  第七章 用数字说话:挪威电信和美国合众银行工程师 
    如何通过预测来施加影响 
    搅拌吧,用力搅拌
    沉睡的狗
    要预测新的内容
    眼睛看不到
    预测说服
    具有说服性的选择
    商业刺激和商业反馈
    定量人性
    量子人性——他是否可被影响?
    通过上提模型预测影响力
    银行业对影响力的运用
    预测错误之事
    响应上提模型
    上提模型的原理
    上提模型如何发挥作用
    说服效应
    不同行业的影响
    让移动客户不移动
  结语
  未来,大数据会变得越来越重要,其核心应用预测也会成为互联网行业以及产业变革的重要力量,我们很有必要对数据预测及其分析方法进行全面且深入的了解。在这一点上,《大数据预测》是本很好的读物,适合大数据所有相关行业的人阅读。
——360公司董事长周鸿祎
我对不确定性怀有畏惧之心,但科学技术的发展尤其是大数据时代的来临以及数据加工技术的进步,使人类行为可预测成为可能。我想,20年后,我们是不是会利用数据也就是预测的方法,去框定一个人的行为,或者说,我们的世界会因为预测技术改变到什么程度?读完这本《大数据预测》,基本就能找到答案了。
——资深媒体人《罗辑思维》主讲人罗振宇
本书是21世纪生活的使用说明手册。利用大数据进行预测几乎成为所有领域的关键,不管是科技、商业、财经、运动,还是政治。而埃里克西格尔正是我们最理想的向导。
——斯蒂芬贝克,《数字迷宫与终极风险》作者未来,大数据会变得越来越重要,其核心应用预测也会成为互联网行业以及产业变革的重要力量,我们很有必要对数据预测及其分析方法进行全面且深入的了解。在这一点上,《大数据预测》是本很好的读物,适合大数据所有相关行业的人阅读。
  ——360公司董事长 周鸿祎
  我对不确定性怀有畏惧之心,但科学技术的发展尤其是大数据时代的来临以及数据加工技术的进步,使人类行为可预测成为可能。我想,20年后,我们是不是会利用数据也就是预测的方法,去框定一个人的行为,或者说,我们的世界会因为预测技术改变到什么程度?读完这本《大数据预测》,基本就能找到答案了。
  ——资深媒体人《罗辑思维》主讲人罗振宇
  本书是21世纪生活的使用说明手册。利用大数据进行预测几乎成为所有领域的关键,不管是科技、商业、财经、运动,还是政治。而埃里克西格尔正是我们最理想的向导。
  ——斯蒂芬贝克,《数字迷宫与终极风险》作者 
  本书有趣、有益、细腻入微,西格尔进行了深入探究,并让科学变得激动人心。
  ——雷伊德加尼,奥巴马2012年美国大选团队首席数据科学家
  结语
    接下来要发生的事就是未来……预测分析就是商业智能的发展方向。——里克·怀廷《信息周报》
    早上好。今天是2020年1月2日,本年度的第一个工作日。在您驱车前往办公室上班时,预测分析技术除了替您开车之外(在未来也完全有望实现),几乎涵盖了您工作和生活的各个方面。
    1.防盗:当您进入车辆时,预测模型会通过若干生物指标确定您的身份,如果身份不能得到确认,那么你将不能启动汽车引擎。
    2.娱乐:Pandora(潘朵拉)自动为您播放您喜欢的音乐。
    3.交通:导航系统会预测交通流量,然后选择最合适的交通路线,由于新选的路线有不少坡道,而您汽车的电池(唯一汽车动力)稍显不足,因此您无法全力加速。
    4.早餐:车内推荐系统会根据您的膳食习惯预测您想吃什么并推荐沿途的早餐店,既然您信任这套推荐系统,那么其推荐一定合乎您的口味。
    5.社交:您的电子社交助理系统自动选择了您可能最感兴趣的Facebook留言和社交网信息,那些垃圾评论则被精确地排除在外。CareerBuilding(凯业必达)系统则会推荐预测您感兴趣的职位,当您在查询电话留言箱时,系统会自动将广告语音过滤掉,就像现在的电子邮箱过滤掉垃圾邮件那样。
    6.交易:您让手机读出了来自手机运营商的短信,显然您的手机运营商预测您将会改换其他运营商,因为运营商向您推荐了大打折扣的iPhone13。
    7.网络搜索:今天是您同事小孩的生日,因此您让系统推荐沿途的玩具店。现在车内的音响系统也安装了Siri,该系统经过了持续的完善,拥有更加强大的语音识别和人机语音对话功能。
    8.驾车提醒:当系统预测到您驾车时有些分心时,座椅会自动震动,或许您分心是因为看到了窗外特别有吸引力的广告牌。
    9.碰撞避免:如果将要发生碰撞,那么车内系统会给出更大的震动以及警报提示,或许当时是有小孩在横穿马路或有车想要闯红灯。
    10.可靠:您的汽车会自动提醒:“请尽快带我去做保养,因为预计化油器会在未来三周出现故障。”
    预测分析不仅是上班路上不可获取的工具,正因为有了预测分析,您才能坐上自己的汽车。
    购车贷款:银行正确判断您的资信风险较低,所以批准了您的购车贷款,因此您才能买得起这辆车。
    保险:车内的传感器将您的驾车行为信号全部传回了汽车保险公司,然后这些信息会被输入预测模型来确定您的保费。参与此保费调整项目可让您每月节省30美元。
    无线连接:为您的手机和爱车提供无线连接服务的运营商通过预测分析了解需求变化,然后对其网络基础设施进行升级和更新。
    网络安全:您可能无法察觉,但通过预测,您的汽车和手机每天都在避免各种恶意的软件攻击。
    道路安全:大型路面坑洼以及桥梁问题会被提前预知,然后政府会根据预测系统采取强化检查等手段来消除隐患。
    减少不良驾驶:对于那些屡次违规的“马路杀手”而言,会有预测分析模型来确定其驾驶执照应该吊销多长时间。
    您的健康:预测模型会确定最适合您的医疗方案,由此让您以健康的状态开车上路。
  未来就在转瞬之间
    所有上述预测分析应用都已经问世,或至少类似的应用在不断研发中。预测分析技术已经完全成熟,虽然有些不能立刻付诸实施,但其原因在于,现实生活中汽车和手机系统难以对接。Google眼镜等可将移动装置嵌入随身设备的新发明会让预测结果拥有更大的发挥空间,加速数据的生成,推动预测模型的发展。
    如今,预测分析的触角早已伸向社会的各个角落,无论是企业还是政府机构、无论是执法部门还是慈善组织以及医院和高校,这些社会组织都要做出数以百万计的运营决策来实施服务,而预测技术则能引领这些决策。预测技术是用来改善大规模运营效率的通途。
    有若干因素将会推动预测技术的不断发展:爆炸式的数据增长、功能更加强大的计算机、更加广泛深入的理解以及科学的发展。组织与个人之见越来越多的交互行为将受到预测的驱动。
  预测的未来
    当然,这些预测技术的具体细节和时点会有赖于现实的条件;但预测分析技术本身不再是问题。因此,我们大可自信预测,预测将大行其道。几乎每隔几个月,媒体上就会出现关于预测技术大显神威的消息。这样的机遇还将不断涌现,有时甚至会让人目不暇接。不管如何,我们将如何预见未来,未来正等待着我们大展身手。
  





上一本:我们为何不幸福 下一本:台湾这些年所知道的祖国

作家文集

下载说明
大数据预测的作者是埃里克西格尔,全书语言优美,行文流畅,内容丰富生动引人入胜。为表示对作者的支持,建议在阅读电子书的同时,购买纸质书。

更多好书