这本书内容比较浅,基本属于讲故事、走马观花的那种。作者文笔、见识、阅历是很牛,本书没有体现出来。
唯一觉得亮点的地方在于,以前不太知道大数据和人工智能具体关系,这本书简单地讲解了一下。
机器智能,传统上来说是指机器能够像人一样思考,去解决问题,而由于人类解决问题并非是在当下的场景下学会解决当下那个场景的问题,有很多时候是应用了其他方面的知识来解决这个问题,所以在迁移能力这方面,机器要学会“人”的思考很难。那么大数据是怎么与机器智能相联系的呢?另一条发展机器智能的方法,就完全摒弃了“像人思考”这一条路,而是直接对准“解决问题”这一终极目标。比如说翻译,以前的思路是让机器理解各种语法,现在则不需要机器去理解语法,而是直接去“学习”十几万句用语,用量变来抵达质变。也就是说,当见识过越来越多的用语时,翻译的准确性也会不断提高。
标题来自书本序言,出自混沌大学创始人李善友教授之手,在此借用。
总的来讲,本书主要内容是在探讨基于大数据的机器智能是如何发展的、将如何影响人们生活的方方面面以及如何应对。
大数据给世界带来的改变很深刻,最深刻的是思维方式的转变——从因果论的机械思维到相关性的相关性思维。这里转变的不只是解决问题的手段——如今我们有能力在全集上分析问题,也终于有能力在全集的基础上精准刻画群体侧面画像,转变的还有看待问题的`方法——我们不再是“小心假设,大胆求证”,而是“减少假设,数据自明”。这种转变实际上使得机器智能具备了成为公共设施的基础——不必要所有人都懂机器智能是如何工作的,对于使用者来说只需要明白有这样一个工具可以在数据全集上找到恰当的结论即可。因此,这会迅速引起一场商业革命。
实际上,这场革命已经开始:在书本中已经列举了包括酒吧、冰箱制造商在内的传统行业利用大数据的手段改善经营状况。但是,还有更多的行业在探索如何将数据有效整合起来探索新的模式——首先是数据的获取问题,寻找有效的获取数据的方法可能不是一拍脑袋就想得到的;其次,如何从这些数据中发现价值依然需要一个指导方向;最后,如何利用数据发现的规则设计更合理的模式。
书中另外一个精彩内容是最后一章——论述了智能革命带来的正面影响和负面冲击。我认为作者实际上是问了这样一个问题:智能革命大大解放了生产力,大大促进了生产,只需要更少的人就能够养活全世界,那么剩下的人怎么办?作者通过论述第一、二、三次工业革命的历史进程,得出来的结论不容乐观——只有通过时间的作用才能使革命带来的巨大的生产力解放得到释放。我们很不幸地处于这个历史进程,我们也很幸运地处于这个历史进程。
所以整本书,可以说是一本科普的书,读完全书能对当下最时髦的概念——大数据、机器智能、区块链等有进一步的理解,尤其是大数据。但是我觉得更像是一本宣传鼓动的书——因为他描绘了两个世界,一种是参与到革命的进程中,跟上历史的车轮向前,另一种则是抗拒革命,被历史抛弃——这两者之间的差别,不可以云泥计。至于事实上是否真的会有这么严重,这个就仁者见仁了,只不过历史告诉我们,至少前三次是这样的,如果抱有怀疑,最好祈祷太阳底下会有新鲜事。
至于革命已经发生,这是毋庸置疑的。当然,这是读本书之前就已经知道了的。实际上,很多人都已经知道——置身在一个全社会都在讨论大数据的环境下,很难不去想大数据会如何影响世界。本书的效用只是在于让读者知道这个过程是如何的不可抗拒。
人工智能是未来10年可期有大发展的领域,也是我们从事数据行业的职业愿景。看我这本书,更加坚定这是一个可期,有意思的方向。下面是我读这本书的过程中,产生的对于数据分析和应用的一些理解和总结。
基本思路
经典思路:目前在做数据分析时,采用的是传统的逻辑推理的分析的思路。先提出问题,再通过严谨的逻辑推理进行验证,解释商业问题。
新思路:尝试使用相关性进行数据挖掘分析;就是数据挖掘的一些技术,比如聚类、决策树、随机森林等高级统计模型。这种思路做出的东西,一般而言是技术门槛较高、解决经典思路无法解答的问题,也符合当前流行的大数据思维、人工智能思维。新思路的处理问题逻辑,先有相关性分析,找出导致问题的相关性因素,然后再解释背后的商业逻辑。
适用范围
经典思路:符合人脑的思维模式,由A—>B—>C的逻辑顺序。在解决小而美的独立case时,效率高。比如,“为什么今天某个页面的转化率突然升高啦”这类的问题,通过逻辑推理,一步一步下钻,可以很快定位原因。
新思路
这是AlphaGo下围棋是采用的思路,决策next move是因为next move对最终赢得棋局概率最高。这是一种结果导向的思维,将智能问题变成了数据问题。AlphaGo不需要知道如何布局,只关注每一次的落子都在提高最终胜利的概率。这种思路可以解决目标明确且影响因素众多的决策问题。