题图:百度公司董事长兼首席执行官 李彦宏先生
1
AI到了「终于可以用了」的阶段全世界都在为即将到来的人工智能革命感到振奋。这种情绪就仿佛二十多年前我在硅谷亲历互联网大潮初起时所感受到的。
2012年,我注意到深度学习在学术界和应用方面都有了突破。比如,用深度学习的方法来识别图像,突然就比以前的任何算法都有明显提升。
这个时候我马上意识到,新的时代来临了,搜索将被革新。过去我们用文字搜索,现在可以用语音和图像进行搜索。比如我看到一株不认识的植物,拍一张照片上传搜索,就可以立刻识别出来它叫福禄桐。过去用文字搜索是没法描述这样的植物的。不仅是搜索,很多过去不可能的事情现在都可能了。
语音识别能力、图像识别能力、自然语言理解能力,包括为用户画像的能力,这些都是人的最本质的智慧能力。当计算机拥有了人的这些能力时,一场新的革命就会到来。以后速记员和同声传译人员可能会被机器代替,计算机可以做得更好。以后也许不需要司机了,车自己就可以开起来,更安全,更有效率。人工智能对人的这种赋能,超过了以往任何一个时代。
如今,尤其是这两年,人工智能呈现技惊世人的技术,这是机器学习技术的升华版——基于多层计算机芯片神经网络的「深度学习」方法。通过多层芯片联结,模仿人脑大量神经元的网状联结方式,辅以精妙的奖惩算法设计和大数据,可以训练计算机自己从数据中高效地寻找模型和规律,从而开启了一个机器智能的新时代。
科学家们觉得人工智能经过这么多年的发展,到了「终于可以用了」的阶段,而它的实力在我看来,才刚刚开始施展拳脚。
2
在人工智能时代下,你我都需要做出改变
我无意过分夸大人工智能的作用。
从纵向发展来说,业界通常把人工智能分为三个阶段:第一阶段,弱人工智能;第二阶段,强人工智能;第三阶段,超人工智能。实际上,目前所有的人工智能技术,不管多先进,都属于弱人工智能,只能在某一个领域做得跟人差不多,而不能超越人类。
对此,我可能比大多数人都更保守一些。在我看来,人工智能永远不会到那一步,很可能连强人工智能都到不了。未来,机器可以无限接近人的能力,但是永远无法超越人的能力。
跟我不一样,技术界还是很乐观的。
智能领域的权威人士都认为,在不久的未来,智能流会像今天的电流一样平静地环绕、支持着我们,在一切环节提供养料,彻底改变人类经济、政治、社会、生活的形态。
陆奇称智能时代的核心本质是「knowledge in every system, intelligence in every interaction」(知识无处不在,任何交互都是智能的)。未来世界的人们将像穿衣吃饭一样享用着人工智能而无所察觉。
3
跳棋、国际象棋、围棋后,AI还将进击
AlphaGO和深蓝的逻辑并不一样,同样是下棋,但背后的人工智能已经实现再次飞跃。
蒙特卡洛方法就体现了概率学的精妙。假设,在某个棋局局面下,深度学习网络给出了三个候选落子办法A、B、C,以这三个点为根节点,分别往下走子,可以想象成三棵树,每棵树还有无数分支。蒙特卡洛搜索不去穷尽所有分支(穷尽所有是深蓝的做法),而是派出300万只蚂蚁分别从A、B、C出发,每个点100万只,飞速向树梢爬(也就是往下黑白棋交替走子直到决出胜负,基本上走200步就会分出胜负),总有部分蚂蚁走到最高点(也就是决出胜负,假设蚂蚁走到终点的情况代表黑子胜,没走到终点的情况代表白子胜)。
除了下棋,人工智能还进击了金融、翻译、资讯分发领域。
金融信息可能是最复杂、最枯燥的信息,一份股转书有两百多页,还有大量的年报、半年报、研究报告、公告、反馈意见、尽职调查结果……我们不知道,有多少行业分析师是完全看完这些信息,再做出决策的。也许,不是他们不够勤勉,而是读完这些信息已经非人力所及。
而机器可以瞬间完成上市公司的公告、财务报表、官方发布、社交平台、证券行情、实时新闻、行业分析报告等海量异构数据的阅读,对于文本中的图片和表格需要OCR(光学字符识别)等技术解析。紧接着,进行关键实体信息的提取,发现埋藏在实体信息之间,如行业上下游关系、供应链关系、股权变更历史、定增与重大资产重组的关系、多张财务报表之间的数据交叉验证等数据关系,形成并呈现这些复杂关系的「知识图谱」。
技术是神奇的。以资讯分发当中的贝叶斯方法为例,可以构建一个用概率来描述的人格特征模型。比如男性读者模型的特征之一是在阅读新闻时点击军事新闻的概率是40%,而女性读者模型是4%。一旦一个读者点击了军事新闻,根据贝叶斯公式就可以逆推这个读者的性别概率,加上这个读者的其他行为数据,综合计算,就能比较准确地判断读者的性别以及其他特征。这就是数学的「神奇」。当然,计算机神经网络使用的数学方法远不止这些。
人类的行为一旦被互联网以数据的形式记录下来,就成为滋养人工智能在各行各业齐头并进,进而帮助人类自己的无穷无尽的燃料。机器翻译、语音识别、图像识别都是基于互联网提供的大量数据,用户点击行为也是如此。为什么百度搜索引擎的准确性是国内其他搜索引擎难以比拟的?因为数据量最大、算法最先进、积累最雄厚。用户的每一次点击其实都在训练搜索引擎背后的百度大脑,告诉它哪一条资讯才是用户最想要的。
4
大数据之「大」,让不可能成为可能
既然人类运用数据已久,而且自工业革命以来,数据经历过一次又一次的爆发,何以近年来才出现「大数据」的概念?仅仅是它所能记录和计算的数据量更多而已吗?自然数可以无限数下去,1、2、3、4,以至于无穷,但「多」是不够的,还必须具有几大特征:
第一,大数据的「大」。毋庸置疑,这个「大」相对于人类传统数据的储存方式,不是一个量级上的大小之分,而是几何量级的差距。想想百度地图上每日720亿次的定位请求,再想想互联网上每天有多少次点击、社交媒体上每天有多少文字和图片发出……各种大数据平台一天之内收集到的数据量就可以超越人类几千年来文字、图像的总和。
第二,大数据的另一个重要特点是多维度。多维度代表着大数据可以对一个事物进行多方位的描述,从而更准确。
在电影《谍影重重》里出现过一个大数据公司,能够根据互联网数据、交通数据、历史档案等各种维度的数据帮助美国中央情报局(CIA)迅速追踪和定位疑犯。现实中美国的Plantir数据公司便是如此帮助美国政府追踪本·拉登,提供反恐信息和社会危机预警。
第三,处理非结构化数据的能力。结构化数据中最基本的数字、符号等,可以用固定的字段、长短和逻辑结构保存在数据库中,并用数据表的形式向人类展现(想一下常见的Excel表格),处理非常方便。但是互联网时代产生了大量非结构化数据,对于图片、视频、音频等内容,它们的数据量巨大却没有清晰的结构。对于图像的数据,我们只能理解为一个二维矩阵上的无数像素点。非结构化数据增长量很快,据推测将占未来10年新生数据总量的90%。而大数据技术可以通过图像识别、语音识别、自然语言分析等技术计算、分析大量非结构化数据,大大提升了数据维度。
第四,大数据是生生不息的「流」,具有时间性。它过去就不再回来,就像人无法两次踏入同一条河流。这一方面是因为数据量太巨大,无法全部存储;另一方面是大数据和人类生生不息的行动相关,瞬息万变。百度大数据实验室因此提出一个概念叫作「时空大数据」。
地图就是时空大数据之母。百度地图有一个路段拥堵预警功能。如果前方路段畅通会显示为绿色;如果拥堵则会显示成红色,提醒用户选择其他路线。这是我们与数据互动的一个简明例子。如果我们有A和B两条路线可以选择,此时A路线拥堵而B路线畅通,那么我们都会选择B路线;当越来越多的车主选择B路线,那么B路线将会变成拥堵而A路线又会畅通。
最后一点,也是最重要的,大数据的「大」表现为无尽的重复。对于语音识别来说,正因为人们重复讲述同样的语句,机器通过反复识别这些人类语音的细微差别,才能全面掌握人类语音。也正因为人们周而复始的运动,才让系统能捕捉城市运动的规律。「重复」的数学意义是「穷举」。以往人类无法通过穷举法来把握一个事情的规律,只能采用「取样」来估计,或者通过观察用简单明了的函数来代表事物规律,但大数据让穷举法这种「笨办法」变得可能了。
5
中国在人工智能领域存在强烈的内在驱动
显然,在多元化的网络世界里,没有任何一个国家、机构能「独当一面」。只有不同文化、经济、政治背景的基因进行竞争,才能对网民的需求做出全面恰当的回应。
从国情来看,中国发展人工智能较欧美国家有着更强烈的内在驱动,这种驱动来自民间。百度搜索统计显示,有关「服务」的搜索请求数量始终在迅速增长:2014年比2013年增长了133%。2016年在基数更大的情况下,仍有153%的增长。
在移动互联网领域的应用上,中国比美国更普及。中国网民早已习惯于诉诸互联网寻求服务。如今中国每100张电影票中就有55张是通过网络下单预订的。与之对应的是,互联网服务在美国电影行业的渗透率只有20%,也就是说100张电影票中只有20张是网上订票。比如,中国餐饮行业的互联网渗透率是2%时,美国只有1%。
中国之大,之特殊,要高效实现中国网民的服务需求,人工智能创新就是一条必由之路。
驱动的另一个源头则是产业焦虑。中国制造业成本上升很快。放眼全球,工业越来越自动化和智能化,高端制造业可能会回到欧美,而低端制造业已开始流向越南等国。如果不在短时间内完成产业转型,中国制造业将面临「空心化」的困境:高端制造业、低端制造业都将流出中国——这个转型,能不依赖人工智能这一环吗?
尽管局势紧迫,但中国的实力值得看好。中国企业的执行力、中国政府的支持力度都是新兴产业的强力后援。
如果说网民的需求是「天时」,企业与政府的合作是「人和」,数据则是中国大脑发展必不可少的「地利」。在这一领域,中国更是得天独厚。
庞大的人口规模、复杂的社会环境和面向不同应用场景的互联网企业,汇合收集这个数据全集意义非凡。可以预见,不久的未来除了个人数据,依托于公共环境或者政府背景而产生和积累的数据,如汽车注册信息、学籍学历、犯罪记录等,将以加密的方式形成个人基础电子档案。企业与市场通过服务输出获取的数据,如信用卡账单、消费记录、网站浏览偏好、惯用手机品牌等,则将以用户授权的方式再次转化为服务回馈给使用者。
这里的「使用者」,不是会编码、能建模的「码农」博士,而是普通的公众群体。让更多的人也能便捷地使用智能设备才是真正意义上的科技福利。