张亚勤是1998年决定回国的,距今已过20年。这20年中,技术变革天翻地覆,中国发展也日新月异。他见证了互联网在中国的从弱到强,也看到了中国AI正在生发出的全球影响力。但张亚勤坦言,这一切都是10年、20年前难以预料的,最近这一年来,新技术、新趋势和新变革令他着迷,也令他兴奋不已,他甚至最近都在“闭关”读论文,以求第一时间了解最新的技术进展。
他如何看待当前趋势?又有哪些思考、提醒和最新判断?在与量子位的独家对话中,这位百度总裁分享了他最新的所见、所闻和所感。
“得开发者得天下”可能将是下一个时代的公链
得开发者得天下可能将是下一个时代的公链币圈老韭菜讲述触电比特币的故事,会从买显卡研究挖矿开始;17年之后的新流量谈起入坑EOS或是其它一些市值颇高的公链,是从抢到份额万事足开始。这几天,EOS被360吹起的风再次送上币圈舆论浪尖。一会被曝史诗级漏洞;一会BM连番澄清,一会币圈大佬声讨;一会节点内部分歧。自诞生...终极算法赖于类脑突破
我最近两个月把自己的社交网络都停了,朋友圈关了、微博也不看了,现在每天晚上有时间就看论文,比如算法相关的、量子计算等,读书、看论文,发现认知又有提升。
我也在建议我小孩,可以试着把社交网络暂停3个月,然后多读读论文和书,会有增益而不是损失。
当前蓬勃发展的新技术让我兴奋,十年前决计想不到会有今天这样的爆发。
AI的再次火热因深度学习而起,但从算法复杂度、逻辑和计算机科学的角度,深度学习其实并不复杂,终极算法是什么?一切还只是小荷才露尖尖角。
我正在读的一本书,来自多明戈斯(Pedro Domingos)——《终极算法》,其中介绍了5个人工智能学派:符号学派、进化学派、联结学派、统计学派和类脑学派,他认为决定未来走向的终极算法,可能就在这5大学派中。
张亚勤:终日“闭关”读论文,思考终极算法
目前,占主流的是联结学派,通过大量数据做深度学习,建多层网络,就已经展现出了巨大的影响力。
但其实它对人的大脑基本不懂,只是用可监督学习,有输入、输出,然后就靠调参数,用反向传播来优化,优化好之后模拟一个大函数,进而来了新数据之后做新预测——并没有真正用到了人脑学习原理。
联结学派的深度学习模式,在数据量很大、数据有规则、模型有相对规律的情况下,这一套能运行得很漂亮,所以在围棋、语音和翻译等领域,都取得了大突破。
然而它跟人脑学习一比,差距就显而易见。比如小孩学习新事物,并没有那么多数据,小孩学习也不靠语音交互,基本都是看了就记住了,并且马上就能判断及决策。这都是当前AI和深度学习不能相提并论的。
而且当前这种主流算法消耗的计算资源和能量也很高,深度学习依赖海量数据,需要很强的计算资源,有点像大力士,孔武有力,但无法四两拨千斤,不够聪明。
那如果参照大脑,走类脑科学的模式,不仅可以低功耗,而且能有更多决策、记忆系统和突触结构。我们大脑有1000亿神经元,中间通过突触连接,突触本身还能存储信息、参与计算,实现决策,整体结构之精妙复杂,令人惊叹,而且功耗还非常低,运算速度很快,如果我们真能在类脑结构方面实现突破,将大大改变现有的冯·诺依曼架构。
可以看到的是,当前AI芯片层出不穷,都希望在类脑计算方面取得突破,可以学习大脑、学习交互、学习人脑学习系统,然后用低功耗、高效率、有意识的模式进行发展。所以越思考、越往后看,就越能感受到目前深度学习在理论上的大缺陷。
比较起来,我很关注类脑理论,AI要发展得更好,就必须要了解人是怎么学习的,刚才谈到人类小孩的学习能力,如果原理上能让机器学会,都会带来新的跃迁和突破。
于是计算机和生物学跨界交叉研究也越来越受到关注。一方面是从生物学的角度给计算机带来启发,另一方面则是计算机赋能生物研究。之前大脑emotion相关的病症,比如癫痫、老年痴呆、小儿自闭症等可能都是大脑信息传递流程中出现了问题。
拿癫痫来说,病理是神经元一直很活跃,电流就很容易激活,然后毫无征兆就能把人搞晕。那是不是可以通过调节synapse(突触)来降低其活跃度,技能治疗癫痫?此前生物学上难以解决,但现在计算机可以模拟神经元了,能够运用算法可以建立模拟模型,等到进一步知晓如何模拟连接,或许就能治愈癫痫。
我始终觉得,类脑算法中除了研究人脑工作原理——有记忆能力、低功耗,可以做决定,也有待于突触研究的突破,这些连接神经元的部分本身就能存储、计算信息,是一个复杂但令人称奇的系统,这个领域一旦有新突破,或许就能弥补深度学习的不足,进而推动AI实现新的跃迁。
量子计算加速AI 5G带来基础设施大变革
终极算法之外,量子计算的发展也让我兴奋不已。百度前段时间已经成立了量子计算研究所,接下来还有多位世界级科学家加盟。
怎么看量子计算呢?我们从两方面思考。一方面是硬件,另一方面是软件。
硬件方面有量子计算机——有超导方式、半导体方式、光子方式等,我不知道最终哪一个会胜出,但百度会在硬件方面保持合作心态。
我们会更看重软件生态的部分,从三个A的角度看待,也将是百度布局的重点:一个是Algorithms算法,一个是Architecture架构,一个是Application应用,这三个缺一不可,不过算法和架构,我认为还会沿着AI的方式继续向前。
但量子计算带来的变化,将是颠覆性的。这不需要十年二十年,很可能五年左右就会发生。如今机器学习所需要的几个部分,比如大量优化算法、现行方程式、大矩阵计算,以及其中的多项式、大函数,都是量子计算所擅长的,量子计算可以把整个复杂度降低,我们称之为指数型加速。
同样能够带来基础设施革新的是5G。跟2G、3G、4G一样,这又将是一次带宽和信息传输的大革新,会推动AI相关应用更快发展,比如自动驾驶、智能制造和智能家居,其中都有高流量、逼真、交互等相关需求,5G会带来更大带宽,流量也会进一步便宜,新的基础设施+新的技术趋势,就会推动整个产业有大变革,所以这次5G会和AI密切相关。
AI很重要的一部分是万物有灵,5G会让IoT变得更加可能,计算在边缘终端就能实时完成,加之网络虚拟化可以跟现在互联网IP无缝衔接,技术的融合会带来更大的想象。
但越是一片欣欣向荣,越有一些隐患就要留心注意。
警惕AI寒冬 我认为可能有2点需要注意。
第一,要有更长远的心态,其实目前AI在产业有一些泡沫,大家追求短平快,真正研究类脑科学,做算法、深层研究的人还是少,包括量子计算、AI基础算法的人还是少一些,这东西可能要几年后才能出成果,需要一些在安安静静的、长远的心态去进行。
第二,不要犯“短期内高估、长期内低估”的错误,每一个新技术带来,大家往往短期内看得很高,长期又低估了影响,所以我现在很害怕出现所谓的“第三次AI冬天”,因为产业很热,创投很热,可能就会有一些公司亏钱甚至消失,AI不会像很多人预想的那样短期内马上就颠覆所有行业,所以这个时候更需要有耐心,因为这会是一个长期投入的过程,AI对整个社会的影响会是春风化雨的。
或许可以拿千禧年前后的互联网泡沫举例,那时泡沫刚刚破裂,很多人不再相信互联网的价值,但后来事实证明,真正有能力的互联网企业,都是在那个时候成长壮大的,而且我也觉得,现在整个中国科技发展很健康。
而且AI商业化也正在各行各业展开,我可以分享下百度的思路。
AI商业化
百度AI商业化战略也非常清楚。一是通过AI提升现有业务,搜索和信息流,这是双引擎。另外就是进入新的领域,一个是家,一个是车。
AI+云计算方面,关键在于如何到垂直行业中去,比如说金融、医疗、教育、物联网、媒体,就是所谓的落地。
我们现在在几个行业里做得都不错,一个是金融,银联商务、广发银行、浦发银行、百信银行、百度金融的业务落地也相当快。这里面主要依靠的是大数据,数据建立一些风控的模型,建立反欺诈的模型,包括对人的行为的分析。
另外在多媒体方面,包括视频的编码、转码、视频播放,比如像直播、长视频、短视频怎么样去切割视频,我们探索的是怎样对视频内容进行更好的管理。百度信息流里有很多视频,还有爱奇艺,本身就有这个需求。
此外还有物联网相关的落地,包括智慧城市大生态。目前的合作主要是在平台和技术,同时我们会继续寻找每一个场景落地的合作伙伴,最终共同把这个行业打造成一个大生态。我们现在有四、五个行业靠云去实现AI商业化落地。
OMT:区快链技术漂亮,但应用需要观望
也有人问我关于区快链的事情,我觉得技术本身很漂亮,都是经典的分布式计算技术,但具体经营和应用模式,目前还不算明朗,现在只有加密货币是主要应用,但货币的意义很不简单,稍有不慎就会出现别的问题。
所以我想区快链的经营和应用,可能还需要一点时间,我对区快链持开放态度,但在没有想清楚应用场景之前,不希望作过多评论。当然,我认为区快链确实是一个创新,技术很漂亮,产业也需要大家去尝试,只是切忌在没有想清楚之前就大面积炒作,这一点跟AI、机器学习还不同,后者早已在好几个领域开始发挥价值了。