达观数据王文广:人工智能其实就是「八卦」
1956年,几位计算机科学家在达特茅斯会议(Dartmouth Conferences)上提出了“人工智能”的概念,关于人工智能的研究和应用自此开始慢慢孵化。近几年深度学习的研究和发展把人工智能又推到了前所未有的高度。机器问答、智能客服、合同智能审阅等人工智能产品走近了企业和大众的生活。这些智能水平越来越接近于人的机器、程序和算法,其背后的原理是什么?下文,达观数据副总裁王文广,带你从中国最古老的智慧——《易经》的角度看人工智能的本质。
《诗》,即《诗经》,和《易》,即《易经》可以说是中国文化的两个源头,再加上作为科学的源头的《几何原本》,就像三原色一样衍生出多彩的中国社会。在这个社会里,《易》的影响非常巨大。从春秋时期的诸子百家,到唐宋时期的诗词歌赋,以至于现代的仙侠武侠小说,都可以从《易》中找到各种痕迹。更为广泛的是深入大江南北的风水、算命、求神拜佛、婚配嫁娶、升官发财、建筑结构、家具摆放等等南北风俗,无不可以从《易》中找到些许痕迹。就连中国唯二的TOP1学府也从中找了个句子作为自己的校训。
《易》不仅影响中国,也影响了世界。《易》不仅仅在东亚文化圈里影响巨大,也是当代物理学的基础。众所周知,没有量子力学,就没有信息时代的一切,而量子力学的奠基人之一波尔就是受《易》的阴阳相互对立统一原理的启发,提出了量子力学的基础原理之一『互补原理』。
量子力学的另一个奠基性理论『波粒二象性』也隐隐约约有『阴阳』理论的影子。至于信息时代的基础--电脑,以及当今热火朝天的人工智能,更是《易》这个系统的直接传承。
话说当年莱布尼茨就是看了《易》之后,受到启发,发明了二进制体系,而二进制体系则是我们这年代所离不开的计算机、手机等基础。也就是说,本质上,计算机和手机就是高阶的八卦。
还原一下这里面的逻辑,两仪四象和八卦分别是1位、2位和3位二进制系统,而《易》则是4位二进制系统--它一共有六十四个卦象。
早期计算机是8位二进制系统--大家所熟悉的ASCII是7位(后来扩展为8位)的二进制系统。最为大家所熟悉的Windows XP是运行在32位二进制CPU上的系统,而现在大家所用计算机和手机则大都已经是64位二进制系统了。
到此你可以看出其中是如何一脉相承的了吧?
《易》不仅仅是一个系统,它还是一个生态。从中衍生出的应用纷繁复杂,丝毫不逊于前阵子被吹捧的美国第一个超万亿美元市值的苹果公司(世界第一个超万亿美元市值的是中石油,又一次,美国落后于中国)的iOS生态。
比如八字,算卦,梅花易数,风水,大六壬、奇门遁甲、紫微斗数等等不同门派,它的特点是通过朴素的『统计学』原理,结合『自然语言理解』和『自然语言生成』技术,来实现对未来的预测。后来,这些门派传到西欧和北美,经由同样从《易》衍生出来的计算机一起发展,终究成为了现在的大热门--人工智能。
当年由《易》衍生出来的不同门派,现在则成了不同算法派系,比如决策树,随机森林,支持向量机,逻辑回归,神经网络,深度学习等等。这种延绵数千年的传承关系,充分说明了我们祖先的智慧。
简单举个例子,比如梅花易数,显然是一个表示学习,它将日常见到的各种场景学习成向量(卦名),然后将特征表示通过已经学习出来的八卦六爻五行模型来预测,这便是人称『神算子』的AI模型。
决策树算法模型
作为读者的你看到这里,肯定觉得这是在胡扯,是歪理邪说,赤果果的碰瓷。而我要说的是,这是没有理论自信道路自信制度自信文化自信。不然,看看人家诺贝尔获奖者的『四个自信』。
2011年诺贝尔经济学奖获得者Thomas J. Sargent在前一个多月(大约8月11日)就说:“人工智能首先是一些很华丽的辞藻。人工智能其实就是统计学,只不过用了一个很华丽的辞藻,其实就是统计学。”
他不仅说了,还有好多拥趸。要真这么简单的话,那些统计学家怎么在几十年的时间都没有搞出一堆公式来搞定围棋的解?至于图像处理、语音识别、以及达观数据所擅长的文本智能处理、机器翻译、推荐系统等等,没见有统计学家搞出个公式来求解,也没见有统计学家来证明某种方法能够搞定这些事情?
即使到现在,深度学习这种暗黑系的方法效果已经很好了,也没有统计学家出来证明一下,深度学习为什么有用?更不用说让统计学家来证明或者指导一下,怎样才能更有用。
其实统计学本身的发展,也是在一系列的应用后总结归纳抽象出来的。这个跟几何学或者算数学这种古老的数学发展起来的很不一样。而从另一方面来讲,当下的人工智能是一个综合性的多学科交叉的学科(或者技术)。这里面确实有一部分统计学的理论,但其中更多的还包括诸多其他学科,比如包括芯片、分布式体系和架构、高性能计算、程序设计在内的计算机学科。
如果非要强行说AI是数学,那也不一定轮的上『统计学』,像数值分析,组合数学,计算理论,离散数学,图论,微积分,微分几何等等学科对人工智能的作用都不见得比统计学少。
到这里,大概你也明白了。我们要做的是,鼓起『四个自信』大声说出:(计算机科学和)人工智能其实就是易经里的八卦。只不过用了一个很华丽的辞藻,人工智能其实就是八卦。
最后,欢迎大家和达观数据来一起『八卦』人工智能。
关于作者
王文广:达观数据副总裁,在人工智能领域和系统架构设计有十余年工作经验,浙江大学计算机硕士。早期在百度负责MP3搜索、语音搜索系统和音频指纹系统核心研发。
曾担任金融AI公司Kavout首席架构师,将人工智能和文本挖掘技术应用于金融、证券、量化交易等领域,效果得到美国大型基金公司认可。曾负责盛大创新院搜索、推荐、广告等多个项目的架构设计工作,所参与开发的系统具备海量数据的快速处理和高精度的挖掘能力,多次获得嘉奖。