了解详细

工业软件大咖说|谭培波:工业技术软件化的语言底色


作者:谭培波

北京智通云联科技有限公司首席科学家


无论是工业软件还是工业技术软件化这个术语给人比较遥远和陌生的感觉,虽然工业技术是国之重器,工业软件也成为“新五基”之一,但是并不符合当下叙事的主流语境。



1

当代哲学语言转向决定了工业技术也要以语言为底色


19世纪与20世纪之交出现的哲学研究“语言转向(Linguistic turn)”不仅对20世纪人文社会科学研究产生了深刻影响,而且也对自然科学研究产生了深刻的影响。这一改变将哲学研究的关注重点转到语言上,哲学研究要从语言研究开始,强调以语言为对象的科学研究过程,而研究得出的结果、某种理论或体系往往就是某种语言学或者某种知识体系。

哲学、科学技术哲学、学科之间是一个递次包含关系,在哲学的语言转向之前,学科研究的都是现实世界,但是转向之后,语言成为每个具体学科的研究对象。科学技术哲学包含计算机哲学、人工智能哲学、系统哲学等,按照继承关系,语言是AI的研究对象,AI主要研究的是跟人有关的语言、声音和图像语言背后的意义。

具体到每个学科实践,比如勘探开发,在语言转向之前主要研究的是现实世界的油气规律,一般用数学表达式、数学方程等方法实现。在语言转向之后,非结构化的自然语言文本、信号描述的声音等,和传统理论研究的数学表现手段一样,也成为每个学科的研究对象和表现手段。把语言当作学科的研究对象,这是以自然语言为基础的知识加工的哲学基础。

随着手机的普及,当代社会是一个语言及其丰富的社会,除了各种文字的自媒体之外,各种视频、语音阅读之类的语言信息也大量涌现,极大地丰富了人们的生活,也必将推动人们思维模式的改变。

学习和借鉴一定是中国工业化的必经之路,40年的工业化主要是物质层面的工业化,也就是本体层面的工业化,未来要以语言为对象实现工业化。工业化的思想和手段主要是西方的文明结晶,我们要工业化首先就得向西方学习,物质层面学习一个阶段之后,将要进入一个语言层面的学习。最近出现的国外顶级大师被请进中国的公司或者大学讲堂的现象,就是语言学转向在中国的一个自然体现。

西方在发展工业技术的时候大家都姓工,没有互、物、智等别的姓,西方工业技术的发展所走的道路还是调动社会的积极性,通过技术来改变人们的生活,比如飞机、火车、手机等,甚至原子理论的发展也依靠每人都以能谈论相对论为荣。反过来,人们生活的改善又为技术的发展提供了资金市场和效果测试数据。这是一个完整的生产力对生产关系起决定作用,反过来生产关系又影响了生产力发展的循环关系。

所以西方在发展工业技术的时候其底色就是物质的、本体的,但是我们现在要发展工业技术的时候,社会的底色是“声色”的、语言的,这一点我们看看人们的生活有多少时间在手机上就知道。因为工业技术的发展也是靠现在这些刷视频的人,他们要么是在声色中创造着工业技术,要么是在声色中应用着工业技术,总之,都是中国特色工业技术的贡献者。

中国要发展工业技术与西方发展工业技术有一个时代的滞后,这个短板和差距一定要弥补,但是弥补的方式不是回到过去而是面向未来;社会的发展也是金字塔式的,在智能社会发展工业技术,也应该是以智能的方式而不是以工业时代的方式。也就是说,工业技术是西方文明的结果,是西方人选择出来的世界观的体现,这意味着我们要发展工业技术首先要拥有西方的文化基因,要像西方人一样的看待世界,比如在科学中追求二元世界而不是多元世界,追求绝对的评价、测试标准;而超越西方的工业技术则要靠中国的古老的包容的多元世界观,构建技术的人类命运共同体。所以,在工业技术发展的道路上,我们应选择中学为体西学也为体,最终使中国特色的工业技术具有两种文化的混合色或者全息色,比如在中国的太空舱中所有的界面都是中文界面的,而所有的内核绝对是英文的,这就是一次看似表面实际非常深刻的中西文化的结合。

2

工业技术软件化的必由之路是知识工程


就跟抄板一样,物质的东西都可以先固化再优化最后内化,这是一个完整的借鉴学习的技术路线。软件写在芯片上、保存在硬盘上,本质上也是物质的,因此也是可以学习得到的。

但是正如制造业大国很难成为制造业强国一样,真正的技术是买不来的,那要怎样才能得来?学习来、培养来。现在很多人工智能项目很难开展下去,其原因就是买卖的思想,而不是智能的思想,智能的思想是生态,是大家一起创造一个产品。因为智能是随着人走的,只有人的参与才能使得产品更有智慧,所谓的智慧是具体使用人的智慧,而不是仅仅是一种大众的智慧。这就是矛盾的普遍性和特殊性的关系,对于使用者所需要的都是特殊性,普遍性是不能满足现实使用需要的。

要拥有工业技术我们得要像西方人那样思维,那么西方人是如何思维的?承载西方人思维就是西方的文献,承载中国思维的就是中国的文献。因此,对于文献的研究,并从中挖掘出西方的思维模式,这就是中国特色工业技术发展的必由之路,换句话说,知识工程是中国工业技术发展的必由之路。

3

知识工程可理解为通过语言素材去逆向挖掘人的思维模式的过程


模式是从生产和生活经过抽象提炼出来的核心知识体系,是解决某一类问题的方法论。模式是从不断重复事件中发现和抽象的规律,是解决问题形成的高度归纳总结,是把解决问题的方法归纳总结到理论高度的结果,只要有重复出现的事物,就可能存在某种模式。

第谷的天文记录,先是开普勒用来发现了开普勒三定律,这组定律也是一种模式,不过由于定律由相互联系的三个组成,数量太多不能被人们很好的理解和使用。牛顿将开普勒等前人的数据和模式最终总结、归纳、提升为万有引力定律,其中的万有引力假设是科学技术哲学,而这个表达式是表达天文学科对象的模式,如图1所示。

1 表达式是数字背后的模式

模式是对重复事物的结构分析,因此所有统计分析都是寻找重复模式的过程。深度学习是一种统计分析,也是寻找模式的一种过程。统计分析和深度分析的区别在于可解释性,统计分析的模型一般基于现实世界中明确物理意义,但是深度学习由于是对人大脑抽象思维过程的模仿,因此现实意义难以解读,这使得深度学习成为黑盒子,但是无论多么复杂的深度模型,本质上还是一种模式,一种规律的表达式。

明确了模式的意义之后,我们再来理解知识的含义。知识最早的定义是common-justified-belief,也就是一种不断被验证正确的东西,以致人们将之视为一种信仰,并且忽略背后人们还没有弄清楚的内容,比如人们还没有弄清楚重力的超距作用机理,人们就相信万有引力是真实存在的。这种不断验证正确从而变成信仰的东西,在现实中就是模式。比如,人能够区分人和动物,因为人有一种不断重复的模式,从外形、语言、行为等都大体相同,因此人是一个common-justified-belief。

自然语言也以一种模式的形式存在,如下图2所示,自然语言跟身体语言一样,也是一种模式,是一种基因组,这是乔姆斯基最伟大的发现。比如语义就是一种框架也就是一种模式,y=f(x)和 出差(时间、目的地、任务)这个语义定义讲的都是模式。

2 语义即模式

由此可见,对于自然语言加工,其主要的内容就是发现语言中的模式,这个模式源自人类最底层的基因,同时又代表人对大自然的本性的认识。

知识工程本质上是通过工程的方式方法构造一个软件平台以实现对具体知识的挖掘,承载具体知识的主要是各种文本文件。一个软件只要带有工程二字,多具有反向工程的意指,也就是通过现有的数据求背后的假设,通过行为探知世界观。比如AutoCad是正向工程,根据3个参数画出一个标准的圆,但是一个图纸的知识工程则意味着根据已有的图纸资料,反向确定纸面上看到的圆是不是真的圆。知识工程可以根据已有的文本去探求作者背后的基本假设,具体表现为思维模式的差别。NLP中的语义分析、语用分析,本质上都是根据已经知道的句子去反求作者背后的思维模式分析,或者反过来,假定了思维模式,通过已有的句子去验证这个模式存在的概率大小,根据假设检验的原理,剔除那些小概率事件的模式,剩下的就是这个作者的思维模式,或者思维定式。当文献量足够大时就可以通过文本归纳出整个群体的思维模式。

人们认识世界都是一个大场景,远远超过了一个句子所能表达的范畴。因此,人们表达一个大的认识场景的方法是句子之间的连接关系,这就是连接主义的出发点,也是我们习惯于用目录篇章结构来表达知识的自然选择。当我们在讲知识的时候,背后都隐含着一个由很多句子关联在一起的篇章框架的背景,就像我们在讲牛顿万有引力的时候,也有一个无数先辈努力积累的数据记录这个背景。

把知识工程理解为通过语言素材去逆向挖掘人的思维模式的过程,这就是一个学习思想的过程,这就是超越了看得见摸得着的物质模仿学习阶段,而进入语言思维层面的学习阶段。我们挖掘思维模式的目的,最终还是改造我们自己的思维模式,这就是通过刻意地打破语言惯性,学习新的语言模式,从而建立起与这种语言模式相对应的神经肌肉系统,刻意地建立与这种思维相对应的潜意识,通过长久的自然选择,使我们建立起工业技术所需要的思维模式。这是一场全民的思维变革运动,只有全民的参与与实践,才能使整个民族拥有工业思维模式。

所以,工业技术软件化要先从改变语习惯、学习使用新术语、应用新模式开始。

4

最宝贵的工业技术是专家对专业软件的操作序列


工业技术软件化一般不是从零开始的,而是先有了一个基础的软件工具,这个工具是之前工业化的成果。工业软件得出的结果跟使用者有很大关系,比如石油测井解释软件,这是典型的工业软件,只有专家才能用得好,而一般的新手需要至少10年的学习才能掌握。真正的工业知识掌握在少数专家手里,这是一个普遍的现象。

知识开始只有少数人才具有,通过传播、实践,最终成为大多数人都懂的知识,又叫常识,常识能提升人类整体的生活品质却不能提升工业的品质。少数人才有的东西是个小样本事件,这就意味着知识挖掘很难用数学建模的方法,因为数学建模都是通过大数定律、通过平均值计算得来的。无论是万有引力还是相对论的知识,最开始都只存在于牛顿和爱因斯坦的脑袋当中,是个最小的概率事件,对他们知识的挖掘没有数学模型可以建立;只有当他们头脑中的小样本知识经过传播成为大众的信仰,才能成为我们现在似乎人人都懂的常识,由此人类生活在了一个更有知识的阶段。

仔细观察专家使用软件的过程,他的每次点击形成序列也是一个时间单序列,跟句子是一样的,这些点击序列就是实体序列,这正是自然语言挖掘的模式。因此,仔细跟踪和记录专家的操作序列,同时记录专家的语言,通过文本语言和操作语言2个序列的组合,就能用语言的方法获得专家的知识素材,而通过对这些素材的挖掘,能过获得专家背后的思维模式,然后通过软件平台使得专家知识得到普及,从而提升整个团队、公司、软件的工业技术水平,这是我们工业技术软件化的一个重要方向,也是知识工程的现场落地的方法。

总之,当我们在讨论工业技术和工业技术软件化的时候,我们认为需要考虑技术的语言底色,而不是仅仅局限于工业或者工业品本身。




作者简介

谭培波,高级工程师,国际TRIZ认证三级专家,6sigma(六西格玛)黑带大师,并担任国家创新方法研究会企业分会理事。具有10年卫星通讯系统研发经验,参与多个卫星型号研发,获得3项部级科技进步奖;10年移动通讯系统研发经验,并推进中兴集团6sigma工作,申请3项相关突破性改进专利。十余年知识工程、人工智能技术研究经验,并在航空、石化、电力、乳品等行业实现工程化应用,申请相关发明专利十余项。



相关链接

1、工业软件大咖说第一期|求索:中国工业软件产业发展之策
2、工业软件大咖说第二期|朱位秋:发展工业软件,助力制造业转型升级
3、工业软件大咖说第三期|宁振波:工业技术软件化名词溯源
4、工业软件大咖说第四期|郭朝晖:工业知识与工业APP
5、工业软件大咖说第五期|田锋:中国工业软件的守望者
6、工业软件大咖说第六期|叶军:打造工业软件领域的移动化、数字化协同平台,探索制造业产业链强链新模式
7、工业软件大咖说第七期|字应坤:长期视角下的工业软件投资
8、工业软件大咖说第八期|陈志杨:国产工业软件的“困”与“难”
9、工业软件大咖说第九期|梅敬成:自主可控、技术创新——国产三维CAD必走的突围之路
10、工业软件大咖说第十期|朱铎先、赵敏:工业软件重新定义微笑曲线
即刻关注中国工业技术软件化产业联盟微信公众号,获取更多资讯!
2022年1月7日 15:57
收藏

行业动态

NEWS & EVENTS