2021年1月22日,中国工业技术软件化产业联盟知识工程专业委员会成立会暨知识工程论坛在北京智通云联科技有限公司成功召开。九家发起单位、多家会员单位以及线上、线下共计超过200人参会。
作为知识工程专委会专家,走向智能研究院执行院长赵敏为知识工程论坛作了题为《工业技术软件化视角下的知识工程》专题讲演。
以下是根据录屏视频整理的讲演全文。附PPT讲稿及录屏视频。
各位在坐的、包括我们在线上的各位朋友,我看到已经有100多位进来了。非常感谢大家今天的光临!
这三本书的顺序和内容,实际上第一本是在12年前,即2009年写的,就是《知识工程与创新》,这里面是我第一次比较系统地把对知识工程的一些认识呈现在书里。但是那是12年前的认识,现在有了改变。一会我在后面讲。
但是也有一些东西,它是一直没有变化,一直贯穿到今天的。我写《三体智能革命》这本书的时候,在我写的内容当中,我也特别强调了对知识的认识和应用。在《铸魂》这本书当中,又特别地把工业技术软件化,专门作为一章写进来,书中也讲到了,这其中对于知识,我们一直是从过去的物化传承,到转化传承,然后到流化传承,一直到今天的数字化传承。
关于知识本身,直到今天,知识工程包括知识管理已经发展了好几十年,从70年代到今天。但是对于知识,并没有公认的这样一个所谓的标准和定义,或者叫标准化的定义。这是现在的一个现实情况。
知识是我们人类认识自然、改造自然、改造我们所生存的这个物质世界,让我们获得更好的工作和生活的环境,来进行指导的两方面内容:一个是我们人类面向自然界,面向工业界或者说科技领域等,在各种实践当中我们得出来的结晶;另一方面,它又是指导我们下一步去进行具体的技术改造、针对具体的人工制造物,帮助我们来建设更美好 会,这样一个指导性内容。
因此,“知识XX化”,这是我提出来的,这是一个过程,影响到整个 会和经济。当然我今天主要讲的是在工业领域这样一个发展过程。因此,无论是知识载体、知识获取过程、知识作用机理、人和知识的关系,乃至知识本身,都在不断的、渐进式的在发生变化。因此今天我们对知识的认识一定是在发展的。
十几年来不断总结的这些认识,我本人也在不断的在学习,在提升。因此,我把三本书中与知识有关的这样一些内容,给大家做一个总结汇 。
其实,我认为,知识工程仅仅是研究应用知识的一个细分专业而已。像工业技术软件化、知识自动化、智能制造,包括工业软件开发本身,都和知识工程有着密不可分的关系。
我们先把我们的眼光放在长远的历史位置。我们从知识的产生来去讲这句话——知识存在了多长时间?
我个人的观点是,也是一个推断,只是一个大胆的推断——人类历史发展得时间有多长,对知识的这样一个认识、提炼、收集、整理、应用,并且用它来进行创新,以获得更好的劳动工具,这样的一个历史就有多长——大约在330万年前,我们有确切的证据证明,人类已经开始了早期的原始制造,在那个时候,用知识去制造最古老的石器工具,就已经开始了,所以这是人类知识的一个“人类知识实物化”的过程。发展到几十万年前,一直到20多万年前,人类第一次走出非洲。
大约十万年前,人类第二次走出非洲,直到七万年前,我们这一支人类获得一个特殊的能力,语言!这是第一次信息大爆发,而且的话,人类(智人)正是靠掌握的语言,有了强烈的表述能力,才把地球上存在着其它的人种、人类都干掉了,当时还有丹尼索瓦人, 尼安德特人,霍比特人,大家都知道,对吧?它们同样要会用工具,会用火,会缝纫,会劳动,但是我们这一支人类——智人,掌握了语言,所以它是“ 人类知识的表述化”;
大概一万年前。人类学会了在岩壁上、在甲骨上,来绘制图文,这是一个重要的标志,所以从大几千年前,知识已经开始以图文的方式与人分离,知识的载体不再是人的大脑和肌肉,人已经开始在某些物质的表面上进行刻画,把人类想表达的图、文知识呈现出来,这是“人类知识图文化”;
大概在两千年前,我们人类学会了造纸,所以知识开始变得容易传播,造纸就是为了有更好的一种书写表面。如果写在竹简上、木简上,是一种方式,刻在石碑上、青铜器上,也是一种方式,写在兽皮上或者写在锦帛上都行,但是太贵了,且不易复制传播,因此的话,找到一个表面能够书写墨迹的东西,是很困难的。所以当我们有了造纸术之后,我们可以把它写成文章,把它印成书,因此人类 实现了快速的 “ 知识复制化” ,我们有更好的载体,所以知识传播速度加快了。
从1600年前有了印刷术,一直发展到今天,我们这种以纸介质的方式,包括进化到今天以数字化的方式,来作为介质,来去做快速的复制传播,我们人类知识已经进入到了快速的“知识复用化和 会化”这样一个阶段。所以今天大家可以看到,任何的一条新闻如果是爆炸性的,只要大家愿意的话,一定可以在5分钟之内传遍全中国,在15分钟之内传遍全世界。而过去在用电影记录的时代是几天,用电视片记录的时代大概是几小时,但是今天可以缩短到几分钟。
知识的物化,它是知识逐渐与人类分离,并且以某种容易获得的物质作为载体而留存和传播。
知识传播的模式,从动作示范,( 因为没有语言的时候,只能用肢体动作来表达,大家可以看到,今天有些动物也还是这样做的),再 到后来,有了语言,再到图文、符 ,文字,直到我们今天有了非常详尽的知识表达方式,这都是我们技术创新的结晶。
知识载体也是从人体的大脑记忆、肌肉记忆、发展到今天,从过去的青铜、兽皮、锦帛、木、竹,纸,纸用到了今天。
我们会发现,它是一个不断发展的过程。那么,我们把这类知识统称为“碳基知识”——因为实际上这些载体最后给它烧完了,基本上它就剩下碳了,包括我们人本身,烧完了也都是碳。所以,就有了一个通俗的说法,这叫“ 碳基知识”。
再发展,我们可以看到,从几千年前到一万年前的石斧,还有甲骨文和司母戊大方鼎。石斧是新石器时代的产物,大致是在两万年前的,甲骨文的大概是四五千年前的,司母戊大方鼎铭文大概是3500年前的。
因此大家可以看到,实物固化知识。我们看到一个实物的时候,我们可以根据实物推断其制作工艺,例如这个石斧到底是怎么做的,因为它把人类的制作知识固化在了上面,我们能够根据实物推断它制作的方式、方法。
如果有铭文的话,我们就能够看到实物承载了历史知识,根据这个铭文的所记录的东西,我们可以推断过去曾经发生了什么,去推断它的年代和当时的历史事实。
作为知识转化更有意思,直到今天知识工程仍然在研究知识转化。知识在不同的主体之间是可以转化的,转化有规律可循,有模式可表达。这个就是我们要研究的知识表达的问题。
首先,我们先来看一张漫画,来看所谓的信息、知识和智慧之间,以最古老的方式,把它三种转化的模式,我们来看一下:一个是信息(information),一个是知识(knowledge),一个是智慧(wisdom),刚才宁总已经提到了这个模式。当然这一漫画表达的,还没有数据的概念。
大家可以看到的,“自然信息”是人的感官和物质世界交互的时候,人们感受的所有事实。比如说太阳东出西落,乌云翻滚,或者是蓝天白云,月盈月亏,兔子跑过去了,鸟在叫,等等,这些东西都叫information,但是它是自然界的information。直到今天,我们的巨大的射电望远镜,已经接收到了几亿年前或者十 几亿年前发过来一条信息,但是我们解读不了,可是它明显的是一条信息。那我们认为这个东西属于自然信息,包括我们感受到了地震波,感受到了更大的“地震波”——是别的星球“星震”了,传到了我们地球,就是引力波。因此,我们经常讨论的话题就是:信息、知识、智慧。
但是大家一定记住,这里谈论的是自然信息。并且,人们观察自然信息之后,用自己的语言、符 输出,所以这是第二体信息——如果按三体智能革命的观点,我们可以认为自然界中物理实体都是“ 第一体”,第一体的事物是客观规律支配的,你想干涉都不行,对吧?你想让鸟儿不飞都不行,你不想月盈月亏都不行,它们不会按照你的意志来,而是按照自然界的天意来,所以,这些都是自然信息,而人类表述的一些东西,就是“ 表述信息”( 第二体信息)。
我们所涉及的信息,细分有三种,大家可以看,这我专门对此做了区分:
自然信息,人类观察到的所有的事实,人类感官所看到的、听到的、闻到的。
表述信息,人类发明的符 系统,用这种图形文字等来表述自然信息。
数字化信息,就是对前面的两种信息,让它们进入计算机之后,变成了数字化的信息,变成了计算机可以处理的信息。
所以,这是有严格界定的。因此今天我们讲的“信息化”是有点牵强的,你讲就是哪种信息呀,对吧?所以我本人一直比较反对这个“信息化”的术语。如果你知道其真实内涵也行,前提是明确界定,它是“数字化的信息化”。其实,你就直接说“数字化”就好了,这样就没有任何的误解。我们要正确区分三种信息。
纸介质的文档属于表述信息的一种,电脑无法通过计算来检索处理,即使以扫描成数字图像,仍缺乏电脑可辨识的文本信息;精准的图像检索,迄今为止仍难以实现。
所以,可以看到,数字化是实现信息化的最佳抓手。首先要做的是,把第一体信息、第二体信息进行数字化处理。
因此,三种信息之间的关系,包括由此引出来的DIKW这样一个金字塔模式。
我们来看,人类通过自己感官观察到了所有的自然信息以及事实。这个不以人类意志为转移的事实,经过人的意识活动,把它变成一种表述信息。我用“5W1H”来说:什么时间,什么地点,看到谁,在做什么事情,那么因此的话,我们会有一系列的说辞,这就是我们语言的魅力。当然,也还有描述不清楚的地方,那是表述信息本身的缺陷。所以,我们可以用语言、文字、图形、肢体表情等等去做一系列的说明。
当然,我们还有知识。我们可以有物理的、化学的、人文的、 会的、哲学的,各种各样的知识,仅就数学而言,里面有函数坐标、整数分数、小数等等,于是我们有了关于“数”的概念。前面宁总也提到了数字。“数”是一个总称,所以我们讲过去有“数论”,有算式。
我们可以把我们在前面讲到的最古老的那个信息、知识、智慧,因为它是不断的往上的,在复用(reuse)当中来叠加、升级的。所以,刚才从前面几张图当中,大家应该看到了,它只是不同层级的变化而已。但是我们又有了“数”的概念,data,这个数字化的数据,这个时候大家要注意,这张DIKW图是在没有任何数字化概念的基础上总结出来的东西。
当然我们可以把知识、信息数据都用二进制的比特来表达,因此,我们有了数字化的数据,有了数字化的信息和数字化的知识,因为比特本身它承载了按照模型组织的数据,我们在电脑当中1、2、3、4、5都是有二进制的,然后经过重用,它组成了信息,然后结构化的信息变成了知识,这是一个不断发展的过程。每一个阶段都有精确的定义,我就不展开讲了。
比如说数据,我们通常来说的话,它都是各种各样的杂乱的数值。刚才的宁总也讲了。比如讲2020,我不知道你在讲什么,对吧,因为你如果再讲个2021也可以,它们可以比较大小,我知道2020一定比2021小,反过来说,2021比2020大,我也知道3比2大,5比2大,2就比5小,但是它没意义,因为我不知道你在说什么。
如果你加上了一个量纲的话来看2020,你说秒,好,我知道这是时间,你说吨,我就知道你在讲重量,你说加上一个别的量纲,都可以。所以,这就是它会变成信息。信息是消除了数据的不确定性的。当然的话,信息在不断地应用过程当中会变成结构化的信息,结构化信息就可以指导人做事情。那么它就变成了知识。当我们用知识不断地去关联的时候,我们可以说激发了智慧。所以,这个是在作为人之间转化的、这样一种交互的DIKW模型。它与数字化/信息化没有几毛钱的关系。我认为这样的东西,不适合我们在赛博空间来进行研究。
因此,在写我刚才提到三本书时,在写《知识工程与创新》的时候,我就是用的是这个DIKW,最经典的模型。但是到了我写《三体智能革命》这本书的时候,那已经过了七年,即在2016年出版,我在2015年写书的时候,我就把它做了一个拓展。
我认为,如果在赛博空间,电脑只会算bit,就是0和1比特,那么所有的数据,不管是1、2、3、4、5,还是任何的数据,只要你是电脑按出来的那个ASCII码字符( 有128个),在电脑里面都有一段二进制的表达。所以,它会构成比特化的数据,比特化的数据如果加上量纲,它会构成比特化的信息,比特化的信息如果变成结构化信息,那么它就是比特化知识。那么知识的话,它实际上还没到智慧,因为 智慧只是人所具有的一种独特的能力,我们迄今为止还没有发现任何非人体的这种智慧。
所以枉谈“ 智慧工厂、智慧XX(something)”,其实都是把它拔得太高了,尤其是“智慧城市”,错得离谱,一个smart city,它与“智慧”有一毛钱的关系吗?没有!这是胡翻乱译。所以这类东西,我们没有办法杜绝,我们只能知道这是错的就好了。
所以,为了改造这个模型,我提出来说,基于DIKW,( 大家可以去看我们在《三体智能革命》这本书上都有写到),我把它建成一个BDIKSW体系——在层次划分上,往下拓展出比特层,中间再加上一个smart层,这样的话,我觉得更合理一点。因为这四层(注:指其中的DIKS),它是我们要经常用到的。而且顶层的智慧,我已经讲了,在电脑里面、任何的人造系统里面都没有智慧,因为现在的“ 智能”也只是3岁、5岁孩子的水平。所以,系统的发展必须首先达到智能的形态,才能向更高级的智慧演进,而且还不知道这个东西要50年还是100年以后才行。目前,一定记住,只有人具有智慧。
所以,我们首先实现由二进制比特构成的数据贯通,然后到知识贯通,然后从数据智能到知识赋能。
我们可以看到,在这样的一个情况下,原有的模型是DIKW,数据-信息-知识-智慧,它具有哲学上的指导意义,而且其自然信息转化成表述信息,向下层又提炼了抽象的数据,向上层关联成为知识。
所以,我们可以看到,人去观察各种自然信息,然后的话,我们提炼数据,观察到的信息变成表述信息,最后,信息承载的知识激发智慧。这个都是人体处理的。
那现在,如果换成我在《三体智能革命》书中提出来的这个改进模式,大家可以看到,它就不一样了,我们可以用模拟人的机器视觉去观察东西——这里指的是所有的感官——因为今天,我们已经在智能机器加上了很多东西,机器为什么智能?因为它在模拟人的感官,我们给它加上的视觉、听觉、嗅觉、触觉等等的一系列的传感器,因此我们可以感知物理现象,各种各样的物理信息,并且把这些物理信息转变成数字信息——转化成比特数据,它再拼成数字信息,然后承载了数字知识,最后才能智能地去运行。这个过程是从人体处理变成了机器处理,对现场观察还需要在反复的reuse当中逐渐地关联和升级。
因此的话,数据的关联成为信息,信息的关联为知识,知识的关联激发智慧,所以这是一套非常精准的、说的通的知识体系。大家可以看到,今天的智能制造、工业互联 ,与这个模式几乎是一样的。
好了,我们再看日本人提出来的这样一个“四化”模型。刚才是DIKW发展到BDIKSW这样一个金字塔的转换。我们再来看看日本人说的“ 四化”: 会化、外化、组合化、内化,这个是纯属是在人群之间来进行知识管理,也跟数字化没有一毛钱的关系。
所以只是讲,你要“ 会化”,大家一块共享经验,比如说今天,就是把我的知识、宁总的知识、各位专家的知识讲出来,供大家分享,这是一个 会化的过程;如果要是“外化”的话,你就是要隐性知识显性化;那么你要说“组合化”,那就是大家要把碎片化的知识关联起来——今天我们大部分的知识是碎片化的,很多碎片化的知识都是没用的,甚至是误导你的垃圾知识,所以大家一定要学会如何从碎片化的知识当中,学出这种信息化的、体系化的知识。当然的话,你还可以把它学到,领会得非常透彻,要深入到数据里面,创造出新的隐性知识,你又感悟了,又有了新知识出来(“内化”)。所以,这是一个“四 化”过程,但是这是一个基于人与人之间进行知识转化的、最经典的、基于DIKW的模式。
我们再来看看,咱们中国人提出来的基于“三体智能模型”的这样的转化模式。
我们可以看到,从人类学会打制石器,我想从330万年前,直到30年前,其实很多做事方式没什么本质区别,只是说工具更先进了一些。我们还是“两体互动”的一个认识。因为在《 三体智能革命》当中,我们提出来,这个世界如果去宏观地划分一下的话,那么它可以划分成三种体body。我们既不谈所谓的空间,如“三个空间”,也不谈所谓的“三个世界”,因为它们都不足以描述未来智能系统的发展。我们认为用“ 三个体”的方式来谈是合理的——物理实体,意识人体,数字虚体。这三个词汇描述的是,它有可能让数字虚体将来从一个被我们人类作用的这样一个“客体”,将来有可能成为一个它去作用于别人的“主体”,所以它包含了这样一个未来发展过程,如果缺了这个要点,就没有理解《三体智能革命》,没有理解“三体智能模型”。所以我们认为tree-body,用“三体”的方式谈是更合适的。我们基于这个分类说出来的“三体”,跟刘慈欣那个“三体”也没有一毛钱的关系,那完全是我们在自创模型的基础之上看到的。
所以在两体模型上看到,古老而经典的这样一个知识发生学是贯穿在这里边的,就是针对某种物理实体,它可以是当时获取的石头,也可以是今天的一个铸件,还可以是被车床在车制的一个东西,反正anyway,它是一个物理实体。意识人体在研究用什么样方式加工它,只不过,从古老粗犷的原始制造工艺到今天比较先进的、我们有了更先进的工艺。但是,它仍然是一种落后的状态,但是这种模式,大家在今天的一些乡镇企业仍然看得到。
我们可以这样看,人类不断去认识世界,积累知识,向大自然学习。然后把它写成书,再创新指导人类改造自然——这就是我讲的,既是结晶,也是指导。所以我们积累的海量知识写成了书,知识传承了几十万年,至少是几十万年。我们凭借知识来认识自然、改造自然,自然又启发和约束人,因为你改造得太多了,比如说你把树砍光了,那么自然就会惩罚你,所以现在气候在变暖,空气在变差。
人类又是依靠知识创造物理设备、物理设备又凝固了人的知识。早期的知识是凝固在物理设备上的,例如我在里面用了一片不锈钢,永远不锈,不锈就是一个很好的概念,我们只能去分析这里面用了什么样的组分,它 就可以不锈了,但是不锈钢无法告诉你这些知识,需要人自己去分析。所以机器一直不智能。
因此的话,我们提出来“三体智能模型”,一定是从“两体互动”发展到“三体交汇”。所以在三体之间,数据要流动,信息、知识要流动。
前面我已经讲到了,就是这个BDIKSW模型。所以因此我们知识一定要积累,这是两体之间的互动模式。然后再发展到六七十年前,出来个数字虚体,我们把人的知识(通过知识建模)放到电脑里面、软件里面,然后知识驱动来去改进任何一个物理产品,至少任何的物理实体产品。当然了,它也回馈优化,学习提升,也有创新改造,这都是我们“三体智能模型”当中提出来的、它们三个“体”之间的转化关系。基于知识我们可以开发软件,可以构建更好的智能系统。这个我们就分开讲。
再往下发展,知识数字化,所以知识物化、知识转化、知识数字化,也就是要在知识数字化的基础之上来实现知识关联,因为只有关联的知识才有力量。
所以我也写了一本早期的《知识工程与创新》的书。大家可以看到,我在上面写到,培根说“知识就是力量”,我认为还差点火候,现在更显示出来知识它不是这样的 ,只有关联的知识它才是有更大的力量。所以我们可以看到,知识数字化——很多的知识载体,从物理的、表面的碳基,现在变成了硅基。
很多的图片知识,以前是叫“ 电分”,现在是扫描拍照,你拍照一下,就是把物理空间的信息,变成了一种数字化的东西,只不过这是模式化之后的数字化,因为在电脑里面那些所有的内容,都是由0和1组成的,都是按照某种模型、以不同模式组成的0和1,电脑只会计算这个东西,它其实是比特化的。
书 知识数字化不用说了,咱们有电子 什么之类的;场景知识数字化,把拍摄断层扫描,大脑中知识的数字化现在也可以做到了,因为现在在美国的一所大学已经可以利用现代数字技术,把猴子的海马体里边的东西下载到电脑上。所以未来的话,这种技术将来一定应在人脑方面——脑机接口、机脑接口,大家知道马斯克等人也一直在做。所以这些都是试图把物理空间的很多东西给它做数字化,尤其是把物理介质给它数字化。
在数字化的基础之上,所有的信息不应该是零散的,所有的知识不应该是片段的,所以我们要把知识和信息给它关联起来,这是在《知识工程与创新》这本书上,也就是12年前我写了要用本体关系来关联知识。
那个时候我们就在讲万物互联,知识一定要关联,信息要关联。所以我在书中讲:数据关联会产生信息,信息关联会产生知识,知识关联会激发出智慧,这是当时这本书上最基本的观点。
大家可以看到,这个图上显示的(注:水的本体关系片段),其实不就是咱们今天的知识图谱的一个基本模型么?
刚才宁总也讲到了飞机,我给大家看一个飞机的本体的片段。这个图比较长,这只是其中一部分。
大家可以看到,如果我们用我在书中给出了的一个“类”,我们可以说有它的对象1,指的对象1和类的关系,还有对象2, 对象1、对象2之间还有从属关系、异构关系等等。我们把这些工程的概念之间的关系和术语讲清楚的话,那么它就是我们今天看到的知识图谱。
很有意思,我们今天坐在一个以知识图谱作为核心技术的公司的会议室里面。他们做的基于知识图谱的工业互联 和工业APP,做得还是很先进的,就我个人所看到的范围内,他们是中国做得最好的。
大家看,这就是智通云联公司做的一个知识图谱。关于“ 卡钻”,关于“ 井筒”,都可以给出这一类术语它们不同之间的关联,所以知识在数字化的基础之上它们关联了,关联了就很有意义,让我们可以做很多事情,我们可以掌握过去我们掌握不了东西,我们能够发现过去我们发现不了的事情。这个是重要的进步。
在知识数字化的基础上,我们就可以进行知识软件化。 在人类的这样一个“人类知识软件化”的宏大进程中,一个大趋势、大路径下,于是我们有了“工业技术软件化”这个工业基础建设。
我给大家看一个东西,这个是我和电子五所的人一起做了一个“工业技术软件化研究 告”,上个月结题了。在这个 告当中提出来一个转化的模式,一个发展的过程。我拿出来给大家看一下。
大家可以看到,“人类知识软件化”是一个宏大的历史进程。而且“军工知识软件化”、“数学知识软件化”早就在进行,因为我们是靠着基本的数学知识来研究计算机的,计算机历史有多长,“数学知识软件化”的历史就有多长,但是最先进入应用是军工领域,最先做的是国防军工武器,如怎么投弹、怎么算坐标,怎么搞物流,这样的应用。当时没有高级语言,用最基本的汇编语言做成程序,但是确实是在40年代初就有了。但是它没有高级语言,到50年代后期才有的高级语言。
大家可以看到,当然还有“物理知识软件化”、“ 化学知识软件化”,所有的基础知识的软件化,这是中科院该搞的。我们可以看到,工业技术软件化,它是一个大的发展趋势,它的起点,我个人认为应该是1957年第一款用高级语言编写的CAD/CAM软件,叫作PRONTO,它应该是我们工业技术软件化的起点。
在这个过程当中,不仅有工业技术软件化,而且还有“软件知识工业化”。我们不要忘记这个进程,因为建成一个工业软件,不仅仅是工业知识,你没有图形交互,没有graphics engine(图形引擎),你没有一些最基本的东西,这些都不足以构成一个良好的工业软件。所以工业技术是主流,但是还有这些其它的技术,例如几何的、计算的、算术的、图形表达的、界面的等等,甚至包括美学,都要把它用到GUI当中,即graphics user interface(图形用户界面),所以这个是我们要想到的。
而且,它有个传统的工业软件在不断发展,现在例如说云化,比如说还有一些“机械装备/过程孪生化”,因此基于软件开发的“数字孪生”也必须要提到,还有就是云架构的工业软件,包括工业APP等等。这都是它这样一个发展过程。
我们可以看到,知识应用载体,知识应用主体,都在发生变更。所以在知识数字化的基础之上,知识大规模的嵌入软件,软件嵌入研发和生产流程。而且有两个重要的事情发生:
第一,知识存储与人分离,过去的话,我们把它写在了纸上,画在了岩壁上,但是那都是不好分享的一种物理介质。但当我们把它数字化了,放在 上、云端进行传播,那就完全不一样了。
第二,最重要的,还有一个知识应用与人分离,千万年以来都是人用知识,我用纸把它写出来,把它放入书籍进行管理,搁在课堂上去教大家,才是一个知识的传输与分享,基于纸介质的。但是,逐渐地开始换介质了,我们基于PPT讲,基于软件来教大家,所以传播的介质不太一样了,但重要的是,从人用知识——我们教人怎么学知识、用知识、传播知识,到软件应用知识,更重要的是,今天软件在控制着机器在应用知识,甚至是在产生知识。
世界变了。所以知识密集型企业一定要基于知识发展,做知识数字化,知识软件化,知识平台化和APP化。你比如说平台化,索为就做的不错,还有很多公司都在做平台化的软件。但是,今天又做到了另外一个方向——APP化。
我们会发现,知识自动化也提到了议事日程上来,因此的话,在“硅基知识”的基础之上,我们来发展数字化的生产力。我们有digital labor( 数字化劳力),替代我们人的劳力。
所以,这个世界为什么在变,那是因为这个基础性的变化:没有知识做基础,一切无从谈起!
好了,那我们再来看,知识载体、应用主体都变了,很多东西也变了,包括知识本身也在变,因此从大家进入“碳基知识”,再到“硅基知识”,这是一个根本性的转变。
这张图 一下就跨越了几百万年。但是我们还是从几十年前来看,因为有了电脑之后才有数字虚体( 第三体)出现,这是《三体智能革命》的观点,然后你才能有在软件当中写入知识这些东西,它应该是知识工程的一部分。
知识自动化的定义,这是由科普中国编订的词条,我把它拿过来用。人家该说的都说了。但是你把这里面最关键的、核心的词提取出来,我们可以看到:
1.知识;2.表达式;3.模型化(刚才宁总讲了半天模型,要特别注意,没有模型啥也不能解决,因为把知识进去要形成特定的模型和算法,知识要关联起来,要组织起来);4.软件化,最终要写入软件;5.不仅是软件还要形成软件系统,形成从应用上的软件系统;6.我们强调的是知识的复用性(reuse),在不断的reuse过程中来找到更好的方式。
大家记住,在新工业革命中,智能制造、工业互联 、工业4.0等等这一系列的不同形式但是本质相同的工业转型升级活动当中,大部分业务功能的实现,都是基于智能软件系统,因此,这也是为什么我和宁总要专门要写一本书叫做“软件定义制造”,就是从这里认识到知识和软件是最基础的东西。所以,知识自动化,与我们的知识工程,与工业技术软件化在内容上有很大的重叠。
我给大家用这个模型说一下。在(《 铸魂》)书中有这张图,但我稍微做了点改进,因为当时没有想的特别清楚,我只画了一个闭环,后来我认为是应该两个闭环。
大家看最上边,实际上工业技术软件化的一个基本流程,把人的脑子里面的、看不见摸不着(因为我不讲出来你不知道),把这种隐性知识通过各种各样的方式给它外化、显性化,这个可以通过深度会谈、大家可以在这个 区里面BBS,或者各种各样的方式线下座谈会。
显性化的知识就可以模型化、组织化,然后我们再可以让它算法化、代码化,大家可以看到,找到模型算法。现在模型(宁总刚才给定义好了),所以我们可以算法化、代码化,进入软件,因此我们可以看到,在这儿,工业软件,你会发现它是一个核心,然后我们再有精准的定义,最后再有决策,基于软件的决策,然后优化,基于软件的自主化、智能化,所以才有了智能的机器,其实这个机器工作的时候,我们各种各样的传感器,它不断地进行“状态感知,实时分析,自主决策,精准执行”,这个智能闭环它就很重要的。于是,这个机器不断的智能,这是我们在《三体智能革命》中总结的智能系统的几个基本特征。如果是用了人工智能,还有学习提升。
两个闭环在这里非常重要。大家可以看到,从机器工作的物理现场“状态感知”,然后马上送到芯片里面,软件要去“实时分析”,怎么分析呢——基于人给定的模型、算法、知识、最佳经验和数据去分析,然后推理决策,给出了“自主决策”,该去做什么呢?如果是第三次工业革命,那就显示出来辅助人去决策,第四次工业革命或者叫新工业革命,它不一样,它会给你一个指令,直接送到controlor(控制器)里面驱动机器,做此时、此刻、此场景下的最佳的动作。
所以就不断地状态感知,做完了现场信息又被传感器抓住了,“状态感知,实时分析,自主决策,精准执行”,这是一个loop( 闭环)。
第二个loop,(我在书上忘了补这个闭环了),大家可以看到,人在跟软件不断的交互过程当中,我们去“应用交互”,然后我有“全新感悟”,我不断的“认识提升”,最后再把这种提升,又变成了新的隐性知识,我再给它显性化,“化入软件”,让软件不断的去丰富发展。如果我们想想的话,在所有的软件发展过程当中,其实都是这么干的。
软件里面不是几个人的知识,不是几家企业的知识,而是把人类发展到今天,所有的我们能找到的知识,跟行业专业有关知识,我们都把它们放进去了。当你用一个软件的时候,实际上有千千万万同行业的专家、甚至不同行业的专家,在支撑着你——这就是为什么软件有强大的赋能作用,让我们能够干出来我们个人干不出来的事情。
今天我们所有的研发,如果没有软件中的知识的支撑。那是不可想象的事情。所以这个过程当中又形成了一个闭环,不断地发展着软件、培训着人。
大家可以看到以工业软件为核心的两个闭环,无论是从机器的一端、还是从人的一端,都聚焦在工业软件上!因此工业软件,它就是我们最需要关注的事情,它也是知识工程要落地的东西,这是为什么我们写《铸魂》这本书的最初的出发点。
好了,既然这样的话,软件是什么?软件是工业技术软件化的结晶。软件就是一个容器,知识容器。我们如果有物理的知识,放到里面,有了化学的知识,放到里面,有了数学的知识,放到里面,有了任何的工业的、各种各样的知识,有了know-how,有了best practice,最佳数据,最佳经验,有了know-how,都放到里面。所以我也借用了林总的一张图来说明。
其实图中还有更多的知识,所以看到工业知识占多数,但是还有别的那么多的知识。所以,为什么工业软件它也并不仅仅是工业软件的事,它会以工业为主体,但是那些计算机的技术,包括一些数学的、物理的、图形交互的技术,还有我们工业实践当中提炼出来,这种多少专业的耦合的技术,都非常重要。
因此的话,我们可以思考的是,智能的源头在于什么?在于人正确的决策,而人推理思考所形成的这种能力,我们把它叫做“人智”,以知识的方式沉淀下来,然后我们把“人智”嵌入软件,最后让它变成了机器的智能,简称为“机智”。
所以,工业技术软件化,就是把那些碎片化的知识,多学科的知识,进行模块化构建,系统化组装,智能化检索、创新化应用,是这样的过程。
软件按照人给出的知识、算法和数据,所赋予的逻辑和流程,高速模拟、重复甚至超越人的思维过程,它是靠算力、算法来极速计算的,最终实现了:
第一,以软件精算的指令来控制设备的运转,为其所嵌入的机器设备赋能;
第二,与人交互,为人纾困、解惑、计算、展示,因为你背后有千千万万的行业专家在支撑着你,所以让软件内汇集的这些专家知识为人赋能。
所以两个目的:为机械赋能,为人赋能,但都是要基于知识来实现的。
工业技术软件化和知识工程,二者有着密切的关系,大家可以看到,内容上有着很大的重叠。
我在《知识工程与创新》这本书当中给了定义,当时是说:依托IT技术,最大程度地实现信息关联和知识关联,并把关联的知识和信息作为企业智力资产来以人机交互的方式管理和利用,在使用中提升其价值,以此促进技术创新和管理创新,提升企业的核心竞争能力,推动企业持续发展的全部相关活动,叫作知识工程。
这是2004最初去601所时给出来的一个定义,稍微修订一下这个定义,在2005年(即16年前)提了出来。书是在2009年出版的, 正好过了12年。
技术发展到今天,强调最大程度地实现信息关联和知识关联,仍然是必须做到,今天的知识图谱就是干这个,它仍是知识工程的重点。但是需要补充一点,因为当时没有大数据这一说,更没有大数据智能。今天发展起来的大数据智能、机器学习和知识图谱技术,让知识工程的内容,包括但并不限于人机交互,甚至机器,包括机器人,它都可以产生和利用知识。这里就是知识工程发展之后的新技术了。
在这里我借用了电子五所杨春晖副总师的一张图。这是她在“软件工程和应用实验室建设”的一个PPT介绍当中,讲到的一个内容。
知识工程和软件工程是助推工业软件发展的“一体两翼”,所以左边是知识工程,右边是软件工程。知识工程有知识工程的一系列做法:隐性知识的显性化,数据知识的标准化等等,知识的结构化、范式化、模型化和全息化。然后,它有一系列的知识表示方法,推理规则、获取工具、管理机制等等。那么到了软件工程,那当然也有一系列质量保障过程,把软件本身的功能性及安全性、可靠性加以综合考虑。因为五所是搞可靠性的,所以对这些内容,都可以来做很多的检测和指导改进。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!