计算语言学
第一节计算语言学概说
概念:
计算语言学(computational linguistics)是用计算机研究和处理自然语言的一门新兴边缘学科。涉及语言学、计算机科学、数学等多个领域。旨在通过建立形式化的数学模型,来分析处理自然语言,并在计算机上用程序来实现分析和处理的过程。从而实现机器模拟人的部分乃至全部语言能力。
研究对象
自然语言&计算机处理(或者简单地说“计算”)
自然语言:指日常生活中人们所使用的语言,如汉语、英语、法语等。
自然语言的特性和规则是计算语言学研究的主体。计算语言学不仅要研究自然语言的书写系统(文字)还要研究自然语言的各级语言单位(音素、音位、语素、词、短语、句子等)的组合规则和这些语言单位与语义产生联系的各种规则【这是我们研究计算语言学的基础,初步工作】(目的:要让计算机能自动理解和产生自然语言)
计算机处理:用计算机所能接受的方式来描写和刻画自然语言并把它表示在计算机中。(计算机是以数值处理的方式来处理信息的,它以二进制数0和1为基本的操作符 ,在此基础上建立起一整套形式化处理的方法来进行运转。因此要让计算机能够理解和生成自然语言,自然语言的特性和每一条规则必须要以形式化的方式表示出来。自然语言的规则是错综复杂的,而且规则的数量也非常多。有了自然语言各种规则的形式化表示,并不能保证计算机就能够正确有效地理解和产生自然语言,要想让计算机能够正确有效地处理自然语言,还需要研究自然语言规则之间的关系及其处理策略,并且也要用形式化的方式表示出来。)有了自然语言和计算机处理的研究基础,人们才能够选择计算机程序设计语言来设计和编写处理自然语言的软件程序,才能最终实现自然语言计算机处理的目的。
整个过程包括四部分:
知识挖掘
涉及语言学的众多理论问题,
首先是语言观问题,然后是语言研究的方法论问题;
形式表示
算法设计
更多涉及语言处理的实际工程问题
软件编制
知识挖掘即从语言学角度提出自然语言处理的语言问题和理论
形式表示即把需要研究的问题在语言学上形式化,使之能以一定的数学形式严密规整地表示出来
算法设计即把这种严密而规整的数学形式表示为算法,使之能在计算机上形式化
软件编制即根据算法编写计算机程序,使之在计算机上能得以实现
计算语言学性质
计算语言学是一门交叉性的学科,它是由语言学和计算机科学相互交叉要有语言学的知识,又要有计算机科学的知识。涉及语言学、计算机科学、数学等多个领域。
语言,这种我们习以为常的 会现象,人们可以从不同的角度来加以认识,而研究目标
相关资源:连续梁的弯矩计算软件V1.0绿色版_连续梁-其它代码类资源-CSDN文库
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!