《软件技术基础》之《词法分析》
- 词法分析的功能
-
- 功能
- 词法分析器和语法分析器的关系
-
- 词法分析器作为单独的一遍
- 词法分析器作为子程序
- 词法分析器的输出形式
-
- 单词的种类
- 单词的输出形式:二元式
- 单词类型的划分
- 词法分析器的结构
-
- 扫描缓冲区
-
- 扫描缓冲区的结构:双缓冲区
- 符 的识别
-
- 词法分析技术——超前搜索
- 词法分析器的实现
-
- 状态转换图
- 状态转换图识别的串
- 利用状态转换图识别单词符 的过程
- 其他状态转换图的例子
- 符 表
-
- 符 表在词法分析阶段的角色
- 符 表的一般形式
词法分析的功能
功能
- 扫描源程序的字符串;
- 按照词法规则识别出单词符 作为输出;
- 对识别过程中发现的词法错误,则输出有关的错误信息。
词法分析器在编译器负责:
- 读取源程序;
- 识别单词;
- 过滤掉源程序的注释和空白;
- 将编译器生成的错误信息与源程序的位置关联(记录遇到的换行符的个数、给出错信息赋予一个行 )。
词法分析器和语法分析器的关系
词法分析器作为单独的一遍
词法分析器不断地读取输入串(源文件),直到识别出下一个符合单词模式的字符串(词素),词法分析器根据此“符合单词模式的字符串”生成下一个单词,将单词流的输出形成一个输出文件,作为语法分析器的输入。
词法分析器的输出形式
单词的种类
- 标识符:用来命名程序中出现的变量、数组、函数、过程、标 等
- 基本字:也可称关键字或保留字,如if、while、for、do、goto等
- 常数:各种类型的常数,如233、3.1415、true等
- 运算符:如+、-、*、/等
- 界符:如;、:、(、)等
单词的输出形式:二元式
扫描缓冲区
- 输入缓冲区:源程序进入输入缓冲区;
- 预处理程序:取消注释、剔除无用的空白、回车、换行等;
- 扫描缓冲区:从输入缓冲区输入固定长度的字符串到另一个缓冲区(扫描缓冲区),词法分析可以直接在此缓冲区中进行符 识别
扫描缓冲区的结构:双缓冲区
设置左右两个缓冲区,当左缓冲区读完后,新读入的字符存入右缓冲区;反之,存放在左缓冲区;
- 起点指针 (lexeme Begin) :用来指示正在扫描的单词的起点;
- 搜索指针 (forward) :用于向前搜索,寻找单词的结束;
词法分析器的实现
状态转换图
简称转换图(transition diagram),是一张有限方向图,是设计词法分析器的有效工具。
它由如下成分构成:
- 结点(mode):圆圈表示结点,代表状态(state)
- 从初态开始
- 从输入串中读一个字符
- 判明读入字符与从当前状态出发的哪条弧上的标记相匹配,便转到相应匹配的那条弧所指向的状态;
- 重复3,均不匹配时便告失败;到达终态时便识别出一个单词符 。
-
在符 表中预先填写保留字,并指明它们不是普通标识符;
利用状态转换图识别单词符 的过程
在很多程序设计语言中,基本字也符合标识符的模式,如何区分br> 解决方法:
其他状态转换图的例子
信息域通常设置若干个子域和标志位,其内容可以是与名字有关的任何信息,如类型、种属、长度、相对地址、数组的内情向量、记录与分量的联系、形参标志、说明标志、赋值标志等。
因名字的长度、信息域的组成和长度可能是各不相同的,一般采用间接表技术。
间接符 表的数据结构:

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!