1.词法分析(Lexical analysis或Scanning)和词法分析程序(Lexical analyzer或Scanner)

词法分析阶段是编译过程的第一个阶段。这个阶段的任务是从左到右一个字符一个字符地读入源程序,即对构成源程序的字符流进行扫描然后根据构词规则识别单词(也称单词符号或符号或Token)。词法分析程序实现这个任务。词法分析程序可以使用lex等工具自动生成。

词法分析器也可以简称为lexer

2.语法分析(Parsing)和语法分析程序(Parser)

语法分析是编译过程的一个逻辑阶段。语法分析的任务是在词法分析的基础上将单词序列组合成各类语法短语,如“程序”,“语句”,“表达式”等等.语法分析程序判断源程序在结构上是否正确.源程序的结构由上下文无关文法描述.

例如语法分析器可以分析输入的内容是否符合 INTEGER ->PLUS->INTEGER这样的结构,例如PLUS INTEGER INTEGER这样的结构在语法分析的时候会发现操作符第一个就出现了则是不正确的语法形式。

3.语义分析(Syntax analysis)

语义分析是编译过程的一个逻辑阶段. 语义分析的任务是对结构上正确的源程序进行上下文有关性质的审查, 进行类型审查.例如一个C程序片断:

  int arr[2],b;
  b = arr * 10; 

源程序的结构是正确的.
语义分析将审查类型并报告错误:不能在表达式中使用一个数组变量,赋值语句的右端和左端的类型不匹配.

4.Lex和Yacc工具

  • Lex: 一个词法分析程序的自动生成工具。它输入描述构词规则的一系列正规式,然后构建有穷自动机和这个有穷自动机的一个驱动程序,进而生成一个词法分析程序.

  • Yacc:  一个语法分析程序的自动生成工具。它接受语言的文法,构造一个LALR(1)分析程序.因为它采用语法制导翻译的思想,还可以接受用C语言描述的语义动作,从而构造一个编译程序. Yacc 是 Yet another compiler compiler的缩写.

5. 源语言(Source language)和源程序(Source program)

 被编译程序翻译的程序称为源程序,书写该程序的语言称为源语言.

6. 目标语言(Object language or Target language)和目标程序(Object program or Target program)

编译程序翻译源程序而得到的结果程序称为目标程序, 书写该程序的语言称为目标语言.

7. 中间语言(中间表示)(Intermediate language(representation))

在进行了语法分析和语义分析阶段的工作之后,有的编译程序将源程序变成一种内部表示形式,这种内部表示形式叫做中间语言或中间表示或中间代码。所谓“中间代码”是一种结构简单、含义明确的记号系统,这种记号系统复杂性介于源程序语言和机器语言之间,容易将它翻译成目标代码。另外,还可以在中间代码一级进行与机器无关的优化。

参考资料:http://blog.csdn.net/nic_r/article/details/7835908

8. 文法和文法分类

这个讲清楚设计篇幅较多,以后再总结,敬请期待!