compiler-go/doc/三地址生成说明.md

6.0 KiB
Raw Blame History

通过例子来说明如何通过语法树实现三地址代码的生成。 假设有一个非常简单的算术表达式语言,它支持加法和变量赋值。 目标是将这个表达式转换为三地址代码。

步骤 1: 定义语法规则

首先需要定义这个简单语言的语法规则

grammar SimpleLang;

stat:   assign
    |   expr
    ;

assign: ID '=' expr ';' { /* 生成赋值的三地址代码 */ }
    ;

expr:   expr '+' expr
    |   num
    ;

num:   INT { /* 生成数字的三地址代码 */ }
    ;

ID  :   [_a-zA-Z] [_a-zA-Z0-9]*
    ;

INT :   [0-9]+
    ;

步骤 2: 生成解析器代码

使用ANTLR工具根据上述语法规则文件生成对应的词法分析器和语法分析器代码。

步骤 3: 遍历解析树

接下来遍历解析树来生成三地址代码。创建一个监听器或访问者来实现这一过程。 以下是一个访问者实现,遍历解析树并生成三地址代码:

class SimpleLangVisitor : public SimpleLangBaseVisitor<ThreeAddressCode*> {
public:
    // 访问数字节点时调用
    ThreeAddressCode* visitNum(SimpleLangParser::NumContext* ctx) {
        string value = ctx->INT()->getText();
        return new ThreeAddressCode("MOV", "R0", value); // 假设R0是临时寄存器
    }

    // 访问加法表达式节点时调用
    ThreeAddressCode* visitExpr(SimpleLangParser::ExprContext* ctx) {
        // 假设左右子树已经生成了三地址代码
        ThreeAddressCode* left = visit(ctx->expr(0));
        ThreeAddressCode* right = visit(ctx->expr(1));
        // 生成加法的三地址代码
        return new ThreeAddressCode("ADD", left->dest, right->dest);
    }

    // 访问赋值节点时调用
    ThreeAddressCode* visitAssign(SimpleLangParser::AssignContext* ctx) {
        string varName = ctx->ID()->getText();
        ThreeAddressCode* exprCode = visit(ctx->expr());
        // 生成赋值的三地址代码
        return new ThreeAddressCode("MOV", varName, exprCode->dest);
    }
};

步骤 4: 生成三地址代码

在上述访问者中,我们定义了如何生成数字、加法表达式和赋值语句的三地址代码。例如,对于数字,我们生成一个将数字移动到临时寄存器的指令。对于加法,我们生成一个将两个操作数相加的指令。对于赋值,我们生成一个将表达式的结果移动到变量的指令。

示例

假设我们有如下的源代码:

x = 3 + 4;

解析树将如下所示:

   assign
    /   \
  ID     expr
       /   \
    '='   +
       /   \
     num   num
     |     |
    3     4

遍历这个解析树,我们将生成以下三地址代码:

  1. MOV R0, 3 将数字3移动到临时寄存器R0
  2. MOV R1, 4 将数字4移动到另一个临时寄存器R1
  3. ADD R0, R0, R1 将R0和R1相加结果存回R0
  4. MOV x, R0 将R0的值移动到变量x

这样,我们就通过语法树实现了从源代码到三地址代码的转换。这个过程可以根据具体的语言和需求进行扩展和修改。

从提供的代码文件中,我们可以总结出三地址代码生成部分的实现方法如下:

1. 基本结构和初始化

  • GoTo3code 类负责将抽象语法树AST转换为三地址代码TAC。这个类包含了一系列的私有成员变量和方法用于存储和生成三地址代码。

  • 符号表Scope用于存储和管理变量、函数等符号信息。每个作用域Scope都包含变量符号表para_symbols和函数符号表fun_symbols

  • TACBlock 和 TACLine:三地址代码的基本单元是 TACLine表示单个操作指令而 TACBlock 表示一个代码块,包含多个 TACLine。

2. 代码生成流程

  • enterSourceFile 和 exitSourceFile:在进入和退出源文件解析时,初始化和结束全局作用域。

  • FunctionDecl:在函数声明时,创建新的 TACBlock并将其添加到 TACBlocks一个存储所有函数 TACBlock 的映射)中。

  • VarDecl 和 VarSpec:在变量声明时,生成相应的三地址代码指令,如 CREATLIST(用于数组创建)和 ASSIGN(用于变量赋值)。

  • Assignment:处理赋值语句,生成 ASSIGN 三地址代码指令。

  • ShortVarDecl:处理简短变量声明,类似于 VarDecl但通常用于循环或条件语句中。

  • IfStmt:处理 if 语句,生成条件跳转指令(如 IFEQIFNEQ 等)。

  • ForStmt:处理 for 循环,生成循环入口标签、条件检查、循环体和循环更新代码。

  • ReturnStmt:处理 return 语句,生成函数返回值的三地址代码指令。

3. 辅助功能

  • CreateLocalVar:创建局部变量名,用于临时变量或其他需要新变量的场景。

  • push_line:将新的三地址代码指令添加到当前 TACBlock。

  • OperandTypereslove:确定操作数的类型,如变量、立即数或指针。

  • is_digit:检查字符串是否为数字,用于处理数组长度等。

  • Go23file 和 Go23file_:将生成的三地址代码输出到文件。

4. 代码生成细节

  • 操作数编码:使用 Operand 结构表示操作数,包含值和类型。

  • 操作码映射:通过 ToString 函数将枚举类型的操作码映射为字符串,便于输出和调试。

  • 条件语句和循环:对于条件语句和循环,生成相应的跳转和标签指令,以实现控制流。

  • 函数调用:处理函数调用时,生成参数传递、函数调用和返回值处理的三地址代码。

总结

三地址代码生成部分的实现方法涉及到对源代码的深度优先遍历,根据语法树的结构生成相应的三地址代码指令。这个过程需要维护一个符号表来跟踪变量和函数的定义,以及一个代码块结构来存储生成的三地址代码。通过这种方式,可以将高级语言的控制流和数据流转换为低级的三地址代码表示,为后续的代码优化和目标代码生成打下基础。