OCaml 教程 / OCaml 编译器内部

OCaml 编译器内部

理解 OCaml 编译器的内部工作机制，有助于编写更高效的代码、调试复杂问题，以及为编译器本身做出贡献。

编译流程总览

OCaml 编译器（ocamlc/ocamlopt）将源码转换为可执行程序的完整流程：

源码 (.ml)
    │
    ▼
┌─────────┐
│  词法分析 │  ocamllex / 手写 lexer
│ (Lexing) │
└────┬────┘
     │ tokens
     ▼
┌─────────┐
│  语法分析 │  Menhir / ocamlyacc
│ (Parsing)│
└────┬────┘
     │ Parsetree（AST）
     ▼
┌──────────┐
│ 语义分析  │  ppx 预处理
│ (Typing) │  类型推导与检查
└────┬─────┘
      │ Typedtree
      ▼
┌──────────┐
│ Lambda    │  去糖、模式匹配编译
│ 中间语言   │  闭包变换
└────┬─────┘
      │ Lambda IR
      ▼
┌───────────┐   ocamlc 路径
│  字节码生成  │ ──────────────▶ .byte（字节码可执行）
│ (Bytecode) │
└───────────┘
      │
      │   ocamlopt 路径
      ▼
┌───────────┐
│  CMM 生成   │  Closure/Flambda 优化
│ (CMM IR)   │
└────┬──────┘
     │
     ▼
┌───────────┐
│  汇编生成   │  寄存器分配
│ (Asmgen)   │  指令选择
└────┬──────┘
     │
     ▼
┌───────────┐
│  目标文件   │  .o / .cmx
│ (Native)   │  链接为可执行
└───────────┘

各阶段详解

1. 词法分析与语法分析

源码文本被拆分为 token 流，再由 Menhir（或 ocamlyacc）解析为 Parsetree（未类型化的 AST）。

(* 源码 *)
let add x y = x + y

(* Parsetree（简化表示） *)
Pstr_value (Nonrecursive,
  [{ pvb_pat = Ppat_var "add";
     pvb_expr =
       Pexp_fun (Nolabel, None, Ppat_var "x",
         Pexp_fun (Nolabel, None, Ppat_var "y",
           Pexp_apply (Pexp_ident "+",
             [(Nolabel, Pexp_ident "x");
              (Nolabel, Pexp_ident "y")]))))
  }])

2. 类型检查（Typing）

类型检查器遍历 Parsetree，执行 Hindley-Milner 类型推导，输出 Typedtree。此阶段：

解析所有类型注解
推导缺失的类型
检查模式匹配的完整性
解析模块路径

(* Typedtree 中的表达式携带类型信息 *)
Texp_ident (path "Stdlib.+",
  { val_type = int -> int -> int })

3. Lambda 中间语言

Typedtree 被翻译为 Lambda IR，这是编译器的第一个低级中间表示：

(* Lambda IR 表示 *)
Llet (Strict, "x", Lconst (Const_base (Const_int 1)),
  Lapply {
    ap_func = Lident "add";
    ap_args = [Lvar "x"; Lconst (Const_base (Const_int 2))];
    ap_loc = Location.none;
  })

Lambda 阶段完成的关键变换：

变换	说明
模式匹配编译	将 match/let 编译为决策树或跳转表
闭包变换	将高阶函数编译为闭包数据结构
去糖	移除 `let`/`begin`/`end` 等语法糖
异常处理	`try...with` 编译为异常处理器安装/卸载

4. 字节码 vs 原生码

特性	字节码 (`ocamlc`)	原生码 (`ocamlopt`)
编译速度	快	慢
运行速度	较慢（解释执行）	快（机器码）
可移植性	跨平台（虚拟机）	平台特定
调试支持	优秀（`ocamldebug`）	有限
输出文件	`.byte`	原生可执行文件
启动速度	需要加载 VM	直接执行

# 字节码编译
ocamlc -o main.byte main.ml

# 原生码编译
ocamlopt -o main main.ml

# 字节码调试
ocamldebug main.byte

ocamlopt 优化 Pass

优化流水线

Lambda
  │
  ▼
Closure conversion（闭包转换）
  │
  ▼
Flambda（可选，实验性优化框架）
  │   ├── 内联 (Inlining)
  │   ├── 常量传播 (Constant propagation)
  │   ├── 死代码消除 (Dead code elimination)
  │   └── 循环不变量外提 (Loop-invariant code motion)
  │
  ▼
CMM (C-- 中间语言)
  │
  ▼
指令选择 (Instruction selection)
  │
  ▼
寄存器分配 (Register allocation)
  │
  ▼
汇编代码生成

内联优化

内联是最重要的优化之一，将小函数体直接替换调用点：

(* 原始代码 *)
let double x = x * 2
let result = double 21

(* 内联后 *)
let result = 21 * 2

(* 进一步常量传播 *)
let result = 42

编译器的内联启发式：

因素	影响
函数体大小	越小越容易被内联
调用频率	热点函数优先
是否递归	递归函数通常不内联
`[@@inline]` 注解	强制内联
`[@@unrolled]` 注解	展开循环

let[@inline always] fast_add x y = x + y
let[@inline never] complex_fn x = (* 大函数体 *)

⚠️ 注意：[@inline always] 是提示而非保证。编译器可能在函数体过大或存在递归时忽略。

模式匹配编译

模式匹配被编译为决策树（decision tree），编译器选择最优的测试序列：

(* 源码 *)
match x with
| (true, 0)  -> "a"
| (true, n)  -> "b"
| (false, 0) -> "c"
| (false, _) -> "d"

(* 编译后的决策树（简化） *)
if fst x then
  if snd x = 0 then "a"
  else "b"
else
  if snd x = 0 then "c"
  else "d"

编译器对模式匹配的优化策略：

共享前缀：相同前缀的模式共享测试
跳转表：连续整数模式编译为查表
默认分支：通配符模式减少测试次数

CMM 后端语言

CMM（C Minus Minus）是 OCaml 编译器自定义的低级 IR，类似于 C 语言但面向寄存器机器：

; CMM 示例（简化）
(function "add" (x: val y: val)
  (let (r (+ x y))
    (return r)))

CMM 之后被翻译为目标架构的汇编代码。OCaml 支持的后端架构：

架构	状态
x86-64 (Linux/macOS/Windows)	主要支持
ARM64	主要支持
RISC-V	社区支持
s390x	社区支持

编译器源码阅读指南

源码结构

ocaml/
├── parsing/          # 词法/语法分析
│   ├── lexer.mll     # 词法器（ocamllex）
│   ├── parser.mly    # 语法器（Menhir）
│   └── parsetree.mli # Parsetree 定义
├── typing/           # 类型检查
│   ├── typecore.ml   # 表达式类型检查
│   ├── typedecl.ml   # 类型声明检查
│   ├── typemod.ml    # 模块类型检查
│   └── typedtree.mli # Typedtree 定义
├── lambda/           # Lambda IR
│   ├── lambda.mli    # Lambda 定义
│   ├── matching.ml   # 模式匹配编译
│   └── simplif.ml    # Lambda 简化
├── asmcomp/          # 原生码编译
│   ├── closure.ml    # 闭包转换
│   ├── flambda/      # Flambda 优化（可选）
│   ├── cmmgen.ml     # CMM 生成
│   └── asmgen.ml     # 汇编生成
├── bytecomp/         # 字节码编译
│   ├── bytegen.ml    # 字节码生成
│   └── interp.ml     # 字节码解释器
├── driver/           # 编译器驱动
│   ├── main.ml       # ocamlc 入口
│   └── optmain.ml    # ocamlopt 入口
└── utils/            # 工具模块
    ├── misc.ml
    └── warnings.ml

如何贡献 OCaml 编译器

贡献流程

阅读 Contributing Guide
选择 Issue：标记为 good first issue 的适合新人
Fork + Branch：从 trunk 分支创建功能分支
实现 + 测试：确保 make tests 通过
提交 PR：到 GitHub ocaml/ocaml 仓库

贡献类型

类型	适合人群
文档改进	所有人
错误消息优化	有使用经验者
测试用例	有使用经验者
Bug 修复	熟悉编译器结构者
新特性	需讨论 RFC

业务场景

场景：优化热路径代码

了解编译器优化可以帮助编写更高效的代码：

(* ❌ 每次调用创建闭包，阻碍内联 *)
let process items =
  List.map (fun x -> x * 2 + 1) items

(* ✅ 使用命名函数，编译器更容易内联 *)
let transform x = x * 2 + 1
let process items = List.map transform items

(* ✅ 使用数组循环，避免闭包和分配 *)
let process arr =
  for i = 0 to Array.length arr - 1 do
    arr.(i) <- arr.(i) * 2 + 1
  done

场景：阅读编译器错误定位问题

当看到晦涩的类型错误时，理解 Typedtree 可以帮助定位：

Error: This expression has type string but an expression was expected of type
         int
       Hint: Did you mean to use string_of_int?