编译原理习题3-9

✅ 3.9.1

Q（题目）：
扩展图 3.58 的表格，加入下列操作符：

Answer（答案）：

节点 n	nullable(n)	firstpos(n)
`n = c₁?`	true（因为可以为 ε）	firstpos(c₁)
`n = c₁+`	nullable(c₁)	firstpos(c₁)

Explanation（解释）：

Q（题目）：
通过构造最小状态的 DFA，证明下列正则表达式是等价的：

Answer（答案）：
参见 3.7.3 和 3.9.2 中的最小 DFA 图，可知它们都生成相同语言：由任意数量的 a 和 b 组成的字符串，即 Σ*（任意串）。

Explanation（解释）：

这些表达式从形式上不同，但都允许任意数量的 a 和 b 交替、混合、重复，因此它们的最小 DFA 是相同的（只有一个循环状态接收所有输入）。

Q（题目）：
构造下列正则表达式的最小状态 DFA：

是否能发现规律？

Answer（答案）：

Pattern（规律）：

对于正则 (a|b)*a(a|b)ⁿ，DFA 至少需要 2n 个状态：

Q（题目）：
正式证明：对正则 (a|b)*a(a|b)...(a|b)，其中末尾有 n-1 个 (a|b)，任何 DFA 至少需要 2n 个状态。

Hint 提示：
观察 3.9.4 的模式，每个状态记录了输入的历史信息。

Answer（答案）：

我们构造 DFA 时需要记录：

因此：

Conclusion（结论）：

为了处理这种历史相关的匹配任务，必须区分多种前缀路径，DFA 无法通过合并状态减少状态数，因此状态数下界为 2n。