他山之石:调试之剑
弗雷德里克·布鲁克斯( F r e d e r i c k P·B r o o ks ) 博士在他那篇著名的《没 有 银弹— 软件工程 中的根本和次要问 题》 一文 中 , 将软件项目比作可怕的人狼 (w e r e w o l v e s ) , 并大胆地预言十年内不会 找到特别有效 的银 弹 。 该论文发表的时 间是 19 8 6 年 , 如今整整 2 0 年过去了 , 尽 管不时有人惊呼找到 了神奇的银弹 , 但是 冷静的人们很快发现那只是美好的愿望 。
如果说 软件工业 中与人狼 的战 斗还在持续 , 那么在这些战役 中一 定会有程 序 员的身影 , 笔者 也是 其中的一个。 我的 编程生涯是从使用汇编语言编写 D O S 下 的 T SR 程序开始的。 今天 D O S 操作 系统 已经成为历史 , 在那个年代最值得炫 耀 的 T S R 技术也早 已经过时了 。 十几年 中 ,O W L、V F W、V D X、ISA P I、A e ti v e M o v i e 等技术也被 时间淘汰… …然而 , 在这漫 长的时间当中 , 我最看重的是软件调试技术。它是十几年中我学到的最有用、一直受用、而且 日久弥新的一项技术。
从软件 工程 的角度来讲 , 软件调试 是软件 工程 的一个重要部分 , 软件调试 过程 出现在软 件工程的各个阶段 。 从最初的可行性分析、原型验证、到开发和测试阶段、再到发布后的维护与支持,都有调试过程的参与。通常认为,一个完整的软件调试过程由以下几个步骤组成:
- 重现故障
通常是用于调试的系统上重复导致故障的步骤,使要解决的问题出现在被调试的系统中。 - 定位根源
及综合利用各种调试工具,使用各种调试手段寻找导致软件故障的根源 (o r o t c a u s e )。通常测试人员 报告和描述的是软件界面或工作 行为中所表现出的异常 , 或者是 与软件需求 和 功能 规约不 符 的地方 , 泛 指软 件 缺 欠(d e f e c t ) 或者故障 (f a i l u e r )。 而这些表面 的缺欠总是 由于一或 多个内在 因素所 导 致的 。 这些内因要 么是代码的行为错误 , 要么是不行为错误 (该作而未作 )。 - 探索和 实现解决方案
即根据寻 找到的故障根源 、 和资源情况 、 紧迫程度 等要求设计和实现解决方案。 - 验证方案 ,
在 目标环境中测试方 案的有效性 , 又称 为回 归 (e r g e r s s ) 测试。 如果 问题 已 经解决 , 那么 就可以关闭问题。 如果没有解决则回到第 3 步调 整和修 改解决方案 。
这些步骤 中 , 定位根 源常常是最困 难也是 最关键的步骤 , 它是软件调试过 程 的核心 和灵魂 。 如果没有找到故障根源 , 那 么解决方案便很是隔靴搔痒 , 或者 头痛医脚 , 白白浪费了时 间。 对软件调试的另一种更通俗的解释是指使 用调试工具求解各种软件 问题的 过程, 例如跟踪软件的执行过程, 探索软件本身或者与其配套 的其它软件或者硬件 系统的工作原理等 , 这些过程 的 目的有可 能是为了去除软 件缺欠, 也 可能不是 。
在了解了软件调试技术的基本概念 以后 , 下面我们来看一 下支撑软件调试 技术的几种基本机制 。
- 断点 : 即当被调试程序执行到某一 空 间或时间点时将其中断 到调试器 中。 根据中断条件分为如下几种 :
a、代码断点: 当程序执行到指定 内存 地址的代码时中断到调试器 。
b、数据断点 : 当程序访问指定内存地 址的数据时中断到调试器 。
c、I/O 断点: 当程序访 问指定 1 / 0 地址 的端口 时中断到调试器 。
根据断点的设置方法 , 断点又分为软 件断 点和硬件断点。 软 件断点通常是通过 向指定的代码位置插入专用的断点指令来实现的 . 比如 IA 32 C p U 的 IN 丁 3指令 (机器码 为o x C C ) 就是断点指令。 硬件断 点通常是通过 设置 C PU 的调试寄存器来 设置的。 IA 3 2 C PU 定义了 8 个调试寄存 器 , D R O一 D R 7 , 可以最多同时设置 4 个硬 件断点〔对于一 个调试会话)。 通过调试寄 存器可以设置以上三种断点中的任一种, 但是通过断点指令只可以设置代码断点。 - 单步跟踪 : 即让应用程序按照某单 位一步步执行。 根据单位 , 又 分几种:
a、每次执行一 条汇编指令 , 称为汇 编语言一级的单步跟踪。 设置 IA 32 C Pu 标志寄存器的 T F (rT 叩 lF a g , 即陷阱标 志位 ) 位 , 便可以让 C P U 每执行完一条 指令便产生一 个调试异常 (N I T I ) , 中断 到调试器 。
b、每次执行源代码 (比汇编语 言更 高级的程序语言, 如 C / C料 ) 的一条语句 , 又称为源代码级的单步跟踪 。 通常高级 语言的单步跟踪是通过反复设置 C P U 的 陷阱标志位来实现的, 如果 当前源代码行还没有执行完 , 那么调试器重新设置 陷阱 标志并让程序继续执行, 直到该语句结 束(E I P 指向另一语句 ) 才中断给用 户 。
c、每次执行一个程序分支 , 又称 为 分支到分支单步跟踪。 设置 IA 32 c Pu 的o bg e t lM s R寄存器的 B T F (B ra n e h T ra pF l g a )标志后 , 便可以启用分支到分支单 步跟踪 。
d、每次执行一 个任务 (线程) , 即当 一个任务 (线程 ) 被调度执行时中断到调 试器 。 IA 3 2 架构所 定义 的任 务状态段( T Ss ) 中的 T标志为实现这一功能提供 了 硬件一级的 支持 , 但 是很多调试器还 有 提供这项功 能。 - 栈 回溯 (s ta e k ba e k ta r e e ) : 即通过记 录在栈中的 函数返 回地址显示 (追溯 ) 函 数调用过程 。 在将返 回 地址翻译 成函数 名时需要有调试符号 ( de b u g sy n t b o l ) 的 支持 。 大 多数编译 器都支持 在编译时生 成调试符号 。 微软的调 试符号服 务 器
( h t t P: // m s d lm ie r o s o f te o m /d o w n lo a d /sy n t b o ls )提供 了大 多数Wi n d o w s 系统文件 的调试符号 , 是调试和学习w id n o w s操作 系统的宝贵资源。 - 调试信息输出(de b铭 o u tP u印i r n t ) : 即将程序运行 的位置 、 变量状态等信 息 输出到调试器 、 窗 口 、 文件或者其它可以 观察到的地方 。 这种方法的优点是 简单方便、不依赖于调试器 , 但也有明显的缺点 , 如效率低 , 安全性差 , 通常不可以动 态开启 , 且难以管理等 。 在W i n d o w s 操作 系统中 , 驱动程序可以 使用 D b g r P in t /D b g P i r in E x 来输出调试信息 , 应用程序可 以调用o u tP u tD e b u g s i t r n g API
- 日志 ( 1 0 9 ) : 将程序运 行的状态信 息写人到特定的文件或者数据库中。 W in d o w s 操作 系统提供 了记录、观察和管理 (删除和备份 ) 日志的功能 。 Win do w s v is a t 新引入 T 名 为 C o m m o n L o g F i le s y s t e m (c L s F . S Y s ) 的内核模块 , 用于进一步加 强 日志功能 。 .
- 事件迫踪 (e v e n t t r a e e ) : 通 常用来 监视频 繁的复杂的软件过程 , 满足普通 日志机制难以胜任 的需求 。 比如监视大 信息t 的文件操作、 网络通信等。 E T W ( E v e n t T r a c e f o r Wi n d o w s ) 是Wid n o w s 操 作系统内建的事件追踪机制 , Wi n d o w s 内 核本身和很多W in do w s下的软件工具(如 B o v o t i s , T C即 P V ie w )都使用了该机制 。
在以 上机制中 , 断 点和单步跟踪通常必须在有调试 器参与的情况下才能使 用 。 调试器 ( s o f t w a e r de b u g g e r ) 是综合提 供 各种调试功能的软 件工具 。 除了处理断点、单步跟踪、模块映射等调试事件外 , 调试器通常还提供如下功能 :
- 观察和编辑被调试程 序的内存和数据 , 如全局变量、局部变量、以及程序的栈和堆等重要数据结构 。
- 观察和 反 汇编被调试程序的代码。
- 显示线程栈 中的函数调 用信息 。
- 管理调试符号 。
- 控制进程和线 程 , 例如将 被调试 程序中断到调试器中 , 和恢 复其执行 等。
根据调试器 所调 试目标程序的工作模式 , 可 以把调试器分 为用户态调试器 和内核态调试器 , 前者用于调试用户态下的各种程序 (应 用程序、系统服务 、 或者用户态的 D L L 模块 ) , 后者用于调试工 作在内核模式 的程序 , 如驱动程 序和操 作系统的内核 部分 。 Wi n D b g 是微软开 发 的一个免 费调试器 , 它既可以用 作用户 态调试器 , 也可以用作 内核态调试器 , 是调试 Win d o w s 操作系统下的各种软件的 一 个强 有力工 具 。 我 几乎 每天都使 用 w in D bg , 它是我 的计算机 中使用频率最 高的软件之一。
最后 , 简要地描述一下软件调试技 术的几个特征。
系统性— 很多看似简单的调试机制 都是依靠系统 内的 多个部件协 同工作 而完 成的 。 以软件断点为例 , C P U 提供了 指令支持和硬 件级的异常机制 , 操 作系统将异常以调试事件的形式分发 给调试 器 , 调试器响应调试事件并与用户交互。 如果在做源 代码级的调试 , 那 么调试 器 又需要编译器所产生的调试符号来帮忙 。
全局性— 对于一 个软件项 目 , 应该 在项 目的设计 和架构阶段就制 定出全 局的调试支持机制 , 并贯彻实施。 比如 , 所有模块都应 该使用统一的 方法 来输出调试信息、记录 日志 、 报告错误 , 并公开 统一的 接 口 用做单元测 试和 故障诊 断 。 这样不仅可以避免重复工作 , 而且增加T 软件的 可调适性 (d e bu g g a bi一 i ty ) , 有利 于保证产品的质量和进度。
困难性— 《C 语言编程》 一书的作者 B r ia n K e r n ig ha n 曾经说过 , “ 调试天生就 比编写代码难上一倍 , 如果你 写出 了最聪明的代码 , 那 么你的智商就不足以 调试这个代码。 ” 因为 , 要调试一个程序 ,就必 须深刻理解它的 工 作原理 , 不仅要知道 h o w 和表 层的东西 , 还要知道w h y 和 深层次的 内幕。 另外 , 调试需要锲而不 舍的探索精神和坚韧的耐 力 , 这 也让很 多 人望而却步 。
综上所述 , 软件调试技术是与软 件 开发 密不可分的一门技 术 , 其初衷是 为了定位和 去除软件故障 , 但 因 为调试技术所具有 的对软件的 强大控制 力和观察 力 , 其应 用早已 延伸到 了很 多其它领域 , 比如逆向 工程 、 计算机安 全等等。 学习和 灵活运用软件 调试技术 , 不仅可以提 高程序 员的 工作效率 , 而且有 利于提升 对代码的感 知力和控制 力 , 加 深对软件和系统的理解。 此 外 , 调试技术 是解决各 种软件 难题 的一 种有效 武器 。 它直击要害 、 锐不可档 , 相对其 它间接方 法具有明显的优势 。 软件有大美 , 调试 见真功。 在寻找银 弹的 努力还 在继续的时候 , 衷心地 希望所有程序员朋友都学 会使 用调试这把利 剑吧 , 使用它为你披荆斩棘 , 帮你探索前进。 只要你的这把剑依然 锋利 , 那你的软 件青春就永远不老 。