wenmo8 发布的文章

他山之石：软件调试相关方面

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

由于软件调试是软件质量鉴定工作必须具备的前提条件 , 而且软件调试过程关系到软件质量的优劣 , 所以 , 专门讨论软件调试技未的有关内容。

目前 , 软件设计人员中存在着一种错误的认识 , 即认为软件调试只是为了证明自己设计的软件或怪序的正确性。在这种思想指导下 , 软件设计人员往往会选择简单的调试方法和简单的数据情况 , 往往仅完成主要功能的调试 , 这就造成了调试过程不全面、不完整 , 使软件在投入实际运行后无法长期可靠的工作。

正确的软件调试作用为: 软件调试是为了发现错误而执行软件的过程。结果通过软件调试发现了错误 , 并不是证明了软件设计的失败 , 而恰好是增加了软件的可靠性和应用价值。所以 , 软件调试是软件开发中地位十分重要的一个工作阶段。

软件调试工作应遵循的原则

根据软件所具有的功能、结构和数据类型来选择调试方案和调试的重点。
从心理学和调试有效性而论 , 软件设计者不应调试自己的软件。如果没有条件做到这一点 , 可以采用一些集体工作的措施来弥补。
在软件调试中, 不但要对那些合法的、正常的情况进行调试 , 而且要对那些非法的、异常的情况进行调试。调试应对软件具有一定的破坏力。
在软件调试中, 不但要检查软件是否完成了应完成的功能 , 而且要检查软件是否完成了不应有的功能。
任何调试数据、调试结果和错误内容都是极有价值的资料 , 应认真地分析、保存。某些情况可能需要反复调试、纠错。
国外的有关统计资料表明: 已发现较多错误的软件与已发现较少错误的软件相比较 , 前者仍存在错误的概率较大。
国外的研究资料表明: 要结束一个软件的调试过程是有条件的 , 是根据诸多因素( 如已发现的错误率、查错效率、调试覆盖率等 ) 综合分沂后做出的。

软件调试的几种工作方式

软件调试中常见的几种工作方式和工作内容见表 l 。在适用范围一栏中, 根据调试的规模分了三个等级: 模块级、功能级、系统级。各等级的任务如下:

模块调试: 对相互独立的各个模块在各种条件下进行运行 , 检查模块内部的运算和逻辑关系、控制关系的正确性。
程序功能调试: 对于组成某一功能的各个模块进行联调 , 检查在各种条件下的执行过程和执行结果 , 特别是模块之间的层次关系和信息交换的正确性。
系统调试: 将各个功能的程序汇合 , 在实际或模拟的工作环境中, 检查输入、输出是否符合要求 , 测定并评价软件的各项性能 , 提出改进意见。

由于三个等级的调试内容与规模不同 , 所采用的工作方式和工作方法也不相同。一般地说 , 由数人组成的软件调试小组可以达到相互启发 , 集思广议 , 相互检查 , 认真高效的工作目的。但这要求软件调试小组的每个成员在软件设计与调试技术方面 , 在微机使用方面 , 在对整个系统功能与性能的理解方面 , 具有较高的水平与深刻的认识。

软件调试方法

软件调试中经常采用的方法见表 2 。逐步增长和非增长式两种调试方法 , 各有优缺点 , 列举如下:

非增长式调试需要完成更大的工作量。
逐步增长式调试中 , 由于及时地完成了模块的组合调试, 模块之间的接口错误和由多个模块运行产生的功能错误 , 能及早地发现。
利用逐步增长式调试 , 寻错纠错比较容易。
逐步增长式调试可以更彻底地对软件进行调试。
非增长式调试需用的机器时间较少。
用非增长式调试 , 在整个调试阶段有可能并行工作。
在逐步增长式调试法中 , 自顶向下调试的缺点是很难产生调试条件, 调试的相当时间内无法考察结果输出。而自底向上调试的缺点是必须给出调用模块 , 在加人最后一个模块之前 , 程序不能作为一个整体存在。
在非增长式调试法中, 黑盒法的缺点是寻错纠错极困难 , 白盒法的缺点是工作量太大。综合比较起来 , 逐步增长式调试法是一种比较好的方法 , 适用于工程应用类软件 , 建议推广实施。如果数人同时采用逐步增长法对同一个软件进行调试 , 就可以达到相互补充、完整调试的目的。

调试工作中应注意的几点

调试前应认真地查阅有关设计资料 , 避免出现对软件设计任务书的理解不准确、不完整而造成的软件设计中的缺陷。
调试中应认真地检查程序结构 ( 是否采用模块结构 ) 和指令使用 ( 如运算指令使用不当 , 转移指令使用太多等 ) 。
调试中一定要对程序进行破坏性试验 , 考核程序的可靠性。
调试结束前 , 应把以前完成的各个调试情况复现一遍 , 避免由于纠正某个程序错误而出现了其他的错误或缺陷。
调试完成后 , 应尽可能的对程序进行优化 , 提高程序质量。

软件调试技术中几个研究专题

为了更有效、更经济地开展软件调试工作 , 有必要在以下两个方面进行研究 :

应重视软件调试数据与结果的收集、分析工作。目的有两个: 第一 , 统计软件出错类型和产生错误的原因 , 以便于在今后的软件开发中加以克服 , 第二 , 分析各种调试措施或数据条件对各类错误的有效性 , 建立起一套高效的调试原则。
利用积累的调试经验 , 建立软件可靠性分析 , 软件错误预测的模型 , 为寻找结束调试的最佳时机提供参考或依据。

软件调试工作是软件开发中最复杂、最具有技术性和技巧性的工作 , 所以 , 应大力地并展研究和提高工作 , 保证软件具有优良的质量与性能。

随软件向大型化和复杂化方向发展 . 软件调试的难度也在不断增大。对于一些小的软件我们可以不讲究什么方法 . 只要通过插入print语句等简单手段就可以解决问题但是如果是要调试一个比较大的系统 . 不讲究必要的调试技巧就会多花费很多时间甚至根本行不通了。
那么如何掌握调试技巧 , 提高调试效率呢？学习基本的调试原理是第一步 . 试想如果我们不了解调试工具的工作机制 , 那么怎么可能最大限度地发挥其功能呢。如果我们根本没听说过硬件断点 . 那么我们怎么能利用它解决普通软件断点无法完成的任务呢 ?
从宏观来看 . 软件调试是调试工具、系统软件 (操作系统)和C P U 这三者密切配合、相互协作的一个复杂过程。简单来说CP U 为软件调试提供了硬件一级的支持 , 是很多调试功能的根本基础: 操作系统负资协调管理 CPU 所提供的硬件支持 ,并为各种调试工具提供服务；调试工具与调试人员直接交互，使操作系统和CPU所提供的调试支持真正可用。

下面 , 便以 IA 一3 2 处理器《CP U ) 为例介绍 CP U 对软件调试的支持。 IA 一 3 2 处理器是指英特尔3 2 位架构 ( l n t e l ? rA c h i一tc e t u r e 3 2一b it ) 处理器 . 即从 38 6 开始的 x 8 6 处理器 . 包括i3 86 、i4 86、奔腾、p 6 系列和奔腾 4 系列处理器。

可以将 lA 一 3 2 处理器的调试支持简单概括如下：

INT3 指令— 又叫断点指令 . 是软件断点的实现基础。
标志寄存器 F L A G S 的 TF 标志— 陷阱标志位 . 是单步执行的实现基础
断点地址寄存器 D R0一 D R 3— 用于设置断点地址 (线性内存地址或 l /O 地址 ), 是硬件断点的实现基础。
断点控制寄存器 DR 7— 用来控制和进一步描述四个调试地址寄存器 (D R O一D R 3 ) 的断点条件
断点状态寄存器 DR 6— 当断点发生时 . 向调试器报告该断点的具体情况, 以便调试器区分发生的是哪个断点。
断点异常 (# BP) 一当 INT3 指令执行时 , 会导致此异常.CPU 转到该异常的处理程序。
调试异常 (# DB ) 一当除 INT 3 指令以外的调试事件发生时会导致此异常。
任务状态段 (T S )S 的T 标志任务陷阱标志 , 当切换到设置了 T 标志的任务时 , 中断到调试器。
分支记录机制用来记录上一个分支、中断和异常的地址等信息。

下面我们分几块对以上内容做进一步讨论：

软件断点

X8 6 系列处理器从其第一代产品英特尔 8 0 8 6 开始就提供了一条专门用来支持调试的指令INT 3。简单来说 , 这条指令的目的就是使 CP U 中断 (陷入 ) 到调试器 . 以供调试者对执行现场进行各种分析。
下面通过一个小实验来感受一下INT 3 指令的工作原理。
在 V is u a l C + + S tu d io 6.0 ( 以下简称 v C 6 ) 中创建一个简单的He l l o w o r l d 控制台程序HIn t 3 然后在m a i n () 函数的开头通过嵌入式汇编插入对INT3指令的调用 :

当在 V C 环境中执行以上程序时 . 会得到以下对话框 , 点O K 按钮后程序便会停在 N I T 3 指令所在的位t 。由此看来我们刚刚插入的一行 (asm INT 3 ) 相当于在那里设了一个断点 .

这正是通过注入代码手工设盆断点的方法 , 这种方法在调试某些特殊的程序时还非常有用。
w id n o w s 操作系统还提供了相应的 A P I 用于手工断点 . 例如用户模式T 的De bu g B re a k ( ) 和内核模式下的DbgBreakPoint（），DbgBreakPointWithStatus()。把刚才的小程序中的对 INT 3 的直接调用改为调用 Win do w s A PI De bug B r e a k ( ) (需要在开头 Include< w id n o w s.h> ) . 然后执行可以看到产生的效果是一样的。通过反汇编很容易看出这些 AIP 在x 8 6 平台上其实都只是对INT 3指令的简单调用。

在 windbg 中启动本地内核调试 (参见 w in d b g 帮助文档 ) 然后使用u命令进行反汇编。提示符 Ikd> 的含义是 “ Lo c a l ke r n e l d “ 。本地内核调试需要Wind o w s XP或以上操作系统才支持。
用来对齐的,没有实际意义。3 2 位 C户 U 通常需要内存和可执行文件以 4 字节对齐。
DbgBreakPointWithStatus()允许向调试器传递一个整型参数。

那么C PU是如何从被调试程序调到调试器的呢 , 这一机制的全部工作过程因操作系统和被调试程序的执行模式 (用户模式还是内核模式 ) 的不同而有所不同。目前我们可以作出如下简单理解 :
C p U 把 INT 3 指令处理为一种软件异常 . 当执行INT 3指令时 C PU 会把当时的程序指针 ( C S 和 EIP) 压入堆栈保存起来,然后通过中断向量表调用 lNT 3 所对应的中断例程。当我们在调试器中运行程序时 . 调试器会直接 ( DOS 时代 ) 或间接(通过操作系统的 A P I ) 注册这个中断服务因此当 INT 3 中断发生时 . 调试器的代码会被调用而执行。在实模式下CPU 的执行逻辑如下 :

这是针对实模式的情况保护模式下会更复杂 . 但原理 ’类似。
对于INT 3指令 ,v e c t o r _ n um b e r 为 3.这个操作过程本适用于所有软件中断和异常。
# G P 即 Ge n e r a l Protection Exception , 常规保护性错误。也就是说当中断向量表的长度 (Lim i t ) 不足以包含本向量时，C P U便会产生常规保护异常。
IF语句的结束语句
当堆栈不足以容纳接下来要压入的6字节内容时，便产生堆栈异常

下面考虑一下调试器是如何设置断点的。当我们在调试器中对代码的某一行设断点时，调试器会先把这里的本来的指令的第一个字节保存起来。然后写入一条INT 3指令。因为INT 3指令的机器码为0xCC,仅有一个字节，所以设置和取消断点时也只需要保存和恢复一个字节。这是设计这条指令时便考虑好的。顺便说一下，虽然VC6是把断点的设置信息(断点所在的文件和行位置)保存在和项目文件相同位置且相同主名称的一个.opt文件中。但注意，该文件并不保存每个断点处应该被INT 3指令替换掉的那个字节。因为这种替换是在启动调试和调试过程中动态进行的。这可以解释有时我们在VC6中，在非调试状态下，我们甚至可以在注释行设置缎带你。当开始调试时，会得到一个图2所示的警告信息。这是因为当用户在非调试状态下设置断点时，VC6只是简单的记录下该断点的设置信息。当开始调试时，VC会一个一个的取出OPT文件中的断点记录 . 并真正将这些断点设置到目标代码的内存映像中。也就是要将断点位置对应的指令的第一个字节先保存起来 , 再替换为C C . 即 INT 3 指令 . 这是如果 VC 6 发现某个断点的位置根本对应不到目标映像的代码段 , 那么便会发出图 2 所示的警告。

下面说说INT 3 断点被触发时的悄形 . 我们仍以V C 6 为例 .也就是使用 VC 6 调试一个普通的 3 2 位 W in d o w s 应用程序。当Cp U 执行到 INT 3 指令时 . 由于 INT 3指令的设计目的就是中断到调试器 . 因此CPU 执行该指令的过程也就是准备产生断点异常 (Breakpoint exception简称# B P)并转去执行异常处理例程的过程。 W in d o w s下所有异常和中断都是先由内核例程处理的. 因此应用程序中的 INT 3会导致 C U P 从用户模式转入内核模式并执行nt!KiTrap03例程。接下来经过几个内核函数的处理 .因为这个异常是来自内核模式的. 而且该异常的拥有进程正在被调试 (内核函数可以得到这些信息 ) . 所以内核例程会把这个异常分发给用户模式的调试器 . 这里也就是VC 6 。接下来V C 6会根据异常的发生位置 (记录在每个异常的附属数据结构中) 试图寻找一个与其匹配的断点记录。如果找不到 . 那么就说明
导致这个异常的INT 3 指令不是 v C6 动态替换进去的 , 因此会显示一个图 1 所示的对话框. 意思是说一个 “ 用户 “ 插入的断点被触发了。另外值得说明的是 . V C 6 在每次中断到调试器时 .会先将所有断点处替换为 INT 3的指令恢复成原来的指令 , 然后再把控制权交给用户。所以在调试器下 . 我们是看不到动态插入的 INT 3指令的.

还想介绍一个有趣现象。当我们用 VC 6 进行调试时 , 常常会观察到一块刚分配的内存或字符串数组里面被坟充满了CC。如果是在中文环境下 . 因为x o C CC C 恰好是汉字 ` 烫 ` 字的简码 . 所以会观察到很多 ` 烫烫烫烫烫烫… ’ . CC 正好是 INT 3 指令的机器码 . 这是偶然的么? 答案是否定的 . 因为这是有意为之 . 为了辅助试调试版本的运行库会用0xCC 来填充刚刚分配的缓冲区 . 这样如果因为缓冲区或堆栈溢出时程序指针意外指向了这些区域 . 那么便会因为遇到这些自动填充的 INT 3指令而马上中断到调试器。另一方面 . 编译器也经常用 INT 3指令来填充函数或代码段末尾的空闲区域。这也可以解释为什么有时我们没有手工插入任何对 INT 3的调用 . 但是也会遇到图 1 所示的对话框。因为使用 INT 3 指令产生的断点是依靠插入指令和软件中断机制工作的 . 因此人们习惯把这类断点成为软件断点 . 软件断点具有如下局限性 :

属于代码类断点 , 即可以让 C PU 执行到代码段内的某个地址时停下来 . 不适用于数据段和 1 / 0 空间。
对于在RO M ( 只读存储器 ) 中执行的程序 ( 比如 B I O S 或其它固件程序) . 无法动态增加软件断点。因为目标内存是只读的 . 不能动态写入断点指令。这时就要使用我们后面介绍的硬件断点。
当中断向量表或中断描述表 (IDT）没有准备好或遭到破坏的情况下这类断点无法或不能正常工作的。比如系统刚刚启动时或者IDT被病毒窜改后。这时只能使用硬件级的调试工具。

虽然软件断点存在以上不足 . 但因为它使用方便 , 而且没有数量限制 (硬件断点需要寄存器记录断点地址 . 有数量限制 ),所以目前仍被广泛应用。
关于 INT 3指令还有一点要说明的是 . IN T 3 指令与当n=3时的 INT n 指令 (通常所说的软件中断) 并不同. INT n 指令对应的机器码是CD后跟 1字节n 值 . 比如INT 23H 会被编译为CD23 。与此不同 INT 3 指令具有独特的单字节机器码 CC 。也就是当编译器看见 IN T 3 时会特别的将其编译为 CC . 而不是 CD 0 3。尽管没有那个编译器会将 INT 3 编译成 CD 0 3. 但是可以通过某些方法直接在程序中插入 CD 0 3 。但是这样做会失去IN T 3 指令所具有的特殊待遇 (例如在虚拟 8086模式下免受IOPL检查).

CPU对软件调试的支持(二)

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

从38 6 开始 , IA 一3 2 处理器内部都含有 8 个 3 2 位的调试寄存器 DR0一 DR7 (如图 1 所示 )。除了 DR4 和 DR5 保留外 , 其它 6 个寄存器分别是 :

四个 3 2 位的调试地址寄存器 (DR0~DR3)
一个 3 2 位的调试控制寄存器 (DR7)
一个 3 2 位的调试状态寄存器 (DR6)

通过以上寄存器可以最多设置 4 个断点，其基本分工是DR0一DR3 用来指定断点的内存 (线性地址) 或l/ O 地址。 DR7 用来进一步定义断点的中断条件。 DR6的作用是当调试事件发生向调试器《d e b g u g , ) 报告事件的类别和属性 . 以供调试器判断发生的是何种事件 (哪个断点、单步跟踪、断点属性等等 )。下面分别详细介绍 D R 7 和DR6 的用法。

3 2 位的DR7寄存器中 , 有2 4 位是被划分成 4 组分别与 4 个调试地址寄存器相对应的.比如 L0 . G0 . R/ W0 和 LEN0这六位都是与DR0相对应的 .L1 . G1. R/ W1 和 LEN1 这六位都是与DR1相对应的依此类推。表 1 列出了DR7 中各个位的具体含义。

调试状态寄存器 DR6 是当 CPU 检测到匹配断点条件的断点时 . 用来向调试器的断点异常处理程序传递该断点异常的具体情况 . 以使调试器可以很容易的识别出发生的是什么断点。比如如果 BO被设置为1，那么就说明满足 DR0、 L E N 0、和 R/ W0 所定义条件的断点发生了。下面的表分别列出了 DR6 中各个位的具体含义。

通过表 1 的定义可以看出 . 调试控制寄存器的各个位域提供了很灵活的方式 .允许我们通过不同的组合定义出各种复杂的断点条件。下面我们先进一步介绍一下读写域R/ Wn , 通过对它的设里 , 我们可以指定要定义的断点的访问类型 (数据、代码还是 l/ 0 ) . 即断点的访问条件 :
1、读写内存中的数据时中断 , 这种断点又被称为数据访问断点 (data breakpointer )。利用数据访问断点可以监控对全局变量 , 或局部变量的读写操作。例如 . 在进行某些复杂的系统级调试 . 或者调试多线程程序时 , 我们不知道哪个线程在何时修改了某一变量，这时我们就可以设置一个数据访问断点。现代调试器大多还都支持复杂的条件断点，比如当某个变量等于某个确定的值时中断 . 这其实也是利用数据访问断点实现的 . 其基本思路是设置一个数据访问断点来监视这个变量 , 每次这个变量改变时 CPU 都会调用调试器的中断处理程序 ,调试器检查这个变量的值 . 如果不满足规定的条件就立刻返回让 CPU 继续执行。如果满足 , 就中断到调试环境。
2、执行内存中的代码时中断. 这种断点又被称为代码访问断点 (Code Br e a k Po in t 》或指令断点 (i n s tr u e t io n b r e a k po in t ) 。代码访问断点从实现的功能上看与软件断点类似 , 都是当 C PU 执行到某个地址的指令时中断。但是通过寄存器实现的代码访问断点具有一个软件断点无法实现的优点 , 就是不需要软件断点那样向目标代码处插入指令。这个优点在某些情况下非常重要。例如 . 当我们调试位于 RO M (只读存储器 ) 上的代码《比如 BIO S 中的 PO S T 程序 ) 时根本没有办法向那里插入软件断点 ( lNT 3 ) 指令 . 因为目标内存是只读的。另外软件断点的另一个局限是只有当目标代码被加载进内存后才可以向该区域设置软件断点。而调试寄存器断点没有这些限制. 因为只要把需要中断的内存地址放入调试地址寄存器 (DR0一DR3 ) . 并设置好调试控制寄存器 ( DR7 ) 的相应位就可以了。

3、读写 I/O(输入输出 ) 端口时中断 .这种断点又被称为I/O访问断点 ( I /O b r e a kp oi n t ) 。I/ O 访问断点对于调试设计使用输入输出端口的设备驱动程序非常有用。也可以利用 I/O 访问断点来监视对I/O空间的非法读写操作 . 提高系统的安全性。因为某些恶意程序在实现破坏动作时 . 需要对某些 I/O 端口进行读写操作。

读写域定义了要监视的访问类型 . 地址寄存器（DR0一DR3 ) 定义了要监视的起始地址。那么要监视的区域长度呢 , 这便是长度域 L E N n (n= 0, 1, 2,3 . 位于 D R 7 中 ) 的任务。L EN n 位段可以指定 1,2,4 或 8 字节长的范围。需要说明的是 :
1、对于代码访问断点 . 长度域应该为00,代表一字节长度。另外地址寄存器应该指向指令的起始字节。也就是 CPU 只会用指令的起始字节来检查代码断点匹配。
2、对于数据和 I/O访问断点 . 有两点需要注意 :
第一只要断点区域中的任一字节在被访问的范围内 . 都会触发该断点。
第二 , 边界对齐要求 . 两字节区域必须按字 (w o r d ) 边界对齐 : 四字节区域必须按双宇 (d o u b l e w o r d ) 边界对齐 : 八字节区城必须按四字 (qu a d w o r d ) 边界对齐。也就是说 . CP U 在检查断点匹配时会自动去除相应数量的低位。因此如果地址没有按耍求对齐可能无法实现预期的结果。例如假设希望通过将 DR0 设为0 x A 003.L E N 0 设为 1 1 (代表 4 字节长)实现任何对0 x A00 3 ~0 x A c 0 6 内存区的写操作都会触发断点: 那么只有当0 x A 00 3 被访问时会触发断点 . 对0x A 00 4、0x A 00 s 和0x A006 处的内存访问都不会触发断点。因为长度域指定的是4 字节所以CPU 在检查地址匹配时 . 会自动将起始地址0x A003 的低4 位屏蔽掉 , 也就是会被看作是0x A00 )。表3 给出了更多的例子用来说明断点的触发条件。

因为以上介绍的断点不需要像软件断点那样向代码中插入软件指令 , 依靠处理器本身的功能便可以实现 . 所以人们习惯上把这些使用调试寄存器 (DR0~DR7 ) 设置的断点叫硬件断点，以与软件断点区别开来。
l A 一 32 处理器专门分配了两个中断向量来处理调试异常向量1 和向量3。向量3 用来处理 INT 3 指令产生的断点异常。向量1 用来处理调试异常(de b u g e x c e pt io n . 简称 # DB ) 。硬件断点产生的是调试异常 .所以硬件断点发生时C U P 会执行 1 号向量对应的处理例程。

硬件断点其有很多优点 , 但是也有不足 , 最明显的就是数量限制因为只用 4 个调试地址寄存器 . 所以 lA 一3 2 Cpu 允许最多设置 4 个硬件断点。这基本可以满足大多数情况下的调试需要。

另一点祷要说明的是 . 只有在实模式或保护模式的内核优先级( ring0 ) 下才能访问调试寄存器 . 否则便会导致保护性异常。这是出于安全性的考虑. 那么像 v i s u a . s t u d i o 这样的用户态调试器是如何设一硬件断点 (VC 6 支持数据访问断点。没必要也不支持 l/ O 访问断点 , 因为从 Win d o w s 9 8 开始用户态下不允许进行直接 l/ O 读写 ) 的呢 ? 答案是通过访问线程的C ON E T X T 数据 (每个线程被挂起时 . 寄存器等上下文信息都被保存起来 . 当该线程恢复执行时 . 寄存器会被恢复回来) 来间接访问调试寄存器。

下面给出一个C + + 例子演示一下如何手工设置数据访问断点.

CPU对软件调试的支持(三)

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

两期我们分别介绍了通过 INT3指令设置的软件断点和通过调试寄存器设置的硬件断点。除了断点 . 还有一类常用的方法使C P U 中断到调试器 . 这便是调试陷阱标志 (debug trap f l a g ) 。也就是当这些陷阱标志被设置时，一旦有符合陷阱条件的事件发生，就会陷入到调试器。 IA 一3 2 处理器所支持的调试陷阱标志可以概括如下

80866就支持的单步执行标志 (标志寄存器E F a g I s 的一位)
3 8 6 引入的任务状态陷阱标志(任务状态段TSS 的T标志)
奔腾Pro引入的分支到分支单步执行标志 (D e b u gC t !寄存器中的BT F 标志)

下面分别详细介绍。

单步执行标志 (T F )

从 8 0 8 6 C pU 开始 , x 86 系列处理器的标志(EF Ia g s ) 寄存器中便有一个陷阱标志位 ( b i t 8 )名为Trap Flag 简称T F。当 T F 位为 1 时 CPU 每执行完一条指令便会产生一个调试异常《# DB ) . 中断到调试器的调试异常处理程序。这就是通常所说的单步执行。调试异常的向量号是 1 因此 T F 标志引发的是 1 号异常服例程。在 80 86 和 2 8 6 时代 , 这个服务例程是专门用来处理单步事件的。从 3 8 6 开始 . 硬件断点发.生时也会产生调试异常 . 调用 1 号服务例程 . 但可利用调试状态寄存器（DR66 ) 来识别发生的是何种事件。为了表达方便我们把因 T F标志触发的软件异常称为单步异常。

单步异常属于陷阱类异常。也就是 C P U 总是在执行完导致此类异常的指令后才产生该异常。这意味着当因单步异常中断到调试器中时，导致该异常的指令已经执行完毕了。软件断点异常(#BP) 和硬件断点中的数据及I/O 断点也是陷阱类异常. 但是硬件断点中的指令访问异常是错误类异常 . 也就是当由于此异常而中断到调试器时 . 相应调试地址寄存器 DRn中所指地址处的指令还没“执行。这是因为CPU是在取指操作时进行此类断点匹配的。

CPU是何时检查 TF标志的呢?’IA-32手册的原文是 "while an instruction is begin executed" 也就是在执行一个指令的过程中。尽管没有说过程中的哪个阶段 (开始、中间还是末尾 ) . 可以推测应该是一条指令即将执行完毕的时候。也就是说当CPU在将执行完一条指令的时候检测TF位 ,如果该位为 1那么 CPU会先清除此位 , 然后准备产生异常。但是这里有个例外 , 对于那些可以设置 TF 位的指令 (例如 POPF) CPU 不会在执行这些指令期间做以上检查。也就是说这些 ,旨令不会立刻产生单步异常 . 而是其后的下一条指令将产生单步异常。
因为 C P U 在进入异常处理例程前会自动清除 T F标，因此当 CPU中断到调试器中后再观察 TF标志 . 它总是0。

既然调试异常的向量号是 1 ,可不可以像 INT 3 那样通过在代码中插入INT 1 这样的指令来实现手工断点呢 , 对于应用程序答案是否定的。 INT 3尽管具有INTn的形式 . 但是它具有独特的单字节机器码 . 而且其作用就是产生一个断点异常一(#BP ) 。因此系统对其有特别的对待 .允许其在用户模式下执行。而 INT 1则不然，它属于普通的 INTn 指令机器码为 CD01。保护模式下如果执行 INTn指令时,当前的 CPL大于引用的门描述符的DPL。那么便会导致通用保护异常 (# GP) 。在 W id n o w s 20 0 0 和 x p 这样的操作系统下，INT1对用的中断门描述符的DPL 为 0 . 这要求只有内核模式的代码才能执行 IN T 1指令，访问该中断门。也就是说 , 用户模式下的应用程序没有权利使用INT 1指令。一旦使用就会导致一个一般保护性异常 ( # GP) 。W id n o w s会将其封装为一个访 `问违例错误 (如图2一 2 1 所示 )。在内核模式下可以在代码 (驱动程序)中写入INT 1指令。CP U 执行到该指令时会转去执行 1号向量对应的处理例程 , 如果在使用 W in D g b 进行内核级调试. 那么会中断到W i n o b g 中 . W i n o b g 会以为是发生了一个单步异常如图 1 所示。

下面谈谈调试高级语言时的单步机制。由于高级语言的一条语句通常都对应多条汇编指令例如 , 表 1 中C+ 十的一条语句= i a 十b* “ + d / e + f / g 十 h对应于 1 5 条汇编语句。因此容易想到单步执行这条C+ + 语句有几种可能方法。一种是也用一标志一步步的走过每条汇编指令 , 这种方法意味着会产生 1 5 次调试异常 . CPU 中断到调试器 1 5 次.不过中间的 1 4 次都是简单的重新设皿起下F 标志便让 CPU返回执行。第二种方法是在 C + + 语句对应的最后一条汇编指令处动态插入一条lN 下 3指令 . 让C P U 一下子跑到那里然后再单步执行一次将被替换的那条指令执行完 . 这种方法需要 CPU中断到调试器两次。第三种方法是在这条 C++ 语句的下一条语句的第一条汇编指令处( 即行 18 ) 替换入一个 N I 下 3 . 这样 C PU 中断到调试器一次就可以了。
表 1 : 高级语言的单步执行

后两种方法较第一种方法速度会快很多 . 但是不幸的是并不总能正确的预测出最后高级语言对应的最后一条指令和下一行语句开始指令 (要替换为INT 3 的那一条指令)。比如 2 8 行的 e l s e if (b ) 语句就很难判断出它对应的最后一条汇编语句和下一条高级语言语句的起始指令。因此今天的大多数调试器在进行高级语言调试时都是使用第一种方法来实现单步跟踪的。关于 TF标志还有一点值得注意： . INTn 和 INTO 指令会清除TF标志 , 因此调试器在单步跟踪这些指令时 . 必须做特别处理。

任务状态陷阱标志

除了标志寄存器中的陷阱标志 (TF ) 位.38 6 引入了一种新的调试陷阱标志任务状态段 (TSS ) 中的T标志。任务状态段 (Ta s k一S t a te S e g m e n t ) 用来记录一个任务 (CPU 可以独立调度和执行的程序段 ) 的状态 . 包括通用寄存器的值 . 段寄存器的值和其它重要信息。在任务切换时 , 当前任务的状态会被保存到这个内存段里。当要恢复执行这个任务时 . 会先根据这个记录来把寄存器的值恢复回来。 T S S 中 , 在宇节偏移为 10 0 的 1 6 位字 (w o r d ) 的最低位是调试陷阱标志位 . 简称 T标志。 T 标志被设置为 1，那么当CPU切换到这个任务时 , 便会产生调试异常。准确的说CPU 是在程序控制权已经转移到新的任务 , 但还没有开始执行新任务的第一条指令前产生异常的。调试中断处理程序可以通过调试状态寄存器 (DR6 ) 的 BT来识别出发生的是否是任务切换异常。值得注意的是 . 如果调试器接管了调试异常处理 . 而且该处理例程属于一个独立的任务 , 那么一定不要设置该任务的TSS段中的 T位。否则便会导致死循环。

分支到分支单步执行标志 ( B T F )

在 lA 一 3 2 处理器家族中 , 所有的 P e n i t u m Pr o Pe n t l u m II和 Pe n t . u m III处理器 (包括相应的 C e .e r o n 《赛扬 ) 和 X e o n (至强 ) 版本) 因为都是基于相同的 6 P 内核《C o r e ) . 因此经常被统称为P6处理器。 P6处理器引入了一项新的对调试非常有用的功能 : 记录分支、中断和异常事件 . 和针对分支单步执行(s in g le 一s z e p o n b r a n e h ) 的功能。奔腾 4 处理器对这一功能又做了很大增强。下面具体介绍一下按分支单步执行的功能和使用方法。
首先解释一下分支到分支单步执行的含义。前面我们介绍过 , 当 ElF a g s 寄存器的T F 位为 1 时 C PU 每执行完一条指令便会中断到调试器 . 也就是以指令为单位单步执行。顾名思义, 针对分支单步执行就是以分支为单位单步执行。换句话说 , 每单步 ( s t ep ) 一次 C P U 会一直执行到有分支、中断或异常发生。下面结合表 2 中的代码进行说明。
那么如何启用按分支单步执行呢? 简单来说 . 就是要同时设置TF和BTF 标志。TF 标志位干 E F Ia g s寄存器, 大家已经很熟悉。 BTF 标志位于名为DebugCtlMSR 寄存器中。

在V C6 的ID E 环境下(系统的 C PU 应该是 P6 或更高 ),先在第 2 2 行设置一个断点 . 然后按F5 运行到这个断点位置。行 1 9是用来启用按分支单步执行功能的 . 也就是设置BTF 标志. 细节我们等一下再讲。接下来 . 我们按 F10单步执行 , 会发现一下子会执行到行 3 1 . 从第 2 2 行单步一次执行到第 3 1 行这便是按分支单步执行的效果。那么为什么会执行到第 3 1 行呢? 按照分支到分支单步执行的定义 , CP U 会在执行到下一次分支、中断或异常发生时停止。对于我们的例子 . CP U 在执行第 2 0 行对应的第一条汇编指令时 , CP U 会检测到 TF 标志 (因为我们是按F10单步执行 . 所以 VC 6 会帮助我们设置TF 标志)。

此外 ,P6及以后的 lA 一 3 2 CP U 还会检变 BTF 标志 . 当发现BTF标志也被设置起时， C P U会认为当前是在按分支单步执行 . 所以会判断当前指令是否是分支指令 , 如果不是，CP U 便会继续执行。因为第 2 2 行的第一条汇编指令不是分支指令 . 所以 CP U 会继续执行。依次类推 . CP U 会连续执行到第 2 4 行的 i f 语句对应的最后一条汇编指令jne (参见表 3 )。因为这条语句是分支语句 ,所以 CPU会认为已经满足停止执行的条件 , 在清除 , TF 和BTF标志后,产生单步异常中断到调试器。中断到调试器时 . 分支语句已经执行完毕 , 但是跳转到的那条语句 (即表 2 中的行 3 1 } 还没有执行。

对以上过程还有有几点需要说明:

第一如果在从第 2 2 行执行到 2 4 行过程中,有中断或异常发生 , 那么 C P U 也会认为停止单步执行的条件已经满足. 因此按分支单步执行的全称是按分支、异常和中断单步执行。

第二 , CPU 认为有分支发生的条件是执行以下分支指令 :JM P (无条件跳转), JCC (包括条件跳转指令 , 如 J A 、 J A E、 JNE等等)、L OO P (循环 ) 和 Call（函数 / 过程调用 ) 。

第三 , 由于只有内核代码才能访问MS R 寄存器 (通过RDMSR 和四WRMSR 指令) 所以上面的例子中 , 在 WriteMSR（）函数中我们使用一个未公开的 A p l ZwSystemDebugControl（）来设置 BTF 标志。

为什么调试在编程中很重要？

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

有很多因素决定了调试在编程乃至整个计算机世界中的无比重要性。从根本上来说，是计算机系统的设计理念决定了调试的重要地位。现代计算机系统的一个重要设计原则是让硬件在软件的指挥下工作，把灵活和智能留在软件中实现，这同时也把计算机系统的控制权交给了软件。让软件控制强大的计算机硬件是聪明的，运行不同的软件就可以让同一台机器做完全不同的事情也是冒险的，一条错误的指令就可能让系统崩溃甚至导致灾难。降低风险的方法是提高软件的质量和我们对软件的控制力。但对人类而言 , 无形的软件比有形的硬件更加难以驾驭 ! 软件瑕疵总是存在但却难以寻找 ; 病毒和恶意软件不请自来 , 而且挥之不去 ; C P U 不堪重负 , 用户下达的命令却还得不到执行。相对于淳朴的硬件 , 软件更加复杂、多变、柒鹜、事故和狡黯 ! 何以应对? 为了控制软件 , 计算机先驱在一开始设计计算机系统时就设计了各种调试设施 , 包括单步执行和中断执行等。今天我们将这些功能纳入到调试器工具中。一旦进了调试器 , 再狂野的软件都会变得服服帖帖 , 所有的宏观结构和微观细节任由我们审阅 , 大到整个地址空间和每个文件 , 小到每一个内存单元和每一条指令。如果静态的分析还不够 , 那么我们可以让它根据我们的要求来执行 , 执行一条指令 , 执行到下一个分支 , 执行到上一级函数 , 等等。总之 , 以调试器为核心的调试技术是征服软件和计算机世界的最强大工具 , 其用途很广。

具体地讲 , 首先 , 调试是定位软件瑕疵的最直接和最有效的方法。没有哪个程序员能一下子写出没有错误的代码。而使用以调试器为主的调试工具进行调试是定位瑕疵的最直接方法 , 可以从问题的症状入手 , 正向跟踪或者反向追溯。对于大多数瑕疵 , 使用合适的调试方法可以大大提高定位到问题根源的效率。今天的软件环境在不断向着大型化、并行化、复杂化方向发展 , 定位瑕疵的难度也在随之不断提高。完全靠读源代码来寻找 b u g 的方法已经很难适应今天的软件发展形势。另外 , 枚举和排除法通常也会因系统中的软硬件模块数量太多而难以实施 , 有时候 , 花了几天时间来做替换仍然找不到怀疑对象。

第二 , 调试可以帮助程序员提高编写代码的能力。因为调试可以让程序员彻底了解程序的实际执行过程 , 检查与自己设计时的预想是否一致 , 如果不一致 , 那么很可能预示着有问题存在 , 应该引起重视。另外 , 调试过程可以让程序员更好的认识到提高代码可调试性和代码质量的重要性。从此 , 自觉的改进编码方式 , 合理添加用来支持调试的代码。编码和调试是程序员日常工作中的两个最主要任务 , 这两个任务是相辅相成的 , 编写具有可调试性的高质量代码 , 可以明显提高调试效率 , 节约调试时间。另一方面 , 调试可以让程序员真切感受程序的实际执行过程 , 反思编码和设计中的问题 , 加深对软件和系统的理解 , 提高对代码的感知力和控制力。

第三 , 调试工具是学习计算机系统和其它软硬件知识的好帮手。通过软件调试技术的强大观察能力和断点、栈回溯、跟踪等功能可以快速的了解一个软件和系统的模块、架构、和工作流程 , 因此是学习其它软硬件技术的一个快速而有效的方法。