wenmo8 发布的文章

在看代码之前我们先连简单的看下try的处理流程吧

函数入口设置回调函数
函数的异常抛出使用了__CxxThrowException函数，此函数包含了两个参数，分别是抛出一场关键字的throw的参数的指针，另一个抛出信息类型的指针（ThrowInfo *）。
在异常回调函数中，可以得到异常对象的地址和对应ThrowInfo数据的地址以及FunInfo表结构的地址。根据记录的异常类型，进行try块的匹配工作
没找到try块怎么办？先调用异常对象的析构函数，然后反汇ExcetionContinueSearch，继续反回到SEH继续执行。
找到了try块？通过TryBlockMapEntry结构中的pCatch指向catch信息，用ThrowInfo结构中的异常类型遍历查找相匹配的catch块，比较关键字名称，找到有效的catch块。
然后进行栈展开。
析构try块中的对象
跳转到catch块中执行
调用_JumpToContinuation函数，返回catch语句块的结束地址。

上面的步骤，就是典型的异常处理的顺序。

光看文字多无趣，上代码 - 实例分析，我们来跑一遍：

他山之石：一种循环结构的软件调试方法

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

1 引言

软件规模日趋庞大 , 软件调试中 , 发现、定位、分析错误的工作量也相应增长。因此 , 人们开发了 C o d e iV e w 等调试工具以深入错误发生时的程序执行环境 , 使效率大增。不过对于下面的循环结构 ( 以 C 语言为例 )仍有为难之处 :

假定该循环共执行 1 0 0 0 0 遍 , 第 3 0 0 0 次执行死机了 , 那么用调试工具判定死机发生在该循环中很容易 , 但再进一步分析则不可能。因为 , 若设断点于循环内 , 则每次循环皆被中断 , 至 3 0 0 0 次运行才能发现错误所在 , 以后欲分析错误也是每 3 0 0 0 次运行方可进入出错环境一次 , 这绝对无法容忍。

2 调试方法

在这里笔者介绍一种在调试软件过程中改进了的方法 , 可解决这个问题。对于上面的实例只需增加几条语句即可 , 如下所示。其中 fp 为文件指针 , n u m b e r 是初值为零的整型变量 ,
d o o n h t in g 为一空函数 , 它们都为调试而设立。具体的调试方法是将不设断点的程序先执行一次 , 然后阅读 r e c o r d . da t 找出错误发生时的n u m be r 值 , 再设 br e a k p o in t 为该 n u m be r 值 , 置断点于 d o n o t h i n g o 这一行上 , 即可使程序非常方便地运行到出错处停住。

这里文件先用 “ w ” 方式打开 , 就自然清除了上次执行形成的 r e c o r d . da t 。在循环中用“ a " 方式将每次循环中的 n u m h a r 值等关键参数逐次记入文件尾部。切记一定要在循环内打开文件 , 写入信息 , 再关闭文件 , 这可保证切实形成文件 ; 否则 (在进入循环前打开 , 结束循环后关闭) , 一旦循环内出现死机等严重间题 , 文件就不能形成。对于复杂的循环 , 记录于文件中的信息应包含一些除 n u m b e r 外的其他重要参数 , 既利于发现错误 ( 参数异常就是出错 , 不必非死机等重大问题才知出错了 ) , 又有利于了解循环执行过程而分析错误 , 因此 , 这些参数选择的好坏直接影响调试效率。在这个例子中设 do_mai n _ w o r k 为循环中的实质所在 , 又很复杂 , 其余仅是简 . 单工作 , 则应记录它的参数 ( 假设参数 1 为整型 , 参数 2 为双精度型 ) 。

n u m b e r 系一附加变量 , 如循环中有一不断增大或不断减小的变量可用 , 则也可用该变量代替 n u m b e r 的作用。不过本例适用于任何循环 , 则是标准的方法。另外 i f 语句中的相等关系也可用适当的不等关系取代 , 如本例中用不小于关系 , 则 n u m b e r 不小于 b r e a k p o i n t 后的每一次循环中断点有效。 b r e a k p i o n t 最好不要用一常量 ( 以免常常修改 ) , 而采用一变量 , 它可在进入循环前读入或由命令行参数传入 , 如此则程序无须改动而可停在循环的任意次数上。 b r e a kp o in t 类型自然与 n u m b e r 或其他替代者相同。

3 结语

这种方法有利于发现错误 , 以后利用调试工具又极易进入出错时的环境 , 而且为调试而增加的程序是固定不变的 , 故大大提高了效率。不过除了死机、除零等中断程序运行的错误一定发生在 r e c o r d . d a t 的最后一行记录写入后外 , 其余错误往往比较含蓄而要查找一番 , 如关键参数出错 , 则可能需要认真阅读 r e c o r .d
da t , 对于一些不影响关键参数的小错则可能需要另想办法。另外发现的可能是表面错误 , 如果死机由前面某次循环中的错误埋下祸根 , 则需先由死机处仔细分析 , 发现疑点 , 再重设
b r e a k p o f n t 去分析疑点 , 深挖根源 . 所以使用该法虽减小了工作量 , 但软件调试仍是一项艰巨的任务 .

他山之石：软件调试的方法与技巧

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

软件的调试也称纠错或排错 , 它是孤立并纠正错误的一种技巧性过程。软件错误的外部表现形式与内部原因之间往往没有明显的联系 , 所出现的差错并非直接就能找出原因。因此 , 调试既要对错误的性质及程序本身进行系统的研究 , 在某种程度上也要靠直觉与经验。到目前为止 , 调试还没有一套经得起检验的完整而系统的理论方法 , 排错时所采用的方法和时间都不能事先确定 . 这样 , 通常认为调试是困难的 , 是软件开发过程中最为艰巨的一种脑力劳动。本文拟就调试的方法、技术与技巧进行探讨 .

调试的步骤

诊断错误

或是系统报错 , 或是输出结果与设想的不同 , 或是陷入死循环等 , 都认为程序存在错误 .

确定错误的源发点

发现错误的地方不一定是错误的源发点 , 应寻找所有与错误有关的地方 , 从而确定错误的源发点。例如程序 :
1 0 F O R I= 1 T O 1 0
20 R E A D A ( I )
30 N E X T I
4 0 D A T A 15 , 1 6 , 2 5 , 27 , 2 8
R U N
O U T O F D A T A 1 N 2 0
错误发生于 2 0 行 , 但与第 4 0 行有关。

改正错误

确定错误及位置后 , 针对错误的具体类型进行改正。在纠错过程的两方面即确定错误及位置和改正错误中 , 第一方面的工作大约相当于整个工作的 9 5 % , 为排错的关键。故本文重点探讨错误的诊断方法与技巧。

诊断错误的实验方法

静态调试

静态调试指对程序进行人工书面检查。静态调试时要仔细阅读程序及其文档 , 经过结构分析、功能分析、逻辑分析、接口分析、语法分析以及逐行检查 , 以便找出并改正错误。通常有下面两种方法。

检查语法错误
产生语法错误的原因主要有两个 , 一个是键入错误 , 此错误如同写文章时的“ 笔误” ; 二是由于对语法规则不熟悉 , 如书后的错误信息、各种限制、全局变量与局部变量、先左后右的原则等 , 这些虽不是系统的规定 , 但也是语法的一部分 , 应作为专项予以检查。
跟踪程序流程
此时的跟踪程序流程 , 即将自己当做计算机 , 给定一组输入数据后 , 顺序执行每条语句 , 考察所得结果 . 寻找错误 . 此方法需花一定时间 , 但这是最基本的方法 , 用其它方法难以查出问题时 . 可以试用此法。顺便说一句 , 学习编程技术的主要途径是读别人的程序 , 对较难懂的地方 , 也只有跟踪程序才能读懂 , 也就是常说的阅读能力提高的途径。对程序的流程图也可采取此方法检查。一般提倡应尽可能将各种错误消灭在静态调试阶段。

动态调试

动态调试 , 是指实际上机运行程序进行调试 . 经过静态调试后 , 仍留在程序中的错误便都十分隐蔽。为找到这些错误 , 首先需捕获一些与错误有关的线索 . 即进行错误侦察 , 此时需充分利用计算机系统提供的调试手段。

试通
源程序上机运行 , 语言系统及操作系统会在程序有故障时给出信息 , 这些信息反映了如下几种故障情况 :
①没有通过编译对解释型的高级语言来说 , 如 B A S I C 语言 , 程序出现语法错误 , 系统便使程序在出错点中断 , 并指出错误的类型和位置。对编译型的高能语言 , 如 P A S C A L 语言程序 , 编译系统把程序检查一遍后 , 对语法错误会打印出一系列的出错信息 , 根据这些语法出错信息号 , 可在“ 用户手册 ” 中查出原因。
②没有通过连接编辑连接编辑阶段的错误有 : 公共数据块长度不一致 , 系统自动按最长处理 , 但给出警告 ; 某个模块名找不到所需要的模块 , 如数据说明遗漏 , 连接数组元素引用当函数引用 , 库函数引用不符合规格说明; 内存容量不够而需要分节等。这些错误可参照 “ 用户手册 ” 予以改正。
③程序的运行过程因故障而停止程序因故障而停止运行 , 在多数情况下会给出出错信息 , 这类信息在“ 用户手册 ” 中都有解释。
④程序只输出部分结果对这部分结果进行分析 , 可大致了解程序被执行的逻辑 , 或程序在什么地方被中断。
⑤程序执行了很长时间没有结果这种情况可能由三个原因造成 : 一是程序本来执行时间就很长 ; 二是程序内有死循环 ; 三是程序运行时使硬件系统“ 死锁” 。
调试工具
错误的位置可以通过在程序中插入调试语句 , 也可以使用机器提供的调试工具在程序中的某一点将有关数据单元的内容或程序的执行路径输出。不同的操作系统或编译程序提供不同的调试工具。调试软件一般有两种 , 一种是交互式调试程序 , 它使得程序员和执行中的用户软件在联机方式下相互作用 , 提供了中断程序、在程序中设置断点、显示并改变符号项中的变量、逐语句的执行程序等特性。如 B I M 公司为 P L l / 的 C C ; D E C 公司为 CO B O L 配的 C ID 等。另一种是程序语言所提供的调试特性对语言的扩充。如 P L l / 提供了 c H E c K 语句 , F O R T R A N 提供了作为注释或在编译时作为正式语句解释的特性等。此外 , 为了调试程序 , 常常使用操作系统提供的某些实用软件 , 例如文件或内存的转储 , 两个文件的比较程序等 , 或是利用测试得到的信息。然而 , 最有效的调试工具似乎是写程序时写到程序中的调试语句 , 这样 , 出错区域可由程序员定位。调试语句是一些不影响程序的功能 , 仅给调试人员提供如下信息的语句:
✦活动路径
✦统计活动次数
✦其它有关信息
常用的调试语句有以下几种 :
①利用系统提供的调试命令和语句如在 A P P L E S O F T 中以下命令与语句常用 , S T O P 语句使程序暂停 , 设置断点 ; C O N T 语句使程序从断点继续执行下去 ; T R A C E 逐个行跟踪 , 即逐次显示计算机执行的语句行号 , 给定一组调试数据后可以检查程序是否按预想的路径执行及执行的结果是否正确 ; N O T R A C E 命令取消逐行跟踪。在 F O X B A s E 中 , 程序执行到 S U S P E N D 时能把正在执行的程序挂起 , R E S U M E 能使被挂起的程序从断点处继续恢复运行 ; S E T E C H O O F F / O N , 默认值为 O F F , 若设置为 O N , 则将每一条执行过的命令在屏幕上显示 , 由此可确切地掌握当前程序运行的进程 , 帮助查出产生间题的位置 , S E T S T E P O F F /O N , 默认为 O F F , 当为 O N 时 , 程序会以单步形式进行等。
②设置状态变量例如 , 在每个模块中设置一个状态变量 , 程序进入该模块时 , 便给该状态变量一个特殊值 , 根据各状态变量的值 , 可以判定程序活动的大致路径。
③设置计数器在每个模块或基本结构中 , 设置一个计数器 , 程序每进入该结构一次 , 便计数一次。这样 , 不仅可以判断出程序活动的路径 , 而且当程序中有死循环时 , 用此方法便能很快确定 .
④插入打印语句
打印语句是最常用的一种调试语句。它用起来非常敏捷 , 能产生许多有用的信息 . 特别适用于人机对话或调试过程。关键是断点的位置和打印哪些变量的值。下面介绍打印语句的几种用法。
A.回声打印 ( E C H O P R IN T IN G ) “ 回声 ” 打印的特点是“ 读了就写” 。它把打印语句放在紧靠读语句之 (或输入语句 )之后 , 或模块入口处 , 及调用语句之前后 . 可以帮助调试人员检查数据有没有被正确地翰入或接口处信息传递是否正确。
B. 追踪打印
追踪打印是为提供程序执行的路径信息而设置的打印语句。这些打印语句通常设置在下述位置 : . 模块首部或尾部 . 调用语句前后 . 循环结构内的第一个语句或最后一个语句 . 紧靠循环结构后面第一个语句 . 分支点之前 . 分支中的第一个语句
C.抽点打印
抽点打印就是选择一些可疑点设置打印语句 , 以便打印有关变量的值。
D.成组打印子程序
即集中一组打印语句写成一个专用子程序 , 凡是需要了解情况处就可调用此子程序。例 : 考虑到层、块结构的需要 , 可在一层中编写一个打印子程序。
8 9 9 9 R E M C 层成组打印子程序
90 0 0 P R I N T “ C $ = ” ; C $ ; “ C C $ = ” ; C C $
9 0 1 0 P R IN T “ C = ” ; C ; “ C C 一 ” ; C C ; “ C l = ” ; C l ; “ C Z = " ; C Z
9 0 20 R E T U R N
可在若干地方调用此子程序 :
31 4 5 P R IN T “ 检索部分打印” : G O S U B 90 0 0
3 5 6 5 P R IN T “ 分类部分打印” : G O S U B 9 0 0 0
36 7 5 P R I N T “ 求和部分打印” : G O S U B 9 0 0 0
此方法很有用 , 能动态地了解程序运行情况。

预埋技术

预埋技术是在程序中加入“ 潜伏” 的调试语句。前面介绍的打印语句和成组打印子程序 , 在程序完成后要将其删去 . 而预埋技术将调试语句永久地编入程序 , 其是否起作用由逻辑软件开头控制。
例如:

10 IN P U T “ X = ” ; X

20 IF X ( 1 O R X ) = 1 0 T H E N P R IN T “ N O D E F IN I T IO N ”

30 IF X ) = 1 A N D X ( 3 T 圣IE N P R I N T “ Y = ” ; 5一 CO S ( 8 * X )

4 0 IF X ) = 3 A N D X ( 6 T H E N P R I N T “ Y = " ; E X P ( X )
5 0 IF X >= 6 A N D X ( 1 0 T } {E N P R IN T “ Y = ” ; 1+ S Q R ( X 二 1)
60 E N D

在此例中 , 我们只处理了 X e 〔1 , 10 ) 的正常情况 , 但估计到使用中出现的变动可能导致 x ( 1 或 x ) 1 0, 提前将调试语句放在程序中。这样 , 对于任何情况的输入程序都能适应。人是健忘的 , 如果没有这个调试语句 , 将会花费很多时间去查错。

错误诊断的推理技术

归纳法排错 ( D E B U G G I N G B Y I N D U C T IO N )

其荃本思想是逐步减少和改进假定的过程。在查出错误后 , 要把一切可能的原因和假定都提出来 , 利用错误数据排除一部分 , 假定再从其余假定中估计可能性最大的一个。使确定错误原因的范围更集中 , 下一步或许就可证明这一改进后的假定 , 或再作其他选择 .

演绎法排错

其基本思想是枚举所有可能引起出错的原因作为假设 , 然后利用数据逐一排除不可能发生的原因与假设 , 将余下的原因作为主攻方向。演绎法过程如下图所示 :

回溯法 ( B A C K T R A C KING)

对于小程序 , 这种技术极为有用。从错误出现之处出发 , 沿反向路径进行检查 , 直到找出错误的原因。推理是在取得一定的实验数据的基础上进行的 , 推理得出的假设 , 要靠实验证明并取得新的数据 , 把搜索范围缩小。故错误诊断的实验方法与推理技术应结合使用 , 互相补充。

错误修改的原则

不要试着改

不要当只查到了一些征兆 , 原因还没有查清 , 便想试着改动某个语句。这种盲目行为成功的概率很小。因某些错误征兆的修改并没有治本。有时会把某些新的错误掺加到程序中 , 造成调试的混乱。

修改了一个错误 , 可能还会有别的错误

一般错误是密集的 , 修改了一个错误后 , 还应检查它的近邻还有没有别的错误或者在程序中还有无类似的错误。

改变源程序代码 , 不要改变目标代码

当调试一个大系统 , 特别是用汇编语言写的系统纠错时 , 不要直接修改目标代码。否则 , 当程序重新编译或重新汇编时 , 错误还会再现

修改错误的过程将迫使人们暂时回到设计阶段

修改错误是程序设计的一个重要内容和形式。一般说来 , 在设计过程中所使用的各种方法应能应用于错误修改过程。

修改完毕 . 需进行回溯测试

因为 :

纠正错误的概率不是 10 0 %
纠正错误时产生新错误的可能性
修改代码比原有的代码更易出错

他山之石：软件调试相关方面

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

由于软件调试是软件质量鉴定工作必须具备的前提条件 , 而且软件调试过程关系到软件质量的优劣 , 所以 , 专门讨论软件调试技未的有关内容。

目前 , 软件设计人员中存在着一种错误的认识 , 即认为软件调试只是为了证明自己设计的软件或怪序的正确性。在这种思想指导下 , 软件设计人员往往会选择简单的调试方法和简单的数据情况 , 往往仅完成主要功能的调试 , 这就造成了调试过程不全面、不完整 , 使软件在投入实际运行后无法长期可靠的工作。

正确的软件调试作用为: 软件调试是为了发现错误而执行软件的过程。结果通过软件调试发现了错误 , 并不是证明了软件设计的失败 , 而恰好是增加了软件的可靠性和应用价值。所以 , 软件调试是软件开发中地位十分重要的一个工作阶段。

软件调试工作应遵循的原则

根据软件所具有的功能、结构和数据类型来选择调试方案和调试的重点。
从心理学和调试有效性而论 , 软件设计者不应调试自己的软件。如果没有条件做到这一点 , 可以采用一些集体工作的措施来弥补。
在软件调试中, 不但要对那些合法的、正常的情况进行调试 , 而且要对那些非法的、异常的情况进行调试。调试应对软件具有一定的破坏力。
在软件调试中, 不但要检查软件是否完成了应完成的功能 , 而且要检查软件是否完成了不应有的功能。
任何调试数据、调试结果和错误内容都是极有价值的资料 , 应认真地分析、保存。某些情况可能需要反复调试、纠错。
国外的有关统计资料表明: 已发现较多错误的软件与已发现较少错误的软件相比较 , 前者仍存在错误的概率较大。
国外的研究资料表明: 要结束一个软件的调试过程是有条件的 , 是根据诸多因素( 如已发现的错误率、查错效率、调试覆盖率等 ) 综合分沂后做出的。

软件调试的几种工作方式

软件调试中常见的几种工作方式和工作内容见表 l 。在适用范围一栏中, 根据调试的规模分了三个等级: 模块级、功能级、系统级。各等级的任务如下:

模块调试: 对相互独立的各个模块在各种条件下进行运行 , 检查模块内部的运算和逻辑关系、控制关系的正确性。
程序功能调试: 对于组成某一功能的各个模块进行联调 , 检查在各种条件下的执行过程和执行结果 , 特别是模块之间的层次关系和信息交换的正确性。
系统调试: 将各个功能的程序汇合 , 在实际或模拟的工作环境中, 检查输入、输出是否符合要求 , 测定并评价软件的各项性能 , 提出改进意见。

由于三个等级的调试内容与规模不同 , 所采用的工作方式和工作方法也不相同。一般地说 , 由数人组成的软件调试小组可以达到相互启发 , 集思广议 , 相互检查 , 认真高效的工作目的。但这要求软件调试小组的每个成员在软件设计与调试技术方面 , 在微机使用方面 , 在对整个系统功能与性能的理解方面 , 具有较高的水平与深刻的认识。

软件调试方法

软件调试中经常采用的方法见表 2 。逐步增长和非增长式两种调试方法 , 各有优缺点 , 列举如下:

非增长式调试需要完成更大的工作量。
逐步增长式调试中 , 由于及时地完成了模块的组合调试, 模块之间的接口错误和由多个模块运行产生的功能错误 , 能及早地发现。
利用逐步增长式调试 , 寻错纠错比较容易。
逐步增长式调试可以更彻底地对软件进行调试。
非增长式调试需用的机器时间较少。
用非增长式调试 , 在整个调试阶段有可能并行工作。
在逐步增长式调试法中 , 自顶向下调试的缺点是很难产生调试条件, 调试的相当时间内无法考察结果输出。而自底向上调试的缺点是必须给出调用模块 , 在加人最后一个模块之前 , 程序不能作为一个整体存在。
在非增长式调试法中, 黑盒法的缺点是寻错纠错极困难 , 白盒法的缺点是工作量太大。综合比较起来 , 逐步增长式调试法是一种比较好的方法 , 适用于工程应用类软件 , 建议推广实施。如果数人同时采用逐步增长法对同一个软件进行调试 , 就可以达到相互补充、完整调试的目的。

调试工作中应注意的几点

调试前应认真地查阅有关设计资料 , 避免出现对软件设计任务书的理解不准确、不完整而造成的软件设计中的缺陷。
调试中应认真地检查程序结构 ( 是否采用模块结构 ) 和指令使用 ( 如运算指令使用不当 , 转移指令使用太多等 ) 。
调试中一定要对程序进行破坏性试验 , 考核程序的可靠性。
调试结束前 , 应把以前完成的各个调试情况复现一遍 , 避免由于纠正某个程序错误而出现了其他的错误或缺陷。
调试完成后 , 应尽可能的对程序进行优化 , 提高程序质量。

软件调试技术中几个研究专题

为了更有效、更经济地开展软件调试工作 , 有必要在以下两个方面进行研究 :

应重视软件调试数据与结果的收集、分析工作。目的有两个: 第一 , 统计软件出错类型和产生错误的原因 , 以便于在今后的软件开发中加以克服 , 第二 , 分析各种调试措施或数据条件对各类错误的有效性 , 建立起一套高效的调试原则。
利用积累的调试经验 , 建立软件可靠性分析 , 软件错误预测的模型 , 为寻找结束调试的最佳时机提供参考或依据。

软件调试工作是软件开发中最复杂、最具有技术性和技巧性的工作 , 所以 , 应大力地并展研究和提高工作 , 保证软件具有优良的质量与性能。

CPU对软件调试的支持(一）

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

随软件向大型化和复杂化方向发展 . 软件调试的难度也在不断增大。对于一些小的软件我们可以不讲究什么方法 . 只要通过插入print语句等简单手段就可以解决问题但是如果是要调试一个比较大的系统 . 不讲究必要的调试技巧就会多花费很多时间甚至根本行不通了。
那么如何掌握调试技巧 , 提高调试效率呢？学习基本的调试原理是第一步 . 试想如果我们不了解调试工具的工作机制 , 那么怎么可能最大限度地发挥其功能呢。如果我们根本没听说过硬件断点 . 那么我们怎么能利用它解决普通软件断点无法完成的任务呢 ?
从宏观来看 . 软件调试是调试工具、系统软件 (操作系统)和C P U 这三者密切配合、相互协作的一个复杂过程。简单来说CP U 为软件调试提供了硬件一级的支持 , 是很多调试功能的根本基础: 操作系统负资协调管理 CPU 所提供的硬件支持 ,并为各种调试工具提供服务；调试工具与调试人员直接交互，使操作系统和CPU所提供的调试支持真正可用。

下面 , 便以 IA 一3 2 处理器《CP U ) 为例介绍 CP U 对软件调试的支持。 IA 一 3 2 处理器是指英特尔3 2 位架构 ( l n t e l ? rA c h i一tc e t u r e 3 2一b it ) 处理器 . 即从 38 6 开始的 x 8 6 处理器 . 包括i3 86 、i4 86、奔腾、p 6 系列和奔腾 4 系列处理器。

可以将 lA 一 3 2 处理器的调试支持简单概括如下：

INT3 指令— 又叫断点指令 . 是软件断点的实现基础。
标志寄存器 F L A G S 的 TF 标志— 陷阱标志位 . 是单步执行的实现基础
断点地址寄存器 D R0一 D R 3— 用于设置断点地址 (线性内存地址或 l /O 地址 ), 是硬件断点的实现基础。
断点控制寄存器 DR 7— 用来控制和进一步描述四个调试地址寄存器 (D R O一D R 3 ) 的断点条件
断点状态寄存器 DR 6— 当断点发生时 . 向调试器报告该断点的具体情况, 以便调试器区分发生的是哪个断点。
断点异常 (# BP) 一当 INT3 指令执行时 , 会导致此异常.CPU 转到该异常的处理程序。
调试异常 (# DB ) 一当除 INT 3 指令以外的调试事件发生时会导致此异常。
任务状态段 (T S )S 的T 标志任务陷阱标志 , 当切换到设置了 T 标志的任务时 , 中断到调试器。
分支记录机制用来记录上一个分支、中断和异常的地址等信息。

下面我们分几块对以上内容做进一步讨论：

软件断点

X8 6 系列处理器从其第一代产品英特尔 8 0 8 6 开始就提供了一条专门用来支持调试的指令INT 3。简单来说 , 这条指令的目的就是使 CP U 中断 (陷入 ) 到调试器 . 以供调试者对执行现场进行各种分析。
下面通过一个小实验来感受一下INT 3 指令的工作原理。
在 V is u a l C + + S tu d io 6.0 ( 以下简称 v C 6 ) 中创建一个简单的He l l o w o r l d 控制台程序HIn t 3 然后在m a i n () 函数的开头通过嵌入式汇编插入对INT3指令的调用 :

当在 V C 环境中执行以上程序时 . 会得到以下对话框 , 点O K 按钮后程序便会停在 N I T 3 指令所在的位t 。由此看来我们刚刚插入的一行 (asm INT 3 ) 相当于在那里设了一个断点 .

这正是通过注入代码手工设盆断点的方法 , 这种方法在调试某些特殊的程序时还非常有用。
w id n o w s 操作系统还提供了相应的 A P I 用于手工断点 . 例如用户模式T 的De bu g B re a k ( ) 和内核模式下的DbgBreakPoint（），DbgBreakPointWithStatus()。把刚才的小程序中的对 INT 3 的直接调用改为调用 Win do w s A PI De bug B r e a k ( ) (需要在开头 Include< w id n o w s.h> ) . 然后执行可以看到产生的效果是一样的。通过反汇编很容易看出这些 AIP 在x 8 6 平台上其实都只是对INT 3指令的简单调用。

在 windbg 中启动本地内核调试 (参见 w in d b g 帮助文档 ) 然后使用u命令进行反汇编。提示符 Ikd> 的含义是 “ Lo c a l ke r n e l d “ 。本地内核调试需要Wind o w s XP或以上操作系统才支持。
用来对齐的,没有实际意义。3 2 位 C户 U 通常需要内存和可执行文件以 4 字节对齐。
DbgBreakPointWithStatus()允许向调试器传递一个整型参数。

那么C PU是如何从被调试程序调到调试器的呢 , 这一机制的全部工作过程因操作系统和被调试程序的执行模式 (用户模式还是内核模式 ) 的不同而有所不同。目前我们可以作出如下简单理解 :
C p U 把 INT 3 指令处理为一种软件异常 . 当执行INT 3指令时 C PU 会把当时的程序指针 ( C S 和 EIP) 压入堆栈保存起来,然后通过中断向量表调用 lNT 3 所对应的中断例程。当我们在调试器中运行程序时 . 调试器会直接 ( DOS 时代 ) 或间接(通过操作系统的 A P I ) 注册这个中断服务因此当 INT 3 中断发生时 . 调试器的代码会被调用而执行。在实模式下CPU 的执行逻辑如下 :

这是针对实模式的情况保护模式下会更复杂 . 但原理 ’类似。
对于INT 3指令 ,v e c t o r _ n um b e r 为 3.这个操作过程本适用于所有软件中断和异常。
# G P 即 Ge n e r a l Protection Exception , 常规保护性错误。也就是说当中断向量表的长度 (Lim i t ) 不足以包含本向量时，C P U便会产生常规保护异常。
IF语句的结束语句
当堆栈不足以容纳接下来要压入的6字节内容时，便产生堆栈异常

下面考虑一下调试器是如何设置断点的。当我们在调试器中对代码的某一行设断点时，调试器会先把这里的本来的指令的第一个字节保存起来。然后写入一条INT 3指令。因为INT 3指令的机器码为0xCC,仅有一个字节，所以设置和取消断点时也只需要保存和恢复一个字节。这是设计这条指令时便考虑好的。顺便说一下，虽然VC6是把断点的设置信息(断点所在的文件和行位置)保存在和项目文件相同位置且相同主名称的一个.opt文件中。但注意，该文件并不保存每个断点处应该被INT 3指令替换掉的那个字节。因为这种替换是在启动调试和调试过程中动态进行的。这可以解释有时我们在VC6中，在非调试状态下，我们甚至可以在注释行设置缎带你。当开始调试时，会得到一个图2所示的警告信息。这是因为当用户在非调试状态下设置断点时，VC6只是简单的记录下该断点的设置信息。当开始调试时，VC会一个一个的取出OPT文件中的断点记录 . 并真正将这些断点设置到目标代码的内存映像中。也就是要将断点位置对应的指令的第一个字节先保存起来 , 再替换为C C . 即 INT 3 指令 . 这是如果 VC 6 发现某个断点的位置根本对应不到目标映像的代码段 , 那么便会发出图 2 所示的警告。

下面说说INT 3 断点被触发时的悄形 . 我们仍以V C 6 为例 .也就是使用 VC 6 调试一个普通的 3 2 位 W in d o w s 应用程序。当Cp U 执行到 INT 3 指令时 . 由于 INT 3指令的设计目的就是中断到调试器 . 因此CPU 执行该指令的过程也就是准备产生断点异常 (Breakpoint exception简称# B P)并转去执行异常处理例程的过程。 W in d o w s下所有异常和中断都是先由内核例程处理的. 因此应用程序中的 INT 3会导致 C U P 从用户模式转入内核模式并执行nt!KiTrap03例程。接下来经过几个内核函数的处理 .因为这个异常是来自内核模式的. 而且该异常的拥有进程正在被调试 (内核函数可以得到这些信息 ) . 所以内核例程会把这个异常分发给用户模式的调试器 . 这里也就是VC 6 。接下来V C 6会根据异常的发生位置 (记录在每个异常的附属数据结构中) 试图寻找一个与其匹配的断点记录。如果找不到 . 那么就说明
导致这个异常的INT 3 指令不是 v C6 动态替换进去的 , 因此会显示一个图 1 所示的对话框. 意思是说一个 “ 用户 “ 插入的断点被触发了。另外值得说明的是 . V C 6 在每次中断到调试器时 .会先将所有断点处替换为 INT 3的指令恢复成原来的指令 , 然后再把控制权交给用户。所以在调试器下 . 我们是看不到动态插入的 INT 3指令的.

还想介绍一个有趣现象。当我们用 VC 6 进行调试时 , 常常会观察到一块刚分配的内存或字符串数组里面被坟充满了CC。如果是在中文环境下 . 因为x o C CC C 恰好是汉字 ` 烫 ` 字的简码 . 所以会观察到很多 ` 烫烫烫烫烫烫… ’ . CC 正好是 INT 3 指令的机器码 . 这是偶然的么? 答案是否定的 . 因为这是有意为之 . 为了辅助试调试版本的运行库会用0xCC 来填充刚刚分配的缓冲区 . 这样如果因为缓冲区或堆栈溢出时程序指针意外指向了这些区域 . 那么便会因为遇到这些自动填充的 INT 3指令而马上中断到调试器。另一方面 . 编译器也经常用 INT 3指令来填充函数或代码段末尾的空闲区域。这也可以解释为什么有时我们没有手工插入任何对 INT 3的调用 . 但是也会遇到图 1 所示的对话框。因为使用 INT 3 指令产生的断点是依靠插入指令和软件中断机制工作的 . 因此人们习惯把这类断点成为软件断点 . 软件断点具有如下局限性 :

属于代码类断点 , 即可以让 C PU 执行到代码段内的某个地址时停下来 . 不适用于数据段和 1 / 0 空间。
对于在RO M ( 只读存储器 ) 中执行的程序 ( 比如 B I O S 或其它固件程序) . 无法动态增加软件断点。因为目标内存是只读的 . 不能动态写入断点指令。这时就要使用我们后面介绍的硬件断点。
当中断向量表或中断描述表 (IDT）没有准备好或遭到破坏的情况下这类断点无法或不能正常工作的。比如系统刚刚启动时或者IDT被病毒窜改后。这时只能使用硬件级的调试工具。

虽然软件断点存在以上不足 . 但因为它使用方便 , 而且没有数量限制 (硬件断点需要寄存器记录断点地址 . 有数量限制 ),所以目前仍被广泛应用。
关于 INT 3指令还有一点要说明的是 . IN T 3 指令与当n=3时的 INT n 指令 (通常所说的软件中断) 并不同. INT n 指令对应的机器码是CD后跟 1字节n 值 . 比如INT 23H 会被编译为CD23 。与此不同 INT 3 指令具有独特的单字节机器码 CC 。也就是当编译器看见 IN T 3 时会特别的将其编译为 CC . 而不是 CD 0 3。尽管没有那个编译器会将 INT 3 编译成 CD 0 3. 但是可以通过某些方法直接在程序中插入 CD 0 3 。但是这样做会失去IN T 3 指令所具有的特殊待遇 (例如在虚拟 8086模式下免受IOPL检查).

wenmo8 发布的文章

C++基于SEH二次封装的异常流程与识别

他山之石：一种循环结构的软件调试方法