wenmo8 发布的文章

符号文件如何让断点发挥作用的？

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

调试符号文件（pdb）是一种很复杂的文件，由于这种文件格式微软并不公开，所以至今为止，并没有一篇文章或资料敢说自己对pdb文件进行了深入剖析。更重要的原因是，我们为了研究调试技术，需要知道一些系统（操作系统，编译器，连接器，调试器等）调试支持，仅仅知道即可，没必要深究微软为了实现调试而做出的每一个细节。
首先，我先问几个问题：

我们经常用的调试方法，下断点，是如何实现的呢？
我们可以在程序还没有执行起来的时候就可以下断点，等调试启动的时候，就可以命中这个断点。这个是怎么实现的？
当断点命中时，我们可以观察一个变量的值，这是怎么实现的？

先简单讲解本文中用到的两个概念：

OFFSET，文件中的偏移。
VA，程序加载到内存后的一个虚拟地址。

假设在一个EXE文件中，有一个全局变量a，距离文件起始的偏移为0x10，此时文件的起始位置为0x00000000，那么该全局变量a的OFFSET就是0x00000010。当这个exe执行起来，加载到内存后，这个exe本身所加载到的内存位置称为基地址。假设基地址为0x00400000，那么这个全局变量a的VA便是0x00400010。可见，exe本身所加载到的基地址不一样的话，那么a的VA就不能确定。
依然使用最简单的例子，来阐述原理，代码如下：

可以观察到，此时，笔者并未调试启动程序，而这个断点，就已经打上了。接下来我们调试启动程序，如下图：

此时，我们已经进入断点，并中断下来，我们可以观察到全局变量g_nVar的值。想必这个过程，有过VC++开发经验的开发者，再熟悉不过了。下面，详细分析一下这个过程。
当我们鼠标点击下断点的时候，我们的程序还没有启动，VS是不可能知道这个断点应该打在内存中的哪一条指令的地址处的（此时，VS顶多知道断点所在的OFFSET，但是无法知道断点所在的VA），但是VS可以记录到一条重要的信息，就是当前断点在哪个源文件的哪个行号上。
接下来，我们调试启动程序，exe的镜像加载到内存后，所有代码段的指令的VA便是真实可用的了。但此时调试器是如何根据断点所在源文件和行号，来找到断点所在的VA的呢？现在，你应该想到本文在讲什么，哈哈，就是pdb啦。那么pdb文件中到底存了什么，才让调试器可以根据源文件及行号来找到对应的VA呢？

默认情况下，在pdb文件中，保存了可执行文件中所有的符号（函数名、变量名等）所在源文件、行号、OFFSET等信息。但是这些信息，是在什么时间得到的呢？很明显是编译阶段，编译器在编译每个cpp的过程中，就可以把这些符号的相关信息收集起来，存放在各个cpp所生成的obj文件中，然后在链接的时候，提取每个obj中的这些信息，生成一个单独的pdb文件。这样，以后调试程序的时候，调试器只要找得到这个pdb，就可以知道可执行文件中，所有符号所在的源文件、行号和OFFSET了。反过来说，当给出一个源文件和行号，就可以拿到对应的OFFSET了，所以在还没有启动调试的时候，我们下的断点，实际上调试器是知道这个断点应该在哪个OFFSET上了，等启动调试的时候，用这个OFFSET加上这个模块所加载到的基地址值，就可以得到这个断点所在的VA了，然后在这个VA处强行写上int
3指令，并继续执行，当执行到这里，便中断下来给我们一个调试机会了。想想，如果没有pdb，这个断点还能用么？
当我们鼠标放在某个变量上时，调试器可以拿到这个变量的名称，根据我们前面说的，用这个名称去pdb中查找，自然就可以找到pdb文件中保存的OFFSET了，加上这个模块的基地址，就找到了这个变量所在内存的VA，剩下的就是读一下这个VA内存中的内容了。这样也就实现了观察变量值得功能。
下面证实一下，pdb文件中确实存储了源文件、行号、OFFSET等信息。将上面例子代码放到VC6中编译，然后到debug目录中使用dumpbin来查看CodeTest.obj文件中的符号信息，如图：

可见，add函数和main函数所在行号和起始行号和结束行号都是有记录的，那源文件是哪个呢？哈哈，当然是CodeTest.cpp了，我们查看的是CodeTest.obj文件嘛。。。
但是这里并没有add或者main函数的OFFSET啊，为什么呢？想想，此时只有一堆obj，真正的可执行模块还没有生成出来呢，何来的可执行模块的OFFSET呢。。。由此可以知道，这个OFFSET要在链接过程中，才可以确定。经过了链接之后，这些本来在obj里的调试信息，也就被收集到pdb文件中了，下面我们来找找add函数的OFFSET到底在哪里？使用SymView工具打开CodeTest.pdb文件，如下图：

可见，pdb中存储了add函数相关信息，不仅仅只有offset，而且此处并未直接记载add函数在哪个cpp里，这些关系都是通过索引来查找的，其实pdb文件的内部结构是很复杂的，要想解释清楚，其实很不容易，大家如果想知道pdb内部到底都有什么东西，可以参考一下《软件调试》第25章，但也是讲了个大概。

在我们观察的过程中，我们可以发现两个很主要的特征：

可执行模块中，保存了当前模块的调试符号文件的路径，而且是绝对路径，如下图：
Pdb文件中保存了每个cpp文件的路径，而且也是用的绝对路径。如下图：

这样，我们可以得出一个结论：

在同一台开发者的机器上，如果被调试的exe放在了其他目录里，而pdb依然在原来生成时所在的位置，那么调试exe时，依然可以找到对应的pdb文件。
如果exe和pdb都换了路径，只要调试的时候，我们手动指定了pdb所在的位置，如果源码文件还在原来的路径，那么调试时，依然可以找得到源码文件。

他山之石：InfoQ采访Spinellis---如何有效地调试软件

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

Diomidis Spinellis是《代码阅读与代码质量》一书的作者。在GOTO阿姆斯特丹2016大会上，他就如何有效地调试软件和预防错误做了演讲。InfoQ采访了Spinellis，内容涉及发现和修复软件中的错误、软件调试的原则、如何提高调试效率、如何编写出不怎么需要调试的代码以及管理人员如何为错误预防和处理提供支持。

InfoQ：是什么让软件错误的发现和修复如此困难？

Diomidis Spinellis：如果你认为编写代码困难，那就尝试下代码调试吧。你编写了一个新的函数或方法，并加上一些语句形成某个只是貌似正确的东西。当你调试一个程序的时候，你要面对数千或数百万行貌似正确的代码，并设法找出其中的错误。这必定要困难许多。然后，你还要应对各种系统和层次之间的复杂交互、每秒执行数十亿次的CPU指令、难以再现的Bug以及来自生产环境系统的压力。

而且，课堂上很少教调试；从一切可能出错的东西辛苦得来的经验很难压缩到一次演讲中。此外，由于系统失败的方式各不相同，你必须不断地改进和调整你所用的工具和方法。你可以从观察开始，继之以数据分析，然后做一些试验，最后推断出Bug的原因。没有什么标准的初学者技能。

InfoQ：软件调试有什么一般原则吗？

Spinellis：很遗憾，由于软件会出现各种难以想象的错误情况，我不认为有什么可以在软件调试过程中遵循的一般原则。退而求其次，我归纳出了三大类方法：

高级策略，比如由故障特征推断出原因，或者确保某些代码满足了其前提条件；

方法和实践，比如确保Bug可以有效地再现，或者着重突出故障的影响；

通用工具，比如Unix命令行工具、跟踪（考虑下strace、dtrace和systemtap）工具和版本控制系统。

InfoQ：程序员做什么能够提高调试效率？

Spinellis：首先要为调试成功做好准备。让自己相信问题将会得到解决，留出足够的时间用于调试，不要分心，要坚持不懈，必要的时候，留待第二天解决。重要的是，要不断地在环境、工具和知识上投入。购买高效工作所需的软件和硬件。例如，如果软件生成大量的调试日志文件，你就应该有足够的磁盘空间、CPU处理能力和带宽，以便可以高效地处理它们。在调试的过程中，你很容易遇到千奇百怪的问题，因此，花些精力管理和优化自己的环境和工具配置。这包括按键绑定、别名、辅助脚本、快捷方式和工具配置；所有这些都可以显著地提高调试生产力。

InfoQ：有什么技术或方法可以编写出不怎么需要调试的代码吗？

Spinellis：当然！编写可维护的代码——可读、稳定、易于分析和修改的代码——带来的Bug也比较少。此外，像单元测试、代码审查这样的方法以及使用断言都有助于最小化进入生产环境的错误。

在设计时使用高级抽象（例如使用一个框架的算法或容器数据结构，而不是选择自己开发一种方案）可以减少代码和错误。另外，让程序易于调试也很重要。这包括为详细地记录日志提供便利，当出现内部错误时报告丰富的上下文信息，并将问题及崩溃的详细信息发送到一个中央存储库。

InfoQ：管理人员如何为组织里的错误预防和处理提供支持？

Spinellis：设定基本的过程有助于确保软件错误不会失控。部署并采用一个问题跟踪系统，用它把要处理的问题分类并排定优先级。将软件变更恰当地记录在进一个运作良好的版本管理系统里，并将它与问题跟踪系统联系起来；我经常仅仅通过仔细研究一个文件的历史和变更就修复了Bug。在软件建设方面，推广单元测试的应用，把软件的构建性能分析、静态分析和动态分析包含进来，并维护一个快速、精益、均衡的构建-测试周期。这有助于帮助开发人员尽早捕获Bug，并迅速修复。最后，在运维方面，逐步部署软件，允许新旧版本对比，努力确保所使用的工具和所部署的环境的多样性，并有组织地升级工具和库。

转自：http://lf.lnu.edu.cn/detail.jsp?id=55243

他山之石：软件调试排错阶段的可靠性评估模型

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

在硬件可靠性理论中 , 典型的失效率又( t ) 函数是一条形似“ 浴盆” 的曲线。浴盆曲线由三段构成 : 早期故障期、偶然故障期、耗损故障期。这种曲线描述了事物生命期的整个过程 , 而且具有普遍性。对软件来说 , 在调试排错阶段 , 故障易被发现 , 也易于纠正 , 而且在纠正中引人新故障的概率较小 , 因此 , 在此阶段 , 软件失效率是递减的 ; 当软件中存在的残留错误数减少到一定数目后 , 由于故障发现率较低 , 故障机理较复杂 , 再发现的错误一般就难以得到纠正 , 甚至在纠正过程中又引人新的错误 , 从而使得软件在运行阶段失效率基本保持不变 ; 在软件生存的后期 , 由于软件应用范围的扩大 , 或用户对软件功能提出更新的要求 , 从而导致软件故障增多 , 而对其纠正越来越困难 , 很易引入新故障 , 这样使得软件失效率呈递增趋势 , 直到软件寿命期结束。因此 , 人们把浴盆曲线理论运用到软件可靠性领域来 , 结合软件固有特性 , 提出了许多评估软件可靠性的模型 , 并在实践中得到了广泛应用 , 取得了良好效果。
J一M 模型就是其中的一种 , 它对应于浴盆曲线的第一段 , 适用于软件调试排错阶段 , 这类模型统称为软件出生模型 ( Born-In模型)。

1、J一 M 模型简介

J 一M 模型是由 2 . Je lin s ki 和 P . B . M o r a n d a 于 19 7 2 年提出的一种确定性模型 , 简称 J一 M 模型 , 用来描述软件错误的检测过程。根据软件特性 , 在 B o r n 一 n I 模型中规定了四条基本假设：

假设 1 : 错误纠正时间忽略不计 ;
假设 2 : 纠正所发现的错误不会引人新的错误 ;
假设 3 : 两次失效时间间隔相互独立 ;
假设 4 : 两次失效之间的失效率是与时间 t 无关的常数。

J一M 模型除上述四条基本假设外 , 还增加两条假设：

假设 5 : 软件失效率与当前的软件残留错误数成正比 ;
假设 6 : 所有残留错误的错误尺寸视为相同。所谓错误尺寸 , 是指因某一软件错误而导致该软件失效的概率。

由上述假设可得到 J一M 模型的失效率曲线如图所示：

失效率和可靠度函数可表示为：

式中 , N 表示开始时软件存在的错误总数 ; ∮表示错误尺寸 , 由假设 6 知∮是个常数 ; λ表示第( i一 1 ) 次失效至第 i 次失效为止 , 这段时间的失效率 ; R_i ( t )表示第( i 一 l ) 次失效至第 i 次失效为止 , 这段时间的软件可靠性函数。
式中的 N 、 ∮必两参数可由极大似然法估计出来。如果以 X _i ( i=1 , 2 , … , n ) 表示被观察到的一系列失效间隔时间 , 则可求得第 n 次失效后的软件可靠性函数估计 , 以及到第 n + 1 次失效发生的平均间隔时间的估计。

2、 J一 M 模型分析

J一M 模型的准确性主要取决于假设的有效性。在软件的调试排错阶段 , B o r n 一玩模型的四个基本假设是比较合理的 , 而对于 J一M 模型所附加的两条假设 , 在软件工程实践中具有一定的缺陷。首先 , 软件的失效率不仅仅取决于当前残留错误数。例如 , 一个仅含有两个不常碰到的错误 ( 即错误尺寸非常小 , 如 0 5 死锁等 ) 的软件 5 1 , 另一个仅含有一个经常出现的错误 ( 即错误尺寸较大 , 如下标动态超界等 ) 的软件 5 2 。显而易见 S , 比 S : 可靠性高。这样 , 假设 5 就不成立。其次 , 根据定义 , 错误尺寸是某一错误导致软件失效的概率 , 即对软件失效率的贡献率。很明显 , 错误尺寸越大 , 就越容易造成软件运行失效 , 就越容易被发现 ; 反之 , 错误尺寸越小 , 就越难被发现。从另一角度说 , 越先发现的错误 , 其错误尺寸越大 ; 而越是后发现的错误 , 其错误尺寸越小。也就是说 , 不同的软件错误 , 其错误尺寸是不相等的 , 而是随着被发现的顺序呈递减序列。这样 , 假设 6 也不成立。综上所述 , J一 M 模型所附加的两条假设 , 对于某些软件工程不适用 , 不能很好地反映软件的客观状况。此外 , 适用于软件调试阶段的其它出生模型 , 如 B a y e S 模型、 Sh o o m a n 模型、非出错计数模型等 , 也都存在类似的问题 , 为此 , 应予改进。

3、新的评估模型

软件的失效率不仅与其残留错误数有关 , 而且与每个错误的错误尺寸有关。如果软件残设 : 开始时软件的残留错误数为 N , 其相应的错误尺寸为 ∮_j( j= 1, 2 , … , N ) , 则失效率与可靠性函数由下式表示 :

由于错误尺寸随着发现的先后次序呈递减序列 , 因此 : ∮_j>∮_j+1; 。如果直接用 ( 2 ) 式进行分析计算 , 比较困难。为减化计算 , 根据 ( 3 ) 式引人假设 7;

假设 7 : 第 i ( + l ) 个错误与第 i 个错误的错误尺寸之比为常数。即 : ∮_j+1=K*∮j( 0 < K < 1 )。
令笋 ∮j=∮1 ,则，∮_j=k^j-1* ∮这样 ( 2 ) 式变为 :

4、软件故障数据的收集与预处理

软件测试数据是软件可靠性评估的基础 , 在软件调试排错阶段 , 开发人员应详细记录每次软件故障间隔时间 , 保证数据的客观性和准确性。对收集的数据在用于评估前 , 应进行初步处理。对重复出现的故障 , 应将前几次故障数据剔除 , 保留最后一次真正消除软件故障的那个数据 , 即如果第 i 次出现的故障剔除不成功 , 应将 x ` 删除 , 同时将 x 、 ,数据赋予 x 、 , 即 : x 、一` + , 一 t、 , 以此类推。另外 , 如果有多个程序模块 , 则各模块的故障数据应分别记录 , 不要混淆 , 同一程序模块的不同版本的软件故障数据也不要混淆。收集到一定数量的数据后 , 就可以进行数据分析 , 代入评估模型进行评估。
5 结束语
过去由于缺少切合软件开发实际的软件可靠性评估模型 , 在系统工程产品的可靠性分析和评估中 , 只对硬件进行 , 而将软件可靠度视为 1 , 即不考虑软件可靠性问题。事实上随着硬件可靠性的不断提高 , 软件可靠性显得日益突出。而且一个软件模块 , 开发人员调试到什么程度就可结束调试排错 , 也就是如何确定软件调试周期也是个棘手的问题。本文正是基于这种情况 , 结合系统工程实际 , 对软件调试排错阶段的可靠性评估模型进行探索 , 使得软件开发人员在软件调试阶段收集 n 个数据后 , 经过预处理 , 运用本文提供的评估模型计算得到该软件残留错误总数及下一个软件故障出现的平均时间。排除第 n 个软件错误后 , 也可以估计出该软件的平均无故障时间及排除剩余软件错误还需工作的时间。这对于开展软件可靠性增长试验 , 合理确定调试周期 , 调整软件开发计划等有较大作用。

他山之石：调试之剑

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

弗雷德里克·布鲁克斯( F r e d e r i c k P·B r o o ks ) 博士在他那篇著名的《没有银弹— 软件工程中的根本和次要问题》一文中 , 将软件项目比作可怕的人狼 (w e r e w o l v e s ) , 并大胆地预言十年内不会找到特别有效的银弹。该论文发表的时间是 19 8 6 年 , 如今整整 2 0 年过去了 , 尽管不时有人惊呼找到了神奇的银弹 , 但是冷静的人们很快发现那只是美好的愿望。
如果说软件工业中与人狼的战斗还在持续 , 那么在这些战役中一定会有程序员的身影 , 笔者也是其中的一个。我的编程生涯是从使用汇编语言编写 D O S 下的 T SR 程序开始的。今天 D O S 操作系统已经成为历史 , 在那个年代最值得炫耀的 T S R 技术也早已经过时了。十几年中 ,O W L、V F W、V D X、ISA P I、A e ti v e M o v i e 等技术也被时间淘汰… …然而 , 在这漫长的时间当中 , 我最看重的是软件调试技术。它是十几年中我学到的最有用、一直受用、而且日久弥新的一项技术。
从软件工程的角度来讲 , 软件调试是软件工程的一个重要部分 , 软件调试过程出现在软件工程的各个阶段。从最初的可行性分析、原型验证、到开发和测试阶段、再到发布后的维护与支持，都有调试过程的参与。通常认为，一个完整的软件调试过程由以下几个步骤组成：

重现故障
通常是用于调试的系统上重复导致故障的步骤，使要解决的问题出现在被调试的系统中。
定位根源
及综合利用各种调试工具，使用各种调试手段寻找导致软件故障的根源 (o r o t c a u s e )。通常测试人员报告和描述的是软件界面或工作行为中所表现出的异常 , 或者是与软件需求和功能规约不符的地方 , 泛指软件缺欠(d e f e c t ) 或者故障 (f a i l u e r )。而这些表面的缺欠总是由于一或多个内在因素所导致的。这些内因要么是代码的行为错误 , 要么是不行为错误 (该作而未作 )。
探索和实现解决方案
即根据寻找到的故障根源、和资源情况、紧迫程度等要求设计和实现解决方案。
验证方案 ,
在目标环境中测试方案的有效性 , 又称为回归 (e r g e r s s ) 测试。如果问题已经解决 , 那么就可以关闭问题。如果没有解决则回到第 3 步调整和修改解决方案。

这些步骤中 , 定位根源常常是最困难也是最关键的步骤 , 它是软件调试过程的核心和灵魂。如果没有找到故障根源 , 那么解决方案便很是隔靴搔痒 , 或者头痛医脚 , 白白浪费了时间。对软件调试的另一种更通俗的解释是指使用调试工具求解各种软件问题的过程, 例如跟踪软件的执行过程, 探索软件本身或者与其配套的其它软件或者硬件系统的工作原理等 , 这些过程的目的有可能是为了去除软件缺欠, 也可能不是。

在了解了软件调试技术的基本概念以后 , 下面我们来看一下支撑软件调试技术的几种基本机制。

断点 : 即当被调试程序执行到某一空间或时间点时将其中断到调试器中。根据中断条件分为如下几种 :
a、代码断点: 当程序执行到指定内存地址的代码时中断到调试器。
b、数据断点 : 当程序访问指定内存地址的数据时中断到调试器。
c、I/O 断点: 当程序访问指定 1 / 0 地址的端口时中断到调试器。
根据断点的设置方法 , 断点又分为软件断点和硬件断点。软件断点通常是通过向指定的代码位置插入专用的断点指令来实现的 . 比如 IA 32 C p U 的 IN 丁 3指令 (机器码为o x C C ) 就是断点指令。硬件断点通常是通过设置 C PU 的调试寄存器来设置的。 IA 3 2 C PU 定义了 8 个调试寄存器 , D R O一 D R 7 , 可以最多同时设置 4 个硬件断点〔对于一个调试会话)。通过调试寄存器可以设置以上三种断点中的任一种, 但是通过断点指令只可以设置代码断点。
单步跟踪 : 即让应用程序按照某单位一步步执行。根据单位 , 又分几种:
a、每次执行一条汇编指令 , 称为汇编语言一级的单步跟踪。设置 IA 32 C Pu 标志寄存器的 T F (rT 叩 lF a g , 即陷阱标志位 ) 位 , 便可以让 C P U 每执行完一条指令便产生一个调试异常 (N I T I ) , 中断到调试器。
b、每次执行源代码 (比汇编语言更高级的程序语言, 如 C / C料 ) 的一条语句 , 又称为源代码级的单步跟踪。通常高级语言的单步跟踪是通过反复设置 C P U 的陷阱标志位来实现的, 如果当前源代码行还没有执行完 , 那么调试器重新设置陷阱标志并让程序继续执行, 直到该语句结束(E I P 指向另一语句 ) 才中断给用户。
c、每次执行一个程序分支 , 又称为分支到分支单步跟踪。设置 IA 32 c Pu 的o bg e t lM s R寄存器的 B T F (B ra n e h T ra pF l g a )标志后 , 便可以启用分支到分支单步跟踪。
d、每次执行一个任务 (线程) , 即当一个任务 (线程 ) 被调度执行时中断到调试器。 IA 3 2 架构所定义的任务状态段( T Ss ) 中的 T标志为实现这一功能提供了硬件一级的支持 , 但是很多调试器还有提供这项功能。
栈回溯 (s ta e k ba e k ta r e e ) : 即通过记录在栈中的函数返回地址显示 (追溯 ) 函数调用过程。在将返回地址翻译成函数名时需要有调试符号 ( de b u g sy n t b o l ) 的支持。大多数编译器都支持在编译时生成调试符号。微软的调试符号服务器
( h t t P: // m s d lm ie r o s o f te o m /d o w n lo a d /sy n t b o ls )提供了大多数Wi n d o w s 系统文件的调试符号 , 是调试和学习w id n o w s操作系统的宝贵资源。
调试信息输出(de b铭 o u tP u印i r n t ) : 即将程序运行的位置、变量状态等信息输出到调试器、窗口、文件或者其它可以观察到的地方。这种方法的优点是简单方便、不依赖于调试器 , 但也有明显的缺点 , 如效率低 , 安全性差 , 通常不可以动态开启 , 且难以管理等。在W i n d o w s 操作系统中 , 驱动程序可以使用 D b g r P in t /D b g P i r in E x 来输出调试信息 , 应用程序可以调用o u tP u tD e b u g s i t r n g API
日志 ( 1 0 9 ) : 将程序运行的状态信息写人到特定的文件或者数据库中。 W in d o w s 操作系统提供了记录、观察和管理 (删除和备份 ) 日志的功能。 Win do w s v is a t 新引入 T 名为 C o m m o n L o g F i le s y s t e m (c L s F . S Y s ) 的内核模块 , 用于进一步加强日志功能。 .
事件迫踪 (e v e n t t r a e e ) : 通常用来监视频繁的复杂的软件过程 , 满足普通日志机制难以胜任的需求。比如监视大信息t 的文件操作、网络通信等。 E T W ( E v e n t T r a c e f o r Wi n d o w s ) 是Wid n o w s 操作系统内建的事件追踪机制 , Wi n d o w s 内核本身和很多W in do w s下的软件工具(如 B o v o t i s , T C即 P V ie w )都使用了该机制。

在以上机制中 , 断点和单步跟踪通常必须在有调试器参与的情况下才能使用。调试器 ( s o f t w a e r de b u g g e r ) 是综合提供各种调试功能的软件工具。除了处理断点、单步跟踪、模块映射等调试事件外 , 调试器通常还提供如下功能 :

观察和编辑被调试程序的内存和数据 , 如全局变量、局部变量、以及程序的栈和堆等重要数据结构。
观察和反汇编被调试程序的代码。
显示线程栈中的函数调用信息。
管理调试符号。
控制进程和线程 , 例如将被调试程序中断到调试器中 , 和恢复其执行等。

根据调试器所调试目标程序的工作模式 , 可以把调试器分为用户态调试器和内核态调试器 , 前者用于调试用户态下的各种程序 (应用程序、系统服务、或者用户态的 D L L 模块 ) , 后者用于调试工作在内核模式的程序 , 如驱动程序和操作系统的内核部分。 Wi n D b g 是微软开发的一个免费调试器 , 它既可以用作用户态调试器 , 也可以用作内核态调试器 , 是调试 Win d o w s 操作系统下的各种软件的一个强有力工具。我几乎每天都使用 w in D bg , 它是我的计算机中使用频率最高的软件之一。

最后 , 简要地描述一下软件调试技术的几个特征。

系统性— 很多看似简单的调试机制都是依靠系统内的多个部件协同工作而完成的。以软件断点为例 , C P U 提供了指令支持和硬件级的异常机制 , 操作系统将异常以调试事件的形式分发给调试器 , 调试器响应调试事件并与用户交互。如果在做源代码级的调试 , 那么调试器又需要编译器所产生的调试符号来帮忙。

全局性— 对于一个软件项目 , 应该在项目的设计和架构阶段就制定出全局的调试支持机制 , 并贯彻实施。比如 , 所有模块都应该使用统一的方法来输出调试信息、记录日志、报告错误 , 并公开统一的接口用做单元测试和故障诊断。这样不仅可以避免重复工作 , 而且增加T 软件的可调适性 (d e bu g g a bi一 i ty ) , 有利于保证产品的质量和进度。

困难性— 《C 语言编程》一书的作者 B r ia n K e r n ig ha n 曾经说过 , “ 调试天生就比编写代码难上一倍 , 如果你写出了最聪明的代码 , 那么你的智商就不足以调试这个代码。 ” 因为 , 要调试一个程序 ,就必须深刻理解它的工作原理 , 不仅要知道 h o w 和表层的东西 , 还要知道w h y 和深层次的内幕。另外 , 调试需要锲而不舍的探索精神和坚韧的耐力 , 这也让很多人望而却步。

综上所述 , 软件调试技术是与软件开发密不可分的一门技术 , 其初衷是为了定位和去除软件故障 , 但因为调试技术所具有的对软件的强大控制力和观察力 , 其应用早已延伸到了很多其它领域 , 比如逆向工程、计算机安全等等。学习和灵活运用软件调试技术 , 不仅可以提高程序员的工作效率 , 而且有利于提升对代码的感知力和控制力 , 加深对软件和系统的理解。此外 , 调试技术是解决各种软件难题的一种有效武器。它直击要害、锐不可档 , 相对其它间接方法具有明显的优势。软件有大美 , 调试见真功。在寻找银弹的努力还在继续的时候 , 衷心地希望所有程序员朋友都学会使用调试这把利剑吧 , 使用它为你披荆斩棘 , 帮你探索前进。只要你的这把剑依然锋利 , 那你的软件青春就永远不老。

他山之石：软件调试过程中的心里效应与心理承受能力分析

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

随着计算机技术的飞速发展和普及 , 越来越多的人直接与计算机打交道 , 因而产生了研究计算机操作者心理状态的一门综合性很强的边缘交叉科学 - 一软件心理学。软件心理学把实验心理学的技术和认知心理学的概念应用于计算机和信息科学 , 它主要研究了计算机科学中人机系统和软件设计中人类心理和行为活动的规律。对软件心理学的研究 , 在我国还是刚刚起步 , 本文对这一领域进行了探讨和尝试 , 探讨程序调试过程中人机对话对人的心理的影响 , 探讨了人同机器会话的心理感受 , 探讨程序与机器速度的关系 , U N IX 分时系统终端数与模块大小的关系。进而探讨如何确定合适的程序模块, 合理的选择机型 , 使程序员不致因为环境因素造成软件调试过程中的心理压力。

心理承受能力实验

首先把用户 (程序员 ) 对机器响应的承受能力分成七个等级 : 极快 (1 ), 快 (2 ), 较快 (3） ,中等 (4 ) , 稍慢 (5 ), 慢 (6 ), 无法忍受 (7) 。本文主要讨论如下几个问题:

PC 机及兼容机上编译 C 语言程序时的心理承受能力分析;
U N IX 分时操作系统环境下 , 编译 O 程序的过程中如何影响程序员的心理状态 ;
人机会话期间 , 中间信息的输入/ 输出对程序员的影响。
P C 机编译 C 程序的实验选择 P C /X T 和 C 8 6 2 . 0 编译器 , 把给定的 6 0 个大小不等的程序共

P C 机编译 C 程序的实验

选择 P C /X T 和 C 8 6 2 . 0 编译器 , 把给定的 6 0 个大小不等的程序共分成 6 组 , 侮组」 0 个程序 , 分组原则是第一组语句 2 1 ~ 3 0 行 , 第二组 3 1 ~ 4 0 , 第三组 4 J ~ o 6 , 第四组 6 1 ~ 阳 , 第五组 8 1” 1 0 0 , 第六组 10 0 ~ 20 0 。对每组程序进行编译测试 , 得出的时间求平均位 , 对该组程序的承受级别求平均值。以第四组程序为例说明测试的过程和测试结果 : 参加测试的四名程序员是计算机软件专业本科四年级的学生。 A , B 男同学 , O , D 女同学。测试过程如下: 先给 10 个程序编号 P 丸 P Z , … , P I O。 A , O 一组 , B , D 为另一组。以A、C 组为例。 C 开始编译一个程序 iP , 记录下开始时间 T l 和结束时间 T Z , 当程序曰编译结束时 , A 说出感受级别, 记录下编译时间口、2一甲1 、 , 0 J 个程序都测试一遍。人 . e 角色互换再测试一遍 , 得出 O 的承受级别 , 同样测出 B , D 的承受级别

平均编译时间 2 6.89 秒 , 平均承受级别3 . 8 ( 中等)。其中二名男同学的平均承受级别4.0 , 二名女同学 3 . 6 。同样的方法得出 6 组程序平均编译时间、平均承受级别如表1.

顺便说一下 , 每组程序测试的结果都表明, 女同学的承受级别普遍小于男同学10% 左右 , 这点说明了在调试过程中, 女同学更有忍耐性 , 更适合做调试工作 (而不是设计)。

不同机型编译 C 程序

选择第六组程序进行实验 (实验过程类似上面实验 1 )。

有屏幕输出信息的心理测试实验

对于小程序 , 看屏幕输出与不看屏幕输出对程序员心理无明显影响 , 对于第六组稍大一点的程序 , 看屏幕输出时, 在 S U P E R P O/ X T 机上, 平均编译时间仍为 38 . 2 9 秒 , 但用户平均感受级别 4 , 在 P O /X T 2 8 6上 , 平均感受级别仍是 3 。这一结果指出了中间信息的输出有时对改善程序员心理有较大作用 , 有时则不明显。
UN I X 分时系统编译实验 ( 680 00 机 )

进行 680 0 0 机编译实验时 , 增补一些较短的程序 , 被测程序语句行 1 0 ~ 2 0 0, 实验结果如下 :

4 台终端同时工作 , 每个程序编译时间4 0 ~ 62 秒 ;

6 台终端同时工作 , 每个程序编译时间7 0 ~ 11 0 秒;

9 台终端同时工作 , 最短程序编译时间接近 3 分钟。

从中看出, 分时系统进行编译或运行 , 对用户心理压力最大的因素来自同时工作终端数 ( C P U 速度) , 其次才是程序规模。因此 , 安排学生在分时系统上机时 , 应考虑这点。

程序调试中个体差异的实验

本实验是让二名受试者背对机器 , 编译开始时 , 二名受试者被告之开始 (事实上 , 根本就没有编译程序 , 只是发出指令信号 ) , 被测者根据自己感觉的时间 , 说出心理感受级别, 下面是记了结果

实验分析与结论

这里讨论的一些结论全部基于心理承受级别不能超过 4 ( 中等) , 承受级别 5 ~ 7 时 , 对程序员的程序调试有很大的心理和身体影响。长期的心理压力也影响程序调试的准确性 , 增加出错率 , 导致程序调试的逆反心理。
1、机器速度对程序员心理的影响表 1 中数据表明大于 8 1 行语句的程序在 S U P E R P O / X T 上编译时, 承受级别 5 , 而在邹 6 _ ! 几编译至少级别是 3 。这说明了大于 8 1 一行的程序模块至少要在 2 86 上调试。 P C 机及卫C / x T 的低档机只可做简易的实习用。
2、屏幕输出对程序员心理的影响实验 3 的结论指示了增加屏幕输出有助于改善调试程序的心理压力 , 但太多的增加 I / O 信息又延长编译时间 , 是否有数据可参考呢 ? 实验 3 数据表明 3 8~ 4 0 秒的界限是心理危机的开始, 因而编译程序应在运行 3 8 秒左右时提供一些信息。如 p O T O O I J 一工具进行磁盘O O p Y 时 , 有磁道的一些信息输出。用户自身的程序运行时, 3 8 秒同样是个界值 , 用户应在相应的程序处加上 1 / 0 信息 , 由于机器主频不一致 , 用户自己根据情况处理。爪 l ) J E R 卫o / x T 一般 10 0 ~ 20 0 语句 , 2 8 6 一般 ` 1 0 0~ 加 0 等 , 这只是笔者之建议 , 供参考。

3、速度祖的机器运行大程序心理调整由于 P O 及兼容机 (1 . OX ) 速度较慢 , 运行大一点程序 (1 0 0 行 ) , 用户的心理压力就很大 , 一般应做心理调整或更换编译器。表 2 中的数据表明更换编译器可使承受级别提高1 、 2 级。另外一点是在上机前就应“ 明确” , 程序很大时 , 编译时间长。

4、UN I X 分时系统影响用户心理的讨论前面已讨论过 , 分时系统对用户的心理影响主要是机器速度 , 其次是编译软件。因而除更换编译软件和心理自身调节外 , 就必须对机器更新换代了。另外 , 笔者在 A ST 2 3 6 上调试 1 0 0 0 ~ 2 0 0 0 行的模块时 , 发现仍有较大的心理压力 , 承受级别 4 ~ 5 , 这也说明心理压力的调节主要靠硬件更新。
5、音响、图像对心理因素的影响笔者对 4 名受测者测试 , 给受试者 M S一 O 和 T U R B O 一 O 二种编译器 (受试者以前从未使用过 C ) , 受试者都愿使用 T U R B O O , 理由是画面直观 , 操作方便。但当笔者介绍了 M S哪 . 0 的 O O D E V I E W , M A K E 和 Q i l t c k一 O 等后 , 受试者表示也愿意选择 M S 一 O 。

心理调节能力与衡量标准

表 1 中数据和实验 5 中相比较 , 可以看出表 1 中承受级别的时间明显高于实验 5 中数据。图 4 是图 1 , 图 2 和图 3 的合成图。