wenmo8 发布的文章

他山之石：调试之剑

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

弗雷德里克·布鲁克斯( F r e d e r i c k P·B r o o ks ) 博士在他那篇著名的《没有银弹— 软件工程中的根本和次要问题》一文中 , 将软件项目比作可怕的人狼 (w e r e w o l v e s ) , 并大胆地预言十年内不会找到特别有效的银弹。该论文发表的时间是 19 8 6 年 , 如今整整 2 0 年过去了 , 尽管不时有人惊呼找到了神奇的银弹 , 但是冷静的人们很快发现那只是美好的愿望。
如果说软件工业中与人狼的战斗还在持续 , 那么在这些战役中一定会有程序员的身影 , 笔者也是其中的一个。我的编程生涯是从使用汇编语言编写 D O S 下的 T SR 程序开始的。今天 D O S 操作系统已经成为历史 , 在那个年代最值得炫耀的 T S R 技术也早已经过时了。十几年中 ,O W L、V F W、V D X、ISA P I、A e ti v e M o v i e 等技术也被时间淘汰… …然而 , 在这漫长的时间当中 , 我最看重的是软件调试技术。它是十几年中我学到的最有用、一直受用、而且日久弥新的一项技术。
从软件工程的角度来讲 , 软件调试是软件工程的一个重要部分 , 软件调试过程出现在软件工程的各个阶段。从最初的可行性分析、原型验证、到开发和测试阶段、再到发布后的维护与支持，都有调试过程的参与。通常认为，一个完整的软件调试过程由以下几个步骤组成：

重现故障
通常是用于调试的系统上重复导致故障的步骤，使要解决的问题出现在被调试的系统中。
定位根源
及综合利用各种调试工具，使用各种调试手段寻找导致软件故障的根源 (o r o t c a u s e )。通常测试人员报告和描述的是软件界面或工作行为中所表现出的异常 , 或者是与软件需求和功能规约不符的地方 , 泛指软件缺欠(d e f e c t ) 或者故障 (f a i l u e r )。而这些表面的缺欠总是由于一或多个内在因素所导致的。这些内因要么是代码的行为错误 , 要么是不行为错误 (该作而未作 )。
探索和实现解决方案
即根据寻找到的故障根源、和资源情况、紧迫程度等要求设计和实现解决方案。
验证方案 ,
在目标环境中测试方案的有效性 , 又称为回归 (e r g e r s s ) 测试。如果问题已经解决 , 那么就可以关闭问题。如果没有解决则回到第 3 步调整和修改解决方案。

这些步骤中 , 定位根源常常是最困难也是最关键的步骤 , 它是软件调试过程的核心和灵魂。如果没有找到故障根源 , 那么解决方案便很是隔靴搔痒 , 或者头痛医脚 , 白白浪费了时间。对软件调试的另一种更通俗的解释是指使用调试工具求解各种软件问题的过程, 例如跟踪软件的执行过程, 探索软件本身或者与其配套的其它软件或者硬件系统的工作原理等 , 这些过程的目的有可能是为了去除软件缺欠, 也可能不是。

在了解了软件调试技术的基本概念以后 , 下面我们来看一下支撑软件调试技术的几种基本机制。

断点 : 即当被调试程序执行到某一空间或时间点时将其中断到调试器中。根据中断条件分为如下几种 :
a、代码断点: 当程序执行到指定内存地址的代码时中断到调试器。
b、数据断点 : 当程序访问指定内存地址的数据时中断到调试器。
c、I/O 断点: 当程序访问指定 1 / 0 地址的端口时中断到调试器。
根据断点的设置方法 , 断点又分为软件断点和硬件断点。软件断点通常是通过向指定的代码位置插入专用的断点指令来实现的 . 比如 IA 32 C p U 的 IN 丁 3指令 (机器码为o x C C ) 就是断点指令。硬件断点通常是通过设置 C PU 的调试寄存器来设置的。 IA 3 2 C PU 定义了 8 个调试寄存器 , D R O一 D R 7 , 可以最多同时设置 4 个硬件断点〔对于一个调试会话)。通过调试寄存器可以设置以上三种断点中的任一种, 但是通过断点指令只可以设置代码断点。
单步跟踪 : 即让应用程序按照某单位一步步执行。根据单位 , 又分几种:
a、每次执行一条汇编指令 , 称为汇编语言一级的单步跟踪。设置 IA 32 C Pu 标志寄存器的 T F (rT 叩 lF a g , 即陷阱标志位 ) 位 , 便可以让 C P U 每执行完一条指令便产生一个调试异常 (N I T I ) , 中断到调试器。
b、每次执行源代码 (比汇编语言更高级的程序语言, 如 C / C料 ) 的一条语句 , 又称为源代码级的单步跟踪。通常高级语言的单步跟踪是通过反复设置 C P U 的陷阱标志位来实现的, 如果当前源代码行还没有执行完 , 那么调试器重新设置陷阱标志并让程序继续执行, 直到该语句结束(E I P 指向另一语句 ) 才中断给用户。
c、每次执行一个程序分支 , 又称为分支到分支单步跟踪。设置 IA 32 c Pu 的o bg e t lM s R寄存器的 B T F (B ra n e h T ra pF l g a )标志后 , 便可以启用分支到分支单步跟踪。
d、每次执行一个任务 (线程) , 即当一个任务 (线程 ) 被调度执行时中断到调试器。 IA 3 2 架构所定义的任务状态段( T Ss ) 中的 T标志为实现这一功能提供了硬件一级的支持 , 但是很多调试器还有提供这项功能。
栈回溯 (s ta e k ba e k ta r e e ) : 即通过记录在栈中的函数返回地址显示 (追溯 ) 函数调用过程。在将返回地址翻译成函数名时需要有调试符号 ( de b u g sy n t b o l ) 的支持。大多数编译器都支持在编译时生成调试符号。微软的调试符号服务器
( h t t P: // m s d lm ie r o s o f te o m /d o w n lo a d /sy n t b o ls )提供了大多数Wi n d o w s 系统文件的调试符号 , 是调试和学习w id n o w s操作系统的宝贵资源。
调试信息输出(de b铭 o u tP u印i r n t ) : 即将程序运行的位置、变量状态等信息输出到调试器、窗口、文件或者其它可以观察到的地方。这种方法的优点是简单方便、不依赖于调试器 , 但也有明显的缺点 , 如效率低 , 安全性差 , 通常不可以动态开启 , 且难以管理等。在W i n d o w s 操作系统中 , 驱动程序可以使用 D b g r P in t /D b g P i r in E x 来输出调试信息 , 应用程序可以调用o u tP u tD e b u g s i t r n g API
日志 ( 1 0 9 ) : 将程序运行的状态信息写人到特定的文件或者数据库中。 W in d o w s 操作系统提供了记录、观察和管理 (删除和备份 ) 日志的功能。 Win do w s v is a t 新引入 T 名为 C o m m o n L o g F i le s y s t e m (c L s F . S Y s ) 的内核模块 , 用于进一步加强日志功能。 .
事件迫踪 (e v e n t t r a e e ) : 通常用来监视频繁的复杂的软件过程 , 满足普通日志机制难以胜任的需求。比如监视大信息t 的文件操作、网络通信等。 E T W ( E v e n t T r a c e f o r Wi n d o w s ) 是Wid n o w s 操作系统内建的事件追踪机制 , Wi n d o w s 内核本身和很多W in do w s下的软件工具(如 B o v o t i s , T C即 P V ie w )都使用了该机制。

在以上机制中 , 断点和单步跟踪通常必须在有调试器参与的情况下才能使用。调试器 ( s o f t w a e r de b u g g e r ) 是综合提供各种调试功能的软件工具。除了处理断点、单步跟踪、模块映射等调试事件外 , 调试器通常还提供如下功能 :

观察和编辑被调试程序的内存和数据 , 如全局变量、局部变量、以及程序的栈和堆等重要数据结构。
观察和反汇编被调试程序的代码。
显示线程栈中的函数调用信息。
管理调试符号。
控制进程和线程 , 例如将被调试程序中断到调试器中 , 和恢复其执行等。

根据调试器所调试目标程序的工作模式 , 可以把调试器分为用户态调试器和内核态调试器 , 前者用于调试用户态下的各种程序 (应用程序、系统服务、或者用户态的 D L L 模块 ) , 后者用于调试工作在内核模式的程序 , 如驱动程序和操作系统的内核部分。 Wi n D b g 是微软开发的一个免费调试器 , 它既可以用作用户态调试器 , 也可以用作内核态调试器 , 是调试 Win d o w s 操作系统下的各种软件的一个强有力工具。我几乎每天都使用 w in D bg , 它是我的计算机中使用频率最高的软件之一。

最后 , 简要地描述一下软件调试技术的几个特征。

系统性— 很多看似简单的调试机制都是依靠系统内的多个部件协同工作而完成的。以软件断点为例 , C P U 提供了指令支持和硬件级的异常机制 , 操作系统将异常以调试事件的形式分发给调试器 , 调试器响应调试事件并与用户交互。如果在做源代码级的调试 , 那么调试器又需要编译器所产生的调试符号来帮忙。

全局性— 对于一个软件项目 , 应该在项目的设计和架构阶段就制定出全局的调试支持机制 , 并贯彻实施。比如 , 所有模块都应该使用统一的方法来输出调试信息、记录日志、报告错误 , 并公开统一的接口用做单元测试和故障诊断。这样不仅可以避免重复工作 , 而且增加T 软件的可调适性 (d e bu g g a bi一 i ty ) , 有利于保证产品的质量和进度。

困难性— 《C 语言编程》一书的作者 B r ia n K e r n ig ha n 曾经说过 , “ 调试天生就比编写代码难上一倍 , 如果你写出了最聪明的代码 , 那么你的智商就不足以调试这个代码。 ” 因为 , 要调试一个程序 ,就必须深刻理解它的工作原理 , 不仅要知道 h o w 和表层的东西 , 还要知道w h y 和深层次的内幕。另外 , 调试需要锲而不舍的探索精神和坚韧的耐力 , 这也让很多人望而却步。

综上所述 , 软件调试技术是与软件开发密不可分的一门技术 , 其初衷是为了定位和去除软件故障 , 但因为调试技术所具有的对软件的强大控制力和观察力 , 其应用早已延伸到了很多其它领域 , 比如逆向工程、计算机安全等等。学习和灵活运用软件调试技术 , 不仅可以提高程序员的工作效率 , 而且有利于提升对代码的感知力和控制力 , 加深对软件和系统的理解。此外 , 调试技术是解决各种软件难题的一种有效武器。它直击要害、锐不可档 , 相对其它间接方法具有明显的优势。软件有大美 , 调试见真功。在寻找银弹的努力还在继续的时候 , 衷心地希望所有程序员朋友都学会使用调试这把利剑吧 , 使用它为你披荆斩棘 , 帮你探索前进。只要你的这把剑依然锋利 , 那你的软件青春就永远不老。

他山之石：软件调试过程中的心里效应与心理承受能力分析

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

随着计算机技术的飞速发展和普及 , 越来越多的人直接与计算机打交道 , 因而产生了研究计算机操作者心理状态的一门综合性很强的边缘交叉科学 - 一软件心理学。软件心理学把实验心理学的技术和认知心理学的概念应用于计算机和信息科学 , 它主要研究了计算机科学中人机系统和软件设计中人类心理和行为活动的规律。对软件心理学的研究 , 在我国还是刚刚起步 , 本文对这一领域进行了探讨和尝试 , 探讨程序调试过程中人机对话对人的心理的影响 , 探讨了人同机器会话的心理感受 , 探讨程序与机器速度的关系 , U N IX 分时系统终端数与模块大小的关系。进而探讨如何确定合适的程序模块, 合理的选择机型 , 使程序员不致因为环境因素造成软件调试过程中的心理压力。

心理承受能力实验

首先把用户 (程序员 ) 对机器响应的承受能力分成七个等级 : 极快 (1 ), 快 (2 ), 较快 (3） ,中等 (4 ) , 稍慢 (5 ), 慢 (6 ), 无法忍受 (7) 。本文主要讨论如下几个问题:

PC 机及兼容机上编译 C 语言程序时的心理承受能力分析;
U N IX 分时操作系统环境下 , 编译 O 程序的过程中如何影响程序员的心理状态 ;
人机会话期间 , 中间信息的输入/ 输出对程序员的影响。
P C 机编译 C 程序的实验选择 P C /X T 和 C 8 6 2 . 0 编译器 , 把给定的 6 0 个大小不等的程序共

P C 机编译 C 程序的实验

选择 P C /X T 和 C 8 6 2 . 0 编译器 , 把给定的 6 0 个大小不等的程序共分成 6 组 , 侮组」 0 个程序 , 分组原则是第一组语句 2 1 ~ 3 0 行 , 第二组 3 1 ~ 4 0 , 第三组 4 J ~ o 6 , 第四组 6 1 ~ 阳 , 第五组 8 1” 1 0 0 , 第六组 10 0 ~ 20 0 。对每组程序进行编译测试 , 得出的时间求平均位 , 对该组程序的承受级别求平均值。以第四组程序为例说明测试的过程和测试结果 : 参加测试的四名程序员是计算机软件专业本科四年级的学生。 A , B 男同学 , O , D 女同学。测试过程如下: 先给 10 个程序编号 P 丸 P Z , … , P I O。 A , O 一组 , B , D 为另一组。以A、C 组为例。 C 开始编译一个程序 iP , 记录下开始时间 T l 和结束时间 T Z , 当程序曰编译结束时 , A 说出感受级别, 记录下编译时间口、2一甲1 、 , 0 J 个程序都测试一遍。人 . e 角色互换再测试一遍 , 得出 O 的承受级别 , 同样测出 B , D 的承受级别

平均编译时间 2 6.89 秒 , 平均承受级别3 . 8 ( 中等)。其中二名男同学的平均承受级别4.0 , 二名女同学 3 . 6 。同样的方法得出 6 组程序平均编译时间、平均承受级别如表1.

顺便说一下 , 每组程序测试的结果都表明, 女同学的承受级别普遍小于男同学10% 左右 , 这点说明了在调试过程中, 女同学更有忍耐性 , 更适合做调试工作 (而不是设计)。

不同机型编译 C 程序

选择第六组程序进行实验 (实验过程类似上面实验 1 )。

有屏幕输出信息的心理测试实验

对于小程序 , 看屏幕输出与不看屏幕输出对程序员心理无明显影响 , 对于第六组稍大一点的程序 , 看屏幕输出时, 在 S U P E R P O/ X T 机上, 平均编译时间仍为 38 . 2 9 秒 , 但用户平均感受级别 4 , 在 P O /X T 2 8 6上 , 平均感受级别仍是 3 。这一结果指出了中间信息的输出有时对改善程序员心理有较大作用 , 有时则不明显。
UN I X 分时系统编译实验 ( 680 00 机 )

进行 680 0 0 机编译实验时 , 增补一些较短的程序 , 被测程序语句行 1 0 ~ 2 0 0, 实验结果如下 :

4 台终端同时工作 , 每个程序编译时间4 0 ~ 62 秒 ;

6 台终端同时工作 , 每个程序编译时间7 0 ~ 11 0 秒;

9 台终端同时工作 , 最短程序编译时间接近 3 分钟。

从中看出, 分时系统进行编译或运行 , 对用户心理压力最大的因素来自同时工作终端数 ( C P U 速度) , 其次才是程序规模。因此 , 安排学生在分时系统上机时 , 应考虑这点。

程序调试中个体差异的实验

本实验是让二名受试者背对机器 , 编译开始时 , 二名受试者被告之开始 (事实上 , 根本就没有编译程序 , 只是发出指令信号 ) , 被测者根据自己感觉的时间 , 说出心理感受级别, 下面是记了结果

实验分析与结论

这里讨论的一些结论全部基于心理承受级别不能超过 4 ( 中等) , 承受级别 5 ~ 7 时 , 对程序员的程序调试有很大的心理和身体影响。长期的心理压力也影响程序调试的准确性 , 增加出错率 , 导致程序调试的逆反心理。
1、机器速度对程序员心理的影响表 1 中数据表明大于 8 1 行语句的程序在 S U P E R P O / X T 上编译时, 承受级别 5 , 而在邹 6 _ ! 几编译至少级别是 3 。这说明了大于 8 1 一行的程序模块至少要在 2 86 上调试。 P C 机及卫C / x T 的低档机只可做简易的实习用。
2、屏幕输出对程序员心理的影响实验 3 的结论指示了增加屏幕输出有助于改善调试程序的心理压力 , 但太多的增加 I / O 信息又延长编译时间 , 是否有数据可参考呢 ? 实验 3 数据表明 3 8~ 4 0 秒的界限是心理危机的开始, 因而编译程序应在运行 3 8 秒左右时提供一些信息。如 p O T O O I J 一工具进行磁盘O O p Y 时 , 有磁道的一些信息输出。用户自身的程序运行时, 3 8 秒同样是个界值 , 用户应在相应的程序处加上 1 / 0 信息 , 由于机器主频不一致 , 用户自己根据情况处理。爪 l ) J E R 卫o / x T 一般 10 0 ~ 20 0 语句 , 2 8 6 一般 ` 1 0 0~ 加 0 等 , 这只是笔者之建议 , 供参考。

3、速度祖的机器运行大程序心理调整由于 P O 及兼容机 (1 . OX ) 速度较慢 , 运行大一点程序 (1 0 0 行 ) , 用户的心理压力就很大 , 一般应做心理调整或更换编译器。表 2 中的数据表明更换编译器可使承受级别提高1 、 2 级。另外一点是在上机前就应“ 明确” , 程序很大时 , 编译时间长。

4、UN I X 分时系统影响用户心理的讨论前面已讨论过 , 分时系统对用户的心理影响主要是机器速度 , 其次是编译软件。因而除更换编译软件和心理自身调节外 , 就必须对机器更新换代了。另外 , 笔者在 A ST 2 3 6 上调试 1 0 0 0 ~ 2 0 0 0 行的模块时 , 发现仍有较大的心理压力 , 承受级别 4 ~ 5 , 这也说明心理压力的调节主要靠硬件更新。
5、音响、图像对心理因素的影响笔者对 4 名受测者测试 , 给受试者 M S一 O 和 T U R B O 一 O 二种编译器 (受试者以前从未使用过 C ) , 受试者都愿使用 T U R B O O , 理由是画面直观 , 操作方便。但当笔者介绍了 M S哪 . 0 的 O O D E V I E W , M A K E 和 Q i l t c k一 O 等后 , 受试者表示也愿意选择 M S 一 O 。

心理调节能力与衡量标准

表 1 中数据和实验 5 中相比较 , 可以看出表 1 中承受级别的时间明显高于实验 5 中数据。图 4 是图 1 , 图 2 和图 3 的合成图。

C++基于SEH二次封装的异常流程与识别

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

在看代码之前我们先连简单的看下try的处理流程吧

函数入口设置回调函数
函数的异常抛出使用了__CxxThrowException函数，此函数包含了两个参数，分别是抛出一场关键字的throw的参数的指针，另一个抛出信息类型的指针（ThrowInfo *）。
在异常回调函数中，可以得到异常对象的地址和对应ThrowInfo数据的地址以及FunInfo表结构的地址。根据记录的异常类型，进行try块的匹配工作
没找到try块怎么办？先调用异常对象的析构函数，然后反汇ExcetionContinueSearch，继续反回到SEH继续执行。
找到了try块？通过TryBlockMapEntry结构中的pCatch指向catch信息，用ThrowInfo结构中的异常类型遍历查找相匹配的catch块，比较关键字名称，找到有效的catch块。
然后进行栈展开。
析构try块中的对象
跳转到catch块中执行
调用_JumpToContinuation函数，返回catch语句块的结束地址。

上面的步骤，就是典型的异常处理的顺序。

光看文字多无趣，上代码 - 实例分析，我们来跑一遍：

1

他山之石：一种循环结构的软件调试方法

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

1 引言

软件规模日趋庞大 , 软件调试中 , 发现、定位、分析错误的工作量也相应增长。因此 , 人们开发了 C o d e iV e w 等调试工具以深入错误发生时的程序执行环境 , 使效率大增。不过对于下面的循环结构 ( 以 C 语言为例 )仍有为难之处 :

假定该循环共执行 1 0 0 0 0 遍 , 第 3 0 0 0 次执行死机了 , 那么用调试工具判定死机发生在该循环中很容易 , 但再进一步分析则不可能。因为 , 若设断点于循环内 , 则每次循环皆被中断 , 至 3 0 0 0 次运行才能发现错误所在 , 以后欲分析错误也是每 3 0 0 0 次运行方可进入出错环境一次 , 这绝对无法容忍。

2 调试方法

在这里笔者介绍一种在调试软件过程中改进了的方法 , 可解决这个问题。对于上面的实例只需增加几条语句即可 , 如下所示。其中 fp 为文件指针 , n u m b e r 是初值为零的整型变量 ,
d o o n h t in g 为一空函数 , 它们都为调试而设立。具体的调试方法是将不设断点的程序先执行一次 , 然后阅读 r e c o r d . da t 找出错误发生时的n u m be r 值 , 再设 br e a k p o in t 为该 n u m be r 值 , 置断点于 d o n o t h i n g o 这一行上 , 即可使程序非常方便地运行到出错处停住。

这里文件先用 “ w ” 方式打开 , 就自然清除了上次执行形成的 r e c o r d . da t 。在循环中用“ a " 方式将每次循环中的 n u m h a r 值等关键参数逐次记入文件尾部。切记一定要在循环内打开文件 , 写入信息 , 再关闭文件 , 这可保证切实形成文件 ; 否则 (在进入循环前打开 , 结束循环后关闭) , 一旦循环内出现死机等严重间题 , 文件就不能形成。对于复杂的循环 , 记录于文件中的信息应包含一些除 n u m b e r 外的其他重要参数 , 既利于发现错误 ( 参数异常就是出错 , 不必非死机等重大问题才知出错了 ) , 又有利于了解循环执行过程而分析错误 , 因此 , 这些参数选择的好坏直接影响调试效率。在这个例子中设 do_mai n _ w o r k 为循环中的实质所在 , 又很复杂 , 其余仅是简 . 单工作 , 则应记录它的参数 ( 假设参数 1 为整型 , 参数 2 为双精度型 ) 。

n u m b e r 系一附加变量 , 如循环中有一不断增大或不断减小的变量可用 , 则也可用该变量代替 n u m b e r 的作用。不过本例适用于任何循环 , 则是标准的方法。另外 i f 语句中的相等关系也可用适当的不等关系取代 , 如本例中用不小于关系 , 则 n u m b e r 不小于 b r e a k p o i n t 后的每一次循环中断点有效。 b r e a k p i o n t 最好不要用一常量 ( 以免常常修改 ) , 而采用一变量 , 它可在进入循环前读入或由命令行参数传入 , 如此则程序无须改动而可停在循环的任意次数上。 b r e a kp o in t 类型自然与 n u m b e r 或其他替代者相同。

3 结语

这种方法有利于发现错误 , 以后利用调试工具又极易进入出错时的环境 , 而且为调试而增加的程序是固定不变的 , 故大大提高了效率。不过除了死机、除零等中断程序运行的错误一定发生在 r e c o r d . d a t 的最后一行记录写入后外 , 其余错误往往比较含蓄而要查找一番 , 如关键参数出错 , 则可能需要认真阅读 r e c o r .d
da t , 对于一些不影响关键参数的小错则可能需要另想办法。另外发现的可能是表面错误 , 如果死机由前面某次循环中的错误埋下祸根 , 则需先由死机处仔细分析 , 发现疑点 , 再重设
b r e a k p o f n t 去分析疑点 , 深挖根源 . 所以使用该法虽减小了工作量 , 但软件调试仍是一项艰巨的任务 .

他山之石：软件调试的方法与技巧

作者: wenmo8
时间: 2023-01-31
分类: 调试
评论

软件的调试也称纠错或排错 , 它是孤立并纠正错误的一种技巧性过程。软件错误的外部表现形式与内部原因之间往往没有明显的联系 , 所出现的差错并非直接就能找出原因。因此 , 调试既要对错误的性质及程序本身进行系统的研究 , 在某种程度上也要靠直觉与经验。到目前为止 , 调试还没有一套经得起检验的完整而系统的理论方法 , 排错时所采用的方法和时间都不能事先确定 . 这样 , 通常认为调试是困难的 , 是软件开发过程中最为艰巨的一种脑力劳动。本文拟就调试的方法、技术与技巧进行探讨 .

调试的步骤

诊断错误

或是系统报错 , 或是输出结果与设想的不同 , 或是陷入死循环等 , 都认为程序存在错误 .

确定错误的源发点

发现错误的地方不一定是错误的源发点 , 应寻找所有与错误有关的地方 , 从而确定错误的源发点。例如程序 :
1 0 F O R I= 1 T O 1 0
20 R E A D A ( I )
30 N E X T I
4 0 D A T A 15 , 1 6 , 2 5 , 27 , 2 8
R U N
O U T O F D A T A 1 N 2 0
错误发生于 2 0 行 , 但与第 4 0 行有关。

改正错误

确定错误及位置后 , 针对错误的具体类型进行改正。在纠错过程的两方面即确定错误及位置和改正错误中 , 第一方面的工作大约相当于整个工作的 9 5 % , 为排错的关键。故本文重点探讨错误的诊断方法与技巧。

诊断错误的实验方法

静态调试

静态调试指对程序进行人工书面检查。静态调试时要仔细阅读程序及其文档 , 经过结构分析、功能分析、逻辑分析、接口分析、语法分析以及逐行检查 , 以便找出并改正错误。通常有下面两种方法。

检查语法错误
产生语法错误的原因主要有两个 , 一个是键入错误 , 此错误如同写文章时的“ 笔误” ; 二是由于对语法规则不熟悉 , 如书后的错误信息、各种限制、全局变量与局部变量、先左后右的原则等 , 这些虽不是系统的规定 , 但也是语法的一部分 , 应作为专项予以检查。
跟踪程序流程
此时的跟踪程序流程 , 即将自己当做计算机 , 给定一组输入数据后 , 顺序执行每条语句 , 考察所得结果 . 寻找错误 . 此方法需花一定时间 , 但这是最基本的方法 , 用其它方法难以查出问题时 . 可以试用此法。顺便说一句 , 学习编程技术的主要途径是读别人的程序 , 对较难懂的地方 , 也只有跟踪程序才能读懂 , 也就是常说的阅读能力提高的途径。对程序的流程图也可采取此方法检查。一般提倡应尽可能将各种错误消灭在静态调试阶段。

动态调试

动态调试 , 是指实际上机运行程序进行调试 . 经过静态调试后 , 仍留在程序中的错误便都十分隐蔽。为找到这些错误 , 首先需捕获一些与错误有关的线索 . 即进行错误侦察 , 此时需充分利用计算机系统提供的调试手段。

试通
源程序上机运行 , 语言系统及操作系统会在程序有故障时给出信息 , 这些信息反映了如下几种故障情况 :
①没有通过编译对解释型的高级语言来说 , 如 B A S I C 语言 , 程序出现语法错误 , 系统便使程序在出错点中断 , 并指出错误的类型和位置。对编译型的高能语言 , 如 P A S C A L 语言程序 , 编译系统把程序检查一遍后 , 对语法错误会打印出一系列的出错信息 , 根据这些语法出错信息号 , 可在“ 用户手册 ” 中查出原因。
②没有通过连接编辑连接编辑阶段的错误有 : 公共数据块长度不一致 , 系统自动按最长处理 , 但给出警告 ; 某个模块名找不到所需要的模块 , 如数据说明遗漏 , 连接数组元素引用当函数引用 , 库函数引用不符合规格说明; 内存容量不够而需要分节等。这些错误可参照 “ 用户手册 ” 予以改正。
③程序的运行过程因故障而停止程序因故障而停止运行 , 在多数情况下会给出出错信息 , 这类信息在“ 用户手册 ” 中都有解释。
④程序只输出部分结果对这部分结果进行分析 , 可大致了解程序被执行的逻辑 , 或程序在什么地方被中断。
⑤程序执行了很长时间没有结果这种情况可能由三个原因造成 : 一是程序本来执行时间就很长 ; 二是程序内有死循环 ; 三是程序运行时使硬件系统“ 死锁” 。
调试工具
错误的位置可以通过在程序中插入调试语句 , 也可以使用机器提供的调试工具在程序中的某一点将有关数据单元的内容或程序的执行路径输出。不同的操作系统或编译程序提供不同的调试工具。调试软件一般有两种 , 一种是交互式调试程序 , 它使得程序员和执行中的用户软件在联机方式下相互作用 , 提供了中断程序、在程序中设置断点、显示并改变符号项中的变量、逐语句的执行程序等特性。如 B I M 公司为 P L l / 的 C C ; D E C 公司为 CO B O L 配的 C ID 等。另一种是程序语言所提供的调试特性对语言的扩充。如 P L l / 提供了 c H E c K 语句 , F O R T R A N 提供了作为注释或在编译时作为正式语句解释的特性等。此外 , 为了调试程序 , 常常使用操作系统提供的某些实用软件 , 例如文件或内存的转储 , 两个文件的比较程序等 , 或是利用测试得到的信息。然而 , 最有效的调试工具似乎是写程序时写到程序中的调试语句 , 这样 , 出错区域可由程序员定位。调试语句是一些不影响程序的功能 , 仅给调试人员提供如下信息的语句:
✦活动路径
✦统计活动次数
✦其它有关信息
常用的调试语句有以下几种 :
①利用系统提供的调试命令和语句如在 A P P L E S O F T 中以下命令与语句常用 , S T O P 语句使程序暂停 , 设置断点 ; C O N T 语句使程序从断点继续执行下去 ; T R A C E 逐个行跟踪 , 即逐次显示计算机执行的语句行号 , 给定一组调试数据后可以检查程序是否按预想的路径执行及执行的结果是否正确 ; N O T R A C E 命令取消逐行跟踪。在 F O X B A s E 中 , 程序执行到 S U S P E N D 时能把正在执行的程序挂起 , R E S U M E 能使被挂起的程序从断点处继续恢复运行 ; S E T E C H O O F F / O N , 默认值为 O F F , 若设置为 O N , 则将每一条执行过的命令在屏幕上显示 , 由此可确切地掌握当前程序运行的进程 , 帮助查出产生间题的位置 , S E T S T E P O F F /O N , 默认为 O F F , 当为 O N 时 , 程序会以单步形式进行等。
②设置状态变量例如 , 在每个模块中设置一个状态变量 , 程序进入该模块时 , 便给该状态变量一个特殊值 , 根据各状态变量的值 , 可以判定程序活动的大致路径。
③设置计数器在每个模块或基本结构中 , 设置一个计数器 , 程序每进入该结构一次 , 便计数一次。这样 , 不仅可以判断出程序活动的路径 , 而且当程序中有死循环时 , 用此方法便能很快确定 .
④插入打印语句
打印语句是最常用的一种调试语句。它用起来非常敏捷 , 能产生许多有用的信息 . 特别适用于人机对话或调试过程。关键是断点的位置和打印哪些变量的值。下面介绍打印语句的几种用法。
A.回声打印 ( E C H O P R IN T IN G ) “ 回声 ” 打印的特点是“ 读了就写” 。它把打印语句放在紧靠读语句之 (或输入语句 )之后 , 或模块入口处 , 及调用语句之前后 . 可以帮助调试人员检查数据有没有被正确地翰入或接口处信息传递是否正确。
B. 追踪打印
追踪打印是为提供程序执行的路径信息而设置的打印语句。这些打印语句通常设置在下述位置 : . 模块首部或尾部 . 调用语句前后 . 循环结构内的第一个语句或最后一个语句 . 紧靠循环结构后面第一个语句 . 分支点之前 . 分支中的第一个语句
C.抽点打印
抽点打印就是选择一些可疑点设置打印语句 , 以便打印有关变量的值。
D.成组打印子程序
即集中一组打印语句写成一个专用子程序 , 凡是需要了解情况处就可调用此子程序。例 : 考虑到层、块结构的需要 , 可在一层中编写一个打印子程序。
8 9 9 9 R E M C 层成组打印子程序
90 0 0 P R I N T “ C $ = ” ; C $ ; “ C C $ = ” ; C C $
9 0 1 0 P R IN T “ C = ” ; C ; “ C C 一 ” ; C C ; “ C l = ” ; C l ; “ C Z = " ; C Z
9 0 20 R E T U R N
可在若干地方调用此子程序 :
31 4 5 P R IN T “ 检索部分打印” : G O S U B 90 0 0
3 5 6 5 P R IN T “ 分类部分打印” : G O S U B 9 0 0 0
36 7 5 P R I N T “ 求和部分打印” : G O S U B 9 0 0 0
此方法很有用 , 能动态地了解程序运行情况。

预埋技术

预埋技术是在程序中加入“ 潜伏” 的调试语句。前面介绍的打印语句和成组打印子程序 , 在程序完成后要将其删去 . 而预埋技术将调试语句永久地编入程序 , 其是否起作用由逻辑软件开头控制。
例如:

10 IN P U T “ X = ” ; X

20 IF X ( 1 O R X ) = 1 0 T H E N P R IN T “ N O D E F IN I T IO N ”

30 IF X ) = 1 A N D X ( 3 T 圣IE N P R I N T “ Y = ” ; 5一 CO S ( 8 * X )

4 0 IF X ) = 3 A N D X ( 6 T H E N P R I N T “ Y = " ; E X P ( X )
5 0 IF X >= 6 A N D X ( 1 0 T } {E N P R IN T “ Y = ” ; 1+ S Q R ( X 二 1)
60 E N D

在此例中 , 我们只处理了 X e 〔1 , 10 ) 的正常情况 , 但估计到使用中出现的变动可能导致 x ( 1 或 x ) 1 0, 提前将调试语句放在程序中。这样 , 对于任何情况的输入程序都能适应。人是健忘的 , 如果没有这个调试语句 , 将会花费很多时间去查错。

错误诊断的推理技术

归纳法排错 ( D E B U G G I N G B Y I N D U C T IO N )

其荃本思想是逐步减少和改进假定的过程。在查出错误后 , 要把一切可能的原因和假定都提出来 , 利用错误数据排除一部分 , 假定再从其余假定中估计可能性最大的一个。使确定错误原因的范围更集中 , 下一步或许就可证明这一改进后的假定 , 或再作其他选择 .

演绎法排错

其基本思想是枚举所有可能引起出错的原因作为假设 , 然后利用数据逐一排除不可能发生的原因与假设 , 将余下的原因作为主攻方向。演绎法过程如下图所示 :

回溯法 ( B A C K T R A C KING)

对于小程序 , 这种技术极为有用。从错误出现之处出发 , 沿反向路径进行检查 , 直到找出错误的原因。推理是在取得一定的实验数据的基础上进行的 , 推理得出的假设 , 要靠实验证明并取得新的数据 , 把搜索范围缩小。故错误诊断的实验方法与推理技术应结合使用 , 互相补充。

错误修改的原则

不要试着改

不要当只查到了一些征兆 , 原因还没有查清 , 便想试着改动某个语句。这种盲目行为成功的概率很小。因某些错误征兆的修改并没有治本。有时会把某些新的错误掺加到程序中 , 造成调试的混乱。

修改了一个错误 , 可能还会有别的错误

一般错误是密集的 , 修改了一个错误后 , 还应检查它的近邻还有没有别的错误或者在程序中还有无类似的错误。

改变源程序代码 , 不要改变目标代码

当调试一个大系统 , 特别是用汇编语言写的系统纠错时 , 不要直接修改目标代码。否则 , 当程序重新编译或重新汇编时 , 错误还会再现

修改错误的过程将迫使人们暂时回到设计阶段

修改错误是程序设计的一个重要内容和形式。一般说来 , 在设计过程中所使用的各种方法应能应用于错误修改过程。

修改完毕 . 需进行回溯测试

因为 :

纠正错误的概率不是 10 0 %
纠正错误时产生新错误的可能性
修改代码比原有的代码更易出错

wenmo8 发布的文章

他山之石：调试之剑