wenmo8 发布的文章

这是个公平的问题。部分原因是我们不相信人们能正确地使用它。我们发现人们问的主要原因是:


1) 用户好奇心:

用户只想在调试时知道这些琐事。当调试你认为是单线程应用程序时,你会在VSThreads窗口中看到6个线程,你想知道原因。请参阅Steve关于为调试器命名线程的帖子。不幸的是,CLR没有命名终结器线程。。我认为正确的解决方法是让终结器线程的命名和其他线程命名一样工作(并修复之前出现的任何perf问题);而不是添加一个特殊的调试器API来识别它。


2) 解决错误:

人们碰到了由终结器线程暴露的线程错误,然后希望能够识别终结器线程,以识别特殊情况下该错误的某些行为。终结器使用与其他线程相同的规则,因此线程错误(无论是在调试器中还是在常规托管应用程序中),发生在终结器线程上的线程错误也很可能发生在其他线程中。


现在根据经验,终结器的行为与主线程不同。在运行终结器之前,终结器实际上不会出现在托管代码中,这可能在任何随机时间发生。这是因为托管调试器在实际运行托管代码之前不会看到线程。由于主线程立即运行托管main()函数,因此这不是问题。


但是,其他线程的行为可能与终结器相同。通常,本机线程可以随时进入托管代码。在MC++中,线程可以在应用程序的本地部分启动,然后调用C++编译到IL,然后再进行管理。

我想讨论一个我们都非常熟悉的场景。在过去的一年里你一直在拼命工作,在过去的几个月里,你甚至在晚上和周末工作。管理层对你的团队给予两周的休息,以感谢你的努力。但是现在你回到了办公室,你听到了来自你的技术支持部门的流言,说有些情况下你的应用程序因为神秘的原因在现场崩溃。你是做什么的?
应用程序恰好是用通过注册的未经处理的异常筛选器生成的AppDomain.UnhandledException事件。因此,您至少知道应用程序因InvalidCastException而失败,但是您无法想象为什么会发生这种情况。
如果您可以在受影响的系统上进行实时调试,那不是很好吗?除非您在现场为您的客户工作,或者您的软件在笔记本电脑上,并且您的客户愿意将其发送给您,否则我怀疑您是否会获得此机会。您需要的是一个工具来捕获应用程序失败时的状态。然后客户可以捕获这些信息并将其发送给您。

输入ADPlus。ADPlus是Debugging Tools for Windows包中的一个免费工具,它为CDB调试器编写脚本,允许您捕获系统上一个或多个进程的转储。它还具有以下优点:

  • ADPlus可以监视桌面应用程序、服务等。
  • ADPlus可以监视系统上的多个进程。当它收集这些进程的转储时,它会同时冻结和转储它们。这对于跟踪进程间通信的问题至关重要。
  • ADPlus支持xcopy部署,这意味着客户不需要通过Windows安装程序等来安装任何东西。这将最大限度地减少机器上的配置更改,这对客户来说是一种音乐。

注意:尽管ADPlus可以xcopy安装,但您仍然必须通过Windows安装程序安装Windows调试工具包,因为这是微软发布它的唯一方式。但是,一旦安装了一次Windows调试工具,就可以xcopy将ADPlus或整个Windows调试工具包部署到另一台计算机上。事实上,在开发过程中,我发现将开发工具签入源存储库非常方便。Windows调试工具支持这一点,因为它是xcopy可安装的。
对于熟悉Windows Installer的用户,您可以使用msi执行管理安装,以便调试Windows工具,这将允许您提取文件,而无需在计算机上实际安装软件包,例如:msiexec /a dbg_x86_6.11.1.404.msi。

综上所述,让我们看看ADPlus如何帮助您诊断.NET应用程序的问题。

示例应用程序

我将引用我放在一起的C#3.0示例应用程序来演示如何使用ADPlus捕获.NET应用程序中未经处理的异常。代码如下:

usingSystem;usingSystem.Linq;usingSystem.Runtime.Serialization;classA

{
public voidSaySomething() {

Console.WriteLine(
"Yeah, Peter....");throw newBadDesignException();

}

}
classB : A

{

}
classC

{

}
classEntryPoint

{
static voidMain() {

DoSomething();

}
static voidDoSomething() {

Func
<int, object> generatorFunc = (x) =>{if( x == 7) {return newC();

}
else{return newB();

}

};
var collection = from i in Enumerable.Range( 0, 10)selectgeneratorFunc(i);//Let's iterate over each of the items in the collection// //ASSUMING THEY ARE ALL DERIVED FROM A !!!! foreach( var item incollection ) {

A a
=(A) item;try{

a.SaySomething();

}
catch( BadDesignException ) {//Swallow these here. The programmer chose to//use exceptions for normal control flow which//is *very* poor design. }

}

}

}
public classBadDesignException : Exception

{
publicBadDesignException() { }public BadDesignException( string msg ) : base( msg ) { }public BadDesignException( string msg, Exception x ) : base( msg, x ) { }protectedBadDesignException( SerializationInfo si,

StreamingContext ctx )

:
base( si, ctx ) { }

}

在本机代码中,内存由调用Malloc()/Free()的程序(或类似的api)显式管理。在托管代码中,有一个垃圾收集器(GC)。
GC并不意味着您不再有内存泄漏。它只意味着运行时在运行时检测到对象不再可访问后的某个任意点为您调用Free()。这有效地在安全方面出错(不能释放对象),以避免悬空指针问题,这通常会导致崩溃。因此,如果对象总是可访问的,即使GC也无法释放它,因此会出现内存泄漏。发生这种情况的一种常见方法是使用一些委托或静态引用。这是一个常见的关于主题的文章,所以在基本问题上我没有什么要补充的。查看Maoni或Chris Lyon的博客,了解GC的优点。

我想说的是,这是所产生的bug的一种范式转变。


本机内存管理中的常见错误:

Bug Effect
calling Free() twice on the same memory Crash, undefined behavior.
never calling Free()  (or Release()) Memory leak
Using a pointer after the original memory was freed (dangling pointer). Crash, Using undefined memory, arbitrary undefined behavior

注意:这些问题的范围已经超出了内存的使用范围,但由于这是一篇博客文章,而不是一篇论文,所以我的范围是有限的。(例如,如果我们使用C++析构函数而不是Free(),C++ dor会释放OS资源)

GC环境中的常见错误(托管代码):

Bug Effect
Not releasing a reference Memory leak
Finalizer called at random times Native resource not released when expected. This could be a resource leak. Or it could lock resources longer than expected, preventing others from using them)The finalizer can't be sure what state it's called in.

由于在GC环境中不能调用Free(),因此您不必再担心整个类的bug。

从一个角度来看,GCs基本上将bug从崩溃降级为内存泄漏。从debugger+工具的角度来看,用户代码中仍然存在bug,因此用户仍然需要工具来调试它们。但是,针对本机内存泄漏的传统工具在托管内存泄漏的世界中发挥得并不好。

malloc/free错误很难,因为罪魁祸首可能离失败点很远。例如,当Free()被调用两次时,您可能会发现第二个Free()崩溃。但是现在您可能需要找到对Free()的第一个调用,它可能发生在过去的某个任意时刻。一般来说,诊断非托管内存泄漏通常需要日志记录工具来跟踪malloc/free调用并对其进行分析;或者采用捕捉悬空指针的奇特内存页保护方案。(参见UMDH或PageHeap)

托管内存泄漏在概念上很容易,因为您可以通过检查当前堆,从单个快照中及时静态诊断它们。不幸的是,ICorDebug没有提供这个功能,所以这里没有很好的VS集成。实际上,您需要使用SOS。

总而言之:从bug的角度来看,从手动内存管理到GC的转变有两大好处:

-它降低了bug的严重性(从崩溃/未定义的行为到内存泄漏)

-它产生的bug更容易诊断,但需要改变工具范式来解决这些新的bug。