这是一份来自google的报告,他们的取样率应该是远超那些实验室的。所以,以后要注意了。为服务器选一个好内存是非常重要的事情。。不然,想后悔也来不及啊【虽然换内存很方便,但宕机一天两天总不是好事情,特别对于小站长来说】
还在为你的计算机为什么老是死机而困扰吗?据谷歌最近的一项研究表明,大多数死机故障均是由内存问题而引起的,谷歌最近对自己数据中心中大量计算机两年半内的工作状况进行了搜集整理,抽样的范围可谓史上最大,结果显示内存问题而导致的故障率比早先一些研究中所显示的要高得多。
研究报告指出:“我们发现内存的整体故障率和不同插槽上内存条的故障率比过去的研究结果要高出许多。研究结果显示内存部分出现故障绝不是少数情况。”
那么实际的内存故障率有多高呢?根据谷歌统计,每年有1/3的谷歌服务器都会出现可纠正的内存故障,而有1/100的谷歌服务器会出现不可纠正的内存故障,后者是造成系统死机的典型情况之一。
如果以上的数字看起来还不是显得那么惊人,那么下面的数字应该更具备说服力。每年每条内存条的平均可纠正故障为4000次。请注意,谷歌服务器内存配有 ECC校验机构,因此这里所谓的可纠正故障可以通过ECC校验机构得以修复,而我们家用PC机中所用的内存条一般都不具备ECC校验功能,因此这里的 4000次在家用机上其实就等于无法纠正的故障。
此前类似的研究规模并不如这次谷歌取样的规模,多是在一些由300多台计算机组成的簇中进行,这些研究显示内存出现可纠正故障的几率是每十亿小时 200-5000次,相比之下,谷歌这次抽样的结果显示的故障率则要高出许多,每十亿小时达到了25000-75000次的水平。
尽管内存故障会导致严重的问题,但对家用机而言,内存故障导致的严重后果要比服务器上的低得多。服务器通常将大量数据存放在内存中,并经常要将这些数据写入硬盘;而家用机的内存中则一般只存储应用程序或操作系统运行所需的文件。
另外,这次研究的结果在其它几点上也与过去的经验论呈现出较大的区别:
1、温度并不是大问题:
通常我们会认为温度过高时导致内存故障率较高的主要因素之一。但据这次谷歌研究的结果表明,内存工作温度上的差异对故障率高低的影响其实很小。不过研究结果同时表明系统占用率较高的系统,内存的故障率也比较高,而系统占用率高的系统中内存的温度则一般是较高的。
2、内存硬件故障率比软件故障率更高:
这次研究结果显示内存出现硬件故障的几率比出现软件故障的几率要高。而以前的研究则得出过于此完全相反的结论;
3、使用新技术的内存芯片的故障率并不比旧内存产品高:
过去人们一度认为采用新技术的内存如DDR2内存等由于晶体管密度更大,因此出现故障的几率要比旧内存更高。而这次谷歌的研究结果则表明采用新技术的内存故障率明显比旧款内存故障率要低。
据这次研究结果显示,内存条出现第一次故障之后,很快便会再次出现故障,而且故障率还会随着时间的推移而逐步增加。
CNBeta编译
原文:cnet
本文来自:http://www.cnbeta.com/articles/95088.htm