Part 4 PConline独家报道专业数据恢复 ??数据恢复所涉及的不仅仅是各种软件,一旦遇到硬件故障,这就完全是硬件级的操作了。当硬盘的内部部件出现问题之后,一般需要对其进行维修或是更换,至少保证在很短的时间内能够工作,以便顺利读取数据,这也是硬件级数据恢复的指导思想。不过由于硬盘本身的精密度更高,因此要做到这一步可并不容易。对于我们普通读者而言,要实现硬件级数据恢复并不现实,这受到环境、工具与经验的制约。但是了解这些硬件级数据恢复技术却能帮助我们更加理性地选择数据恢复服务商,同时也增长一些必要的硬件知识。 一、全面认识硬盘内部结构与工作原理 ??尽管在外部结构方面,各种硬盘之间有着一定的区别,但是其内部结构还是完全相同的,毕竟硬盘的本质工作方式不会改变。打开硬盘外壳之后,我们也就能够看到神秘的内部世界,其核心部分包括盘体、主轴电机、读写磁头、寻道电机等主要部件。不过需要提醒大家的是,千万不要随意打开硬盘的外壳,这将100%地使整个硬盘报废,因为硬盘的内部盘面不能沾染上一滴汇成,否则立即报废。一般硬盘内部结构维修甚至需要在要求极为严格的无尘实验室中进行。 ??1.盘体 ??盘体从物理的角度分为磁面(Side)、磁道(Track)、柱面(Cylinder)与扇区(Sector)等4个结构。磁面也就是组成盘体各盘片的上下两个盘面,第一个盘片的第一面为0磁面,下一个为1磁面;第二个盘片的第一面为2磁面,以此类推……。磁道也就是在格式化磁盘时盘片上被划分出来的许多同心圆。最外层的磁道为0道,并向着磁面中心增长。事实上,硬盘的盘体结构与大家熟悉的软盘非常类似。只不过其盘片是由多个重叠在一起并由垫圈隔开的盘片组成,而且盘片采用金属圆片(IBM曾经采用玻璃作为材料),表面极为平整光滑,并涂有磁性物质。 ??2.读写磁头组件 ??读写磁头组件由读写磁头、传动手臂、传动轴三部分组成。在具体工作时,磁头通过传动手臂和传动轴以固定半径扫描盘片,以此来读写数据。磁头是集成工艺制成的多个磁头的组合,采用非接触式结构。硬盘加电后,读写磁头在高速旋转的磁盘表面飞行,飞高间隙只有0.1~0.3μm,可以获得极高的数据传输率。新型MR(Magnetoresistive heads) 磁阻磁头采用读写分离的磁头结构,写操作时使用传统的磁感应磁头,读操作则采用MR磁头。 ??3.磁头驱动机构 ??对于硬盘而言,磁头驱动机构就好比是一个指挥官,它控制磁头的读写,直接为传动手臂与传动轴传送指令。磁头驱动机构主要由音圈电机、磁头驱动小车和防震动机构组成。磁头驱动机构对磁头进行正确的驱动,在很短的时间内精确定位到系统指令指定的磁道上,保证数据读写的可靠性。一般而言,磁头机构的电机有步进电机、力矩电机和音圈电机三种,现在硬盘多采用音圈电机驱动。音圈是中间插有与磁头相连的磁棒的的线圈,当电流通过线圈时,磁棒就会发生位移,进而驱动装载磁头的小车,并根据控制器在盘面上磁头位置的信息编码来得到磁头移动的距离,达到准确定位的目的。 ??4.主轴组件 ??硬盘的主轴组件主要是电机轴承和马达,我们可以笼统地认为轴承决定一款硬盘的噪音表现,而马达决定性能。当然,这样说并不完全,但是基本上表达了这两项内容在硬盘中的重要地位。从滚珠轴承到油浸轴承再到液态轴承,硬盘轴承处于不断的改良当中,目前液态轴承已经成为绝对的主流市场。由于采用液体作为轴承,所以金属之间不直接摩擦,这样一来除了延长了主轴点解的寿命、减少发热之外,最重要一点是实现了硬盘噪声控制的突破。不过需要指出的是,采用液态轴承对于性能并没有任何好处,甚至反而会延长寻道时间。对于PC设备而言,似乎噪音与性能是一对永远难以平衡的矛盾。 二、 危险本源:硬盘的天生存储缺陷
??与闪存类存储介质或是光存储介质所不同,带有磁头装置的硬盘在稳定性方面有着先天性的缺点,再加上本身就存在一定故障率的电路板,因此整个硬盘出现故障的概率可并不低。如果进行一个简单的归纳,硬盘的硬件损坏可以分为以下几类:
??控制电路损坏:
??是指硬盘的电路板中的某一部分线路断路或短路,或者某些电气元件或IC芯片损坏等等,导致硬盘在通电后盘片不能正常起转,或者起转后磁头不能正确寻道等。
??磁头组件损坏:
已经损坏的磁头组件 ??主要指硬盘中磁头组件的某部分被损坏,造成部分或全部磁头无法正常读写的情况。磁头组件损坏的方式和可能性非常多,主要包括磁头磨损、磁头悬臂变形、磁线圈受损、移位等。
??综合性损坏:
??主要是指因为一些微小的变化使硬盘产生的种种问题。有些是硬盘在使用过程中因为发热或者其他关系导致部分芯片老化;有些是硬盘在受到震动后,外壳或盘面或马达主轴产生了微小的变化或位移;有些是硬盘本身在设计方面就在散热、摩擦或结构上存在缺陷。种种的原因导致硬盘不稳定,经常丢数据或者出现逻辑错误,工作噪音大,读写速度慢,有时能正常工作但有时又不能正常工作等。
??扇区物理性损坏:
??是指因为碰撞、磁头摩擦或其他原因导致磁盘盘面出现的物理性损坏,譬如划伤盘片、掉磁等。
三、用PC-3000修复硬盘故障
??毫无疑问,控制电路损坏应当是这类故障中级别最低的,一般不会对数据造成危害。目前更换一块电路板已经是很容易的事情,毕竟主流硬盘的型号数量非常有限,一般专业硬盘维修店或是数据恢复服务商都能轻松解决这一问题。至于磁头组件损坏、综合性损坏和扇区物理性损坏,理论上是根本无法恢复的,只能通过一定的方法将其在短时间内快速读取数据,此时所能做的仅仅是数据恢复,而无法彻底修复硬盘。
ISA版本的PC-3000硬件卡 ??但是为何很多用户都或多或少听说过一些特殊的软件修理方法呢?其实这仅仅是针对一些硬盘缺陷方式的处理方法。为了减少硬盘返修的概率,硬盘厂商在硬盘内部设计了一个自动修复机制(Automatic Reallcation或 Automatic Reassign)。现在生产的硬盘都有这样的功能:在对硬盘的读写过程中,如果发现一个坏扇区,则由内部管理程序自动分配一个备用扇区来替换该扇区,并将该扇区物理位置及其替换情况记录在G-list(增长缺陷表,Grown defects list) 中。这样一来,少量的坏扇区有可能在使用过程中被自动替换掉了,对用户的使用没有太大的影响。
??现在的硬盘密度越来越高,也极难做到100%的完美,硬盘盘面上或多或少存在一些缺陷。厂家在硬盘出厂前把所有的硬盘都进行低级格式化,在低级格式化过程中将自动找出所有defect track和defect sector,记录在永久缺陷列表(P-list,Permanent defect list)中。并且在对所有磁道和扇区的编号过程中,将skip(跳过)这些缺陷部分,让用户永远不能用到它们。这样,用户在分区、格式化、检查刚购买的新硬盘时,很难发现有问题。
??当遇到硬盘没有明显的异响,而在操作系统中可以识别硬盘设备却无法在磁盘管理器中分配盘符时,很可能就是缺陷表故障,一般采用HDD Regenerator、MHDD、PC-3000和效率源等等这些软件可以修复。但是这类软件往往都有一定的局限性,表现为某一种软件针对某一型号的硬盘特别有效。我们在此以PC-3000为例向大家简单介绍。
PC-3000针对固件的操作界面 ??PC-3000是由俄罗斯著名硬盘实验室ACE Laboratory研究开发专业修复硬盘综合工具。PC-3000的基本工作原理是:掌握各种硬盘的专用CPU指令集,解读各种硬盘的Firmware(固件),控制硬盘的读写操作,实现硬盘内部参数的读写和硬盘内部管理程序的调用,最终达到以软件修复多种硬盘缺陷的目的。PC-3000由硬件部分和软件部分组成,硬件部分以专用于控制硬盘的测试卡为主;软件分为俄文版本和英文版本,其中包括若干个针对不同品牌不同系列的硬盘而开发的程序模块。
PC-3000缺陷列表修改界面 ??以目前最新的For Windows版PC-3000为例,进入之后选择相对应的硬盘品牌,然后可以根据自己的判断来确认究竟是硬盘P-list部分故障还是固件区故障,然后使用软件提供的固件备份系统进行覆盖。事实上,正版PC-3000用户都可以得到不断升级的固件支持以及一些相关参数,因此整个处理过程非常简单,仅仅是使用已经内置的几个操作选项而已。PC-3000的确非常强大,可以编辑固件和缺陷列表。一般来说,执行这些操作并不会破坏硬盘中的数据,因此的确可以作为有效的数据恢复方法。
使用PC-3000读写硬盘固件 四、硬盘厂商如何修复硬盘
??硬盘里面还有另外一种封闭区域,又称为保留容量,它们其实是完全没有问题的好的盘面,但是因为某种原因被封闭起来了。譬如说一个硬盘是60GB,而磁碟的单碟容量为40GB,那么由两片磁碟构成的硬盘就必须封闭掉20GB的容量(磁碟的生产线都是一定的,厂商为了降低成本,都只会生产一种容量的磁碟,通过封闭不同容量的区域来获得不同的实际硬盘容量)。
??弄清楚了硬盘的生产原理,那么厂商如何维修硬盘就很好理解了。对于控制电路、磁头等的损坏,就是应用最简单的替换法,换上新的零件就可以了。对于IC芯片的损坏,可以通过重写IC芯片的信息或者干脆替换IC芯片来修理。对于磁盘盘片的问题,情况就比较复杂。首先,厂商会用专门的仪器设备对硬盘的磁碟表面按照实际的物理地址重新进行全面的扫描,检查出所有坏的、不稳定的扇区,形成一个新的硬盘缺陷列表,然后把它写进硬盘的系统信息区,替换掉原来旧的硬盘缺陷列表。然后调用内部低级格式化程序,对硬盘进行内部格式化。程序会根据新的系统信息区信息,重新对所有的磁道和扇区进行编号、清零,重写磁道伺服信息和扇区信息。经过这样的处理,返修的硬盘就又可以像新的硬盘一样了。
??有人可能会有疑问:既然有新的坏扇区加进系统保留区去了,那么硬盘的容量应该减少才对啊。其实这是不必担心的,我们上面提到过有另外一种被封闭区域,它们其实是完全没有问题的好的盘面。厂商的设备既然可以封闭新出现的坏扇区,当然也可以从被封闭的完好盘面上提取出相应的扇区容量来替代被封闭的坏扇区。现今的硬盘一般都有非常可观的保留容量,最少的也有好几个GB,大的可以达到20~30GB,甚至更多。
五、硬件开盘处理方法:最后的必杀技
??当排除硬盘是因为缺陷列表或是固件区的故障之后,其内部的故障就很让人担心了。无论是磁头缺陷,还是电机故障或是更为严重的盘片划伤,这些都需要进行开盘操作。所谓开盘操作,指的是在一定洁净度要求的空间内打开硬盘的盘腔,对其内部进行各种操作,以便找回数据。杭州某电机公司刚从国外购买的技术资料保存在总经理的台式机中,不料该台式机硬盘最终成为“数据杀手”。该硬盘起初工作速度缓慢,此后突然无法被BIOS识别,而且加电后带有异常的“咔哒”身。由于这些技术资料都是一次性授权,因此价值百万的数据可谓命悬一线。一般而言,这类故障情况几乎都是磁头老化,必须进行开盘处理。根据飞客数据恢复中心表示,这类故障的维修难度极大,数据恢复服务费一般在2500元左右,而且也是占据整体数据恢复案例中比例最大的一项故障,大约有46%左右的份额。而如果是SCSI硬盘,则收费将更为昂贵,可以高达5000元以上。
??深入了解超净间:参观飞客百级超净间
??开盘操作对于很多第一次接触数据恢复的读者而言的确非常神秘,而且无论是使用的方法本身还是所要求的环境设备都非常新颖。为了解开大家的迷惑,我们在飞客数据恢复中心的配合下带领大家参观百级超净间,这也是开盘所必备的环境要求。
百级超净间 ??有些读者可能会提出这样的疑问,硬盘的工作环境需要达到十级洁净度,仅仅是百级超净间又如何符合要求呢?其实需要明确这样一个概念,十级洁净度是指硬盘长时间稳定工作所需要的环境。数据恢复过程仅仅是几十分钟,而且最终的目的并非是修复硬盘,而是找回丢失的数据,此时百级洁净度已经完全能够满足需求,十级洁净度与百级洁净度下的开盘成功率是一样的,而千级超净间则会存在比较严重的问题。
紫外线灯与过滤器 ??尽管千级甚至万级或是最普通的操作台也有可能开盘成功,但是此时的失误率实在太高,很容易造成无可挽救的二次破坏。对于数据恢复服务行业,做到对客户的数据负责是最基本的原则。此外,目前行业中存在对超净间的误解或是过于神化的现象。真正的超净间并非数据恢复服务商本身建造,需要委托专业的厂商专门定做,而能否达到要求则需要进行严格的检测。飞客在上海建立的超净间通过上海市计量局百级净化检测,完全达到百级洁净度,只有这样针对每一个超净间严格监控才能确保较高的开盘成功率。
上海市计量局百级净化检测仪器 在进入超净间之前,工程师必须穿戴专用的洁净服,否则辛苦建立的净化环境就要付诸东流。一般而言,联体式洁净服有着较好的效果,此时可以将全身包裹,不至于让人体皮屑污染环境。如果想要进一步提升效果,还必须安装风淋设备,工程师在进入超净间之前必须在风淋室内吹上几分钟,可以将吸附在身上的灰尘颗粒基本去除。风淋室可分为以下几种:单人单吹风淋室,单人双吹风淋室,单人三吹风淋室,双人双吹风淋室,飞客在上海建立的超净间使用了效果一般的单人单吹风淋室,但是应对数据恢复百级净化应用已经绰绰有余了。一般而言,超净间内还有一个专用操作台,此时上下吹风方式可以进一步过滤尘埃。工程师的硬盘开盘操作完全在操作台内进行。 ??如果参观过硬盘厂商,一定会对其超高洁净度的工厂环境印象深刻。事实上,在硬盘内部,其洁净程度已经得到国际标准的十级,完全符合人类脑部开颅手术的需求。之所以要求如此高的洁净度并非是吹毛求疵,而是硬盘内部的盘片在高速旋转时无法经受细小颗粒尘埃的冲击。 ??同样的道理,我们无法在空气中随意将硬盘外壳打开,否则极有可能使硬盘报废。如今硬盘的存储密度越来越高,特别是垂直磁化技术应用之后,对于尘埃的敏感度更高了。在开盘数据恢复的过程中,如果只是简单地在普通环境下打开硬盘,那么其危险性可想而知。即便是普通的千级操作台,洁净度也无法达到要求。根据飞客数据恢复中心研发部的实验表明:大约有95%左右的硬盘在空气中暴露10分钟以上会报废,大约有40%左右的硬盘在千级操作台暴露15分钟以上会报废。而如果将操作台放在千级超净间并形成局部百级环境,那么暴露时间在30分钟以内而导致的数据丢失比例可控制在1%以内。 ??深入硬盘内部:开盘过程全展示
??硬盘的密封都十分结实,但是只要使用六角螺丝刀也很好处理。分别拧下各个六角螺丝之后,就可以打开硬盘的上盖,此时也能清晰看到其内部结构。
事实上,在打开硬盘之前,工程师一般都会凭借经验判 断故障部位。如果在加电时没有听到硬盘转动声音且更换电路板后也没有效果,那么很可能是电机故障。而如果转动声音很正常且伴随着“咔哒”声,则多半是磁头偏移造成的划盘(此时应尽可能减少加电次数),需要更换磁头后才能恢复数据。然而需要指出的是,硬盘加电出现“咔哒”的敲盘声并非完全是磁头偏移,很多迈拓硬盘在固件信息损坏之后也会有这样的现象,少数西数硬盘也是同样的情况,而IBM/日立和希捷的硬盘则很少会固件损坏,因此具体问题还是得分门别类地判断。
打开硬盘后看到的盘体内部 ??事实上,开盘操作本身是非常危险的,一般情况下并不推荐采用这种方案,因此事先的故障判断非常重要。或许很多非专业的数据恢复服务商都不知道如何去区分固件故障与磁头故障,其实要做到这一步很容易,其核心思想便是电路板热交换。在带电的情况,将电路板热插(要求相同型号与Model号的电路板)。如果此时还是无法导出数据,则可以确定是磁头或是电机等内部盘腔故障。
??开盘操作并不像我们所说得那样简单,毕竟硬盘内部的这些配件并非完全通用,因此进行开盘操作时需要找到合适的备件,此时所要求的应该不仅仅是型号一样,甚至是Model号也完全一致。在更换磁头的时候,工程师首先将内部磁铁盖片掀开,此时需要用力得当,否则很容易弄伤盘片,从而导致数据彻底报废(图31,调整硬盘的磁头部分)。对于一些SCSI硬盘,其磁铁盖片甚至很难掀开,即便费劲九牛二虎之力以后也难以那里如此复杂的磁头结构,因此国内大部分数据恢复服务商无法处理SCSI开盘,仅有少数超大规模服务商才具备这样的实力。
??真正困难的还在于磁头的安放步骤。如果硬盘内部有多个盘片和磁头组成,那么留给工程师的操作空间就很小,此时稍不当心就可能触及盘片或是弄坏磁头。此外,不同型号的硬盘在磁头特性方面也不尽相同,这需要工程师凭借经验去调整距离。在开盘操作中,最简单的莫过于磁头卡住,因此只要轻轻地拨动一下让其归位即可解决问题。如果开盘洁净度足够高,甚至该硬盘还能继续使用,导出数据也将是轻而易举。而如果确认磁头已经损坏(主要依靠加电后的异常声音进行判断),则必须更换磁头。这一步操作要求工程师掌握精确的定位,并且丝毫不能触及到盘片,否则就会前功尽弃。
安装新的磁头 ??开盘操作其实并不神秘,超净间环境是其根本保障,而更换磁头等步骤要求工程师足够心细且合理操作。不过真正的难点还在于不同硬盘以及型号的开盘更换磁头方法并不一样。一般而言,IBM/日立硬盘(特别是笔记本硬盘)比较容易成功,西数和希捷硬盘成功率也不低,但是部分型号的迈拓硬盘,尤其是D540X和D740X,整体成功率偏低。造成这些现象的关键因素在于不同品牌硬盘的磁头性能完全不同,有些品牌的磁头非常脆弱,而且定位精确度要求很高,此时就会很难处理。
??不得不很尴尬地承认,目前最顶级的国外数据恢复服务商也没能在更换磁头方面实现机械化操作,因此失误是在所难免的。不过这将是未来开盘技术的发展方向:逐步摆脱纯手工操作方式。至于前几年业界流行的“盘片读盘机”传言,这几乎是不可能实现的,因此指望像光盘驱动器那样来读取硬盘盘片简直是天方夜潭。
|