医院信息系统典型故障案例解析(txt+pdf+epub+mobi电子书下载)


发布时间:2020-08-08 13:35:16

点击下载

作者:傅昊阳

出版社:人民卫生出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

医院信息系统典型故障案例解析

医院信息系统典型故障案例解析试读:

前言

新医改背景下,国家从战略高度将信息化建设定义为深化医药卫生体制改革的“四梁八柱”之一,不断出台推动医院信息化发展的政策和举措,为医院信息化建设注入强劲动力。近年来,云计算、大数据、物联网、移动互联网和人工智能等新兴技术的发展更是为医院信息化建设提供了有力的技术支撑。医院信息化建设进入空前活跃和快速成长的时期。

医院信息化如火如荼的发展建设,带来了信息化基础设施、相关业务及管理信息系统数量的激增,故障在所难免,相对应的运行维护工作也变得越来越重要。

为提高医疗卫生信息化运维人员技术水平和分析、解决问题的能力,本书基于多家一线医疗机构工作实践,从基础设施、网络、应用系统、数据库、安全设备、虚拟化等方面精选了数十例医院信息系统典型故障案例,详细介绍了不同案例的故障现象、分析及处理过程、经验总结。希望这些具体的案例分析,能在实际工作中给广大医院信息化运维人员提供一定的帮助和参考。

感谢本书各位编者的热情投入和辛勤劳动,正是本着为行业负责的态度,整个编写团队汲取众多医院信息化运维的智慧与经验,将医院信息化种种“前车之鉴”记录分享。

感谢中国医院协会信息专业委员会主任委员王才有教授在本书编写过程中给予的悉心指导,并为本书做序。

感谢为本书提供技术资料和应用案例的医疗兄弟单位和医疗IT厂家,使本书能够博取众家经验。

因医疗卫生信息化仍处于不断发展、不断丰富的过程,信息化建设内涵也在不断扩展,本书编写水平有限,难免有疏漏和不足之处,敬请专家和同仁指正。广东省中医药学会信息管理专业委员会主任委员2019年5月15日Part 1 信息基础设施类故障分析与处理

医院建成一个新的机房并不意味着就可以高枕无忧,机房有它的生命周期,也会面临各种各样的问题,比如制冷、供电、新风等,当然,在这些问题中,最为严峻的要属设备日益老化的问题。作为医院信息化的主管部门,为了保障业务的连续性,同时满足国家及地方性的法律法规、安全等保、医院等级评审等要求,对机房设备性能、容灾服务能力、不间断提供信息化支撑的能力提出了更高的要求。案例1 精密空调室外主机过脏导致无法正常制冷

【案例概述】

案例关键字:精密空调 高温

某天,系统突然停止了运行,且机房的温度也一直处于过热的状态,这让小L一时摸不到头脑。在维修工程师的提醒下,小L才想到,精密空调的主机散热器如果因为灰土过多而造成堵塞,就会导致机房过热,进而引发系统停止运行。原来,空调主机散热器的日常清洁及保养竟然是如此重要。

【案例还原】

小L所任职的医院机房使用的精密空调为XXXX风冷R22机组,该空调的主要设备为室内主机和室外主机,如图1-1-1所示。

某日,小L正在参加院内的文献分享会议,突然接到值班人员打来电话“机房精密空调机组异常,温度超标报警,部分信息系统运行缓慢导致临床业务中断”。小L立即起身回到机房,发现机房温度高达40℃以上,精密空调控制面板亮起黄灯。小L立即向领导汇报情况,同时请精密空调维修工程师到现场协助处理故障。图1-1-1 精密空调系统图

机房设备属于高精密设备,由大量密集电子元件组成,要提高这些设备使用的稳定与可靠性,需要将环境的温度、湿度严格控制在特定的范围内。一般来讲,机房内温度应在20~25℃,湿度保持在20%~70%,机房精密空调便可以实现这样精准的控制,从而大大提高设备的寿命及可靠性。

在精密空调维修工程师到达现场前,小L决定首先检查室外机,他发现精密空调的室外机散热风扇没有转动。一般而言,室内温度如此高,室外机应该是不间断地工作才对,现在散热风扇却一丝不动,看来问题应该出在室外机身上。过了不长时间,精密空调维修工程师到达现场,小L把现场情况及自己的推测告诉了维修工程师,维修工程师对精密空调制冷剂的气压、室外机风扇的电路进行了检测,都没有发现问题。维修工程师对小L说:“你们有多长时间没有清洗过空调的室外机了?”小L吱呜了半天,说不出话来。原来,自精密空调安装使用至今,他都没有注意到这件事,想到自己很有可能是这次事故的“幕后的凶手”,小L不禁满脸通红。果然不出维修工程师所料,经检查,精密空调室外机的散热片上堆积了大量灰尘,导致风扇无法正常运转,从而影响整体空调机组的正常运行和制冷。维修工程师立即切断精密空调的供电,对室外机组进行拆洗和清洁。待冷却后重新进行安装,精密空调机组就恢复了正常的运行,困扰小L的问题得到了圆满的解决。

【案例总结】

1.精密空调的室外机应该尽量安装在空旷的地方,不要在其周边堆放杂物。

2.在日常的机房巡查中,除了关心精密空调的温度、湿度、设备是否正常工作、有无报警等信息外,还需定时(每3~6个月)对室外机散热片进行清洁。

3.在条件许可的情况下,推荐购买精密空调的维保服务,由专业人员定期对精密空调进行巡检和维护保养,这样可有效保障精密空调的正常运行及使用寿命。案例2 配电箱线路老化故障导致供电异常

【案例概述】

案例关键字:配电箱 老化 三相不平衡

机房是信息系统的心脏,是医院的核心所在,机房用电安全是保证网络、服务器、存储等设备安全有效运行的基础。因平时不注重用电安全,小L终于尝到了苦果,由于三相不平衡造成断电,影响业务系统的正常作用。

【案例还原】

某日,下午临近下班时间,正值小W值班,突然电话声此起彼伏,临床科室都反映LIS、PACS、移动护理、院感等几个信息系统无法正常登录,要知道现在正是临床科室最忙的时候,却无法登录系统,大家都急的不得了。小W立即PING了报障科室网段的IP,发现网络畅通,没有任何丢包的情况出现;接下来,他试图在自己的计算机上登录这几个信息系统,发现确实无法正常登录,于是小W立即通知各软件维护负责人查找原因。

软件维护负责人发现无法远程连接到服务器,然后通过PING服务发现服务器IP地址不通,于是告知小L一起到机房查找原因。机房内光线昏暗,天花板上有几个灯盘不亮,且有三个机柜完全断电。小L立即向领导汇报情况,同时请电路维修工程师和现场工程师一起排查故障。一行人经现场检查发现,故障原因是配电柜某空气开关老化,三相负载不均衡。该院机房强电配电箱如图1-2-1所示,主要设备包括配电箱和开关。这次的故障是由于配电柜某路电压偏低,三相负载不均衡,部分线路负载过高,导致电机发热,部分强电开关老化、损坏,导致某一电路断电。一般来说,三相负载不均衡会导致中性点电位发生偏移,单相电路会出现电压过低,电灯不亮等故障。刚好,这个空气开关连接着部分照明及三个机柜的供电。图1-2-1 配电柜图

当天下午6点50分左右,供应商工程师更换了强电开关,重新调整负载,达到相对的三相平衡后供配电恢复正常。

【案例总结】

1.有条件尽量做到每一个机柜都要有独立的两路电源,且这两路电源使用独立的空气开关,照明不要与机柜共用空气开关。

2.三相电尽量做到平均布署,服务器、存储、交换机等机关设备的上架,也尽量做到不要全部都放在其中一部分机柜或同一两路电源上,造成其中一两路电源使用率过高,而其他使用率不高,这对用电安全不利。

3.制订维护保养计划,请有资质的人员定时查看线路连接情况,并对相关设备运行情况进行记录,发现异常要及时处理。

4.关注负荷的变化,长期运行的负荷应控制在开关设定容量的70%以内(即按三相负荷电流中最大的一相计算),应尽可能调整三相负荷电流平整,提高断路器开关的实际带载能力。

5.要留意停电通知,提前做好停机操作。意外断电时,要及时检查UPS的供电情况,如果断电时间长,UPS会自动旁路供电。在电力恢复后,应检验UPS是否已经自动切换到正常模式,电池是否开始充电等。案例3 防雷器损毁导致网络故障

【案例概述】

案例关键字:雷击 防雷器

随着医院信息化建设的不断深入,机房数字化、网络化设备越来越多,大多数电子设备具有高密度、高速度、低电压和低功耗等特性,号称“电子时代一大公害”的雷击已经成为损坏机房设备的头号罪魁祸首。一个雷雨天,一次雷击,近十台交换机及防雷器就此“牺牲”,全院网络因此中断,小L忙上忙下,更换损坏的设备,才让一切重新回归正常。

【案例还原】

在一个雷雨交加的早上,大家与往常一样处理着自己手头的工作,铃铃铃……一阵电话铃声打破了上午的平静,全是反映网络不通的问题。信息科的同志们开始PING各汇聚的网络,发现机房交换机异常,小L开始至上而下地对交换机进行巡检。

小L越是检查,越是心惊胆跳,1台、2台、3台、4台、5台……联接不上的交换机越来越多,背后冷汗湿透了衣服。经过检查,小L最后确定了近十台交换机联接不上。小L到弱电间检查,发现交换机电源指示灯不亮,更换上新的交换机,电源指示灯还是不亮。小L立即通知电工,通过检测,发现是防雷器被雷击后损坏。在查明原因后,电工更换了新的防雷器,交换机的电源灯终于亮了。然而,网络还是不通,难道交换机在这次雷击中和“保镖”防雷器一起“牺牲”了?经检测,这些交换机还真的全部“牺牲”了,小L调来备用交换机,将原交换机的备份配置应用到新交换机上,网络这才恢复正常。

【案例总结】

1.在雷雨季节到来之前应组织专业人员进行全面检查,检查内容包括避雷针、避雷带与建筑物主钢筋及接地极的连接是否良好、配电系统中防雷及防浪涌器件是否有损坏等。对于已损坏的物件应及时更换以免影响后端接入的设备。

2.对于易损件,如防雷器、交换机等,应在库房内留有备品备件,以便发生故障时能及时替代。

3.对网络设备的配置进行更改时,要做好记录和设置备份工作,如当时交换机的配置没有进行备份或备份不是最新配置内容,都将大大延长故障处理的时间。案例4 电源分配单元及静态切换开关故障导致机柜供电异常

【案例概述】

案例关键字:PDU STS 供电异常

随着医院信息化建设的不断深入、新兴技术的广泛应用,医院机房“成员”们自身功能越来越强,使得中心机房功率密度、整体耗电量日益增加。为保障“业务不断、数据不丢”,要求信息科的工程师对机房配电设备的日常管理要做到“胆大心细”,及时排除故障。小L近来就遇到了类似的事情,不起眼的PDU及STS开关损坏,还好工作经验丰富的小L在看似复杂的情况中,及时找到问题所在,排除故障。

【案例还原】

某天早上晨交班刚结束,院感系统项目负责人小W就接到几个临床护士打来的电话,反映院感系统无法正常登录,小W通过堡垒机远程登录到院感服务器时发现无法连接,PING服务器IP时发现超时。于是小W请小L协助一同到机房查找原因。两人到机房时发现院感系统所在的机柜断电了,导致院感程序无法正常使用。按照故障排查流程,小L和小W在现场进行了认真的检查和排查工作,发现机柜上的PDU及单电源设备均无强电电压,初步判断为PDU及STS开关故障。

PDU就是我们常说的机柜用电源分配插座,它主要负责为机柜式安装的电气设备提供电力分配,如图1-4-1所示。作为配电系统的最后一环,连接着供电等基础设施与IT系统和机房内所有设备负载,是关系到电力能否正常运行的关键设备。STS如图1-4-2所示,主要用于在两个独立的AC电源之间转换供电,当第一路出现故障后,STS自动切换到第二路给负载供电;如果第二路故障的话,STS自动切换到第一路给负载供电,有效保障精密电子设备不间断工作而被广泛应用到数字机房。图1-4-1 PDU图1-4-2 STS

找到原因后,小L迅速跑到库房找到型号相同的PDU和STS开关备件,到机房进行更换后机柜设备恢复正常供电,院感程序随即恢复了正常使用。

【案例总结】

1.在经费允许的情况下,全面、合理的易损备件储备可以保证损坏的设备得到及时更换,如本案例中备用的PDU及STS开关对于解除此次故障起到了关键作用。

2.建立机房设备管理台账,台账内容包括设备名称、品牌、型号、配置、购置时间、保修期、用途、维修记录、零配件更换记录等,以便于后期追溯。案例5 精密空调高压报警故障导致无法制冷

【案例概述】

案例关键字:精密空调 高压报警 漏水

精密空调对数字机房的重要性不言而喻,除了对精密空调的定期巡检,对室外机的维护和清洁外,对精密空调进水管及排水管的日常巡检及维护也是必不可少的,要不然,精密空调也会出现问题导致无法正常工作。前些时间,小L所在机房的精密空调就“无缘无故”地停止工作,还来了一个“水漫金山”,这让小L痛苦不已。还好在精密空调维保工程师的帮助下,小L逐渐摸透了精密空调的脾气。

【案例还原】

多年的工作经验让小L练就了如武林高手一般“听音辨物”的好本领,某天早上,小L例行对机房进行巡检,还没走到机房,已经听到机房里传来一阵阵蜂鸣声,小L心头一紧,坏了,空调报警。小L赶紧打开机房门冲进机房,还好,最糟的情况还没有发生,机房的温度还在正常范围内,并没有出现因温度过高造成服务器、交换机宕机的惨剧。心神安定下来的小L发现第一台精密空调蜂鸣器一直发出报警声音,空调显示面板提示为高压报警,空调已停止制冷,还好机房另一台精密空调已经自动启动,接管制冷服务,温度未见明显上升,各业务系统运行正常。小L有些纳闷,两个月前维保工程师才进行过现场巡查,对精密空调做了全身体检,没有发现任何问题,怎么现在会出现停止制冷的故障呢?小L思索着,忽然灵光一闪,“真相永远只有一个”,旁边新大楼正在进行基建工程,灰尘铺天盖地的,是否是室外机散热器堵塞了。小L带着疑虑,请维保工程师协助处理。经专业人员现场检查后发现因室外机吸入了大量的灰尘,导致冷凝器的换热效率低下,精密空调无法正常工作,报高压报警,经过用高压水枪冲洗室外机散热片,并对精密空调的高压复位,空调恢复正常。

还有一次,也是在巡检时,小L意外发现有一个机柜的其中一路PDU断电了,由于此机柜里的设备都有双电源,所以没有对临床业务造成影响,小L立即通知该机柜所承载的业务系统的负责人和值班人员,同时向领导汇报出现的问题。然后小L在现场进行了认真检查,发现配电柜对应的空气开关跳闸了,小L立即请维修工程师协助处理,对现场进行更深一步的问题排查。

小L和维修工程师在现场进行了认真检查,却没有发现异常,当拉开静电地板时地面发现全是水,水源由精密空调下方漏出,判断是精密空调出现了漏水问题。维修人员立刻对进水管、排水管、上水电磁阀等进行检查,发现是排水管堵塞造成排水不畅,长期累积至机房静电地板下方,导致严重积水,使得地板下方桥架及相关线缆老化加速而出现故障。维修人员在精密空调控制面板进行手动操作,让加湿水罐注水,并加热到100℃,然后手动排水,反复几次,排水管堵塞情况得到解决,排水顺畅。稍后大家清理了积水,并对电路等进行了整改,及时避免了重大事故的发生。

【案例总结】

1.根据实际情况,适当增加日常机房巡检的频率及内容,如空气灰尘严重时,应加强对空调运行情况的检查,必要时更换室内机滤网、清洗室外机、补充制冷剂等,从而降低故障发生率。

2.有条件的话,考虑购买相关设备的维保服务,这样可以有效保障设备运行。

3.条件许可时,配置两台或两台以上的精密空调,并设置定时轮转、故障接管。这样设计,一方面,可有效提高精密空调的使用寿命;另一方面,也可在精密空调发生故障时有足够的冗余能力,继续提供恒温恒湿的环境,保障机房相关设备的正常运行。

4.精密空调漏水是比较容易发生的问题:(1)进水管、出水管所有的接头不能使用金属材质,金属接头容易发生氧化或与水、矿物质等产生化学反应而出现漏水或堵塞现象。(2)排水管应当短且相对较粗,便于维护;要有一定的倾斜角度,便于排水。日常维护时,需不时对排水管进行热水灌冲,减少微生物在排水管的繁衍而造成堵塞。(3)精密空调下方设置防水坝,走好排水管。(4)可以在静电地板下方设置漏水检测系统,尤其在精密空调下方应加大漏水检测线缆的布置密度。案例6 医院数字机房安防门禁故障

【案例概述】

案例关键字:摄像头 门禁

数字机房内有数量多且价格昂贵的电子设备,承担着医院的业务与运营,其重要性不言而喻。数字机房通常情况下无人值守,安防系统具有灵活的权限管理、实时监控、发现异常及时报警等优势,被广泛应用于机房管理中。安防系统主要包括监控摄像头、监控主机、门禁控制板、门禁软件及门锁等。为了有效保障安防系统的正常运行,诸如摄像头、门锁等小设备虽然看起来不起眼,但是在日常工作中也是必不可少的。小L就经历了因为门禁锁故障而不能进入机房,机房摄像头又碰巧无信号,导致他对机房里的情况一无所知的事件。

【案例还原】

某晚,小W值班,机房监控突然黑屏,软件提示摄像头无视频信号,于是小W立即告小L。小L到现场后准备进入机房检查摄像头,却发现门禁的门锁开不了。经过反复测试并认真观察,小L发现门禁开门按钮及指纹读头验证通过之后,门禁主板继电器是有动作的,但门锁无任何反应,初步判断为门锁损坏。小L给供应商工程师打电话调来相同型号的门禁门锁更换后,门终于打开了。接着,小L按照故障排查流程对摄像头进行了检查,一般来说,监控设备运行过程中出现问题时的检查步骤为:①首先检查设备电源供电是否正常;②用测线仪检查线路是否畅通、摄像机触点因环境污染是否氧化;③线路中是否增加路由器等固定IP设备导致冲突;④重启录像机、交换机、摄像机等设备。经仔细检查后小L发现摄像头无电压,推测是直流供电出现问题而导致的黑屏,小L到备件库房找到备用直流变压器进行更换,摄像头视频信号恢复正常。

【案例总结】

1.定期组织专业人员进行日常巡视工作,对容易老化的监控设备部件,一旦发现老化现象应及时更换、维修,如门锁、直流变压器、视频头等,同时检查监控机房通风、散热、净尘、供电等情况。

2.组织专业人员每季度进行一次全面检查,检测安防系统各项技术参数及监控系统传输线路质量,做好巡检记录,发现隐患及时处理。案例7 保养不当导致新风系统故障

【案例概述】

案例关键字:新风系统 堵塞 机房异味

机房设备属于高精密设备,因此对周边环境,如温度、湿度、电源等都有非常高的要求,但人们往往忽略灰尘对机房设备的损害。由于机房内的尘埃会影响IT类设备的正常作业,尘埃堆集在电子元件上易导致电路板腐蚀、绝缘功用下降、散热不良等多种问题,因此要求对机房空气进行良好的除尘与净化。机房新风系统及精密空调的过滤网都是解决这个问题的好办法,如图1-7-1所示。但是在日常工作中,新风系统的维护却最容易被忽略,小L这个“资深”工程师也犯了这个低级错误,还好,他及时发现了问题,解决了问题,没有给自己“全能数据库管理员”的金字招牌抹黑。图1-7-1 新风系统

【案例还原】

某天早上,小L和往常一样到机房进行巡检,他一进机房就觉得哪里不对劲,一股莫名的味道冲面而来,这酸爽,正宗!再认真感受一下,发现新风系统风量明显变小了许多,心思敏锐的小L意识到大事不好,有情况。于是,小L一方面同领导汇报情况,另一方面联系维修工程师和现场工程师协助一起排查故障。

经验丰富的小L迅速把问题定位在新风系统上,通过紧张有序的故障排查后发现,是滤网上沉积了大量的灰尘。新风机滤网自机房启用到现在,一直没有更换过,由于使用时间过长,灰尘日积月累,与细菌、病毒共同作用,产生了一种无法言语的味道,不仅对新风系统的风量有影响,还会加重室内空气的污染指数。维修工程师立即更换了新风机滤网,清洁送风管道后新风系统恢复正常,问题得到了解决。

【案例总结】

1.新风机的滤网、送风管道及精密空调的过滤网等部件都必须定期进行检查,并及时做好清洁和更换工作。

2.重视新风系统的重要性,机房空调只做内循环,必须依靠新风系统带入新鲜空气,同时使机房保持正气压。当机房出现火情时,气体消防放气灭火后,如新风系统不工作,机房灭火气体会长时间无法消散,工作人员无法进入机房善后。案例8 应急演练误操作导致机房断电故障

【案例概述】

案例关键字:误操作 断电 SQL Server故障迁移

长时间负责机房管理的工作人员,一般都会有较强的“强迫症”,无论谁要对机房做什么事情,必须要求对方包括自己规范化、流程化地将工作做好、做细,并做好日志记录。小L在一次例行故障应急演练时,因网线、电源线杂乱,在整理线的过程中发生误操作,使PDU供电出现问题,导致一连串的问题出现,还好最终顺利解决,没有造成较大影响。

【案例还原】

一转眼又到了一年一度的医保路由故障应急演练的日子,按事先准备好的演练预案,各位同事各就各位,该院主要设备的参数如图1-8-1所示。

一切准备就绪,按计划进行模拟医保路由器故障,21:00准时关闭医保路由器并更换备用路由器。因为网络机柜中网线、交换机电源线杂乱、理线架安装位置不当,于是大伙开始整理网线、电源线、拆除理线架等。约5分钟后,小L收到运维系统监控平台短信报警信息“服务器汇聚交换机可用性异常,门诊收费、电子病历、超声、医保等服务器网络连接断开”,接着陆续接到门诊打来的电话反映门诊收费系统无法使用。图1-8-1 系统架构图

小L通过ping命令检查服务器汇聚交换机时发现全部包超时,网络不通。接着到现场查看交换机状态时发现交换机电源指示灯不亮,再查看交换机连接的PDU电源时发现PDU的开关处于OFF状态。原来是刚才整理电源线时误关了PDU开关,导致整个网络机柜断电,此机柜内的汇聚交换机断电关机,网络断开。于是小L赶紧打开PDU电源开关,服务器汇聚交换机正常启动,随后服务器网络恢复正常。小L正得意自己又快速完美地解决了问题时,小W却发现门诊收费系统、电子病历系统、超声系统、药房显示屏等系统都出现了同一个问题,即客户端与服务器间的网络畅通,但客户端程序无法正常启动。于是,将目标锁定到服务器上查找问题。

小L通过堡垒机登录到门诊系统服务器时发现基于Windows群集的SQL Server服务脱机,虽网络已恢复正常,但主、备节点均无法自动联机,于是他手动将服务联机,门诊系统的业务恢复正常。接着用同样的方法检查电子病历系统SQL Server相关服务,现象与门诊系统服务器类似,小L驾轻就熟,同样手动将电子病历群集服务联机,但此次操作联机失败,SQL Server(MSSQLSERVER)、SQL Server Analysis Services、SQL Server代理(MSSQLSERVER)三个服务均无法启动。时间一分一秒地过去,问题还是没有解决,临床的报障电话响个不停,小L的压力越来越大,但是他反而更加冷静沉着,经验丰富的他想到了电子病历系统的SQL Server服务是用域账户启动的,如果修改启动账户密码后没有对SQL Server服务进行重新配置,SQL Server服务在没有重启的情况下仍然可以正常运行,但服务关闭之后就无法正常启动,问题很有可能就是如此。于是通过“服务”管理界面重新配置SQL Server服务的启动账户,再手动将SQL Server服务联机,SQL Server服务正常启动,电子病历业务恢复正常。

检查超声系统服务器时发现服务器与网络存储的连接丢失,导致超声系统无法获取图像信息,重启服务器后网络连接正常,超声系统恢复正常。

业务系统都恢复正常后,小L来到了药房查看显示屏,发现显示屏程序与门诊收费系统服务器网络断开,程序处于假死状态,网络恢复后系统无法自动连接,于是手动重启显示屏程序后候药信息恢复正常显示。

【案例总结】

1.应急演练一定要有严谨的预案及统一的指挥、协调管理机制,所有的演练必须严格按预案进行,不得额外进行不在预案中的任何操作,以防意外。

2.应急演练前必须对相关的设备做好检查,评估好演练的风险,做好相关系统数据备份,准备好相关的硬件,以防备在演练过程中造成的附带损伤。

3.对于网线、电源线等,每次布线结束后要规范整理,认真打标签,避免因线杂乱、没有标签或安置不当而导致误操作。

4.应组织专业的人员定期进行巡检和日常维护,对存在的隐患问题及时整改。

5.对域账号进行计划性或非计划性维护时,要按照规范做好维护方案、配置管理,同时要及时对相关的业务系统配置进行同步更新。

6.对所有服务器的网络配置及电源的接入要有合理规划,做到冗余配置,保障在某一路电源或某一台交换机出现故障时,也能保证服务器及网络可用。案例9 温度过高导致服务器故障

【案例概述】

案例关键字:温度过高 PACS故障 服务器面板报警

高温是机房设备的天敌,一般来说机房的温度应在20~25℃,机房温度是保障机房设备正常运转和“延年益寿”的必要条件之一。对于认真负责的机房管理员来讲,对机房温度的关注往往等同于甚至超过对自己体温的关注。小L曾遇到因机房温度过高,导致PACS影像服务器出现过热自我保护停止对外服务的情况,还好他通过数据库性能及综合其他情况冷静分析,最终在早高峰前解决了问题。

【案例还原】

小L所任职的医院于2013年年底进行系统全面升级,上线了厂家A的信息系统,该系统包含了PACS、LIS、EMR等模块。随着医院信息化的不断建设与扩展,机房设备也日渐增多,目前服务器XX台、存储XX台、核心交换机X台,这给小L带来了不小的困扰和压力。医院网络拓扑图如图1-9-1和图1-9-2所示。图1-9-1 网络拓扑图图1-9-2 网络拓扑图

话说某日小W值班,当天凌晨,医院信息系统日常维护微信群里,有放射科护士截图反映影像工作站不能正常使用,由于时间在深夜且该名护士没有电话报故障,因此小W并未及时回复、跟进。到了早上上班前,陆续接到有临床医生反映不能正常读取PACS图像,紧接着两家分院也打来电话反映无法进入PACS系统,小W瞬间意识到这是一个全院性的故障,遂马上通知小L到现场处理故障,并将情况汇报给领导。

不到十分钟,小L赶到机房,人还没有进入机房,透过墙壁就已经听到机房内传来阵阵非常大的轰鸣声,小L已经知道大事不妙。进入机房,一股热浪迎面而来,机房空调明显已经停止工作,机房温度异常高,服务器前面板全亮起报警灯,所有的服务器风扇以最大功率运转,发出巨大的声响。小L仔细检查后发现机房内UPS供电正常、市电正常、消防正常、核心交换机正常、存储器指示灯正常。因医院的经费问题,机房里使用的空调为家用的柜式空调,小L赶紧开启空调,空调能够正常开机,空调主机显示当前温度为43℃,远远超过了普通服务器运行的正常环境要求。小L一方面向领导汇报情况,另一方面着手查找PACS的故障原因。

考虑到故障出现在凌晨,必须迅速有效解决,领导请示分管院长后,启动应急预案,影像科室启用DR、CT设备的本地服务应用程序,手工出具检查报告。同时在医院内网、职工微信群对全体成员发了一则公告,PACS信息系统正在恢复中,请耐心等待,请大家注意做好患者的解释工作。

小L通过堡垒机登录PACS服务器,查找原因,排查故障。经排

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载