三板斧搞定工控一体机故障(一)——故障分析方法_联智通达
来源:
|
作者:LANXUS
|
发布时间: 2023-10-10
|
1391 次浏览
|
分享到:
本文以操作员和设备维护工程师的角度来分析工控一体机的常见故障和分析方法。尽管工控现场会有千奇百怪的问题出现,但几乎所有产品的稳定性和可靠性问题,都可根据本文提到的三个点作为判断依据。希望阅读完本文后,读者会对问题判断有系统性的分析方法。任何产品故障都离不开这三个核心点,通过对这三个方面的分析处理,一方面能解决实实在在的问题,另一方面也可以从多个角度采取措施,避免产品故障。资源,一般指硬件资源,即硬件配置,主板、CPU、内存、硬盘、网络带宽、外部接口等硬指标是否符合现场环境需求。在现场使用的工控一体机,通常硬件配置和软件匹配度都是经过测试符合要求的,一般不存在刚开始正常,一段时间后软件异常的情况。因此这种异常,通常不会是工控一体机硬件配置不够导致,所以,需要从配件、外部接口、连接线等硬件设施找原因。联智通达总结十多年工业产品研发制造的经验后发现,故障频率较高的原因主要有以下几个方面:1.接口接触不良。经常拔插的接口最容易出现问题,不拔插的接口基本不会有问题,或者是使用多年以后出现故障;2.线缆破损是工程现场最容易出现且不容易发现的故障;3.机械硬盘损坏。一般在非法频繁断电或者是震动环境中容易出现,SSD硬盘会好一些,一般建议使用SSD硬盘;4.内存接触不良。在灰尘较大、湿度较高的环境中容易出现内存使用一段时间后异常,重新拔插后正常;正常情况下,正式部署的工业软件,对CPU、内存资源占用都在一定控制范围内,但也可能存在CPU偶尔占用高的情况出现,主要原因可能因为环境过热导致。可以先查环境温度和主机温度,如果主机温度过高,则需要考虑降温处理;一般来说,要保证工控一体机稳定工作,建议CPU资源占用不要超过40%(肉眼可见的占用情况,不是峰值),内存占用必须相对稳定,整体控制不超过50%,更不能出现内存泄漏的情况。逻辑一般是软件的业务逻辑,指的是软件是否成熟,逻辑上有没有存在异常。一般来说,业务逻辑的问题比较容易重现。对于成熟的工业软件来说,这方面问题相对较少,一般正常部署到工业现场的软件,基本都是通严格测试并经历过现场验证的,所以,本文主要关注硬件故障。业务逻辑也有可能存在冲突问题,比如有的传感器超出常规的频繁报警导致业务逻辑负载增加等,具体需要根据实际情况测试后分析。逻辑也包含网络拓扑,特别是一些总线方式的布线方案。网络拓扑也是整体系统的业务逻辑,拿RS485总线来说,通常出现的情况是单机测试都没有问题,多机(终端)连接后就有问题,这个现象就是理论上没问题,实际又不能使用,所以,需要考虑到网络拓扑在实际使用中可能遇到的干扰问题,采取必要的措施。用RS485举例的目的是明确这种看似不是逻辑问题的故障,明确归类到逻辑类,便于分析和处理故障,针对工控一体机的各种具体故障,我们会专门撰文分享,请关注联智通达,及时获取我们分享的工控一体机资讯和产品知识。环境,一般指设备工作环境,如温度、湿度、电压波动、电磁干扰等各种外部因素对设备稳定工作的影响。温度和湿度是最容易判断的,但电压波动和电磁干扰相对就难以判断,一般需要专业仪器检测才会发现,当然,作为具有丰富现场经验的联智通达工程师,也会有一些简便的判断方法。如何快速判断电压稳定性,一般来说,用万用表检测即可测出动力电源是否稳定。另一种电压不稳是电源适配器造成的,电源适配器通常输出的是低压,万用表测出来通常不准确,有一种简单方法是查看电源适配器的发热情况(从另外的角度规避问题)。一般来说,电源适配器都会发热,如果适配器表面明显烫手,表明适配器负载较大,甚至超标,电源适配器超负载时稳压效果会大打折扣,建议更换。在中国大陆,目前电网供电相对平稳,一般动力电源不太有问题,但局部大型设备的开启和关闭会对局部电网造成电压波动。比如:设备出现规律性死机现象,如果时间上和大型设备的开启/关闭吻合,基本可以判断就是这个原因,解决方法是在设备电源前加稳压器或者电源线上加磁环,一般就可解决这个问题。电磁干扰是一般工程师难以判断的问题,如果频繁出现,可以考虑购买电磁辐射检测仪来测试。预防电磁干扰始终是最佳选择,主要注意几点:以上是工控一体机的一般现场故障分析处理思路,遇到问题不用慌,按照以上逻辑分析,把问题归类后分析,一般可以得出相对准确的结论。本文是工控一体机系列故障处理文章的首篇,后续会继续针对各种具体问题进行分析,联智通达结合多年的工业产品经验,将具体问题的分析处理思路分享给大家,关注我们,可以随时了解工控一体机相关产品知识以及故障处理的经验分享。