免费的一旦你订阅了《可靠性周报》,你就需要一份《正常运行时间要素实施指南》

马里兰大学风险与可靠性中心目前正在进行这项研究1该项目由美国海军资助,旨在以科学的方式量化可靠性。目前的研究“依赖于对损伤作为材料失效来源的科学解释,并开发了一种基于热力学第二定律的可靠性评估替代方法。”目前的可靠性计算倾向于单一的故障模式或机制,并假设恒定的故障率,而这项研究表明,可靠性是系统可以承受的损坏程度的函数,操作环境、操作条件和操作包线决定了损坏增长的速度。

实际上,风险和可靠性研究中心正在研究熵的耗散如何等同于系统中的损坏程度,随着损坏的增加,增加了故障的可能性,这实际上降低了可靠性。

可靠性在工程环境中是指一个项目在给定条件下,在给定时间间隔内执行所需功能的能力。通常假设项目在时间间隔开始时处于执行所需功能的状态,可靠性性能通常表示为概率。例如,一个电气继电器有99%的概率在满载情况下实现10万次操作循环。

进一步以继电器为例,基于运行环境(无影响)、运行条件(满载开关)和运行包线(每分钟四个周期,24/7/365),可以计算随时间的损坏增长水平,从而预测该组件的单个平均故障间隔时间(MTBF)为17.4天,准确率为99%。

由于当前的可靠性计算倾向于单一故障模式或机制,并假设恒定的故障率,以继电器为例,这可能是触点上的电弧损坏,但弹簧故障或线圈过热也可能是可能的。问题是,对于每个组件,都会有几种失效模式或机制,每种模式或机制都会产生自己的失效预测,从而导致不一致的可靠性计算。另一方面,基于熵的故障预测将所有这些因素考虑在内,以确定损坏级别,然后用于计算组件的寿命。

因此,可靠性成为系统可以承受的损伤水平(即弹性)的函数,而操作环境、操作条件和操作范围决定了损伤增长的速度。

可靠性(右)Resiliance (X)伤害(D)

建立弹性

许多卫星已经在没有任何人为干预的情况下运行了多年。这表明弹性是设备或系统创建的功能,而不一定由人为干预驱动。以继电器为例,选择一个平均寿命为5000个周期的继电器,并在相同的应用程序中使用它。最终,您已经构建了一个MTBF为0.86天的失败模式。显然,基于组件的故障,这将是一个本质上不可靠的系统,因为所需的关注和修复级别过高。

因此,为了提高系统的可靠性,有必要进行设计评审。相反,如果选择一个平均寿命为20万循环的继电器,则MTBF增加到34.7天,尽管仍然不可靠,但比第一种选择有了很大改善。从根本上说,这种设计是有缺陷的,因为继电器上的占空比过大,为了提高系统的弹性,需要改变设计。其他的方法是减少激活的数量,在多个继电器之间交替激活或消除对激活的要求。

一旦设计完成,弹性创建就会进入设计实施的新阶段。不幸的是,这是你开始削弱弹性的地方,而不是增强它。这是由几个因素造成的:

  • 材料的选择不同于设计阶段指定的材料- - - - - -毫无疑问,这是由价格和某种形式的价值工程驱动的。通常情况下,设计人员的决策或组件选择背后的原因被遗忘或忽略,结果,组件不再满足设计要求。以中继为例,价格最好的选择可能是平均寿命为5000次激活的单元,而不是20万次激活的单元。只要不破坏设计意图,价值工程就没有错。
  • 由于制造缺陷而产生的不良材料- - - - - -生产缺陷应在整个生产过程的质量控制检查中发现。然而,一些制造缺陷可能深深地根植于组件中,几乎不可能检测到;而检测水平也反映在价格上。这通常会导致早期组件故障或缩短单个组件的预期寿命,并且很容易导致大量返工以更换有缺陷的组件。
  • 由于交货过程中缺乏细心而造成的不良材料- - - - - -交付过程涵盖了从在制造商处处理部件到运输、储存,最后在安装现场处理部件的所有内容。在这个过程中管理护理水平是非常困难的,因为需要考虑冲击、振动、环境和存储条件。这些控制的失误通常会导致早期组件故障或缩短单个组件的预期寿命,类似于制造缺陷造成的故障。
  • 组件或设备安装不当或不良- - - - - -经验表明,不正确安装的轴承或安装的电子元件没有正确的静电放电(ESD)保护,都可能导致因元件损坏而缩短预期寿命。系统未来的可靠性取决于安装时的小心程度,不仅体现在安装方法上,还体现在安装时的勤奋程度上。这方面的例子包括不良的接线连接导致连接器故障或不正确的设备设置导致过度磨损。无一例外,这通常是由于安装承包商管理不善以及在设备或系统投入运行之前安装测试程序执行不力造成的。
  • 在调试阶段进行现场测试- - - - - -调试应该是一系列渐进的测试,以证明系统满足设计参数。然而,为了确保系统能够充分保护自己,一些用于证明系统安全性的测试可能具有相当大的破坏性。请考虑按下紧急停止按钮时,在满载状态下对压缩机的影响。除了这一级别的测试之外,还要考虑委托一个具有数千个相互连接的设备的相当大的站点所需的时间长度。在某些情况下,例如建筑环境,这可能是几年,有显著的环境条件,不能反映正常的操作条件。

一旦系统准备投入运行,许多组件已经产生了一定程度的损坏,这最终降低了系统可以承受的损坏级别,从而影响系统可靠性。用数学公式表示:

XdXdes(D女士+D男人。+D+D本月+D通讯

这是指安装新设备或新系统时所提供的弹性水平。

提高韧性

将安装弹性作为一个时间点,需要稳定运行,消除安装不良造成的潜在损害。重点关注的一个关键领域应该是审查控制元素,特别是与软件相关的更新。通常情况下,系统会将自己固定起来,当采取这些操作时,系统将变得更有弹性(图1)。

图1:调试后稳定阶段

本文没有涉及操作和软件的稳定以及定时更新,但是有几个可用的系统可以帮助确定这些改进可能对稳定阶段持续时间产生最大影响的领域。然而,从安装损坏的角度来看,您应该考虑这些状态监测活动,以确定可以补救的潜在问题。

  • 红外热成像,以确定设备可能会陷入麻烦的热点和整体温度上升趋势。红外热成像适用于电机、超过50v的电气连接、热损失或寒冷地区以及轴承故障。
  • 振动监测,以识别不寻常的振动特征和水平,以及上升趋势的振动。振动监测对大多数旋转设备都很好,但对慢速旋转设备的监测很差,因此如何识别频繁启停设备引起的瞬态振动问题将成为一个问题。在旋转设备的起降过程中,振动监测将突出任何与谐波相关的问题,如果管理不当,这些问题也可能导致损坏。
  • 超声波帮助识别泄漏和其他异常的高能噪声,如气动,轴承和电弧。
  • 如果有足够的油量来支持它,则可以使用油液分析来识别产生过度磨损的系统,如白色金属轴承、齿轮系或液压系统。

所有这些,以及其他状态监测活动,将使您对损害的发展水平有所了解,如果及早解决,可以避免这种损害。这使您可以及时安排维修,以确保在系统移交正常运营使用时,新系统的恢复能力可以提高到尽可能高的水平。

保持弹性

一旦系统进入全面生产,可靠性的真正艺术是保持系统以正确的效率和高质量的输出运行,并进行最少的干预。为了做到这一点,您需要设置流程来监控和限制损害的增长,这最终会侵蚀系统的弹性。用数学公式表示:

XtXdD生活

地点:

Xt 岁的韧性
Xd 交付的韧性
D生活 使用寿命造成的损坏

和D生活与这些元素成正比:

  • 应用于系统的护理水平:你知道,如果你照顾好设备,识别故障并在故障发生前采取纠正措施,设备或系统往往会更长时间地保持其可靠性,因为你不允许它遭受二次故障。以电气面板上松开的压盖为例。当您看到它松动时,您可以拧紧它,从而降低面板中水分进入的风险,并限制连接器被腐蚀的可能性。
  • 对系统执行的维护级别:根据经验,如果只对设备或系统进行故障维护,故障的频率将上升到不可持续的水平。在这一点上,您将从一个故障运行到下一个故障,几乎不可能将预防性维护(PM)程序设置到位。或者,您可能会过度维护项目,以至于您将系统离线进行不必要的检查,纯粹是为了碰碰运气,您可能会发现一些隐藏的故障。
  • 人为错误和劣质工艺:当更换部件或执行任何侵入性检查时(例如,您超出了拆除安全防护的级别,并开始拆卸设备以执行检查),就会引入人为错误的可能性。据估计,50%到70%的设备故障是人为错误造成的。这可能是由于更换部件或重新组装设备时使用了不正确的方法,缺乏任务所需的培训或技能,或由于不良实践或拙劣的工艺造成的错误。
  • 更换部件必须符合设计要求:当购买替换部件时,它们需要符合系统的设计参数,否则就有可能改变系统的弹性,类似于前面示例中的继电器选择。此外,系统可以设计成将特定的故障内置于保护系统其余部分不受重大损害的方式。如果你用一个更健壮的部分来改变失败的部分,实际上你已经改变了设计参数。结果,您可能已经将故障转移到另一个组件,这可能更具灾难性。采购过程和组件规格应避免这种可能性。
  • 没有正确管理的快速修复:当设备或系统正在运行并且发生故障时,您必须应用快速修复程序以使系统运行以满足需求。如果您不返回并进行永久性修复,而是继续使用快速修复,那么原始故障的原因仍然存在,并且损坏的级别可能会增加。这是一个文化问题,当维护人员因其对问题的快速响应而不是长期的系统改进而得到奖励时,就会产生这种文化问题。
  • 使用超出设计参数的设备或系统:设备或系统被设计成以特定的方式工作,只要以这种方式使用,通常就会可靠地工作。但是,如果你改变了操作流程,而不改变设计意图,系统或设备可能会变得不那么可靠,效率也会大大降低。
  • 设备剩余寿命:以继电器为例,如果所选继电器的MTBF为15.4天(100,000个周期),精度为99%,那么在继电器生命周期的第一天,您几乎有100%的可能性无故障。但是在第16天,你几乎有百分之百的可能失败。这同样适用于一个系统;随着时间的推移,构件的损坏程度将增长到老化弹性显著降低的程度。因此,系统的可靠性大大降低。

从元素列表中可以清楚地看出,许多元素都在操作人员和维护人员的管理和控制范围内,而剩余设备寿命更多地是设计的功能。

结论

可靠性是对系统造成的损坏程度的函数,因此,它应该等于Xt在一个时间点上,如图2所示。

图2:随时间变化的系统弹性

在某个时间点(Xx)时,当设备或系统的弹性低于保持预期的可靠性水平所必需的水平时,系统就会变得固有的不可靠。一旦设备或系统达到这一点,经验表明,几乎无法重建弹性水平以支持所需的可靠性。此时的维护成本开始上升,因为需要更多的人力来解决大量的故障。此外,随着故障数量的增加,更换部件的数量也会增加。此时,设备或系统可用性更多地取决于人力和MTTR,而不是系统可靠性。

组织需要改变他们对维护者角色的看法。正如本文所示,维护人员需要将注意力集中在尽量减少对设备或系统的损害上,因为随着时间的推移,这最终会提高可靠性水平。此外,组织应该寻找方法来量化他们控制范围内的元素,以便在任何时间点预测弹性水平。

参考文献

  1. http://crr.umd.edu/sites/default/files/documents/anniv25/posters/RE25th-Poster-Imanian.pdf

马尔科姆隐藏

Malcolm Hide是一名独立维护顾问,在维护和设计方面拥有超过35年的经验。他曾在钢铁、石油天然气和食品加工行业工作过,由于拥有广泛的经验,Malcolm能够将他在资产管理和维护需求方面的知识应用于许多环境和应用程序。
www.stratmaint.com

下载文章
横幅
每周收集推荐的文章和视频,以促进您的可靠性之旅。bob体育双赢彩票就在收件箱里
立即下载