美国动力学2020年6月 美国动力学2020年6月 美国动力学2020年6月
维修可靠性工程

风险门槛调查出生

T.

风险阈值调查(RTI)方法由安东尼(Mac)史密斯(Anthony Smith)开发,以支持大辛辛那提污水处理(MSDGC WWT)部门寻求提高可靠性。本文将带您经历RTI的诞生,解释RTI是什么,为什么创建它,它适合于维护可靠性计划策略,它是如何执行的,并展示它在实际操作中的一些实际结果。

“20/80系统需要一种简单的方法来在干草堆中找到针”

介绍RTI

RTI的思想过程开始于此问题:

“在系统中有一些潜在的设备问题或失败,即使一个整体而言,也可能是相当严重的,这可能是一个”乖巧“?”

乖巧的系统(即,20/80)通常表现出相对较小的严重问题。相比之下,麻烦的系统(即80/20)具有更多组件,也许是50%或更高的界限,这些组件可以被归类为有助于展示展示者问题。RTI的目的是确保在令人难以置信的系统上进行可靠性居中的维护(RCM),但在可能永远不会受到任何形式的RCM分析的相对良好表现的系统中,不会忽视一些严重问题。

RTI流程在系统级执行,而不是组件级。这是因为我们已经知道20/80系统有一个相对良性的故障历史记录。80/20系统则不是这样,它们有“吃掉我们的午餐”的历史。20/80系统需要一种简单的方法来“大海捞针”。因此,RTI诞生了。

RTI的出现是因为发现关键方法在几个方面的不足。在一项基于组件的临界性研究中,一个组件可以从其23个临界性标准问题中获得足够的分数,从而根据其定义被认为是“临界”的,但并不一定是“风险”,因为其故障对核电站的后果相对无害。组件故障的大多数后果并不是真正意义上的风险。这样做的目的是集中精力找出那些可能真正让人头疼的问题,并尽量避免它们。

在RTI分析中,只考虑了七个后果区域:安全,环境,停机时间,运营,监管要求,单点故障和经济学。RTI方法依赖于系统专家维护技术人员、操作人员和可靠性工程师的经验,以考虑在20/80系统边界内的任何特定问题是否会对七个指定后果区域中的一个或多个造成风险。

基本的想法是定性识别潜在的问题或失败在20/80系统实际发生和导致问题在一个或更多的七个领域,还穿过一个阈值,结果被认为是足够严重,特别注意减轻或消除风险。

如何适合R&M战略

2011年,MSDGC WWT部门制定了一项可靠性和维护(R & M)策略,并成立了团队以改善三个关键领域:

  • 可靠性工程,特别强调环境保护和风险降低,使用RCM、以经验为中心的维护(ECM)、风险阈值调查(RTI)、根本原因分析(RCA)和缺陷消除(DE);
  • 计划和安排维修工作,强调增加主动维修和减少被动维修;
  • 监控资产状况,关注于内在化和扩大覆盖到所有适用资产,尽可能多地使用预测、状况监测技术和相关功能(例如,机械激光校准),使其具有成本效益和可行性。

整体策略的可靠性工程元素如图1所示。1

让我们来看看图1中的每个最佳实践。

图1:R&M战略的可靠性工程部分

帕累托分析识别系统的RCM, ECM和RTI分析-顶部的柱状图描述了7个MSDGC WWT工厂中最大的10个系统(以编号标识)的故障数量。这样做是为了直接对最麻烦的系统采取行动。这种对系统进行排名的方法采用了成本分析、维护工时、停机时间或其他影响组织目标的措施。

图形左侧的最高杆,称为帕累托图表,识别80/20系统或糟糕的演员。它们代表大约20%至30%的系统,这些系统大约产生70%至80%的失败。该图形右侧的系统的条形图显示了更少的故障,并称为20/80系统。这些系统的大多数大约是70%至80%,只产生20%至30%的失败。2,3

不良参与者系统的RCM分析- MSDGC WWT人员选择古典RCM作为坏演员系统的方法。它们是所有WWT系统的大约20%,其中80%的问题影响环境,安全和整体工厂的性能和成本发生。Classical RCM analysis on a major system may take two to three weeks to perform using an experienced facilitator (i.e., a consultant specializing in RCM until an employee gains enough experience to perform the task) and a team of in-house subject matter experts in maintenance, operations and reliability.

ECM分析4- ECM为更好的良好的系统(即,20/80系统,只有大约20%的问题发生)。这样做是为了尽量减少MSDGC WWT人员从事整体可靠性提升倡议的影响,减少对改进倡议的工厂预算的财务影响。每种系统都需要快速外观,大约两到四天,由一个内部的,由专家领导的多学科分析团队在促进的促进方面带领以下问题:

  1. Are current tasks (if any) performed on the system really worth it in terms of applicability (i.e., they work and actually do or can find failure modes) and is each task cost-effective relative to some alternative, such as allowing the asset to run to failure?
  2. 如果在适当或适用的预防或预测维护任务到位,可以避免或减轻在过去五年(或多或少)在系统上执行的任何纠正维护事件?
  3. 该团队可以假设前两个问题尚未涵盖的任何故障模式可能会产生严重后果,例如影响安全性或有需要大量停机和/或强迫维护中断的中断后果吗?

对于20/80系统,可能永远不会受RCM的系统- MSDGC WWT人员对良好行为系统的20/80系统进行短期,一天或更短的RTI分析。由于两个或更多危险因素,在某些情况下不可接受的风险,RTI可以使用ECM分析触发更深入的外观。RTI结果用于优先考虑所识别的ECM分析的系统。

当存在不确定性时,所有系统的RCA- 当问题发生时,所有植物系统都受到根本原因分析,需要注意减轻或消除它们,并且所有贡献原因都存在不确定性。MSDGC选择了RCA的原因和效果方法。举办了方法论的课程,为预期调查团队参与者和促进者举行。5

需要RCA,因为RCM和ECM无法识别导致系统生命周期中发生故障的所有贡献和/或潜在因素,尤其是涉及人类的贡献。即使在最彻底的RCM或ECM分析完成后,还记录了更良好的维护过程,程序和工作指令即使在最彻底的RCM或ECM分析后也会导致失败的原因。缺乏正常培训和经验的新人才能赶到危机情况,可以忽视完成维修的关键步骤,从而恢复运营后不久的婴儿失败。6导致故障的其他原因包括更换部件、润滑剂和组织供应链中的其他物品的变化,以及操作条件、系统配置或实践的变化。

在分析时处理资产条件和系统配置的RCM或ECM超出的其他原因也需要RCA作为在上述分析完成后减轻或消除重要意外故障的工具。当任何原因都没有发生分析方法并且发生重大事件时也需要。RCA调查可能需要几天时间,调查结果的报告和纠正措施的建议可以漫长。

缺陷消除- 这是MSDGC WWT部门的维护可靠性策略中的最后一个工具。T.he methodology and rationale for including DE in addition to RCA is to eliminate known defects caused by aging, wear and tear, careless or poorly executed work habits, changed operating conditions requiring more robust components, or inadequate replacement parts that don’t meet current stress levels present in an asset. DE analysis meetings can be typically completed in a day because they deal with known defects. The report of findings and recommended action(s) is intentionally limited to one page.7

“他们(坏演员)代表大约20%至30%的系统,这些系统大约产生了70%至80%的失败。”

RTI方法论

在决定采用RTI时,MSDGC WWT总共进行了8次经典RCM分析。由于许多限制因素,其中包括(但不限于)可用来雇用主持人的资金流动速度,以及缺乏用于在分析团队中服务的内部主题专家的可用工时,每年只进行两次分析。此外,RCM分析结果的执行是滞后的。同时提出的其他维护可靠性措施,包括不同的资产状况监测方法,需要工时,这使工作人员的生活变得困难,因为他们仍然必须处理日常的纠正和预防性维护工作。考虑到所有可能影响废水处理目标和目标的系统,以尽量减少人员的影响和最大限度地发挥其努力的影响,因此决定重新考虑如何优先考虑员工活动。

这个问题与风险的主体直接相关。从概念上讲,风险是指电站系统及其设备中的故障(如硬件和/或软件),并通过故障概率和故障后果来衡量。不可接受的风险被认为是重大后果和它实际可能发生的现实机会(即概率)的结合。有些行业,如核电、石化加工等,花费大量资金对风险因素进行定量界定,然后精心设计和运行核电站,以降低事故风险。在MSDGC和大多数其他WWT电站中也可以找到许多相同的设计特性。这包括设备冗余、适当的设计余量和备份操作能力,以防止人员伤亡、泄漏和未经处理的废水排放到环境中。

MSDGC WWT部门人员已经认识到了多年来,需要定义有效的策略来消除或至少减轻植物和系统中意外失败的影响。2007年,该组织采用了组件临界评分方法,以试图识别此类风险和关键性驻留的地方,然后使用该过程指定所选的预测任务应采用以降低这些风险的位置。组件临界方法使用在组件级别应用的多维临界指数。根据关于安全,环境,维护和运营后果的23个问题的答案,使用复合加权分数评估关键性。然后,组件的分数用于从顾问的图书馆分配预测性维护(现在也称为资产条件监测或ACM)策略。这产生了一些好处,如图2所示,通过2008年和2009年的主动维护增加。主动维护从略高于30%以上增加到超过40%,但随后在2010年的更高图中程度。

2009年,管理了一个不同的过程在这个问题上,即使用帕累托分析识别的可靠性计划工厂系统(组件),罪魁祸首造成过度的纠正性维修和系统停机时间成本,然后应用相结合的方法,从古典RCM开始,定义维护策略以消除或减轻这些故障。到2013年底,这种方法显示出了显著的附加结果,在早期基于组件关键度的维护基础上增加了更多的主动维护。在图2中,主动维护的人工(小时)从2010年的40%多一点增加到2013年的70%多一点。

图2:应用ACM策略的结果

因此,MSDGC WWT部门对80/20系统使用了经典的RCM方法,通过对系统故障和维护人工成本的帕累托分析来确定。使用RTI方法可以解决20/80系统的风险。RTI结果可能触发更详细的分析,如ECM。因此,RTI方法被认为是RCM方法家族中的一种,因为它处理的系统、它们的功能和特定的失效模式可能会破坏这些功能或导致其他安全或环境问题。8

失败事件要求纠正措施的下降并没有此前预期通过正确的点或PdM任务和总体失败事件开始下降,导致无功成本的减少维修超过120万年的2011美元,528000年的2012美元和752000年的2013美元。9

RTI进程利用经验丰富的技术人员和/或一线维护监督员和运营商的经验和判断进行分析。通过RTI方法的专家促进,进行图3所示的五步过程。这些步骤模仿在一定程度上,在一定程度上进行了经典RCM研究中使用的分析,但停止远离收集的综合信息并进行审议在古典的rcm。

图3:五个风险阈值调查步骤

RTI的五个步骤是:

  1. 选择20/80系统。这可以从Pareto分析中确定。
  2. 对于选定的20/80系统,就该系统的边界达成集体团队决定。这一步的目的是建立团队对分析过程中包括什么和排除什么的共同理解。通常,这将很快实现。
  3. 列出所选20/80系统的系统功能。列出函数有助于识别与函数相关的影响,这些影响具有值得考虑的特定后果。这些功能被分析辅助人员列在白板上或挂图上,完成后用相机捕获。该数据用于RTI报告。
  4. 列出驻留在边界内的主要组件,如有必要,包括用于控制或安全的仪表。
  5. 使用其集体经验的团队讨论了边界内部的每个组件,以确定它是否有或可能有任何一种合理可能的问题或失败,这将导致表1中的七种后果中的一个或多个。团队试图回答问题:

这种问题或失败可能是系统功能方面不可接受的风险的来源吗?

如果答案是是的,然后讨论该后果是否会超过商定的阈值措施(可接受或不可接受),以及后者是否值得进一步注意,以便在实际事件发生之前消除或减轻风险。

表1 -失效标准区域矩阵

通过点击监控维护其系统,工艺技术人员和监督员的ACM / PDM专家的经验和判断,识别问题和/或失败以及产生一种或更严重后果的潜力是最好的。它。如果最有经验的人员参与分析,最好的结果将会来。

“…反应性维护的成本在2011年减少了120万美元,2012年减少了528000美元,2013年减少了75.2万美元。”

实际的RTI结果

两个MSDGC WWT系统的案例研究

系统名称:

  • 在Mill Creek废水处理厂返回活性污泥(RAS)
  • 废物活性污泥(是)在Mill Creek废水处理厂

实施日期:2013年3月19日

团队成员

  • 液体流的植物监督员
  • 机械小组负责人
  • 仪表机构领导者
  • 操作员
  • RTI专家和MSDGC WWT可靠性工程师

系统边界

  • 从:薄壁溢出出曝气坦克
  • 结束:在入口处返回曝气池的管道
  • 是:输出泵到二次浓缩,最终到焚烧炉

系统功能

  1. 适当的活性污泥返回曝气罐
  2. 妥善浪费激活污泥与二级增厚
  3. 流量信号到可编程逻辑控制器(PLC)

表2提供了该分析的结果。

表2.- - - - - -返回活性污泥(RAS)和废物活性污泥(是)系统分析

系统结果

  • 该团队花了大约四个小时开发表2中摘要的信息。
  • 从风险的角度来看,两个不可接受的发现了该系统存在的问题:中等临界的is排放阀和RAS排放管道到曝气。两者都可能导致高昂的成本和系统和/或工厂停机时间。
  • 如果未启动PM任务以定期锻炼阀门,则在手动流量控制阀(RA到曝气罐手动控制阀,中临界索引1200)和旁路阀(低临界索引450)中可以开发第三个可能不可接受的问题。排除失败的打开状态。

所有三个问题都应由植物监督员的维护和适当技术人员的监督员进一步审查,并报告给可靠性工程师。

RTI团队参与者的观察结果

Eric Stevens, CMRP, CRL

就像RCM学习一样,RTI将所有玩家放入房间,每个人都学习有关系统如何运行的信息以及如何维护。操作和维护不知道其他工艺在做什么。将每个人聚集在一个房间里,并讨论系统的功能让每个人都在同一页面上。在Mill Creek WWT工厂,当我们做了RAS系统时,大多数团队都不认为我们会发现任何东西都是剧案。我们错了,发现表2中确定的一些问题。这些问题是在MSDGC WWT持续改进计划中解决的。
RTI过程也是工厂解决20/80系统的好方法。它比在每个系统上进行全吹的RCM更快和更便宜。虽然公司可能想要在每个系统上完成完整的RCM,但那些需要时间和金钱。组织应首先在80/20系统上首先进行RCM,并且如果可能的话,在20/80系统上执行RTI。Pareto分析用于优先考虑系统。RTI快速指出任何可能是整个系统的展示者的资产。一旦RTI进程完成,我们就可以对有任何可能破坏过程函数的系统进行ECM研究。
通过临界过程坐在临界过程中,被问到23个问题似乎比系统的职能更多地关注资产,RTI过程是一个受欢迎的变化。它与系统功能直接相关,如安全性,并给出更多具体答案,从风险的角度来看,资产更为严重。

参考文献

  1. MSDGC WWT在2014年SMRP年度会议的研讨会期间提供了图1中的图表版本。所描绘的策略是由John Shinn,Jr.,P.E.的策略,当时是Msdgc WWT的维修经理。
  2. 汗,F.I.”糟糕的演员计划正常运行时间杂志,2019年8月/ 9月,pp 56-60。
  3. 科赫,Richard。80/20原则:用更少获得更多的秘密,第四版。波士顿:尼古拉斯·布雷利出版有限公司,2014年1月2日。
  4. Hinchcliffe, Glenn R.和Smith, Anthony M. RCM:通向世界级维护的大门。沃尔瑟姆:Butterworth-Heinemann, 2003。
  5. 选择的具体原因和效果方法是Thinkrelibility,Inc。,德克萨斯州休斯顿。www.thinkreliability.com
  6. 尼古拉斯,杰克。成功的秘诀与程序迈尔斯堡:可靠性网站,2bob综合体育网页版014;见第七章。
  7. Ledet, Winston P., Ledet, Winston J.和Abshire, Sherri M。不要只是解决它,改善它!前往精密域的旅程。迈尔堡:Reliabilbob综合体育网页版ityWeb.com,2009。
  8. 米切尔,约翰斯。物理资产管理手册,第四版。迈尔斯堡:Reliabibob综合体育网页版lityweb.com, 2012。
  9. MSDGC WWT人员和支持承包商(包括本文的作者)在2013年SMRP年度会议上进行的讲习班,包括成本降低。