27

混沌工程在医疗保健领域应用:从敏感的工作负载入手

 3 years ago
source link: https://www.infoq.cn/article/icPYYjbW9rR1lulKStOC
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

本文要点:

  • 虽然混沌工程是一种已被证明可以提高系统弹性的技术,但当涉及到关键系统时,涉众通常不愿意引入这一实践。
  • 对于关键系统,最好首先在开发 / 测试类的环境中进行实验,将实际风险和感知风险都降到最低。当你从这些早期实验中了解到新东西时,你可以向涉众解释说,生产环境是一个更大、更复杂的环境,可以进一步从这种实践中获益。
  • 使用真实的生产流量,而不是合成作负载,可以提高这些在早期阶段进行的实验的有效性。
  • 良好的混沌工程实践可以帮助你提高系统的弹性和事件发生时的可观测性。

近年来,人们对混沌工程越来越感兴趣。它定义了一种有价值的实践,通过接受系统将会失败的事实来提高系统的可靠性。虽然关于如何应用这种方法的文献和讨论比比皆是,但当系统被视为“关键”系统或太重要而不能失败时,人们往往就会产生犹豫。尽管在关键系统中应用此方法可能有更令人信服的理由,但是可以预见,这些系统的涉众对任何可能增加风险的新事物都很敏感。在本文中,我将分享我们 Cerner 公司 (一家医疗保健信息技术公司)的团队在我们的系统中引入这一实践时找到的一种有效的方法。

组织工作

在你开始尝试开展这些类型的实验之前,你希望确保系统涉众就这个方法达成了共识。这在早期阶段是很重要的,因为你的一些发现可能会改变你的软件交付时间表。你希望确保他们理解这个开发过程中新增加的部分,并且这些发现可能比其他计划好的开发工作具有更高的优先级。这就像在生产事件中发现的可靠性问题优先于其他计划好的特性。你通过混沌测试发现的问题可能同样重要,但你是主动发现它们,而不是在实际的事件中被动地发现它们。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK