可用性
定义
系统能够正常运行的时间比例,经常用两次故障之间的时间长度或出现故障时系统能够恢复正常的速度来表示。
度量
无故障时间/(无故障时间+故障恢复时间)*100%
提高方法
- 提升思路
- 提升系统的单次正常工作时长
- 减少故障恢复时间
- 具体战术
- 错误检测
用于错误检测的战术包括响应、心跳和异常。 - 错误恢复
用于错误恢复的战术包括表决、主动冗余和被动冗余。 - 错误防范
用于错误防范的战术把可能出错的组件从服务中删除,引入进程监控器。
- 错误检测
可靠性
定义
软件系统在应用或系统错误面前,在意外或错误使用的情况下维持软件系统的功能特性的基本能力。