[说明]
故障是系统运转过程中出现的任何系统本身的问题,或者是任何不符合标准的操作,已经引起或可能引起服务中断和服务质量下降的事件。
故障管理涉及许多IT部门和IT方面的专家。首先是服务台,作为所有故障的责任人负责监督并记录故障的解决过程。当它不能立即解决发生的故障时,就将其转移给专家支持小组。专家组首先提供临时性的解决办法或者补救措施以尽可能快地恢复服务,避免影响用户正常工作:然后分析故障发生原因,制定解决方案并恢复服务级别协议所规定的服务;最后服务台与客户一道验证方案实施效果并终止故障。
在IT系统运营过程中出现的所有故障都可被纳入故障管理的范围。
如果让我们组织一个小队去调研故障,我们应该怎么做呢
参考答案:故障分配给某个支持小组,他们应当做好如下工作:
(1)确认接收故障处理任务,同时指定有关日期和时间。
(2)更新故障姿态和历史信息。
(3)通知客房故障最新进展。
(4)说明故障当前所处的状态。
(5)尽可能快地把发现的权益措施提供给服务台和客户。
(6)参考已知错误、问题、解决方案、计划的变更和知识库等对故障进行评审。
(7)必要时要求服务台根据协议的服务级别,重新评价故障影响程度和优先级,并对他们进行调整。
(8)记录所有相关信息,包括以下内容。
①解决方案。
②新增的和修改分类。
③对所有相关事件的更新。
④花费的时间。
解析: 本题考点为系统管理规划方面的知识点。
系统管理规划包括故障管理概述(故障定义和特征、故障管理范围)、故障管理流程、主要故障处理、问题控制和管理等等。