计划外的工作无声地杀死了IT部门

你看不到你闻不到。但这是致命的,并且可能在您的IT组织的地下室中,无声地杀死了您的公司。这就是所谓的计划外工作,CIO和首席信息安全官正因此而失业。这个沉默寡言的杀手是如此难以识别,以至于许多IT专业人员甚至都没有意识到它的存在。

有些人会质疑:“如果计划外的工作如此致命,那么所有尸体都在哪里?”答案是它们无处不在。一旦看到它们,您就会发现它们几乎是所有IT问题根源上的第一步。

难以高估计划外工作对IT组织的影响。这是一张餐巾纸计算。根据Forrester Research从2002年开始的估计,美国国内生产总值的10%用于IT,占公司资本支出的50%。但是,IT项目就像一只免费的幼犬-幼犬的资本成本由“运营/维护”成本而不是初始购置成本决定。 2004年美国的GDP约为10万亿美元;如果其中10%用于IT,并且我们估计其中50%用于“运营/维护”活动,并且其中至少35%是计划外的,则为3500亿美元。那有很多尸体。对于许多公司而言,《萨班斯-奥克斯利法案》第404节的IT控制工作是一项计划外活动,AMR Research估计该节在2006年将超过60亿美元。更多的尸体。

计划外工作是IT组织中无法映射到授权项目,过程或变更请求的任何活动。任何服务中断,失败更改,紧急更改,补丁或安全事件都会造成计划外的工作。

IT组织中计划外的工作量是IT有效性的非常准确的指标和预测指标。 2002年,在我公司对高性能IT组织的研究的早期,我们进行了75个问题的评估,以确定组织是否为高性能组织。现在,我们有些尴尬地回顾了这一评估,因为现在我们相信我们可以通过提出一个问题来得出有关组织成熟度和所需的规定性步骤的结论:您IT组织的工作计划外百分比是多少?那些在紧急和计划外工作上花费少于10%的时间的组织通常还具有极高的运营卓越水平,合规性和安全性,并且与审计师具有良好的工作关系。

尽管CIO希望将重点放在战略问题上,但他们必须首先掌握战术,因为未计划的工作是以战略计划的工作为代价的。

普遍的看法是IT具有两个业务功能:

  1. 建立并完成业务的新项目:理想的IT组织按时以可靠的质量完成项目,并为企业提供所需的功能。这些IT项目是计划内的工作,妨碍完成它们的任何事情都是计划外的工作。如果开发人员将30%的时间花在IT运营升级引起的紧急中断/修复问题上,则项目承诺会受到影响,通常会导致项目延迟。
  2. 有效,高效和安全地运营/维护现有的IT服务和资产: 理想情况下,IT服务按广告和承诺的方式运行,质量可靠,客户满意。存在控制措施,以使IT管理层可以及早发现差异并以计划有序的方式对其进行修复,并且存在控制措施以促进合规文化的形成,从而帮助IT管理层实现业务目标并使审计师满意。

出于讨论的目的,让我们假设有两个极端:绩效高的IT组织和绩效低的IT组织。在我与IT Process Institute的研究中,我们发现,绩效高的人员计划外工作量最少(少于5%)。绩效低下的服务质量通常很差,经常发生服务中断,中断/修复工作和灭火。他们还有不满意的客户,他们似乎看到每一个错误,审计师不断用更多的文档要求,测试和考古项目来轰炸他们-当然,大量的计划外工作(通常超过50%)。

高绩效和低绩效者的计划外工作来源大不相同。我请了几位专家,作为表现欠佳的IT组织中计划外工作的主要贡献者。他们的答案几乎是相同的:

  • 更改失败: 生产环境用作测试环境,客户是质量保证团队。
  • 未经授权的更改: 工程师不遵循变更管理流程,从而使错误更难以跟踪和修复。
  • 没有预防性工作,不可避免地会导致反复失败: 平均修复时间可能会有所改善,但是如果没有根本原因分析,该组织注定要一遍又一遍地解决相同的问题。
  • 配置不一致: 用户应用程序,平台和配置中的不一致使进行适当的培训和掌握配置变得困难。
  • 与安全相关的修补和更新: 对配置的了解和一致性不足,使得应用安全补丁非常危险。
  • 存取权过多: 太多的人无法访问太多的IT资产,从而导致太多可预防的问题和事件。

另一方面,对于绩效较高的人员,这组顾问认为“产品和环境故障”是计划外工作的主要原因。 “发布失败”和“人为错误/用户错误”排在第二和第三位,因为这些导致计划外工作的原因在成熟的IT组织中很少见。一位专家表示,“成熟的组织拥有适当的制衡机制,可以防止这些事情发生并在发生时及时捕获。这是测试流程,人员和技术之间集成的链接。”

量化成本

现在,我们认识到计划外的工作如何通过将IT专业人员从实现目标的活动中撤离而损害了IT运营目标,我们是否可以量化计划外的工作成本,以证明减少这些控制措施的投资回报是合理的?

有时我们会听到一个问题:“您如何证明实施IT控制的成本合理?向我展示一个业务案例,供我们购买测试服务器和用于实施变更管理流程的工具。”这是一个公平的问题,可以通过一个简单的示例来解决。

假设某人更改了IT资产,但是由于缺乏生产前测试和变更管理授权,变更失败并导致灾难性的失败。失败的更改导致IT运营人员处于“全力以赴”的状态; IT放弃计划的工作以补救更改的结果。服务中断引起的事件需要四小时的修复时间,涉及25位来自所有职能角色的IT人员:应用程序开发人员,QA人员,数据库管理员,网络和系统管理员以及安全性。失去IT员工的生产力是这一计划外工作的首要代价。

计划外的工作也会以计划内的项目工作为代价。在这种情况下,应用程序开发人员和质量保证人员将从重要的销售支持项目的关键路径中撤出,并且项目的发货日期会推迟一周。此外,为了解决该项目的延误,IT部门必须雇用更长的承包商团队。

成本继续增加。当IT人员致力于恢复服务时,外部客户会致电服务台以查明为何无法访问其账单信息。由于庞大的客户群,成千上万的客户致电服务中心。多余的呼叫需要服务中心激活溢出呼叫中心,这需要花费数万美元。收入也被中断,因为服务中心员工在处理客户事件时无法接订单。

停机时间和IT项目资源成本高达数千美元。服务中心成本,收入损失和延迟的IT项目成本成千上万。让我们更进一步。也许客户变得不高兴,以至于有2%的客户离开了。现在,企业必须花费数百或数千美元才能重新吸引每个客户。

现在,您的无赖更改会影响客户,成本几乎成倍增加。在客户不满的情况下,您现在遇到了营销和公共关系方面的问题。您的营销部门既要赢得新客户又要赢得客户-与获得新客户相比,这项壮举更加困难,而且成本更高。

(而且,计划外工作的成本还要高得多。每个后期项目(这些项目甚至进一步被延迟)都有一些业务附带的投资回报。因此,计划外延迟项目的每一刻都有一个可量化的机会成本。IT突然成为阻碍项目完成的障碍,无法帮助现场销售人员将销售额提高15%。

利用任何与客户和企业关系密切的业务流程,计划外的工作都可以快速,轻松地增加巨额成本。看完我们的场景之后,您如何证明不实施变更控制和测试?

请尝试以下练习:查看过去一个季度或一年中发生的十大计划外停机,并确定哪些是由于更改失败而引起的。在失败的更改中,哪些未经测试或未经授权?计算每个情节的计划外工作成本。如果这些失败的更改中的任何一个导致了类似于我们的场景的破坏,则您已经为IT控制创建了业务案例。

显而易见,一项失败的变更如何能够迅速加起来成千上万美元-以及实施IT变更控制流程如何轻松地获得十倍的回报。

Gene Kim是Tripwire Inc.的首席技术官。请通过以下方式与他联系 [email protected].

有关:

版权© 2006 IDG通讯,Inc.

  
在亚马逊上购买技术产品