IT运营管理怎么着摆脱,IT运行处理拒绝

www.ca88.com

IT运维管理拒绝“私情”,”透明化”是关键

在IT运维管理过程中,没有故障的网络是“理想化”的,尤其是在大型网络中,甚至会出现多起网络故障同时报修的情况。当多起运维需求同时被提交时,IT运维人员往往会面临如何处理优先级的问题。

中国是个讲人情的社会,这种特殊化的交际结构,是国内企业永远不可能绕开的话题。而职场上说到的“人情”,往往含有最基本的两层意思。一种源于亲缘,另一种源于同感。亲缘强调的是“熟人”,常被人当成是一种“私情”;而同感主要指同事、上下属之间的相互理解和体谅,强调人性化的处事方法。在故障处理级别设定的问题上,IT运维管理同样也会受到“人情”的困扰。若不能正确处理“私情”和“同感”的区别,往往就会让IT运维服务处于极其尴尬、被动的局面。

我们来看看一个IT运维中的实际案例。小李是某集团网络中心的资深工程师,他时常会遇到业务部门或者下属公司同时申报网络故障的情况。为了摆明自己不讲私情的立场,小李采用了“先报先修”的流程来处理申报,但这种自以为公正的方法却仍然遭到了投诉。更为严重的一次,由于集团核心业务系统没有得到及时修复,导致整个网络中心受到公司高层的通报批评。难道说“先报先修”不对吗?

针对IT运维管理过程中出现的类似问题,小李请教了国内领先的IT运维管理专家北塔软件。北塔软件专业人员为其解释:“在传统的IT运维管理模式中,运维工作本身不具备透明性、信息不对称,这是屡遭投诉和批评的主要原因。‘先报先修’看似合理,但却没有考虑到故障恢复的优先级,也就是故障的影响度、紧急度。因此,最佳的处理方案,首先就是要实现设备层面的主动运维,减少故障率;其次,就是要在这个基础上,形成业务层面的运维服务管理,签订并履行SLA协议。“

一般来说,在同时需要处理数个故障的情况下,由于受时间、资源和人力等的限制而无法实现时,就要排定处理的先后次序,即确定每个故障的优先级。但出现故障后,没有哪个用户会同意滞后处理。相反,他们总是认为自己的问题才是最需要优先解决的。因此,最好的IT运维方式,是建立透明化的运维平台。这非常像马路上的电子屏幕,用绿色和红色表示畅通和拥堵,通过透明化的方式,为IT部门和业务部门建立一个共同关联的平台进行交互。

以北塔软件的北塔BTIM综合业务管理系统为例,利用北塔BTIM的数据采集层、数据处理层和功能显示层,可以充分对IT基础设施进行透明化管理,将一些看不到摸不着的IT资源,通过清晰直观的方式展现和管理,以便于管理人员对IT系统的现状做到准确的把握,在服务可能出现停滞之前就发现先兆并采取相应措施。

另外,为了帮助企业建立有效的SLA协议机制,北塔BTIM中包含“业务仿真”等功能,以及巡检服务,可以帮助IT部门寻找可能导致违背SLA承诺中的性能问题、WAN延迟和业务缓慢的难题,按照业务访问的路径,关注业务路径中一切的元。其次,北塔BTIM还支持了从网络流量中剥离出关键业务的实时业务流量,进而投射到网络拓扑结构中,让业务用户的分布,各网络节点对业务流动的影响“一目了然”。一旦出现预警和故障,即使多么复杂的异构环境,都能为快速恢复业务的正常运行建立分析机制。

签订SLA之后,IT部门可能会得到一些前所未有的好处,但如何让非IT部门同样受益,实现同感呢?对此,北塔软件表示:“如果只是以列表的方式把参数展现出来,还是无法满足信息对称的要求。为此,用户可以使用北塔BTIM报表功能,将业务系统健康状况、整合参数、外联参数等数据‘翻译’成业务人员和领导看得懂的图形。对于业务部门而言,由于存在这个透明的管理平台,就可以清晰的构建业务架构的质量。而领导层也可以看到这些关键业务的健康状况,好还是不好,下面的员工满意还是不满意。”

如此透明化的IT运维管理,在科学处理故障的同时,就已经屏蔽了可能由于“私情”和不理解产生的协作矛盾,让IT运维管理可以进入到合理、有序的新进程。

在IT运维管理过程中,没有故障的网络是理想化的,尤其是在大型网络中,甚至会出现多起网…

作为世界上华丽的舞蹈–华尔兹享有”舞中之后”的美称。华尔兹速度虽慢,但技艺难度却很大,不仅要先练好基本步,更要在此基础上学习各种变化步、花样步以及组合和套路。

IT运维工程师之间一直流传着“不怕坏,就怕慢”的魔咒。如果是网络发生信息不通、网页不能浏览等连通性故障,运维排错的任务并不困难。可当网络连通性并无问题,业务系统的响应和访问速度却在一步一步变慢,IT运维人员就很难处理这种“软故障”。

BSMBusiness Service
Management,即业务服务管理)的理念是从企业业务角度出发,来重新认识IT对业务的整合,是IT创新管理的风向标。BSM可以称为IT运维管理领域中的”华尔兹”,与华尔兹一样,因为它同样也具有了看似质朴简单却又高贵深奥的特质,所以广受一线IT运维人士的认同。它是打造一流的运维管理体制,是实现从优秀到卓越的关键,但BSM不是一蹴而就的。因此,企业在落实BSM前要形成一定的基础条件,也就是要先掌握最基本的舞步,然后才能倾听业务部门的节拍,将BSM充满活力地舞动。

对此,作为国内领先的IT运维管理专家,北塔软件认为:管理员应最大限度的保障数据中心的运行效率,不能让“软故障”成为阻碍用户应用的屏障。管理者应站在业务应用的全局角度上指导运维细节,建立业务系统与基础网络的映射关系,使用更先进的IT运维管理分析方法和手段,尽量缩短排除故障的时间,进而提升服务的质量和用户的体验效果。

笨拙的舞步会踩踏业务主管的脚面

案例分析:被“怪病”缠身的服务器

作为国内领先的IT运维管理专家,北塔软件在协助电力、政府、金融、电信等4000家用户进行IT运维管理最佳实践中发现,绝大多数的企业深知BSM可以帮助他们改变在公司中的地位,但由于IT基础设施没有实现牢固的监控架构,IT部门的舌尖上也就无法品尝到BSM的美味了。因为主动运维的模式未能落实,假若销售业绩出现问题时,业务部门还会以系统故障,或是网络缓慢为由”起诉”IT经理。但若反过来想,这些投诉是有理由的,又有谁在一场舞会上被舞伴踩了N次脚面之后,不会埋怨几句呢?

小刘,是一家大型企业的运维工程师,但他最近遇到了一种“网络怪病”。业务部门反映,已经上线4年多的CRM(客户关系管理)系统常常出现访问异常缓慢,用户终端需要反复刷新页面,有时还会出现彻底无法访问(访问超时)的问题。另外,还有些业务人员反映,在更新用户联系信息后,已经被更改的用户资料并没有得到更新。而且,这些问题已经被反映到集团老板那里,IT运维部门的领导带着一脸沮丧,要求他迅速查出原因,因为CRM系统的“怪病”严重影响了公司业务处理的效率。

尽管IT运维管理技术在不断进步,但实际上,很多IT运维工程师并没有真正解脱出来,我们可以将传统的IT运维管理简单概括成四个字叫:”人拉肩扛”。因此,在BSM实施之前,企业要做的第一件大事就是解决设备层面的监控和预警难题。因为当涉及到今后的业务管理时,底层监控数据的分析结果,是对业务系统的运行状况最有说服力的。要改善这一状况,国内IT运维管理专家”北塔软件”举例说:IT部门需要把网络、路由器、交换机、服务器等纳入到北塔BTIMBetasoft
Integrated
Management,IT综合管理软件)平台上进行管理,保证其运行不出问题。通过IT基础设施管理服务的建设,IT部门有能力提供7X24小时全天候对服务器、网络和数据库进行监控。IT运维工程师会习惯使用监控工具,而不是手工打理,他们每天都会遵照和运用基础设施运维管理工具发现问题、解决问题、优化系统,并依靠ITIL方法论逐步对应出合理化的流程。

小刘采用的多种方法开始排查故障的源头,例如:业务部门PC终端故障、检查服务器端的性能、找程序开发人员挖BUG、检查数据库、检查交换机、给服务器杀毒、翻阅之前的所有日志、架上流量监控软件……花费了大量的时间,最终也只是找到故障根源可能存在的方向。因为在拔掉交换机上链接服务器的线缆后,
FCS帧就会瞬间减少。这应该是网卡损坏(包括协议、驱动、硬件)故障或者连接服务器的网线(包括RJ45头)部分出现了问题,但排除问题所消耗的时间实在让人无法忍受。

业务视图为IT与业务融合搭好舞台

北塔软件认为:虽然小刘已经知道了“方向”,但这种拖延的后果,无疑还是把矛头指向了IT运维部门的服务质量。业务系统反应越来越慢的现象,对于系统维护部门的压力将直接集中在故障恢复的时效性上。因此,IT运维管理应该利用主动发现的智能机制,以业务为核心建立一体化的管理体系,才能避免这种“软故障”在数据中心的为非作歹。

没有舞伴而空有一身舞技,就像藏在黑暗里的宝石般令人遣憾。BSM就好比双人舞,舞伴之间的默契配合就非常重要。某企业的一名IT部门主管曾经冥想:”业务部门的人70%懂自己的业务,30%懂IT,这样他们就清楚先进的IT技术如何帮助业务提高效率、创造价值、或改进业务流程;IT部门的人70%懂IT,30%懂业务,这样他们就明白业务部门的困境、苦恼、竞争压力,从而提出好的解决方案,这样就可以进入一个良性循环。”不过这是一种非常理想的状态,通常这也只能算是乌托邦而已。那么,IT运维管理就真的无法实现与业务部门的融合了吗?

北塔BTIM三步解决“软故障”

针对这个问题,北塔软件副总经理孙永杰先生认为:”按照一般公司的部门分工,业务部门主要负责业务软件部分的故障,当出现非软件问题时,均有IT部门进行排查,而传统上IT部门会根据网络、服务器、基础软件各个传统分类进行问题的排查,越是分工明确的公司,每个独立的设备都会有专人维护,那么在这个故障排查的过程所花的时间就会越长。而引入BSM后,IT部门以业务为视角,将业务所关联的网络、服务器、基础软件的端口等一目了然的规划在一张图形上,快速定位故障点,这样就能实现及时处理投诉,提高业务部门的满意度。”

业务系统是一个整体,造成其缓慢的原因会由多种因素组成,如果利用OSI模型排错,一层一层的来,势必影响故障定位的效率。那么,利用支持业务服务管理(BSM)的工具是否能够实现更简单有效的故障分析呢?下面以北塔BTIM(Betasoft
Integrated
Management,IT综合管理软件)为例,看看另外一种解决这种软故障的方式:

此前,由于企业已经可以从IT基础设施综合管理平台,以一致的方式来展示每个子系统的事件信息,并能够与配置管理平台CMDB)紧密融合。所以,现在可以围绕企业的关键业务,借助动态的业务与系统之间的映射视图来引入服务水平协议SLA)机制。在此阶段,可以利用BTIM中的构建业务视图,非常清晰地看到业务架构、业务运行、业务使用、事件原因分析、业务统计与分析。这种整合后结果,可以顾及业务系统全面的工作状态、运行效果以及与之直接或间接相关的各个方面,如:业务系统整体机构的吞吐量、机房环境影响等等。

第1步:利用北塔BTIM,分别对监控对象设置事件触发,特别是性能阀值监控这些最容易出问题的地方,形成设备层面的性能监控;

舞者最高的境界是懂得音乐所描述的内涵,而我们的IT运维管理,最重要的就是要听得懂业务部门的心声。BSM让业务部门和IT部门能够拥有统一的管理语言、管理视角。结合企业战略和目前业务运营情况,辨识企业业务服务需求,特别是关键业务应用。扎实的舞步基础,再加上与舞伴的心灵沟通,我们最终会实现实施BSM的预期目标。
 

第2步:把业务系统涉及的每一个对象都合并起来,将所有运维监控对象按照业务访问路径综合起来,形成综合业务视图,并让让整体性能和用户体验关联起来。

第3步:北塔BTIM会智能的发现业务系统缓慢,第一时间通知管理员,而“BTIM故障根源分析策略”便可帮助管理员依据实体业务流分析逻辑,逐层扩大数据采集的深度和广度,层层深入,直达故障根源。

如今,IT运维一体化、智能化管理已是大家普遍关注的热门话题,那些传统分散式、粗粒度、低效率的IT运维管理模式已经难以满足大规模、多层级、全覆盖的运维管理需求。所以,通过建立与IT架构、管理模式等相适应的业务服务模型,不但能够清晰地描述业务与IT之间的关联,更能让主动运维的IT人不惧怕这种“软故障”,进而帮助IT管理人员和业务部门形成合力。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图