运维的主要工作内容(精选6篇)
目前,我国电力企业IT运维管理还处在应用尝试的阶段,主要停留在IT管理软件的深化应用、管理流程的梳理和优化、管理制度的制定和完善的阶段。企业日益增长的个性化服务需求,要求IT运维服务部门提供日趋专业化的服务战略和精细化的解决方案。运维模式正在逐步从“以应用为中心”向“以服务为中心”转变,从“被动运维”向“主动服务”转变,要求服务创新与技术创新并重。公司IT运维服务管理概念与内容
所谓1T运维管理,是指单位1T部门采用相关的方法、手段、技术、制度、流程和文档等,对IT运行环境(如软硬件环境、网络环境等)、IT业务系统和IT运维人员进行的综合管理。IT运维管理主要包括以下几个方面的内容:
(1)设备管理:对网络设备、服务器设备、PC电脑、计算机外设的运行状况进行监控和管理;
(2)应用管理:对各种应用软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统,DNS,DHCP,Web等的监控与管理;
(3)数据管理:对系统和业务数据进行统一存储、备份和恢复;
(4)业务管理:对单位各类业务系统运行状况的监控与管理,包括业务流程的有效性,业务功能的完整性和业务实施的可控性等;
(5)资源管理:单位各类1T资产资源的管理,如:IT物资采购、装配运行方式、时间、编号、折旧和报废等,这些资源均能够与单位的财务部门进行数据交互和统一;
(6)安全管理:安全管理主要是针对单位的安全组织方式、行业特点、人员安全、环境安全、信息安全、保密控制管理等;
(7)事务管理:规范和明确IT运维人员的岗位职责和工作安排、提供绩效考核量化依据。IT运维管理系统(ITSM)是指针对IT运行维护的技术服务支持和为满足领导IT决策支持管理的软件系统。主要实现“以客户为中心,服务可量化,高质量、低成本服务”三大IT运维管理目标。运维过程中产生的问题与状况
(1)人员问题。运维部门在日常运维中经常会碰到一些现象,如用户没有故障申报意识,常常直接打电话找相应的工程师或管理人员甚至领导解决有关问题;工作分配不合理,没有准确的量化数据来进行绩效考核,导致技术人员忙、闲不均,人员无法动态流动,有的系统人手不够有的系统人力资源又没有得到充分利用;部门内部缺乏梯队建设机制,技术储备欠缺,新员工成长周期长,导致系统对人员有很强的依赖性;缺乏对第三方服务的质量控制,长期对第三方服务的依赖影响了自身团队的提高,增加了运维成本的投入等。如果负责研发的技术人员同时还要负责日常运维支持,技术人员就不能投入更多的时间和精力去进行更深层次的工作。如,改进、完善系统自身的某些缺陷;构建支持新业务流程的IT系统的需求分析,解决方案设计,新系统的测试及相关培训等。这就会直接导致技术人员缺乏对故障发生的预知能力,IT运维部门缺乏可操作的应急预案,IT系统缺乏有效的灾难恢复工具。
(2)流程问题。以前的运维工作模式中,在对事件的处理上没有规范的流程,导致很多弊端发生。部门接到故障申告后,对突发事件只有简单的归类,没有确切的事件升级标准,没有事件的优先级定义标准,通常是哪个用户叫得紧、喊得急就先处理哪个用户的申告,在突发事件数量激增的情况下不能保证事件解决的时效性和IT资源的有效利用;突发事件产生后,在处理事件时,没有统一的事件受理平台,许多时候用户的故障和需求都不知道向谁提出,也不知道向谁询问故障处理的进度及结果,极大影响了用户对IT服务的满意度;当重大事件发生时,没有针对重大或紧急事件的处理流程,不能对事件进行及时、有效的处理,不能对事件处理的进度进行监控和跟踪,对事件的处理过程也没有完整的记录,事件的处理质量得不到有效控制,经常是各个环节的技术人员一齐上阵,最后也不知道是那个环节起的作用,也不知道什么时候类似事件又会再次发生。此外,传统的运维工作模式对配置管理的认识也十分欠缺,没有统一完整的配置管理流程及管理范围,也没有规范的配置管理数据库,因此也就没有相应的信息提供给其他流程进行故障分析、风险评估等工作,往往是相类似的问题再次发生在相类似的事件中。
(3)技术问题。理流程没有一个强大的技术平台做支撑,ITIL的实施也就无从谈起。这里所说的技术平台指的就是一套基于ITIL的网管系统解决方案(即网管工具)。没有一套功能强大的网管工具,就不能对突发事件进行及时的监控和正确的诊断,事件就不能在工具的支持下得到主动而快速的处理;技术人员不能借助有效工具对事件处理情况进行完整的记录,这不利于知识的积累和知识库的完善,也不利于处理过程的跟踪;没有工具进行精确的数据分析,就没有系统可用率/故障及时解决率/故障发生率等系统性能指标的产生,也就不能科学分析运维事件的趋势和规律,不能有效预防相同事件的再次发生。改进的措施及方法
(1)搭建层级化的人员组织架构,对服务支持人员和系统管理人员间的角色和职责进行清晰的定义和划分。在人员组织架构设计上,IT运维中心可采用ITIL提供的层级化组织架构,把所有人员划分为一线、二线、三线:一线指服务台的服务支持人员,其职责是接收问题、跟踪问题,处理大量简单、重复并已经记录在配置管理数据库中的各类问题;
二、三线人员负责研究解决技术难度相对较大,对业务影响较严重的问题,并将这些问题的处理方法和解决方案记录到配置管理数据库中,使问题再次出现时,一线人员能够根据配置管理数据库中的内容向用户提供解决方案。
通过搭建层级化的人员组织结构,用户的请求可以在第一时间找到合适的人,并可及时获知事件的处理进度;用户可以得到统一标准的、规范化的服务;IT部门内部也能够更合理地配置服务组织的人员结构,提高效率,降低成本。ITIL的核心理念是降低系统对特定人员的依赖。通过对配置管理数据库的严格管理,系统中任何一点微小的变更都会记录在配置管理数据库中。其确保对一切技术人员的思维创新及行为进行准确的跟踪、控制和记录。配置管理数据库的应用改变了传统服务体系中“谁看到,谁知道。”的知识分裂体系模式,构建了一个“一人拥有,全员皆知”的高性能体系模式,极大提升了一线人员解决用户问题的能力,提高了问题的首次解决率,降低了比一线支持成本高4~6倍的二、三线支持的工作量,保证80%的问题在一线得以解决,消除了过程对个人的依赖,实现IT服务的“工程化”。
(2)流程管理是ITIL的核心内容。在基于ITIL的IT运维中心工作模式中,IT运维中心可将所有IT系统的日常运维操作全部流程化,并通过自动化工具对流程执行情况进行监控与跟踪。同时,基于ITIL的IT运维中心还可针对不同的流程设置相应的流程管理员,以此来推动和优化每个业务流程的实现。笔者所在的单位还不是一个以赢得市场的竞争为主要目标的机构,所以在建立基于ITIL的IT运维中心模式时,我们可以先考虑服务台、事件管理流程、问题管理流程、配置管理流程、变更管理流程、可用性管理流程的建立。根据业务发展情况,再随时增加新的流程。
服务台:服务台作为IT运维中心和用户的单一接口,所有需要解决的事件都通过服务台向IT运维中心提交。所有用户的服务请求统一由服务台记录在案,并依据各个岗位的职责进行工作分派。利用服务台这个唯一的接入点充当过滤器,并协调后续的所有流程。
事件管理:记录所有IT系统软、硬件的日常故障处理情况,所有软、硬件的备件库存情况及使用情况。记录各类突发事件的处理过程,以便能够权衡并改进处理流程,给其他的服务管理流程提供合适的信息,以及正确事件处理进展情况报告。
问题管理:对所有IT系统软、硬件发生的故障进行归类,对归类后的问题进行研究、诊断,找出引起问题的潜在原因,制定解决方案,并将解决方案记入问题数据库,当有类似问题再次发生时可极大提升服务台人员的事件解决率。
配置管理:建立配置管理数据库,完整记录本部门所有IT资产的基本情况和所属情况,记录所有在运行IT系统的基本情况(包括软件的定期更新版本,系统的维护经验和实施技巧,各类文档资料),记录一段时期内各类技术变更情况,记录所有IT运维人员的基本资料(包括职责范围、联系方式等),记录各类与本部门IT系统相关的规定、制度。对配置数据库中各类配置项的正确性和完整性进行校验。
变更管理:完整记录所有的变更资源,对变更请求进行审查、归类、批准并提交;安排变更进度并进行测试,对实施后的变更进行评审。记录因故障处理引起的备件变更情况及对IT系统定期巡检的所有情况。
可用性管理:记录硬件及IT系统保修期限及生命周期,定期对设备的运行及使用情况进行可用性分析,优化IT基础设施,确保IT基础架构实施能够得到最佳利用。
(3)
如何选择一套合适的网管工具将复杂的IT服务管理流程固化下来是ITIL实施中一个重要的环节。好的网络管理工具首先应能提供丰富的图形操作界面,能动态反映网络的拓扑结构,包括网络各种资源变化的自动监测,方便操作人员的网络运行状况监控。能提供用户灵活的设置功能,如阀值设定,以监测网络故障的发生。能提供丰富的用户程序接口,方便用户二次开发自己的网络管理软件。能提供灵活的配置管理可对配置数据库的各类数据进行快速而准确的导入、导出,并确保同步其他管理流程对配置数据库的改动,发现和防止各类配置数据的随意修改。采用开放的、模块化的体系结构,方便用户根据实际需要选择自己的管理流程模块。此外,好的网络管理工具支持领域广泛,可涉及到系统资源和资产管理,数据库管理,存储管理,用户帐号管理,安全管理,软件分发管理等IT运维的方方面面。
目前,比较成熟的基于ITIL的网络管理工具主要有HP公司的Openview系列,IBM公司的Tivoli系列,CA公司的Unicenter系列以及BMC公司的Remedy系列等。我们在选择管理工具时,一定要从实际情况和实际需要出发,先对IT运维工作规划出一定阶段内的目标,并在一定程度上做好流程设计,再结合现有的管理水平和成本投入能力选择合适的工具,确保所建立的IT运维管理系统能够根据IT服务管理水平的不断提高而持续改进与优化。
随着企业对于IT管理和运营的要求越来越高,ITIL作为IT服务管理的国际标准已经被广泛的接受和应用。通过建立基于ITIL的IT运维中心工作模式,企业建立了服务提供和服务支持的流程管理体系,将人员、流程、技术有机的结合起来,并通过操作规范和制度体系的保障,IT服务得以有效提供,企业管理水平得以明显提高。结束语
基于IT 运维的`设备管理平台的设备管理流程包括请实现、事件管理以及配置管理,其总共规划目标是实现设备管理的快捷性、全局性以及经济性。从整体结构上而言,设备管理平台从上而下分为表示层、业务逻辑层以及数据访问层三层。表示层用户和用户交互,业务逻辑层制定业务规则并实现相关的业务流程,充当表示层和数据访问层之间的桥梁;数据访问层的作用是访问数据库。这三层之间的依赖关系是向下的,底层无法感知上层的存在,对上层的任何设计上的改变都不会影响底层。
设计基于IT 运维的设备管理平台的目的是对基于IT 运维的设备管理、维护中的各项功能及非功能性需求进行设计,其中最重要的一部分是数据库,不仅要明确数据库的表名、字段名等数据信息,还要进行存储过程等数据库脚本的扩展。具体设计数据库时,要考虑系统模块相关概念的设计、数据关系图设计以及数据的逻辑结构设计等。使用设备管理系统的人员主要是系统管理员、维护人员以及一般用户,不同角色应该有不同的操作权限。数据逻辑结构的设计包括设备数据库关系图、故障信息数据库关系图以及系统管理数据库关系图等。设备数据库关系图包括设备的信息表、设备相关资料表等;故障信息关系图包含发生故障设备信息表、设备备件维修信息表等;系统管理关系图包含设备单位信息表、厂商信息表等等。
2、合理调配团队资源做好客户服务工作,及时解决客户的疑问和完成客户提交的请求,提高客户的满意度和感知度;
3、合理调配团队资源完成每日业务功能正常使用检测工作;
4、对系统每日运维工作、系统业务正常使用检测工作进行复核;
5、对系统的网络,服务器,存储,应用的基础设施日常运维工作和检查日常巡检工作定期进行复核;
6、负责数据库、中间件TOMCAT、Nginx和业务应用系统的安装、配置及监控调优;
7、负责业务应用系统的灰度发布和正常发布,确保在发布过程中系统服务不中断,用户业务正常使用不受影响;
8、配合运维人员完成应用发布和数据修改, 对生产数据库和业务应用系统的配置和变更工作进行复核;
9、对重要系统、设备及设备配置按需进行备份,并能将备份恢复。制定数据备份和灾难恢复策略及工作流程与规范;
10、协调团队成员配合软件开发人员完成特定任务,例如软件性能测试、数据库参数配置,数据传输测试,软件功能测试、操作手册编写和新系统培训等;
1、负责数据中心网络的总体规划和建设实施;
2、负责数据中心生产网络流量分析和监控,网络路由分析、网络故障排查
3、负责数据中心日常网络变更及应急故障处理;
3、负责参与网络运维自动化体系建设,致力于实现网络运维标准化、工具化、自动化;
4、参与数据中心网络相关规范编写及制定。
任职要求:
1、本科及以上学历,3年以上网络运维和项目实施经验;
2、具有CCIE或同等级别资质证书;
3、熟练掌握主流网络设备配置和管理维护(CISCO、华为、F5);
4、精通BGP、OSPF等动态路由协议;
5、精通SDH、MSTP等广域网线路的接入及维护;
6、具有大型网络系统规划设计、建设及维护经验;
1. 解决客户端电脑出现的日常问题;
2. 判断基本的硬件故障问题,熟悉终端的工作原理;
3. 处理各种形式(网络和本地)的打印机连接服务,并且解决打印机出现的故障问题;
4. 对移动存储设备进行配置;
5. 熟悉主流防病毒软件的功能实施、规划部署;
6. 维护客户端电脑各项应用软件的故障处理;
7. 协助客户对桌面设备进行搬迁;
8. 对日常工作进行总结,撰写故障维护文档和操作手册,并且根据客户要求设计文档。
岗位要求:
1. 熟悉PC硬件知识,具备基本故障判断能力;
2. 熟悉微软/linux操作系统及其相关软件的安装、配置和维护;
3. 熟练常见外设:打印机、投影仪、扫描仪、传真机等的使用管理和故障处理;
4. 有一定网络基础,能够处理常见网络故障;
5. 较好的服务意识、沟通技巧和语言表达能力;
1、确立,评估和实施相应的IT项目,以确保和完善系统的性能,稳定性,可扩展性以及低成本的运行,带领团队安装和配置系统的软硬件,以满足业务发展的需求。
2、指导并带领服务器团队制定并执行与公司战略和整体业务需求一致的流程,策略及IT基础架构部署,遵守并执行相应的安全及业务规范及标准;
3、管理设立外地公司的灾备系统;负责相应灾备恢复需求;通过设立相应的BCP及意外宕预案确保业务的可持续运转;
4、通过积极的相应措施,减少服务器的宕机时间;
5、通过撰写并记录相应的技术难题及解决方案,完善并丰富公式的软件资产及知识库系统。
任职要求:
1、六年以上IT相关的工作经验;
2、成功的大型的IT项目经验;
3、具有跨国公司团队领导经验优先考虑;
【运维的主要工作内容】推荐阅读:
运维部主要工作职责06-10
运维主管岗位的主要职责06-07
主要工作事迹06-19
公司主要工作内容09-23
协会的主要工作09-07
公司文案主要工作09-13
商场主管主要工作10-18
主要工作情况11-13
店长的主要工作内容07-23
人事文员主要工作内容09-22