信息安全运维体系
随着信息安全管理体系和技术体系在信息安全建设中不断推进,占信息系统生命周期70%-80%的信息安全运维体系的建设已经越来越被广大用户重视。尤其是随着信息系统建设工作从大规模建设阶段逐步转型到“建设和运维”并举的发展阶段,信息安全负责人员需要管理越来越庞大的IT系统的情况下,信息安全运维体系建设已经被提到了一个空前的高度上。
目前,大多数的信息安全运维体系的服务水平处在一个被动的阶段。这主要表现在信息技术和设备的应用越来越多,但运维人员在信息系统出现安全事件的时候却茫然不知所措。究其原因,是该组织未建设成完整的信息安全运维体系。
正是因为目前运维服务中存在的弊端,山东省软件评测中心依靠长期从事信息系统运维服务的经验,同时结合信息安全保障体系建设中运维体系建设的要求,遵循ITIL、ISO/IEC 27000系列服务标准、等级保护和分级保护制度,建立了一整套信息安全运维服务管理的建设方案。
信息安全运维体系的构建第一步:建立安全运维监控中心
基于关键业务点面向业务系统可用性和业务连续性进行合理布控和监测,以关键绩效指标指导和考核信息系统运行质量和运维管理工作的实施和执行,帮助用户建立全面覆盖信息系统的监测中心,并对各类事件做出快速、准确的定位和展现。实现对信息系统运行动态的快速掌握,以及运行维护管理过程中的事前预警、事发时快速定位。其主要包括:
● 集中监控:采用开放的、遵循国际标准的、可扩展的架构,整合各类监控管理工具的监控信息,实现对信息资产的集中监视、查看和管理的智能化、可视化监控系统。监控的主要内容包括:基础环境、网络、通信、安全、主机、中间件、数据库和核心应用系统等。
● 综合展现:合理规划与布控,整合来自各种不同的监控管理工具和信息源,进行标准化、归一化的处理,并进行过滤和归并,实现集中、综合的展现。● 快速定位和预警:经过同构和归并的信息,将依据预先配置的规则、事件知识库、关联关系进行快速的故障定位,并根据预警条件进行预警。
构建第二步:建立安全运维告警中心
基于规则配置和自动关联,实现对监控采集、同构、归并的信息的智能关联判别,并综合的展现信息系统中发生的预警和告警事件,帮助运维管理人员快速定位、排查问题所在。
同时,告警中心提供多种告警响应方式,内置与事件响应中心的工单和预案处理接口,可依据事件关联和响应规则的定义,触发相应的预案处理,实现运维管理过程中突发事件和问题处理的自动化和智能化。其中只要包括:
事件基础库维护:是事件知识库的基础定义,内置大量的标准事件,按事件类型进行合理划分和维护管理,可基于事件名称和事件描述信息进行归一化处理的配置,定义了多源、异构信息的同构规则和过滤规则。
智能关联分析:借助基于规则的分析算法,对获取的各类信息进行分析,找到信息之间的逻辑关系,结合安全事件产生的网络环境、资产重要程度,对安全事件进行深度分析,消除安全事件的误报和重复报警。
综合查询和展现:实现了多种视角的故障告警信息和业务预警信息的查询和集中展现。
告警响应和处理:提供了事件生成、过滤、短信告警、邮件告警、自动派发工单、启动预案等多种响应方式,内置监控界面的图形化告警方式;提供了与事件响应中心的智能接口,可基于事件关联响应规则自动生成工单并触发相应的预案工作流进行处理。
构建第三步:建立安全运维事件响应中心
借鉴并融合了ITIL(信息系统基础设施库)/ITSM(IT服务管理)的先进管理规范和最佳实践指南,借助工作流模型参考等标准,开发图形化、可配置的工作流程管理系统,将运维管理工作以任务和工作单传递的方式,通过科学的、符合用户运维管理规范的工作流程进行处置,在处理过程中实现电子化的自动流转,无需人工干预,缩短了流程周期,减少人工错误,并实现对事件、问题处理过程中的各个环节的追踪、监督和审计。其中包括:
图形化的工作流建模工具:实现预案建模的图形化管理,简单易用的预案流程的创建和维护,简洁的工作流仿真和验证。
可配置的预案流程:所有运维管理流程均可由用户自行配置定义,即可实现ITIL/ITSM的主要运维管理流程,又可根据用户的实际管理要求和规范,配置个性化的任务、事件处理流程。
智能化的自动派单:智能的规则匹配和处理,基于用户管理规范的自动处理,降低事件、任务发起到处理的延时,以及人工派发的误差。
全程的事件处理监控:实现对事件响应处理全过程的跟踪记录和监控,根据ITIL管理建议和用户运维要求,对事件处理的响应时限和处理时限的监督和催办。
事件处理经验的积累:实现对事件处理过程的备案和综合查询,帮助用户在处理事件时查找历史处理记录和流程,为运维管理工作积累经验。
构建第四步:建立安全运维审核评估中心
该中心提供对信息系统运行质量、服务水平、运维管理工作绩效的综合评估、考核、审计管理功能。其中包括:
评估:遵循国际和工业标准及指南建立平台的运行质量评估框架,通过评估模型使用户了解运维需求、认知运行风险、采取相应的保护和控制,有效的保证信息系统的建设投入与运行风险的平衡,系统地保证信息化建设的投资效益,提高关键业务应用的连续性。
考核:是为了在评价过程中避免主观臆断和片面随意性,应实现工作量、工作效率、处理考核、状态考核等功能。
审计:是以跨平台多数据源信息安全审计为框架,以电子数据处理审计为基础的信息审计系统。主要包括:系统流程和输入输出数据以及数据接口的完整性、合规性、有效性、真实性审计。构建第五步:以信息资产管理为核心
IT资产管理是全面实现信息系统运行维护管理的基础,提供的丰富的IT资产信息属性维护和备案管理,以及对业务应用系统的备案和配置管理。
基于关键业务点配置关键业务的基础设施关联,通过资产对象信息配置丰富业务应用系统的运行维护内容,实现各类IT基础设施与用户关键业务的有机结合,以及全面的综合监控。这其中包括:
综合运行态势:是全面整合现有各类设备和系统的各类异构信息,包括网络设备、安全设备、应用系统和终端管理中各种事件,经过分析后的综合展现界面,注重对信息系统的运行状态、综合态势的宏观展示。
系统采集管理:以信息系统内各种IT资源及各个核心业务系统的监控管理为主线,采集相关异构监控系统的信息,通过对不同来源的信息数据的整合、同构、规格化处理、规则匹配,生成面向运行维护管理的事件数据,实现信息的共享和标准化。
电力信息系统不仅包括发电、输电、变电、配电、用电等环节的生产、调度与控制系统,还包括生产、营销等工作管理系统。此前,电力行业监管部门一直高度重视信息安全工作,于2005年颁发了《电力二次系统安全防护规定》(电监会5号令)[1],后陆续制定了《电力二次系统安全防护总体方案》、《省级及以上调度中心二次系统安全防护方案》、《变电站二次系统安全防护方案》等。根据《关于开展全国重要信息系统安全等级保护定级工作的通知》(公信安[2007]861号文)[2]要求,电力行业作为首个行业单位率先组织开展信息安全等级保护工作。运维人员需要管理越来越庞大的IT系统这样的情况下,对信息安全运维提出了更高的要求。
1 安全防护设备配置
在目前网络安全的要求下,对数据的安全管理提出了新的要求,例如量测类数据的安全分区划分为II区,需增加横向安全隔离设备,实现安全Ⅱ区与安全Ⅲ区之间必要的数据交互,具体安全防护设备配置如下:
1.1 隔离装置接入点
安全隔离装置(正向)用于安全Ⅱ区到安全Ⅲ区的单向数据传递,安全隔离装置(反向)用于安全Ⅲ区到安全Ⅱ区的单向数据传递。
1.2 正向隔离装置功能
安全隔离装置(正向)具有如下功能:实现两个安全区之间的非网络方式的安全的数据交换,并且能保证安全隔离装置内外的两个处理系统各不相同时仍能连通。
展示层与应用层数据完全单向传输,即从安全Ⅲ区到安全Ⅱ区的TCP应答禁止携带应用数据。
透明工作方式:虚拟主机IP地址、隐藏MAC地址。
基于MAC、IP、传输协议、传输端口以及通信方向综合报文过滤与访问控制。
防止穿透性TCP联接:禁止在两个应用网关之间直接建立TCP联接,将内外两个应用网关之间的TCP联接分解成内外两个应用网关,且分别将隔离装置内外两个网卡的两个TCP虚拟联接。隔离装置内外两个网卡在装置内部是非网络连接,且只允许数据单向传输。
1.3 反向隔离装置功能
专用安全隔离装置(反向)用于从安全Ⅲ区到安全Ⅱ区传递数据,是安全Ⅲ区至安全Ⅱ区的唯一途径。专用安全隔离装置(反向)集中接收安全Ⅲ区发向安全Ⅱ区的数据,进行签名验证、内容过滤、有效性检查等处理后,转发至安全Ⅱ区内部接收程序的具体过程如下:
安全Ⅲ区内的数据发送端首先对需要发送的数据签名,然后发给专用安全隔离装置(反向)。
专用安全隔离装置(反向)接收数据后,进行签名验证,并对数据进行内容过滤、有效性检查等处理
2 安全运维及管理
2.1 日常维护
(1)核心系统及关键服务器定义
关键系统和服务器有清晰的定义(如DNS/DHCP、防病毒等影响全网层面的服务器、承载重要业务或包含敏感信息的系统。
(2)应急与演练
系统和关键服务器编制及准备详尽故障应急预案,定期进行相关应急演练,并形成演练报告,保证每年所有的平台和关键服务器都至少进行一次演练。
(3)备份管理
①数据备份
各系统配置离线数据备份设备,对系统关键数据定期进行离线备份。离线备份数据应可在在线数据丢失、损坏、删除后供恢复使用。
各系统在备用站点配置数据备份设备,对主系统关键数据进行在线镜像备份。
②应用备份
应用备份首先满足业务功能、控制功能的要求,逐步实现管理类的功能要求。
切换时间应小于30秒。其它功能可视需要进行冷备用,可在24小时内启用。
(4)故障管理
制定相应的信息化系统及服务器故障处理流程,发现的异常情况由维护人员根据相关流程在规定时间内处理,故障处理完成后留有相应的故障处理记录。
(5)上线管理
为保障设备接入网络的安全性,设备上线前必须安装防病毒系统及更新操作系统补丁,并对设备进行进行安全扫描评估,针对安全漏洞进行安全加固。
为避免系统上线对其它系统和设备造成影响,发布前必须对系统应用站点、数据库、后台服务、网络端口进行安全评估。系统投入正式运营前必须在测试环境中对系统进行模拟运行一周以上。
(6)漏洞与防病毒
定期进行服务器漏洞扫描,并根据漏洞扫描报告封堵高危漏洞,每季度至少对所有服务器扫描一次。
建立统一的WSUS服务器,并每季度对关键服务器进行高危漏洞升级,并留有升级记录。
(7)核心系统和关键服务器日志审计
在操作系统层、数据库层、应用层建立日志记录功能,日志记录中保存1年的内容,日志安全记录能够关联操作用户的身份,操作行为记录需进行定期审计。检查关键错误日志、应用程序日志中的关键错误记录,保证日志审核正常。
(8)信息防泄密
所有应用系统的核心信息进行清晰的界定,核心信息包括但不限于涉及电网数据、账号密码、操作记录。对核心信息设定保密措施。
2.2 访问控制
(1)账号密码管理
所有系统和服务器上账号必须每季度进行审核,密码应至少每90天进行更新,密码长度应至少6位或以上,密码应由大小写字母、数字或标点符号等字符组成,五次内不能重复。
(2)远程访问
不得有互联网远程维护的访问方式,、系统的远程访问只能通过省公司的SSL VPN或IBM VPN。
3 运维故障应急处理
在软硬件运维过程中的运维故障应急处理措施如下:
3.1 服务器设备部件损坏
建议规避方法:按服务器启停流程进行操作,不要强行关闭电源进行停机操作。
建议应急方法:(1)首先考虑进行故障备件更换。(2)若短时间无法恢复,若为集群环境考虑使用正常运行节点降级运行。(3)若短时间无法恢复,若为单机环境PC服务器,考虑采用备用服务器临时搭建环境以及时恢复运行。
3.2 操作系统故障
建议规避方法:按启停流程进行操作系统启停。
建议应急方法:对于AIX操作系统,必要时执行MKSYSB备份磁带恢复系统,对于无法修复windows操作系统,将现场重装操作系统进而进行应用及数据恢复。
3.3 数据库平台故障
建议规避方法:按启停流程进行数据库启停。
建议应急方法:数据库一般故障,运维工程师均可处理,对于无法解决的数据库平台故障,将按照各数据库平台搭建文档进行重新搭建,并恢复数据。
4 结束语
综上所述,针对消除试验数据的孤岛,将试验数据的合理利用,本文建立了试验同比环比分析机制,实现了试验同比环比分析机制在技术监督工作中的应用,验证了机制的有效性和稳定性。从功能特点上,解决了以往试验数据的数据孤岛,将试验报告与试验设备相结合,使报告中孤立的试验数值串联起来,并形成串联数据分析其试验设备的正常情况和发展趋势,对试验数据和在线监测数据进行融合分析,形成相互监督,为确保设备安全运行提供了双重保障。
摘要:本文分析了安全运维管理中对安全防护设备配置,安全运维及管理的内容及要求,运维故障应急处理。提出了在电网安全新形式下的安全运维标准及运维内容,建立了一整套完善和切实可行的安全运维服务管理方案,实现电网安全运维的快速掌握,以及运行维护管理过程中的事前预警、事发时快速定位。
关键词:安全运维,故障应急,安全防护配置,信息安全
参考文献
[1]蔡暮章.电网信息系统安全工程的管理流程体系研究.上海交通大学,2015.
发布时间:2012年12月21日 作者:未知 文章来源:互联网 【字体:大 中 小】
摘要: 本文通过对国内外信息系统运维体系及现状的研究,总结了我国信息系统运维监理工作的重点及难点。并通过实际的工作经验,总了一套信息系统运维监理工作方法论。该方法从监理工作的运维规划咨询、运维监理及运维评估三个部分分别明确了各部分的工作内容及工作方式。最后结合实际运维项目,详细介绍了运维监理日常管理和考核指标制定方法以及运维评估工作方法。
关键词: 信息系统运维;监理
1.国内外信息系统运维发展历程
1.1 国外信息系统运维工作的发展
从20世纪80年代开始,国外部分机构便开始通过总结信息系统运维中的最佳实践经验,逐渐形成了成体系的一系列方法,其中最著名为IT运维(服务)管理全球最佳实践ITIL和国际标准ISO20000。
1.1.1 ITIL
IT运维(服务)管理全球最佳实践ITIL(Information Technology Infrastructure Library,IT基础设施库)是由英国政府20世纪80年代为提升IT运维管理水平和IT服务质量而总结各出的先进企业IT运维管理办法。ITIL为政府单位和企业提供了一个客观、严谨、可量化的标准和规范,组织的IT部门和最终用户可以根据自己的能力、需求定义以及所要求的不同服务水平,参考ITIL来规划和制定其IT基础架构及服务管理,从而确保IT运维管理能为组织的业务运作提供更好的支持。
目前ITIL已经发展完善到V3版本,并且结合近年来信息运维管理部门的工作需要,形成了BSM、信息SM模式,希望能够更好的为信息运维管理提供服务。
2005年8月,美国州政府CIO协会(NASCIO: National Association of State Chief Information Officers)发布了针对本国IT治理和管理的指导框架:《成功之道:IT管理框架》(“IT Management Frameworks: A Foundation forSuccess”),将ITIL作为IT运行维护管理领域的唯一推荐标准。
1.1.2 ISO20000
2001年,英国标准协会(BSI)在国际IT服务管理论坛(it SMF)年会上正式发布了以ITIL为基础的IT服务管理英国国家标准BS15000。2005年12月国际标准化组织(ISO)和国际电工委员会(IEC)正式发布了ISO/IEC20000,第一个IT运维(服务)管理领域的国际标准体系。
ISO/IEC 20000适用于提供IT服务的各类型组织,不限于其所在行业和规模大小。目前全球有近200家组织通过了认证。ISO/IEC 20000秉承“以客户为导向,以流程为中心”的先进理念,强调PDCA的方法论持续改进组织所提供的信息服务,标准化管理服务运营的输入和输出、生产流程、新的或者变更的服务,以及服务管理体系。它希望通过采用标准的流程方法,有效的向客户提供满足业务与客户需求的高质量服务,从而最终保证以最低成本提供质量稳定的信息服务,保证业务持续运作的能力。
1.2 国内信息系统运维的发展
我国信息系统的建设开始于上个世纪80年代中期,90年代的开始快速发展。进入21世纪后,特别是在2002年17号文件的指引下,我国政府和企业的信息化建设都进入了高速发展的阶段。在建设历程中,形成了各式各样的信息系统,其支持的业务也越来越复杂,信息系统建设完成后的运维工作的要求也越来越高。同时,在信息系统的生命周期(设计、建设、使用)中,使用阶段占有绝对高的时间比例,这也是信息系统建设的真正价值所在。为了保证使用过程的高效和平稳,系统运维成为了贯穿使用过程最重要的保障手段。
信息系统运维是信息服务的一部分,在实际工作中,为了有效的提高自身信息服务水平,国内具有先进理念的机构通过借鉴信息ITIL和ISO/IEC 20000体系,结合自身实际,构建了具有中国特色的IT运维管理体系。
自国务院办公厅颁发《2006—2020年国家信息化发展战略》以来,我国电子政务建设进入了一个以强调应用、注重服务和实效为特征的新阶段。为了改变“谁建设、谁运维”的传统低效率,高成本的运维方式,引入专业权威的第三方做运维监理的运维模式应运而生。
2.信息系统运维监理工作的重点、难点
信息系统运维监理的概念借鉴与建筑工程领域。通过引入专业权威的第三方,为用户提供最适合的运维方案;同时提相应的管理制度来提升运维管理水平;通过科学的绩效考核来提高运维效率,并可动态调整运维成本。虽然在实际工作中针对每个在不同的信息系统运维管理工作的内容都有所不同,但他们都具有以下四个共同的重点、难点。
2.1信息系统标准体系的实现
好的运维服务管理模型需要细化成适合用户需求的可执行方案、办法、流程和运维模式。目前存在的信息系统运维标准,无论是ITLL或ISO服务标准体系,它并没有定义没有明确的操作流程。事实上,这个流程是建立在对日常信息管理过程中,如何发现问题,如何解决问题的经验积累的基础上。因此,监理的主要工作重点就是考虑如何发现问题,并解决问题。根据实际项目的情况提供实际解决方案。
2.2 量化考核指标
如上节所诉,目前存在的信息系统运维管理标准都没有明确具体的量化考核指标。这并不是标准本身的问题,而是信息系统运维的不同阶段,不同类型用户会面对更多个性的环境和要求,难以使用同一套量化考核办法,因此需要由富有经验和能力的监理机构针对用户需求制定可行的量化考核体系,在运维管理过程中,公正客观的进行考核。
评定现有运维人员的能力和工作积极性才能准确的建立运维人力投入和产出及费用的逻辑关系。而建立绩效管理体系,设立全面细化的考核指标,可以为运维服务商的工作内容质量评估与工作量核定提供考核依据。考核以人员的综合素质、服务水平和服务效率为核心,通过信息化运行状态检测、过程执行、成果展现三个角度进行考核,做到可量化可检查。合理的绩效考核体系也是客观准确判断现有运维模式、管理方法、流程制度是否科学合理,包括现有运维商是否胜任运维工作等的最佳评判标准。
2.3运维模式规划
作为监理还需要考虑的一个重要问题是,如何选择最适用户的运维模式,包括总服务台架构、人员组成、服务机制等内容;如何设置运维工作的层级管理;如何打破“谁建设谁运维”的陈旧思想;如何分析目前运维状况是选择总包加分包模式还是软硬件各有一家总包的模式。应通过用户的角度和目的结合实际情况给出最客观最适合的规划方案。
2.4 评估运维工作质量
评估运维工作质量是信息系统运维监理工作的重要部分之一。通过调研对现行的运维状况(模式、制度、效率、水平、费用)进行评估,提出下阶段运维工作需要完善和改进的意见,从而使系统总体运维水平能够不断提高。
3.信息系统运维监理工作方法论
笔者通过参与XXX及YYY单位的两个信息系统运维监理工作,总结并提出了一套完整的信息系统运维监理工作方法。下面将分别从运维工作的运维规划咨询、运维监理、运维评估三个部分着手,详细介绍各阶段的工作内容、工作方法及目标。
3.1 运维规划咨询
运维规划咨询工作是从用户的角度出发,根据丰富的运维管理经验提出最适合用户的运维模式规划。通过清晰的工作目标,协助用户从基础环境到综合管理,为业务服务进行统一规划,一切以保证运维工作为重点。并根据用户实际情况,为用户提供当前应采取的运维模式方案意见,规划未来发展的方向和思路,建立几年度的运维模式提升和转变的规划。
同时应协助用户建立和完善信息化运维管理体系和流程,包括与设备使用、资产管理、服务过程管理、服务级别定级、人员准入准出、人员考勤、信息发布与更新、系统升级与维护相关的各项程序与制度,在保证简化服务程序的基础上,规范运行、维护和管理过程。
3.2 运维监理
运维监理阶段的主要工作是:监督落实绩效考核工作,定期向信息运维管理部门汇报,对考核结果差的运维服务商进行重点监控并采取相应监理措施。为了确保运维工作各项决策、工作、措施的贯彻落实,推动运维工作的顺利进行,提高运维工作效率,结合项目实际,监理单位应按照既定的计划、年度规划推动运维管理工作的按期开展。同时对运维管理工作中存在的问题和风险提出监理意见及解决办法,并协助信息运维管理部门规避和有效处理运维模式转换过程中出现的各类问题。
运维监理过程中最重要的部分是运维绩效考核,通过对现有运维工作的总结,运维绩效考核应包括以下六个方面:
(1)基本情况
(2)巡检情况
(3)故障和问题处理情况
(4)派工服务
(5)电话服务(总服务台)
(6)文档审查
3.3监理评估
运行维护服务质量考核和评估是运维承包单位按照服务质量要求、流程规范完成运行维护工作和自评估,再按照运维质量评估的结果进行服务改进,以此敦促运维承包单位在下一阶段的运维工作中提高服务质量。
对运维服务质量的考核依据有运维合同、运维方案/计划、巡检方案/计划等。对运维服务质量的考核主要通过定期检查巡检执行情况、跟踪故障/问题处理情况、审核运维月报、审核运维过程文档等方式开展,通过编制《运维服务质量考核评估报告》,向运维各方汇报。
在不断提高运维质量和能力的同时,分析业务发展的需要,使信息系统和业务发展产生良性互动,适时提出系统运行评估报告,为用户单位信息系统升级改造提供参考。
建立运行维护绩效考核指标体系和运维绩效量化评估机制利于运维各方及时掌握运维执行过程,有利于运维验收的量化考核,也能够为运维管理部门和运维承包商对运维工作量的评估、下一年运维预算的制定提供数据支持。
4.信息系统运维监理方法的详细设计
上节中介绍了运维监理三部分工作的工作内容及方法。本节将结合笔者参与的实际案例,详细讲解运维绩效考核使用的具体方法及各项指标的设计方式与运维评估工作方法。
4.1绩效考核
1.基本情况考核。
基本情况考核主要是审查现场维护人员资质和能力,考察人员出勤情况。保证现场有足够的技术支持,保证各种特殊情况的发生都能配备充足合理的人员;此项考核每周、每月进行评分。
2.巡检情况考核。
巡检情况考核主要是考察当月巡检次数,与巡检计划比较评估巡检完成情况;检查巡检文档编制情况和巡检过程中发现的问题记录情况,保证巡检结果信息正确汇总;同时也考核巡检发现的问题和运维期报告问题总数的比率。以每周、每月为周期进行评分。
3.故障/问题处理情况考核。
故障/问题处理情况考核主要是考察当月发生故障次数和解决故障次数、及时率,本部门内部问题或常规性故障应在当月内解决;故障处理过程中投入人员情况;文档管理情况;每月进行一次评分。
4.派工服务考核。
派工服务考核主要统计所有派工工作信息,包括派工完成时间,投入工作量等,考核重点在于派工工作完成时间、完成率和用户评价。此项考核每月进行评分。
5.电话服务(总服务台)考核。
电话服务考核办法分为话务部分和业务部分两类,其中话务部分考察服务次数、服务及时率、问题解答率等;业务部分是对座席员处理的问题进行分类,以此统计和分析一段时期内哪个系统问题突出,进而分析原因,做修改或升级的准备。此项考核每周、每月进行评分。
6.文档审查考核。
运维进行过程中将产生大量的技术文档,这些文档是保障信息系统正常运行和维护的重要参照基础。技术文档管理不仅要求各运维服务商切实记录运维过程,保证运维文档的完整,而且要求业主方认真做好文档管理,以便保证各项相关活动的可追溯性。
文档考核内容包括:总包商制定的运维管理制度、规范、流程和表单;各运维服务商在运维过程中产生的各类一般性技术文档。主要包括以下内容:
(1)随着运维的逐步进展,相关运维服务商的总体及分阶段实施组织设计、分部设计/实施方案及其它专项方案等。
(2)收集保管在参与实施的各相关运维服务商的资质资料等;
(3)进度信息的收集:维护项目的季、月的实施进度计划等;
(4)质量信息的收集:
项目设计、实施方案;
所有实施过程的各类设备、材料的质量保证资料;
各分项的实施测试资料;
不合格项目的资料、质量事故的处理报告及处理等资料。
监理方还将负责对各运维服务商提交的各类技术文档进行审核管理,对各类文档从以下方面要求规范:
(5)文档的准确性。监理方必须对技术文档的准确性负责。实际工作中,应对文档的准确性和真实性进行严格检查;
(6)文档的详细程度。监理方必须保障若干重要的技术文档的详细程度,否则,会对项目的验收和开通造成困难;
(7)文档的格式和构成。监理方在文档编制时,应对各编制方在文档格式、内容进行控制和管理。
监理方对相关文档将从以上方面提出改进建议,并根据运维绩效考核管理制度完成对各运维服务商的文档提交的及时性和质量性的评价。
4.2运维评估
对运维服务质量的考核按照不同的考核周期可以分为每月定期评估和年度评估。
1.每月定期评估
每月定期评估是对当月运维情况进行评估,包括本月投入人员情况、出勤情况;IT基础设施和应用系统运维服务有监控类服务如异常报告及时率等;日常维护类服务如维护作业计划的即使完成率、故障隐患发现率、问题解决率等;维修保障类服务如服务响应及时率、故障修复及时率;内容信息服务如检索成功率、响应及时率;网络接入服务如平均响应时间、问题解决率等;安全管理服务如漏洞扫描覆盖率、安全报告呈报及时率、安全事件次数等内容。
同时检查和评估《巡检报告》、《故障/问题记录单》、上门服务或电话支持服务记录统计表、设备升级记录、安全产品维修记录等运维的过程文档。
对每月运维情况的评估,采取打分制,并及时通报当月考核结果,在下一阶段工作中对未达标的运维单位进行整改。
2.年度评估
年度评审是在月度评审的基础上,综合考察运维单位在完成运维内容方面是否达标,运维效果和用户满意度是否符合预期,以此作为运维合同的一项依据。
年度评审内容包括以下4个部分:
(1)各月运维服务评估情况,如连续3个月不达标,视为此项不合格;
(2)提交运维阶段文档的完整性、齐全性;
(3)运行维护管理部门用户部门的服务满意度调查结果;
(4)运维工作量核算的合理性、真实性,评估依据是《运维方案》与每月人员投入情况。
5.总结与展望
随着我国信息系统的快速发展,信息系统运维已成为信息系统使用过程中最重要的环节。一个好的运维方式,不但能够提升系统的应用效率,同时还能为今后的发展提供可靠依据。运维监理工作模式是一个新型的运维模式,近几年得到了快速的发展。本文中阐述得运维监理工作方法论是结合实际工作而提炼出的,具有应用价值,且已投入现有运维项目中实践的方法论。随着今后通过法律法规及各项制度、体制的完善,以及相关工具的开发与实现,为信息系统运维监理工作方法提供更多的发展空间。
6.参考文献
[1]孙强 孟秀转:电子政务综合绩效评估体系研究[C] 中国行政管理 2008.8
[2]中国网:中国推出服务型政府电子政务综合绩效评估体系.2008—11—11
[3]ITGov中国IT治理研究中心:中国IT服务管理现状分析与发展趋势.2008—6—17
[4]孙强等:IT服务管理:概念、理解与实施.机械工业出版社.2004
[5]当代通信:我国电子政务建设发展现状与预测.2005—5—8
作者简介
1.张雪峰(1977—),男,就职于中国软件评测中心,籍贯长春,职称中级,最后学位学士Email:zhangxf@cstc.org.cn
分析处理引擎再度升级
在面对海量原始日志信息的采集、存储和分析处理时, 传统大集中模式的技术架构往往会遭遇性能瓶颈。为了解决海量原始日志信息的高效处置问题, 东软最新版本SOC监控预警系统参考“私有云”的技术架构, 构建了一套以自主开发的业务软件为主, 由安全设备、系统服务器、中间件和数据库共同组成的SOC5.0“监控云”, 将最为耗费资源的原始日志采集存储分析的工作平均分摊到云中, 利用云模式, 灵活集中整合系统软硬件处理能力, 并通过“监控云”的分析, 将原始日志信息生成为告警信息传递到中枢神经系统告警分析引擎中, 进行深度关联和集中展现。
东软SOC5.0系统的高效处理能力源自其全新设计的分析模型和多源交叉告警数据分析处理关联策略。通过模糊推理理论及算法, 提高告警数据分析的准确性, 对环网上报数据进行合理的过滤和归并, 以及对监控数据进行深度挖掘与关联展现。
“简单、务实、美”的界面风格
如何用最为清晰简洁、直观而又不冷冰冰的界面去展现安全现状和态势?如何将功能复杂的SOC以简洁、务实的界面进行展示?东软的研发人员称, 这是东软在做产品设计时经常会考虑到的问题。本着“简单、务实、美”的设计理念, 东软在最新版本的SOC5.0界面设计中做了大量的改进和创新, 例如, 用晴雨表替代传统的高、中、低来展现告警级别等, 目的在于让各个层面的使用者能够真正看懂目前自身系统中的信息安全状况, 并快速对问题进行定位和判断。
用户群体的互动垂直沟通
Web2.0时代的系统设计更加关注用户群体的创造力沟通。东软最新版本的SOC5.0系统中就引入了用户的积极互动垂直在线社区等SNS元素。例如它将SOC案例库与用户微博相互关联, 令用户之间可以快速分享案例, 交换应用体验。
更智能的互联网舆情学习与网站监控
东软最新版本的SOC5.0系统能够定期实时关注互联网各类预定义初始关键字信息, 如某版本系统的漏洞信息补丁、某重要项目的内部名称或某些恶意虚假信息等, 通过互联网, 将用户关注的舆情信息实时拉取出来。
【信息安全运维体系】推荐阅读:
信息安全运维流程09-28
迎全运05-31
全运会简介07-25
法院加强信访维稳信息10-30
综治维稳信息化10-30
构建企业信息安全体系06-13
信息化安全保障体系09-26
生猪追溯信息管理体系11-01
信息化体系建设情况汇报材料07-26
管理会计体系与信息化10-06