电子政务数据库(精选8篇)
电子政务空间辅助决策系统数据库的安全策略
电子政务空间辅助决策系统是一个大型的、集成的运行系统,其Oracle9i数据库的安全性能对系统至关重要,关系到系统的成败.本文在实践的.基础上,从利用网闸、数据库备份/恢复、存取控制、大原始二进制对象等安全策略对提高数据库的安全性能进行了深入和独特的阐述.通过采用这些安全策略,保证了系统的安全运行,最终保障了政府领导部门辅助决策的进行.
作 者:栗斌 刘纪平石丽红 朱翊 LI Bin LIU Ji-ping SHI Li-hong ZHU Yi 作者单位:栗斌,LI Bin(中国测绘科学研究院,北京,100039;武汉大学,资源与环境科学学院,武汉,430079)刘纪平,石丽红,朱翊,LIU Ji-ping,SHI Li-hong,ZHU Yi(中国测绘科学研究院,北京,100039)
刊 名:测绘科学 ISTIC PKU英文刊名:SCIENCE OF SURVEYING AND MAPPING 年,卷(期):2007 32(4) 分类号:P208 关键词:安全策略 网闸 数据库备份/恢复 存取控制 大原始二进制对象关键词:移动数据库,移动电子政务,关键技术
近年来,随着网络技术、移动通信技术和微处理技术的发展,以及移动设备的广泛应用,移动计算环境逐渐成为数据库技术新的研究和应用环境,一种更加灵活、复杂的数据库技术就应运而生,这就是移动数据库技术。于是移动数据库技术就在很多领域进行研究和应用。在电子政务方面,传统的电子政务模式已经不能满足政府工作人员的需求,于是将移动数据库技术应用在该领域,就出现了移动电子政务。
1 移动电子政务概述
移动电子政务(Mobile Government),是基于无线网络技术的新型电子政务模式,主要是指无线通讯及移动计算技术在政府工作中的应用,通过诸如手机、PDA、笔记本、Wi-Fi终端、蓝牙、无线网络等技术为公众提供服务。移动电子政务因为具有不受网线、网络接口的限制、配置简单、应用灵活等特点,开始引起许多政府部门的浓厚兴趣,也得到一些科研人员的重视,并进一步研究。
移动电子政务主要是在移动计算的环境下进行办公,所以移动电子政务也具有移动性、带宽多样性、频繁断接性、可伸缩性、弱可靠性、网络通信的不对称性、电源能力弱等特点,使得传统分布式数据库中的方法和技术不断应用于移动数据库研究中。作为移动电子政务建设所涉及的关键技术之一,下面就对移动数据库技术进行详细介绍。
2 移动数据库技术
2.1 移动数据库的概述
从数据库技术的发展过程来看,计算环境和数据库技术基本保持着一种同步发展的态势,互相影响、互相促进。移动计算的概念是对“任何时间、任何地点的立即通讯”的扩展。在分布式计算的基础上,计算环境进一步扩展为包含各种移动设备、具有无线通信能力的服务网络,构成了一个新的计算环境,即移动计算环境。
从系统的体系结构方面来说,移动数据库就是指支持移动计算环境的分布式数据库,其数据在地理上(或物理上)分散而在逻辑上集中,它涉及数据库技术、分布式计算技术以及移动通讯技术等多个学术领域。通俗的讲,移动数据库包括以下两层含义:
1)人在移动时可以存取后台数据库或其副本。
2)人可以带着后台数据库的副本移动。
2.2 移动数据库的体系结构和参考模型
注:MU———Mobile Unit(移动设备)MSS———Mobile Support Station(支持移动计算的固定站点,具有无线通信接口)FH———Fixed Host(固定主机,没有无线通信接口)
移动计算环境是传统分布计算环境的扩展。图1展示了一种移动计算环境的典型体系结构。在这个移动计算环境中,高速固定网络部分构成了主干,固定网络中拥有若干移动服务支持节点MSS,一个MSS负责建立一个无线网络单元。移动计算机可以从任何一个无线网络单元经由MSS连接到固定网络中,相对于可靠性不高的无线网络单元,我们将固定网络部门称为可信部分。
在移动计算环境中,数据库系统体系结构的建立没有确定的模型,在这里只是给出了一个移动数据库体统的参考模型,如图2。
在图2中可以看出,移动数据库系统包括两部分:一是移动部分或主机,运行在嵌入式设备(移动节点)上,包括嵌入式应用,移动数据库管理系统(MDBMS)及同步接口,以及移动数据库;二是固定部分或服务器,是在主机上运行的,包括主数据库及其数据库管理系统,其他异构数据源及ODBC和同步服务器及同步协同器。这两部分之间通过网络进行通信,嵌入式移动设备与网络的链路通常是无线链接。
2.3 移动数据库的关键技术
2.3.1 复制和缓存技术
复制就是指在多个数据库节点上完成数据备份,包括统一数据库间的复制、统一数据库与远程数据库间的复制,其主要目的就是提高分布式数据库系统的可用性、可靠性以及访问性能。
缓存技术就是通过在客户机上缓存数据服务上的部分数据,减少客户访问数据库服务器的频率,从而提高系统的性能。现在这项技术已经广泛应用到分布式数据库中。
近年来,针对移动计算和移动数据库的特点,一些学者和专家对复制与缓存技术展开了深入的研究。其中比较有代表性的研究成果的有J.Gray的两级复制机制、Coda系统支持客户机断接操作的缓存技术、缓存失效报告广播技术以及国防科技大学周兴铭院士的三级复制体系结构等。
2.3.2 数据广播技术
数据广播是指在移动计算环境中,利用客户机与服务器通信的不对称性,以周期性广播的形式向客户机发送数据。数据广播的研究可分为服务器和客户机两个方面:服务器主要考虑如何组织广播数据,即数据广播的调度;移动节点主要考虑如何利用本地缓存进一步减少查询广播数据的时间。衡量数据广播调度算法好坏的参数是访问时间和调谐时间。
2.3.3 移动查询处理及优化和事务处理技术
在移动计算环境中,位置信息的更新和查询是一个重要的应用。为了有效的支持这种移动查询,于是就产生了移动环境下的查询处理及优化技术。由于移动网络的频繁断接性、带宽多样性等原因,我们不但要考虑分布式查询技术中遇到的问题,还要考虑移动计算环境中地址信息的更新及查询优化问题、移动查询路径选择问题、字查询结果丢失问题、聚集度查询、实时数据查询等。
事务处理用于维护数据的一致性,支持多用户的并发访问,使用户可以可靠地查询和更新数据库。移动数据库系统要提供事务处理能力,以满足移动应用的需要。由于移动计算环境的特点和一些新型移动应用的出现,我们要从新的方面进行研究移动事务处理技术,主要是移动事务模型、数据的一致性、过区切换以及事务恢复。
2.3.4 其他技术
除了上面介绍的数据管理技术之外,移动数据库系统的研究还涉及到其他技术,如省电查询优化、安全技术、人机界面等,在这里就不一一详细介绍了,有兴趣的读者可参看参考文献[1]。
3 移动数据库技术在移动电子政务中的应用
移动数据库技术的快速发展,已经引起各个国家的重视。响应公共服务的需求,利用手机、PDA、笔记本等移动设备,通过无线技术,政府工作人员向社会公众提供信息和服务,就成为各国政府的焦点。移动电子政务平台的出现,极大的提高了政府部门的工作效率,也使得政府部门对网络的使用具有更多灵活性。
在其他公共事业中也得到了广泛应用,譬如:在人口普查时只需现场将资料从移动终端录入,即可通过无线网络提交到内部的服务器上,大大节约了人力物力;在发生紧急情况时(如地震、火灾等),救援人员可以搭建一个内部指挥中心网(如移动自组织网)进行援助工作;在整个城市遭到重大灾难有线网络发生瘫痪时,移动电子政务平台可以充当临时接入网,支撑整个城市继续正常运作。除此之外,移动数据库在零售业、制造业、医疗卫生领域也展现了广阔的应用前景。
4 结束语
由于移动数据库技术还不是很完善,该技术在移动电子政务的应用中还存在移动的问题,值得我们去关注和研究。譬如,移动电子政务在流程优化、资源共享、标准法规等方面还需进一步完善,此外,由于移动电子政务的特殊性,还面临着一些安全方面的问题。但是,随着移动技术的进一步研究,移动电子政务会得到快速发展和普及,将为政府的工作提供更大的便利,使政府工作移动化,信息化。
参考文献
[1]王珊,丁治明,张孝.移动数据库及其应用[J].计算机应用,2000(9):1-8.
[2]邵佩英.分布式数据库系统及其应用[M].北京:科学出版社,2005:299-300.
[3]宋刚,李明升.移动政务推动公共管理与服务创新[J].办公自动化,2006(9):10-13.
[4]贾焰,王志英.分布式数据库技术[M].北京:国防工业出版社,2007:181-189.
关键词:电子政务;数据库;数据挖掘
中图分类号:TP399 文献标识码:A 文章编号:1674-7712 (2012) 18-0014-01
2005年国家信息化领导小组第五次会议通过的《国家信息化发展战略(2006—2020年)》,提出紧紧围绕提高治国理政能力,推行电子政务。在此背景下,国家各级科技部门纷纷建立了具有各自特点的管理信息系统(MIS)、办公自动化系统(OA)以及科技政务网站等。随着这些网站、系统的运行,各级科技系统逐渐累积了大量的数字科技数据,如何应对数据保存、管理以及运用等日益成为科技部门关心的问题,建设基于数据挖掘的科技电子政务数据库将成为问题解决的关键。
一、建设科技电子政务数据库的必要性
在《国家信息化发展战略(2006—2020年)》的指引下,截止笔者调查,以全国副省级城市为例,哈尔滨、长春、沈阳、大连、济南、青岛、南京、杭州、宁波、厦门、广州、深圳、武汉、成都、西安等十五个副省级城市都已建立起比较完整的科技信息服务体系,内容既涵盖了科技法规、科技政策宣传、科技工作报道等新闻类信息、也包括了科技计划申报、科技成果申报以及相关的管理信息系统和科技统计、专利成果等信息系统,这些系统的建立为科技部门信息化管理和服务带来了显著的社会效益。建设科技电子政务数据库,一方面数据库可实现对科技数据的安全保存和管理;一方面引入数据挖掘技术可实现科技数据的分析和深层次利用,势必推动科技电子政务朝着更加有效的保存和利用科技数据的方向发展。
二、科技电子政务数据库系统构建
(一)科技电子政务数据库系统的构建思路
科技数据来源与应用的复杂性为数据库的规划设计增加了难度,在系统规划设计中涉及到的内容是不断变化的,需求也在不断增加,需要一种动态适应的方法来支持复杂应用环境下的系统规划设计。在科技电子政务数据库建设规划中首先应分清整体与局部的关系,可按照:系统构思——系统分析——整体规划——局部规划——建设实施——运行维护——升级的整体系统建设流程,从方案的酝酿到系统投入使用的完整的系统应用流程,层层推进,层层细化,并不断反馈修订原方案,最终形成整体规划方案。
(二)科技电子政务数据库系统的建设内容
科技系统的电子政务源数据主要涉及系统报表数据、汇总生成数据、分析结果数据以及各业务机关之间的办公数据。这些源数据的类型即包括各个企业的申报、审批信息,同时也包括各种社会、公众信息,因此在分类上存在较大的复杂性;同时在分布上受当前科技部门分工影响,科技数据的保存较为分散,一次性的整合利用即存在多部门协调合问题,也不利于源数据的管理。因此建议对科技源数据先实现分别建库,再进行跨库整合;例如:可分别建设高新技术企业和产品数据库、科技成果数据库、科技计划项目数据库、大型仪器设备数据库、科技查新数据库等,再通过建设统一信息服务平台实现综合利用。
三、科技电子政务数据库系统的功能设计
(一)数据采集
一个系统能提供科学客观的决策支持功能,数据的客观性、科学性是基础条件,因此数据的采集对于基于数据挖掘的科技电子政务数据库建设有着基础性作用。有效的数据采集方式应具备以下特点:①满足系统对于数据的需要;②符合下级数据源的填报习惯,最大限度地减少下级部门的工作量;③能有效地对数据进行校验,保障数据的质量;④满足采集标准不断变化的需要;⑤传输量较小,减轻网络负载。⑥能提供多种采集渠道,满足不同类型数据上传。特别强调项目申报审批与工作的流程化定制,科技电子政务主要涉及各类的申报审批工作,当前的科技政务申报审批系统,多设计简单、功能单一,大量源数据的保存和分析再利用都只能脱离已有系统、依赖人工处理。因此建议充分考虑用户需求和使用习惯,应用web service技术和B/C架构等技术设计良好的流程性数据采集系统,就能在完成申报审批政务的同时自动形成数据洼地和信息链,汇集起真实有效的源数据,即减少源数据的二次收集和重复劳动,又便于数据分析和挖掘工作的开展。
(二)数据应用
数据的分析与应用是一个数据库的核心功能,只有全面丰富的汇总数据,科学深入的分析结果,才能使数据库的决策支持功能发挥的更加科学和全面,才能让科技部门和公众通过数据库得到有价值的、能够辅助决策的信息。数据挖掘的维度应从多个角度设计,如时间、空间、项目专业类型等,数据挖掘的生成的信息产品可紧贴科技部门的管理工作。以建设高新技术产业数据库为例,可根据源数据,分析提取生成高新技术企业人力、财力、物力、科研状况等方面的横向或纵向汇总或比较信息,形成深度数据挖掘的信息产品。所形成的信息产品还应该呈现出丰富的表现形式,如:表格、结构图、柱形图、条形图、饼图、圆环图、折线图等,使信息产品即直观生动又便于利用。信息产品的外观设计要求和谐美观、对比鲜明、使用设计上要求方便简洁、注重用户体验。
四、结语
科技电子政务数据库的建设任重道远,在建设过程中可能会面临一些困难,笔者认为主要来自两方面:一是现行科技行政管理体制对数据共享的障碍。科技部门的分割管理使得科技系统各个部门自成体系,形成了从上到下的彼此隔绝的垂直管理体系。各部门的数据信息从行政管理上进行隔离,数据共享的行政阻力大于技术阻力;二是科技信息安全保密问题的障碍。由于科技数据库多涉及政务资料、企业税收、财务等信息,因此对业务处理数据应给予非常高的安全性设计,避免因信息泄漏、灾难等因素造成的损失和工作失误。
参考文献:
[1]张延松.电子政务建设中的基础数据库建设规划研究[J].廈门大学学报.2012 (8):293-299.
[2]肇庆金科信息网[EB/OL].[2011-10-25].http://www. zqsti.net/datasch/gxqy.asp.
二、“数据库”的概念及法律保护的难点
(一)“数据库”的概念及法律性质上述案件诉争的焦点是阳光公司对其编辑的数据流能否享有权利,以及享有什么样的权利。要回答这个问题,必须首先明确电子数据库的概念以及其法律性质。严格意义上的电子数据库是指为了满足某一个部门中多个用户应有的需要,按照一定的数据模型在计算机系统中组织、储存和使用的相互联系的数据集合。所以说,数据库应当称之为信息集合体(collection of information)。数据库的普遍出现和运用是计算机的普及和技术成熟的结果,数据库技术是计算机软件技术的一个组成部分,是对信息进行收集、整理、储存与高速传递处理的一门技术。数据库具有集合性、有序性、可访问性以及信息容量的庞大性等特征。从世界大多数国家的一般规定来看,受版权保护的数据库从作品属性看应属于编辑作品,并且汇编的内容既可以是享有著作权的作品,也可以是不享有著作权的其它数据、材料。但是,这些汇编的数据库内容是不受数据库法律制度所保护的。另外,如果某种数据库没有达到版权保护标准,那么法律给其以特殊保护。
(二)数据库法律保护的问题症结所在—对“原创性”标准的理解根据著作权法的原理,资料和数据库是两个不同的权利客体,两者都必须具备原创性,数据库的著作权并不及于数据库中的资料,这些资料可能有独立的著作权,也可以没有著作权。具有著作权的资料,其著作权并不涵盖数据库;没有著作权的资料,人人可以使用,可能组成不同著作权的数据库。对于不具有原创性的资料和数据库是否应予保护,长久以来争论不休;甚至对于具备著作权要件的资料和数据库,也有人主张不应给予保护。数据库在著作权法上被视为是一种编辑,即将现有的资料加以搜集、整理。当初认为编辑著作应受保护是基于编辑人的劳力和投资,这种说法,即所谓“血汗论”。任何人可以因为这些“血汗”而节省了自己的劳动。20世纪以后,这种观念渐渐改变,原创性和创造力成为著作权保护的标准。美国最高法院在1991年的Feisty一案中,明确指出白页电话薄资料虽然丰富,也使许多人得到方便,但不具有任何创意,因而不受著作权法保护。因此,对“原创性”标准的不同理解就成为数据库是否享有著作权的关键。将数据库纳入著作权法(版权法)的保护范围已被国际条约和大多数国家著作权法(版权法)所采纳。虽然有些国家仍然强调“原则性”标准,但此种标准已经大为宽松,如美国著作权法第101条指出数据库系指以搜集并整合既有素材或资料为形式之著作,该类素材和资料必须经由选取、整理、编排,且就整体而言具有原创性标准。欧盟的数据库法律保护指令第三条第一项也指出:“一数据库欲得著作权之保护,仍然必须在资料的选择与编排上表现出精神创作性始可”,并在第七条提出“对于需要为重大投资,然而在资料之选择及编排上不具有精神创作性之数据库,提供特别立法保护。”而在我国,可享有著作权的作品的必要条件是作品必须具有独创性,不具有独创性的作品是不受著作权法保护的。我国立法和司法实践对独创性做出了明确的规定和解释,这就使得我国在选择著作权保护模式时必须首先明确独创性含义。本文开头所述的案件二审法院虽然没有对“独创性”含义进行说明,但从认定的结果可以推理出其采用了一个更高的标准,即独创性包含了独立完成和一定的创造性。由于电子数据库不具有著作权法所要求的独创性,当然就不能享有著作权。我国的立法、司法实践存在一个问题,即数据库的编辑者不享有著作权或类似于著作权的专有权利,不能产生足以对抗第三人的权利。在市场经济中,放任摘录、利用他人未获著作权保护的劳动成果的行为,会影响到知识产权体系本身。公平、正义和自由一直是法律所追求的目标,在知识产权中同样也体现着这些法律价值。数据库的投资者花费了大量金钱,付出了辛勤劳动,如果放任他人自由使用,就会损害社会公众开发、生产和制造数据库的积极性,这是不公平的。所以,笔者认为,我国立法应该借鉴美国、欧盟的立法经验,对享有版权保护的数据库给以编辑作品的保护待遇,而对那些资料的选择与编排不具有精神创作性的数据库,提供特别
立法保护。下面笔者仅就资料的选择与编排上不具有精神创作性的数据库享有的权利作一简单分析,至于受版权保护的符合版权法规定的“原创性”标准的数据库则已归入编辑作品,其作者的权利已在版权法中有明文规定,所以不再赘述。
三、数据库的特殊权利保护对数据库进行特殊权利保护,旨在在著作权之外阻止未经允许的摘录和商业性使用数据库的行为,保护的是不受版权法保护但又需要相当的人力、技巧和经济投入而成的数据库。这类数据库独立设计,通常需很大的花费,但很容易被复制。所以必须对不纳入版权保护范围的数据库进行特殊权利保护,才能既弥补著作权法的空白,又体现对劳动者“劳动”的尊重。
(一)应受特殊权利保护的数据库的范围对于那些不能享受版权保护的数据库,要享有特殊权利保护,笔者认为要满足以下条件:
1、必须是按有序的方式编排的,由独立的作品、数据或其他材料组成的,并且各部分能被以电子或其他方式单独访问的集合体。但是,用于制作或驱动电子数据库的计算机程序除外。
2、只有在内容的获得、检验、编排等方面进行了实质性投资而非象征性投资的数据库方能享有特殊权利的保护,即数据库的制作者在获取、翻译或表现上体现了质上或量上最基本的投资,这类投资可能包含着运用经济资源或花费的时间努力或精力。
(二)数据库特殊权利的内容欧盟数据库法律保护令第七条第二项称,数据库制作者可以禁止他人取得该数据库的内容,亦即可以禁止他人未经其同意,以任何方式永久或一时地将数据库之全部或部分重要内容移转于其他资料媒介上,资料的下载即属于这一种情况;权利人亦得禁止他人未经其同意而散布复制物,出租、联机或为其它形式之传输,使公众取得数据库的全部或部分重要内容或将其进一步利用。由此可知,欧盟数据库保护指令赋予了数据库制作者禁止他人未经其同意的摘录和再利用行为的权利。权利内容包括阻止摘录和再利用整体或部分数据库内容。“摘录”被定义为永久或一时的将所有或基本部分数据库内容以任何形式或手段转移到另一媒体上。“再利用”被定义为通过发行复制品或出租其他形式传播,使公众能够获得全部或部分数据库的内容。同时,欧盟数据库保护指令规定权利保护期间为数据库完成后十五年,如果在此一期间届满之前,将数据库提供给公众使用,则自首次提供给公众使用起,可再享受十五年之保护;如果对数据库的内容,在质或量上有重大的变更,且在质或量上为重大新投资者,包括继续性的补充、删除或变动而累积成重大变更,则该投资所产生的数据库享有独立的权利保护期间。
以电子政务为核心的政务信息化是推动我国国民经济信息化的关键,而政务信息化是一项全国范围的、异常庞大复杂的系统工程。近日,在国家质检总局、国家标准化管理委员会就电子政务系列标准召开的第一次新闻发布会――《会计核算软件数据接口》国家标准新闻发布会上,国务院有关部委的负责同志在接受记者采访时一再强调:标准化作为一种科学的管理手段,是确保电子政务各功能系统之间互联互通、信息共享、协调运作、安全可靠的基础;统一标准能够减少电子政务建设中不必要的重复和盲目性。标准先行,必须成为政务信息化的首要任务!
信息化监管的基础
以即将于明年1月1日起实施的《会计核算软件数据接口》国家标准为例,国家审计署副审计长石爱中向记者解释了标准先行在审计信息化建设中的重要性:
审计信息化建设的重点是审计应用,审计应用的重点是开展计算机审计,包括现场审计和联网审计。开展计算机审计,首先要获得被审计单位的电子数据,然后才能进行相关的检查分析。然而,目前审计人员所面对的是上百个版本且数据结构各不相同的会计核算软件,这就给审计工作带来了极大的不便。刚刚发布的.《会计核算软件数据接口》国家标准,规定了会计核算软件的数据接口要求,包括会计核算数据元素、数据接口输出文件的内容和格式要求;提出了数据元素和辅助核算的概念,为标准使用者理解会计核算的数据概念奠定了基础;规范了文本格式和XML格式的数据接口,为会计核算软件与其他信息系统之间的数据交换创造了条件。
“标准化是政务信息化的基础。《会计核算软件数据接口》国家标准的出台,是国家通过制定标准来规范企业行为的重大举措,将大大提高审计、财政、税务、工商等经济管理部门的信息化监管水平”石爱中副审计长给出了这样的评价。
对政务信息化有三大作用
谈到标准化在规范和促进政务信息化中的具体作用,国家质检总局副局长蒲长城着重给记者归纳了三点:
第一,标准化是实现电子政务网络互联互通、数据共享和业务协作的有效途径。目前,国内各行业、各地方已投入大量资金建设了不同规模的网络平台和业务系统。由于政府部门之间缺少一致的数据共享手段和有效的业务协作机制,导致信息资源利用率差、办公效率低、业务部门信息沟通困难,通过相关标准的统一,可以推动这些问题的解决。
第二,标准化是规范政府职能和保障信息系统安全可靠的重要手段。政务信息化直接涉及各级政府的核心政务,要求电子政务的实施过程始终具有高度的可靠性和安全性。信息安全是我国电子政务建设发展的关键问题之一,保证业务正常运转和系统安全可靠的信息安全标准已成为普遍关注的焦点。
第三,标准化是促进信息产业发展的推动力。政务信息化建设必将给众多的软件、硬件和系统集成厂商创造一个巨大的市场空间。在遵守国际惯例的前提下,通过标准化的手段来进一步规范电子政务相关产品的开发,对提高我国信息产业的国际竞争力有重要意义。
政务信息化必须标准先行
“标准不是简单的文字工作,标准是实践经验的总结和归纳,政务信息化必须标准先行!”国家标准化管理委员会主任李忠海对记者强调。据李忠海主任介绍,从1月国家标准化管理委员会和国务院信息化工作办公室批准成立电子政务标准化总体组到现在,我国已基本形成了电子政务标准体系。根据应用需求,组织专家编写了《电子政务标准化指南》共六个分册,启动了六项电子政务基础标准的制定工作。今年4月,《电子政务主题词表》、《电子政务业务流程设计方法》、《电子政务数据元》三项国家标准已经发布,为统筹规划我国电子政务建设打下了基础。
一、起草说明
网络和各种电子设备在现代社会人们的生活和工作中发挥着极其重要的作用。一旦发生法律纠纷,电子数据因其带有大量的涉案信息具有重要的证据价值。涉及电子数据证据的案件数量大幅增加,电子数据证据的重要性在办案过程中日益凸显。在此背景下,2012年我国在刑事诉讼法和民事诉讼法修订时均已将“电子数据”列入法定的证据种类。企业应当根据电子数据证据的特性,准确掌握取证、举证、质证等规则,以便更好地应对挑战。实际上,企业在电子数据取证实践方面往往存在困难,在维权中往往不知道如何取证才能使电子数据具有可信度和证明力。在此背景下,上海交通大学知识产权研究中心起草了《企业电子数据事务规范》。
制定本规范的指导思想是:第一,坚持从我国的立法现状和司法实践出发,针对企业实际需要,旨在提高企业电子数据事务管理的水平、提高企业法务人员办理电子数据事务的能力。第二,针对当前对于电子数据业务的认识水平以及现行法律法规的规定,注重企业法务人员办理电子数据证据业务与公安机关、司法机关、公证机构、鉴定机构工作的衔接和配合。第三,详略得当,突出重点,既不失可操作性又不显得过于琐碎。
本规范主要内容如下:第一章总则,阐明制订本规范的依据,电子数据证据的概念、分类,相关概念的解释、办理电子数据证据业务应当遵循的原则等。第二章内部电子数据管理规范,主要包括企业工作人员在日常业务工作中对电子数据的操作规范和企业内部对电子数据的保密和管理规范。第三章内部电子数据取证规范,主要包括企业电子数据证据的取证方式与流程、临场保护与外围调查、电子数据证据等的收集与固定等内容。第四章企业电子数据取证公证注意事项,主要包括企业配合公证处开展电子数据证据公证业务时在材料准备和实际操作方面应注意事项。
二、规范目录
第一章 总则
第二章 内部电子数据管理规范
第一节 员工日常电子数据操作规范
第二节 内部电子数据保密和管理规范
第三章 内部电子数据取证规范
第一节 电子数据证据的取证方式与流程
第二节 临场保护与外围调查
第三节 电子数据证据等的收集与固定
第四章 企业电子数据取证公证规范
三、规范正文
第一章 总则
第1条 制定规范的目的和依据 为了指导企业高效专业地处理与电子数据证据相关的法律业务,提高企业应对电子数据证据所带来法律风险的能力,根据有关实体法与诉讼法的规定,结合电子数据证据的特点,制定本规范。
第2条 电子数据、电子数据证据的定义及作用
2.1电子数据是借助于信息技术生成、修改、删除、存储、传递、获取等形成的一切数据。电子数据包括电脑文档、手机文档、电子邮件、即时通讯记录、博客、微博、网页历史记录、IP地址、手机短信、通话记录、传真记录、信令数据、电子签名、电子痕迹等。
2.2 当电子数据用于证明案件事实时,即为电子数据证据。电子数据证据主要存在于电脑、移动存储设备、移动通信设备、互联网服务器等电子设备或存储介质中。电子数据证据可以依据不同标准区分为文档文件、图形文件、多媒体文件、程序文件与数据库文件等,单机数据与网络数据,静态数据与动态数据,数据内容、附属信息、关联痕迹与系统环境信息等。
第3条 电子设备的定义 本规范所称的电子设备,是指由电子元器件组成,且应用一定的处理系统用于生成、修改、删除、存储、传递电子数据的设备,主要包括台式电脑、笔记本电脑、平板电脑、掌上电脑、服务器、手机、数码照相机、数码摄像机、打印机、复印机、传真机、电话机、扫描仪、导航仪、路由器、电视机顶盒、手机基站等。
第二章 内部电子数据管理规范 第一节 员工日常电子数据操作规范
第4条 员工应当遵守国家法律法规等规定的行为,不得实施破解企业软件、访问不安全网站、以各种形式的手段对企业网络实施监听或者破坏等行为。
第5条 员工日常业务电子数据操作规范 5.1员工根据企业设立权限,实施信息浏览、修改或删除等合乎权限的行为,不得未经许可随意泄露企业内部信息,其中包括不得在企业共享磁盘中发布任何不得共享的信息。
5.2员工不得使用外部邮件系统处理和工作相关的电子邮件,且不得将该邮件转发至个人邮箱。
5.3员工不得随便打开可疑链接、图片、程序等,对于包含以上内容的邮件,直接删除,如有必要打开,咨询IT部门。
5.4员工未经许可,不得从互联网下载、员工个人硬盘传送或者以其他方式将任何软件安装至企业电脑。
5.5员工应使用企业设备与客户进行数据交换,不得使用私人设备处理与工作相关的数据。如不能在本企业处理工作,则尽量避免在公共场所处理与工作相关的数据。
5.6与客户交换的文件,纸质档应附有回执、电子档应附有已阅读回执,确定客户真实获得。
第6条 员工日常电子数据安全操作规范
6.1员工因工作需要与外部交换信息,事先应与对方签订保密协议。因工作需要有电子数据交流时,必须确认对方身份,防止数据外泄。
6.2员工与他人交换消息,无论他人是否为企业内部员工或是外部客户等,传输过程中必须使用数字签名以确保信息的不可否认性。如果技术允许,在传输前根据数据的秘密性,对数据进行不同程度加密,或者传输只允许阅读的版本。确保传输的文件的每一页抬头和页尾处标注企业信息,最好传输PDF版本。
6.3员工在企业内有事需暂时离开电脑时必须锁屏,且不得将密码告诉他人;应定期修改密码,确保自己为该电脑的唯一使用人,特殊情况除外。
6.4非因工作需要并经上级主管许可,在企业电脑上不得安装任何具有破解、侦查、监视等功能的软件。
6.5如果企业电脑遗失,应在第一时间通知IT部门及部门数据安全联系人,尽量防止损失的扩大。
第7条 对于违反企业内部计算机数据安全规章以及有关规定的员工,企业可根据损害结果对相关员工实施警告、处罚、终止劳动合同等不同程度的处罚措施。
第二节 内部电子数据保密和管理规范
第8条 企业电子数据保密等级分类要求
日常工作中,应将电子数据根据保密等级分类,区分不同等级的数据,实施不同的保护措施。不同等级的电子数据,实施浏览、删除或修改等行为,必须有相应的权限。数据的分级可以根据实际情况进行调整。
第9条 企业内部数据备份要求
9.1对企业系统自动生成的任何文件,禁止人为修改,且定期存储在固定位置。具体操作如下:
(一)企业根据需要应定期备份电子数据,确保数据均备份至企业内部服务器上,特殊情况除外。根据数据的机密程度不同,将其备份在不同的空间。如有必要,可延请公证处定期备份并公证。
(二)备份执行过程应记录,包括备份的主体、对象、时间、路径、理由等,形成电子文档,一并存储。
9.2各部门必须确认关键数据的存储、相关责任人,及时根据数据类别采取不同保护措施,定期审核保护措施落实程度,并形成相关报告存档。
第10条 企业内部数据管理安全部门设置 设立专门管理数据安全的部门,其他不同部门分别设立部门内的数据安全协管员。要根据可能发生的数据安全事件,制定相应的应对措施。
第11条 企业内部数据安全管理规范
11.1企业电脑如出现问题需维修或护理,不得由企业IT部门之外的人员实施。便携式处理设备上必须安装有不少于一种防盗设施。
11.2企业电脑必须设置多重密码,除本人外不得将密码告诉他人,定期进行密码重置,特殊情况除外。
11.3定期对员工、尤其是新进员工做数据安全的培训,提高数据安全意识。11.4在技术允许前提下,对企业所有电脑进行标号、特定化、唯一化,以便对从企业系统出具的任何文件的修改处都可显现修改所使用电脑的代称,落实相关修改的责任人。
11.5企业有权对所有员工所持企业电脑的数据进行监控与检查。
第三章 内部电子数据取证规范 第一节 电子数据证据的取证方式与流程
第12条 企业开展电子数据证据取证工作的方式及要求
12.1 企业可以根据案件需要采取如下方式开展电子数据证据取证工作:(一)自行开展电子数据证据取证工作;
(二)聘请鉴定机构开展电子数据证据鉴定工作;(三)申请公证机构进行电子数据证据保全;
(四)申请公安、检察院、法院、仲裁机构等进行电子数据证据的收集和保全;
(五)请求网络运营服务商等第三方进行电子数据证据的固定与保管。12.2 采取12.1中第(一)、(二)、(五)种方式开展电子数据证据取证的,可以申请公证机构进行全程录像公证、全程文字记录公证或者提存镜像报告公证等。
12.3 采取第12.1中
(一)、(三)种方式开展电子数据证据取证的,可以借助专业的电子数据取证设备或软件,或者寻求鉴定机构等专业技术服务机构提供的电子数据证据收集、固定等相关技术服务。
12.4 采取第12.1中
(二)、(三)、(五)种方式开展电子数据证据取证的,可以协助鉴定机构、公证机构或者第三方确定电子数据证据的取证范围和制定方案。
第13条
申请公证机构进行电子数据证据公证
13.1 电子数据证据公证主要包括电子数据证据的内容公证(包括网页公证、电子邮件公证、聊天记录公证、手机数据公证等)、电子数据证据的存储位置以及软硬件环境公证、电子数据证据的文本公证、电子取证行为公证、镜像复制的行为公证、电子数据证据及取证报告的提存公证等。
13.2 企业根据诉讼需要申请进行电子数据证据公证的,可以与公证机构商定公证项目。
第14条
申请鉴定机构进行电子数据司法鉴定
14.1 电子数据司法鉴定是一种提取、保全、检验分析电子数据证据的专门措施,也是一种审查和判断电子数据证据的专门措施。它主要包括电子数据证据内容一致性的认定、对各类电子设备或存储介质所存储数据内容的认定、对各类电子设备或存储介质已删除数据内容的认定、加密文件数据内容的认定、计算机程序功能或系统状况的认定、电子数据证据的真伪及形成过程的认定等。
14.2 企业根据诉讼需要委托鉴定机构进行电子数据证据司法鉴定的,可以与鉴定机构商定鉴定项目。
第15条
自行开展电子数据证据取证工作的流程
企业自行开展电子数据证据的取证工作,主要包括临场保护、外围调查、电子数据证据等的收集与固定以及电子数据证据的检验分析、审查判断等环节。
第16条
自行开展电子数据证据取证工作的记录 企业自行开展电子数据证据的取证工作,应当对取证过程进行记录,并签字和注明时间。
第二节 临场保护与外围调查
第17条 对电子设备的场所与环境进行临场保护的任务 发现电子设备中可能存在涉案电子数据证据的,应当视不同情况及时采取相关措施,对电子设备所在的场所、所接入的网络环境进行控制与保护。
第18条
对电子设备的场所与环境进行临场保护的要求 进行临场控制与保护时,可以采取措施避免或者防止任何人采取可能导致原始电子数据证据发生改变的任何操作。
第19条
对电子设备的场所与环境进行外围调查
19.1 进行临场控制与保护时,可以及时开展外围调查,对有关的当事人陈述、证人证言、书证等进行收集、固定;必要时还可以对电子设备的购买记录、领用记录、归还记录以及使用情况等进行收集、固定,并制作相关笔录,请有关人员签字确认。
19.2 发现电子设备正在运行、且继续运行可能会导致涉案电子数据证据灭失或受损的,应当根据具体情况采取切断电源、断开网络、屏蔽信号等相应的应急措施。必要时,可以自行对易丢失电子数据证据进行紧急收集与固定。
19.3 发现电子设备正在显示或生成涉案电子数据证据的,应当采取拍照、录像等方式,对屏幕显示的内容进行记录,并在记录中签字和注明时间。
第三节 电子数据证据等的收集与固定
第20条
企业制定电子数据证据收集与固定的方案与计划
20.1 企业自行开展电子数据证据的取证工作,必要时可以在具有专门知识的人的协助下,制定电子数据证据收集与固定的方案与计划。
20.2 上述电子数据证据收集与固定的方案与计划主要包括:(一)现场获取的目的和范围;(二)锁定目标设备及其范围;
(三)现场数据收集人员的分工与责任;
(四)进行电子数据证据现场获取所需携带的取证设备、取证软件;(五)现场获取采用的技术规范;
(六)电子数据证据现场获取的具体方案;
(七)电子数据证据现场获取的应急措施或替代方案。第21条
制定电子数据证据收集与固定方案的合法性要求
制定电子数据证据收集与固定的方案与计划时应当注意取证手段和方式的合法性,不得通过窃取、入侵等非法方法取证。
第22条
开展电子数据证据取证的先行取证要求 企业自行开展电子数据证据的取证工作,必要时可以自行或者建议先行提取电子设备上的指纹信息等生物样本。
第23条
开展电子数据证据取证的镜像复制要求
23.1 企业自行开展电子数据证据的取证工作,具备条件的应当制作原始存储介质的镜像复制件,并对原始存储介质进行封存,避免或者防止原始电子数据证据发生任何改变。制作镜像复制件的,以一式两份为宜。
23.2 因客观原因不能封存原始存储介质或制作镜像复制件的,可以采取写保护方法对电子数据证据进行收集与固定,并妥善保管原始存储介质。
第24条
制作镜像复制件的安全性与完整性要求 24.1 企业制作原始存储介质的镜像复制件,应当确保原始存储介质的安全及其中数据的完整性。
24.2 因客观原因不能封存原始存储介质或者不能保证电子数据证据的完整性的,应当说明事由及可能产生的影响。
第25条
封存电子设备、存储介质的注意事项 企业封存电子设备、存储介质的,应当注意记录反映其特定性的标识信息(包括序列号、识别码、用户标识、品牌、厂商、型号、容量等),并注明或者告知妥善保管的注意事项。
第26条
制作镜像复制件的注意事项
26.1 企业制作镜像复制件,可以交由或者聘请具有相关资质或能力的专业人员实施,并记录反映其中电子数据证据完整性的校验信息。
26.2 必要时,可以将含有校验信息的镜像复制报告提交公证处,进行提存公证。
26.3 因客观原因无法产生校验信息的,可以及时采取适当的措施对原始存储介质进行封存以保证其数据完整性。
第27条
对电子数据附属信息、关联痕迹、系统环境信息数据的收集与固定要求
27.1 企业自行开展电子数据证据的取证工作,可以一并收集与固定与电子数据有关的附属信息、关联痕迹、系统环境信息数据。
27.2 这些附属信息、关联痕迹、系统环境信息数据主要包括:(一)存储介质的状态,确认是否存在异常状况等;(二)电子设备中正在运行的进程;(三)用户操作产生的临时文件;(四)日志文件;
(五)操作系统信息,包括系统版本号、注册所有者、安装日期、管理员与用户帐号、登录次数、最后一次关机时间等;
(六)尚未永久存储的电子数据;
(七)共享的网络驱动器、文件夹信息和共享设置选项信息;(八)网络连接信息,包括拨号信息、VPN、无线网络连接及其连接的名称、网络映射信息等;
(九)保证数据独立于电子数据存储介质的软硬件信息;(十)备份数据以及所有者、备份时间等相关信息。第28条
对互联网上电子数据证据的收集与固定
28.1 对于来源于互联网上的电子数据证据,企业可以申请公证机构进行公证保全,或者申请人民法院进行诉前或仲裁前证据保全。
28.2 申请保全的,应当遵守民事诉讼法的相关规定,同时应当依据中国公证协会《办理保全互联网电子证据公证的指导意见》的有关规定进行保证。
第29条 对交互式设备中电子数据证据的收集与固定
29.1 对于交互式电子设备中电子数据证据,可以固定和保全本方电子设备的电子数据证据,也可以固定和保全对方当事人、第三方(如通讯网络服务商等)电子设备中的电子数据证据。
29.2 固定和保全对方当事人、第三方持有的电子数据证据的,可以采取以下两种途径:
(一)通过联系对方当事人或第三方查询并固定相关的电子数据证据,必 要时申请公证机构对取证过程进行公证;
(二)通过向人民法院申请诉前证据保全的方式,向对方当事人、第三方调取相关的电子数据证据。
29.3 向人民法院申请调查令或诉前证据保全的,可以向法院提交存储电子数据证据的电子设备或者存储介质的准确地点。
第30条
保管、转移、使用电子设备、存储介质及电子数据证据的注意事项
30.1 电子设备、存储介质及其电子数据证据的保管、运输应当做好防磁、防震、防热、防潮等措施,避免造成设备、介质损坏或者数据变化。除以上一般保护措施外,对于有网络连接的移动通讯设备还可以采取信号屏蔽等特殊保护措施。
30.2 在保管、转移或使用电子数据证据及其上述载体时,可以同步制作相应的保管记录、转移记录和使用记录。
第四章 企业电子数据取证公证规范
第31条 公证机构的选择
企业申办电子数据取证公证,可以选择企业住所地、行为地或者事实发生地的公证机构。为保证电子数据的证据效力,企业应当优先选择具有“电子邮件保管箱”业务的公证机构。
第32条 企业进行电子数据取证公证需准备的相关证明材料
36.1 主体证明材料:提供营业执照复印件、法定代表人身份证明文件(境内居民提供身份证、境外居民提供护照);委托办理的,需提供委托办理公证的授权委托书、代理人身份证明文件。
36.2 利害关系证明材料:企业开展电子数据取证公证工作,应当根据公证对象的不同,提供以下证明材料:
(一)对企业内部SAP系统生成的产品手册、内部电子确认函、采购单等电子数据公证的,需提供上述SAP系统由本企业所有或使用的证明材料;
(二)对企业与客户沟通所使用的电子邮箱中内容公证的,需提供邮箱由企业所有以及邮箱中内容与企业业务有利害关系的证明材料;申请保全其员工使用的用于公务的电子邮箱内的邮件,应当提交其与该员工签订的有关公务邮箱仅用于公务的书面约定,或者经该员工书面同意,或者由该员工亲自操作提取、固定相关电子邮件;
(三)对企业业务往来的电子传真、光盘、电子照片公证的,需提供上述电子数据与企业业务有利害关系的证明材料。
第33条 企业进行电子数据取证公证需准备的相关取证设备 电子数据取证公证在本地或本单位设备上进行的,应当事前准备好方便公证的电子数据存储、显示设备,并预先对取证设备进行清洁性检查。
第34条 企业进行电子数据取证公证的公证场所 对企业内部SAP系统生成的产品手册、内部电子确认函、采购单等电子数据公证的,可在企业内部进行取证行为公证;对网页等实时数据取证、电子邮箱取证公证的,应当使用公证机构的计算机或者无利害关系第三人的计算机。
第35条 企业申请电子数据取证公证时,应配合公证人员履行以下告知义务:
(一)当事人申请保全的内容不得侵犯他人通信秘密、个人隐私,申请保全 的方式不得违反法律、法规的禁止性规定;
(二)实名制邮箱的注册人或者非实名制邮箱的密码持有人申请办理保全电子邮件公证的,应当保证其申请登录邮箱保全电子邮件的行为不会侵犯他人的通信秘密、个人隐私;
(三)决定是否采纳公证人员提出的提取、固定证据的方法、操作程序以及使用的设备建议。
第36条 企业指定人员在开展电子数据取证公证时,应当注意以下事项:
(一)向公证人员提出最终决定的公证方式和公证对象,向公证人员提供书面操作形式;
(二)提取的电子证据需要附在公证书之后的,建议公证人员使用一次性刻录光盘并采用终结方式刻录。
关键词:大数据,电子政务建设,行动纲要,思想准备,需求创新,技术架构
一、大数据时代电子政务面临挑战与高层需求
1.1 大数据时代电子政务面临挑战
《促进大数据发展行动纲要》 (以下简称《行动纲要》) 是中国启动大数据战略的里程碑, 由国务院在2015 年8 月正式发布。电子政务如何适应大数据时代的发展要求, 对政府部门是一个新的挑战。
构建基于大数据理论与技术的电子政务 (以下简称大数据电子政务) 将对政府的服务、管理、决策等方面的职能转变与深化改革起到巨大的支撑与推动作用。但是, 大数据电子政务的建设涉及思想转换、机制创新、人才结构变化、技术方案选择、推广应用等一系列全新的工作, 对建设者是一个很大的挑战。
1.2 从大数据电子政务需求角度分析《行动纲要》
《行动纲要》可以概括为五大目标、七项措施、十大工程。它们不仅是大数据时代的社会发展需求, 从软件工程角度来看, 也是新一代电子政务的目标和高层业务需求。[1]
上述五大目标及高层业务需求是传统信息技术无法实现的, 必须采用大数据技术才能实现。
二、目前大数据技术已有积累及发展趋势
2.1 大数据技术总体介绍
大数据4V特点是数据量巨大、结构多样、低密度高价值、快速获得结果, 由于传统信息技术无法应对, 逐步发展起来的全新一代大数据技术。
自2006 年左右Google三篇大数据技术论文发表及云计算概念提出, 10 年来大数据技术与产品快速发展。现将主要产品简析如下:
围绕大数据技术核心软件Hadoop, 产生了与其相关的一系列软件, 称为Hadoop生态圈。比较著名的有:Zoo Keeper分布式协作服务、Hive数据仓库工具、Sqoop关系数据ETL工具、Avro数据序列化系统、Pig数据流处理语言、Flume日志收集工具、Ambari集群监控与管理、Mahout机器学习、Oozie工作流引擎、Hue图形化管理界面、chukwa监控分析。传统应用中需要的很多系统级工具软件基本包括在内。这些都是开源的。
2.2 大数据技术发展态势展望
2.2.1 开源依然是大数据技术创新发展的基石
全球开发者通过开源社区来进行大数据代码的开发、维护和完善, 从而集全球智慧推动大数据技术的不断进步。全球各大企业加大对Hadoop、Spark等开源社区的赞助和智力投入, 开源技术生态系统不断壮大。[2]
2.2.2 大数据平台兼容性与性能快速发展
大数据平台原来SQL不兼容、GB级数据性能不佳等不足已基本解决, 分布式内存计算大幅提高处理性能。基于传统数据库的应用会逐步向大数据平台迁移。原来依赖主机高性能、存储高可靠性、高大成本解决方案, 在大数据分布式平台中有了更好、更便宜的解决方案。原来觉得困难重重的去IOE行动, 在大数据这一全新环境下, 居然就顺理成章地解决了。因此, 大数据平台在政府行业会有一个快速的普及。
2.2.3 大数据生态使系统技术复杂度、应用成本快速降低
Hadoop适应各类低成本硬件 (如X86 架构) , 固态盘替代内存逐步流行, 计算硬件成本大幅降低。
传统系统环境一般包括服务器操作系统、DBMS、各类中间件、工作流、数据仓库、BI工具、集群及负载均衡、数据交换等, 产品厂商各异, 技术复杂, 采购维护成本高昂。Hadoop商业版打包的生态圈软件, 包含了上述产品很大部分功能, 复杂性、购置及管理成本大大降低。
阿里云、百度云等互联网企业在自身大数据应用基础上, 将其产品和技术向市场输出, 很多以云平台及Saa S形式提供, 降低了技术复杂性。
2.2.4 流技术发展使实时提醒及决策分析得到兼顾
流数据的高速检测及流处理以后马上保存到某个数据库, 可以把实时数据、历史数据进行连接, 这样, 高速查询与迭代分析可以并行不背。例如, 在对交通流做实时的检测预警分析的同时, 如果在交通高峰期某区域产生拥堵, 需要快速分析影响范围, 防止出现连锁反应。
2.2.5 虚拟化、平台化使得云计算与大数据整合逐步走向完成
基于虚拟化技术的快速发展, 象Linux container、谷歌Kubernetes、YARN支持多种计算框架, mesos资源调度核心、docker工具会走向数据中心操作系统。二是Hadoop技术操作系统化、平台化, 数据挖掘及展示工具适应性加强。这些助力云计算与大数据终得融合。
三、大数据电子政务建设共同性及难点分析
3.1 大数据电子政务的思想准备
大数据的电子政务及社会化应用, 将对政府的架构、职能等方面发生深刻的变化, 主要将表现为:
3.1.1 机构更加扁平化
由于信息化程度, 特别是大数据处理能力对决策自动化程度的提高, 再加上交通进一步的便捷, 机构扁平化、减少管理层次将成为趋势, 省管县的模式可能会在更大范围内推行。
3.1.2 政府事务性人员降低、专业性要求更高、廉政监督更加严密
政府日常管理中很大一块工作量, 就是接受申请、审核、审批等事务, 除了服务态度差、部门间推诿、奇葩证明等顽症, 审核、审批过程由于主要靠人为判断, 流程慢且有很大的寻租机会, 这些都严重影响政府形象及公信力。
随着电子政务网上申请、物联网现场监控、部门数据共享等信息化手段普及, 备案制推行。政府监管对象的行动、时间及空间移动都会以数字形式被采集、传输、挖掘, 原来受限于人力、时间无法做到的事, 在大数据时代就是举手之劳或完全自动化, 因此事务性处理人员会大幅减少。基于深度挖掘与精准推测技术支持的项目中后期监督、决策事项, 不仅流程更加透明, 对人员综合素质也更高[3]
同时, 每个政府人员不可避免地会受到大数据无远弗届的监管, 有来自体制内, 也有来自非政府组织、个人的。
3.1.2 基于大数据的决策成为政府工作的常规手段
大数据可视化技术使得人们用比数据表格形式更加容易识别、图形化的方式, 达到展示浓缩的信息、表达新的知识、作出推荐及预警、发布行动命令等目的。能够精确、清楚地描述复杂信息, 而且富有趣味性、便于阅读。犹如现代医生离不开化验设备一样, 不仅政府工作人员日常监管会依赖实时提示、精准推测, 政府官员做决策时会越来越依赖大数据的量化分析结果。因此, 大数据咨询的机构会获得较大的增长空间。
3.1.4 公众参与政府决策、公共事务的手段及水平更高
随着政府数据不断公开和技术发展, “大数据民主”会获得象魔镜这样的大数据供应商支持。公众参与社会事务决策的程度与水平也会水涨船高, 对政府决策在深度分析基础上提出他们有数据支持的评判意见。
3.2 大数据电子政务的应用阶段及功能类型分析
许多系统都喜欢挂上大数据这个名头, 那么, 什么样的电子政务才能算大数据应用?电子政务结合功能及数据处理技术上可划分为三个阶段:以事务处理为主的数据库应用阶段, 以数据集成及查询分析为主的数据仓库阶段, 以预警及预测为主的大数据阶段。宽泛一点说, 带有共享、预警、分析和预测四类功能, 且数据量接近TB级的系统, 都可称为大数据应用。四类功能在大数据不同应用阶段所占比重是不同的。现分析如下:
3.3 基于决策过程的大数据电子政务业务创新
政府决策涉及大众切身利益、耗用巨大资源、影响深远, 所以, 政府最大的节约就是决策的科学性。下面, 以连续有限比较决策论代表人物Herbert Simon的决策四阶段划分为基础, 通过解析政府最重要的决策过程, 提供一个思考路径, 大数据电子政务能促进政府职能转换、业务创新。
3.3.1 决策前期准备阶段
决策前期准备的信息收集过程中, 政府面临信息“稀缺”与“过载”并存的问题。由于部门条块分割, 部门之间实现数据交换、共享仍存在不少障碍与困难。另一方面, 随着互联网发展, 政府工作受到新闻及网络媒体产生的信息洪流冲击, 面对这些巨量的毁誉夹杂、真假难分的信息不知如何应对。
《行动纲要》明确了政府数据共享具体要求及时间表, 建立具有权威性的政务数据交换制度、机构, 减少部门协调成本, 提高数据交换的质量, 建立对社会的数据公开及购买数据服务等机制, 可以有效解决信息稀缺的问题。
应该借助大数据分析工具将网络舆论中内嵌的多重利益和多元价值转化为定量化、可视化的参考信息, 在科学的基础上界定决策问题、确定决策目标。[4]
3.3.2 多方案设计阶段
对决策目标评估凭经验、缺乏量化分析, 这是政府在方案设计阶段存在的主要问题。大数据在这一个阶段可提供很多支持, 如:通过舆情分析了解决策目标公众认可度, 建立如经济、人口、城建、文化、环保、技术等主题数据库, 分析各种方案的适宜性、约束条件, 进行方案优化。
3.3.3 政策方案选择阶段
目前, 方案选择以定性决策为主, 依赖领导的经验。随着决策议题日趋复杂化, 这种模式急需改进。发挥大数据作用, 建立并不断完善政府常见决策类型的分析模型, 吸纳定量决策方法的优势, 形成定性和定量相结合的综合决策模式。随着大数据技术发展, 政府决策也可以象军队沙盘推演一样, 直接观地对多种方案在各种参数输入下模拟可能结果。
3.3.4 决策执行及反馈阶段
发布和实施一项政策后, 及时收集和评估公众的反映十分重要。由于网络公众舆情构成十分复杂, 个体正当意见诉求, 纯粹情绪发泄, 利益集团诉求, 恶性炒作, 甚至敌对组织蓄意捣乱。利用大数据语义分析和行为分析等算法, 获得大众正当的诉求, 了解状态动态变化, 对决策模型进行动态测算, 有的放矢地调整政府政策, 以更好地实现既定的政策目标。要充分利用网络舆论的优势, 创新模式, 利用其疏导误解、凝聚共识、支持政策实施。
3.4 大数据电子政务的架构设计示意
电子政务相当一段时间会采用传统和大数据混合模式, 常见系统架构示意如圆图1。
电子政务应用趋势是数据从传统DBMS向大数据应用环境转移, 但业务处理及展示层仍会以传统技术为主。
3.5大数据电子政务建设中需关注的几个问题
3.5.1机制及模式创新
大数据应用对数据、业务、技术应用的要求更高, 需要适应不断创新的环境, 不是非常适应政府常规工作氛围。电子政务大数据应用可以考虑共建、外包、采购服务、政策支持等多种模式, 发挥政府应用引领、市场化竞争等不同优势。
3.5.2 大数据电子政务建设投资预算原则
大数据技术仍处在一个爆发初期, 架构、技术都在不断变化。政府在资源投入方面需要谨慎。总体规划、分步建设、按需投入的原则与大数据分布式技术特性也非常吻合。
3.5.3 大数据交换及共享的标准化
国家标准委2007 年《政务信息资源交换体系》规范了传统电子政务信息资源的总体框架、技术要求、数据接口规范、技术管理要求, 虽与大数据应用有一定差距, 但大部分还是可以参考的。应尽快形成政务大数据交换、共享、公开、交易的相关标准与规范。
3.5.4 政府数据在交换、抓取、开放方面的趋势
《行动纲要》明确要求政府间数据共享及开放, 纵横交叉、市场补充的数据共享模式是一个解决方案。纵向行业数据交换中心由行业上级机构 (如部、省级) 建立运行, 横向区域数据交换中心由当地政府建立并负责运行并对外开放。数据抓取的业务特点比较明显, 各中心、甚至单位都会根据具体需要进行。只要有充分的需求, 会出现专业数据交易机构, 政府通过购买服务获得需要的数据。
3.5.5 系统安全及数据隐私
大数据因其影响范围广, 安全上应采取更加严格的要求。数据脱敏的法律法规、评估标准、国产化工具的逐步形成, 才能促进与保障政府将数据开放, 为社会服务, 为创新创业服务。
四、大数据电子政务的展望
大数据电子政务的发展将还有一段很长的道路要走, 随着数据大量积累及深度分析技术提高, 对各级政府在思想、法规、机制、职能、人才甚至政治生态等各方面会带来意想不到的改变。政府管理经验的算法商业化会有一个较快的发展, 技术上则要关注政府私有云平台在大数据应用方向的发展趋势。[5]
参考文献
[1]国发〔2015〕50号《国务院关于印发促进大数据发展行动纲要的通知》
[2]陈光, 大数据发展新趋势, 中国建设信息化2015年第10期, 66-67
[3]安学军, 大数据对电子政务的影响及应用, 天津科技2014年, 第4期,
[4]王存刚, 大数据与中国外交决策机制创新--基于组织决策理论的视角, 外交评论2015年, 第4期。
关键词 电子政务 数据仓库 数据挖掘
中图分类号:C931 文献标识码:A
在信息时代,信息技术的快速发展对社会各个领域都产生了一定的影响,在电子商务中反映尤为突出。电子政务的出现相对较晚,但据国外学者研究表明大约80%以上的重要信息资源掌握在政府手中,所以许多国家都将电子政务作为本国在信息技术应用领域的首要任务。
1政务数据处理状态分析
政府不仅是处理人民群众日常事务的单位,它更重要的作用体现在可以反映群众的多数意见和分析社会大范围的特征,并以此帮助人民群众和社会向更好的方向发展。政府对这些事务的处理到目前为止经历了人工和计算机处理的两大阶段。
(1)人工处理阶段
为了反映较大范围人民群众的整体特征,政府经常要付出庞大的人力和物力收集大量数据。这个数据的收集通常要经历一个较长的时间,间隔一段时间还必须重复执行。比如犯罪规律调查、经济普查、群众意向调查等。然而,分析收集来的海量数据更是政府头疼的一件事。比如经济普查,政府需知道近10年、近20年、50年甚至更长时间的经济发展状况,那么光靠人工去翻阅以前的数据就是件很困难的工作了。所以人工处理数据阶段,有许多政务受到很大的限制。
(2)计算机处理阶段
随着计算机在各政府部分的使用,逐渐出现了“电子政务(Electronic Government,即EG)”。目前为止,电子政务的发展大致经历了以下三个阶段:面向数据处理的第一代电子政务、面向信息处理的第二代电子政务、面向知识处理的第三代电子政务。在前两个阶段中,许多政务工作确实提高了效率,但是政府海量数据中隐含的价值仍不能被有效发掘。正如在一大座金山中,获取更有价值的黄金还需更细致更有效的清理和挖掘。由于信息技术的发展,电子政务逐渐进入第三代发展中,即有效应用数据仓库和数据挖掘技术挖掘知识。
2 DW和DM技术
数据仓库(DataWare,即DW)是指一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策。面向知识处理的EG系统应能够自动剔除掉不需要的数据,按照用户的要求整合杂乱的数据资源,获取某些可用的属性。
数据挖掘(Data Mining,即DM)是指从大量的数据中,抽取出潜在的、有价值的知识(模型或规则)的过程。数据挖掘就是从大量数据中提取或“挖掘”知识。
首先,我们要确定数据挖掘的对象有哪些。其次,要有效地应用数据挖掘技术,就要遵循科学的应用流程。一般的挖掘流程是:(1)确定挖掘对象;(2)数据准备;(3)数据挖掘,即模式提取;(4)结果分析,即模式评估。
3政务平台的数据挖掘过程
按照上述数据挖掘的基本流程,以检察院为例介绍如何在EG系统真正实现数据挖掘。
3.1构建EG系统的数据仓库
这部分主要分为以下四个任务:
(1)确定检察院EG系统中的数据源
检察院EG系统的数据主要从两个方面获得:第一个是调研和用户主动提供的数据资源;第二个是EG系统从其门户网站中获得数据源。
当实施了EG后,政府将从其门户网站中获取更多、更丰富的数据资源。那么如何对庞大的Web日志数据建立数据仓库呢?
(2)Web日志数据的预处理
Web服务器日志文件中的数据称之为原始数据,管理员可根据需要用某些日志字段记录相关数据。如:用户的域名或IP地址,用户的Login ID,访问日期和时间,访问的方法,被访问页的文件名和参数等。对Web日志数据的预处理包括两步。第一步:清除噪音,即去掉对知识挖掘无关的数据。第二步:转化数据,即将原始数据按照挖掘需求通过重新组织或简单计算转换成规范模式。
(3)多维Web数据模式的建立
第一步,选取维。多维数据便于我们从多个角度深入了解数据中的信息。N维数据矩阵用C(A1, A2, . .., Am ,count)模式表示,其中Ai代表第i维,i=1,2,...,n, count是变量,反映数据的实际意义。
第二步,构造检察院门户网站访问数据的(下转第78页)(上接第76页)多维视图。先选取data维(按季度组织)、file维(按文件类型组织)用2—D形式表示用户对检察院门户网站的访问行为。然后加入第三维location(按用户所在区组织),进一步构建用户访问行为的三维视图。视图显示的事实是visit_count(访问次数)。
第三步,创建多维数据模式。最流行的数据仓库数据模型是多维数据模型。最常见的模型范例是星型模式。
(4)应用OLAP技术
应用OLAP(在线联机处理)技术可以很方便地从Web日志数据矩阵中作出一些简单的结论性分析,如回答一些问题:(1)哪些资源访问情况最好,哪些最差;(2)用户的地域分布情况如何。可以应用的技术有:下钻(drill-down)、上卷(roll-up)、切片分析(slice)和切块分析(dice)等。
3.2挖掘模式的有效应用
应用数据挖掘技术可以自动发现用户的行为特征和系统的访问模式。
(1)数据挖掘技术应用的范围
检察院构建其门户网站,需要向公众、企业和其他政府部门提供尽可能多相关信息和服务。同时,检察院通过门户网站也要有能力获悉访问用户的访问行为和动机、趋势。在服务器以及浏览器日志记录的数据中隐藏着模式信息,结合网络技术应用数据挖掘技术可以自动发现系统的访问模式和用户的行为特征,从而进行预测分析。
(2)应用挖掘模式提取和分析知识
根据不同的应用要求,在数据挖掘模式中选择合适的方法进行计算,提取有效数据,得出知识。对于检察院,可以应用聚类方法确定特定用户的地域分布,从而识别出一些问题:
①哪些分区在一段时间内网上举报情况较集中;
②网上举报较集中的地区是因为案件发生频繁,还是因为网络普及范围广;
③对比网上举报和非网上举报的用户群,以辅助政府决策对不同地区采取不同的情报收集手段。
电子政务平台中的数据还有许多值得继续深入研究的。但是,不论从那个方向进行研究,都必须要以提高政务处理能力为宗旨,让政府资源发挥最大的社会价值。
参考文献
[1] Reema Thareja. Data Warehousing [M]. Oxford Univ Pr, 2009.
[2] 张兴会. 数据仓库与数据挖掘技术[M].清华大学出版社,2011.
[3] 黄雯. 数据挖掘算法及其应用研究[D].南京邮电大学,2013.
【电子政务数据库】推荐阅读:
电子政务论文关于电子政务的论文11-20
电子政务系统开发07-04
市电子政务系统10-10
电子政务的特点10-22
电子政务建设模式01-04
电子政务档案管理06-08
电子政务的定义解释10-07
电子政务绩效考核评估11-09
电子政务平台搭建方案02-08
政务服务大数据功能06-30