对网络信息平台的认识
台的介绍
面对网络贷款行业中监管无门、鱼龙混杂等令人无法放心借贷的现状,My标客推出了全新货场监管创新产品,更加安全、透明、高效的打造My标客网络融通业务信息平台,与此同时,为了配套此全新货场监管产品,标客更是在工业区签订2万平方米货场,同时引入远程监控系统,采取全方位、实时监控货场的方式来实现安全风控体系。
另外,针对严格高效的货场监管,标客网会严格筛选借款者,从以往优秀的借款人中选择潜力大,盈利强的项目入驻标客网货场,提供业务支持、资金融通服务。此产品主要针对生产型企业和贸易型企业,处在行业快速发展时期的企业为标客网首选,由此,为中小企业融资服务提供了更加便利有效的方式。
货场监管结合仓储质押的静态监管模式及生产性企业的滚动式质押模式,投入重金,细分借款市场,对盈利掷标枪,还款快,流动资金旺盛的企业进行标客货场引入,或对其场地进行反租,同时派驻财务监控,安装远程视频监控,线下营业部工作人员实时巡检等有效风控手段。
Internet是目前世界上影响最大的网络, 其经过了三个重要的发展阶段:国防应用、科研应用、商业和社会应用。随着计算机网络技术应用领域的扩展, 网络信息安全性问题也越来越明显, 网络信息安全已经涉及到国家的政府、军事、文教等诸多领域。“安全=监管+技术”, 网络信息安全是一整套体系, 以单点的安全防范技术解决问题不是很完善。实施有效的监管和使用完备的技术方法相结合组成了有效的网络信息安全体系。计算机网络安全防范涉及到多种学科, 其中包括信息技术、计算机科学、通信技术、密码技术、信息安全技术、应用数学、数论、信息论等多种学科。如何解决好计算机网络信息的安全问题已经成为现阶段一项重要的高技术课题。
二、基于Internet安全问题的认识
网络信息安全指的是为建立信息收发、存储、处理系统而实施的技术上和宏观管理上的安全保护, 以实现网络信息的完整性、保密性、可控性和可用性。网络信息安全是一个涉及到国家安全和社会稳定等方面的重要问题。一个国家的信息安全体系大致上由这个国家的法律法规以及安全防范技术和技术发展平台所组成。但是, 由于我国信息化发展建设的起步相对比较晚, 与之相关的管理、技术体系仍不完善, 法律法规尚不健全等诸多问题, 网络信息仍然存在许多不安全因素。网络信息的安全问题以及这些安全问题的成因大致可归纳为以下四个方面。
(一) Internet是一个开放的网络, TCP/IP是通用的协议
Internet依靠TCP/IP协议, 在全世界范围内对不同结构的硬件设备、不同源码的操作系统、不同环境的网络系统实现了互联。在Internet上, 每一个节点都有其唯一的IP地址来区别彼此和建立连接。而TCP/IP协议创立连接的三次握手机制存在被监听报文、破坏连接、插入有害数据包等技术弊端。
(二) 对从国外引入的硬件和软件尚未做到有效的管理和技术改造
信息技术在我国起步较晚, 许多政府机关及企事业单位直接引进国外的网络信息硬件, 但是并没有对其进行有效的检测和技术改造, 这使得他人入侵系统或监听信息等非法操作有了方便之处。
(三) 计算机病毒的种类不断增加以及高传播率
据国外统计, 计算机病毒以10种/周的速度增加;另据我国公安部统计, 国内以4-6种/月的速度增加。目前计算机病毒大致可以分为操作系统病毒、源码型病毒、外壳型病毒、嵌入型病毒。新型网络病毒会随着信息网络硬件设备的增加与Internet的普及而迅速传播。由于Internet系统极为庞大, 造成了计算机病毒极易相互传播, 从而对网络信息产生危害。
(四) 信息犯罪在我国有快速发展趋势
随着计算机网络技术的发展, 攻击计算机网络的方式也变得越来越容易;用于攻击的软件工具的功能越来越强, 但是对攻击者的专业知识水平要求却变得更低, 所以黑客也变得更为普遍。除了境外的攻击者对我国信息网络系统所进行攻击外, 在国内也有一部分人利用计算机病毒、山寨网站、系统或软件中的源码漏洞进行网络犯罪。
三、基于Internet安全问题的一些思考
计算机网络有资源共享、更加方便且低成本获取信息、人与人之间的沟通更加快捷、信息保存更方便持久安全等优点。同时也正是这些特点增加了计算机网络安全的脆弱性和复杂性, 资源共享和分布式服务增加了网络受威胁和攻击的可能性。现阶段维护网络安全的主要技术手段有防火墙技术、数据加密技术、入侵检测技术等。
(一) 网络防火墙技术是一种用来加强网络之间的访问控制, 防止外部网络用户以非法手段通过外部进入网络内部, 保护内部网络操作环境的特殊互联设备
1986年美国的Digital公司在计算机网络上安装了全球第一个商用防火墙系统, 提出了防火墙概念后, 这一实用技术得到了快速发展。作为内部网络与公共网络之间的第一道屏障, 防火墙是最先受到人们重视的网络安全设备。它对两个或多个网络之间传输的数据包, 按照一定的安全策略来实施检查, 决定网络间通信是否被允许, 并监视网络的运行状态。
(二) 数据加密技术又叫做密码学, 是通过加密算法和加密密钥将明文转换为密文的一种技术, 而解密的过程则是通过解密算法和解密密钥来将密文转换为之前的明文
信息经过数据加密技术进行加密来隐藏真实信息, 使信息安全得以保障。比较常用的加密技术有对称加密技术与非对称加密技术。对称加密技术是指加密和解密的密钥使用同一个加密的密码, 而非对称加密技术可以理解为允许任何人对信息进行加密处理后, 将它发送给另一个人, 而不需要预先交换密钥。最好的加密算法对计算机系统的性能要求不高, 而且还能带来其他的优点。比如, 众所周知的pkzip, 它压缩数据也加密数据。再如, dbms有些软件包中包含一些加密方法, 使得一些敏感数据无法使用复制功能, 例如用户的密码。所以, 这些加密算法都要有强劲的加密和解密能力。
(三) 入侵检测技术是保障安全的关键技术之一
入侵检测技术是为了保证计算机系统的安全而设计产生的一种技术, 它能够及时找出并提示系统中未授权的或异常的操作现象, 广泛应用于检测信息网络系统中不合乎安全策略的行为。对入侵进行检测报警的软、硬件组合构成了入侵检测系统 (Intrusion Detection System, 简称IDS) 。网络入侵检测技术通过硬件或软件对网络上的数据流进行实时核对, 并且同系统中入侵特征的数据库对比, 如果发现有被攻击的表象, 马上依照用户事先输入的规则进行操作, 例如切断网络连接, 或通知防火墙系统对访问控制策略进行调整, 将入侵的数据包进行过滤等。
四、结束语
[作者简介]李冠亚(1992—),男,河南省周口市人,中国人民公安大学学生,主要研究方向:治安。
[文章编号]1009-3729(2014)04-0071-04
[摘 要]证件合一是针对当前社会居民持有的证件繁杂众多、使用流程复杂低效的现状而提出的简化证件、合众为一的构想,其背后的支撑或实质则是证件合一的网络信息平台。鉴于证件合一网络信息平台构建过程中存在牵扯部门众多、需要规模庞大的软硬件支持、公民个人信息安全问题严峻、信息众多导致录入维护困难、立法滞后等制约因素,建议采取如下应对措施:权威部门牵头,组织协调相关部门合力共建;加大资金投入力度,整合利用原有资源;在保障信息安全的基础上,按照生命轨迹,不间断并有条理地收录、维护公民个人信息;完善相关立法。
[关键词]证件合一;网络信息平台;电子证件;信息安全
[中图分类号]D192.1;F49;TP309 [文献标志码]A [DOI]10.3969/j.issn.1009-3729.2014.04.014
当今社会,人们在享受网络信息化带来的方便快捷高效生活的同时,又深深地被证件系统方面的种种不便所困扰。具体来说,就是各种证件种类繁杂、颁发重复、功能重合,这既带来携带不便、办理困难的困扰,又因使用低效而造成资源浪费。从政策和理论上来说,制作和颁发每一种证件的初衷都是把证件当作服务的工具,保障群众享受相关的权利,但由于证件越发越滥,最终造成其使用效果事与愿违。[1]与此同时,与证件有关的一些服务性系统如金融系统、安检管理系统、服务性的登记系统(如就医时的患者信息录入系统)却与相关证件没有太多软件与硬件上的联系。这样,一方面造成服务性系统收录、核实用户信息耗费大量时间、精力与财力,自身的服务能力弱化,政府职能部门、企事业单位的效益低下;另一方面也给公民带来诸多不便,使其失去了本应享有的高品质现代服务。目前,学界有关证件合一网络信息平台的研究主要涉及其微观方面,涵盖电子证件的信息硬件支撑、安全防伪技术、信用制度、隐私保护与立法研究,而缺乏对证件合一网络信息平台本身构建的系统性研究。本文拟在对证件合一网络信息平台的概念、组成部分、运行方式、可能面临的问题及其对策进行初探,以期有助于证件合一网络信息平台建设,更好地为民众提供优质高效服务。
一、证件合一网络信息平台概述
证件合一是指将功能相同或联系紧密的证件整合统一,简化居民持有证件的种类、数量,加强发证机关、部门之间的联系合作,使其所掌握的证件信息共享,以方便公民的日常生活,提高政府相关职能部门和具有服务性质的企事业单位的工作效率,降低其运作成本的一种证件措施。具体来说,证件合一就是将现有的所有证件按照不同功能划分成几大类,将原先各种证件所包含的信息进一步整合完善,并针对性地只颁发几类实体证件。为此,需要构建一个包含软件与硬件的庞大的网络信息系统平台。这一平台由以下几部分构成,即存储各类证件信息的信息数据库、各级维护信息平台运行的具有不同管理控制权限的分中心、各种权限等级的数据收录与获取的终端,以及连接以上所有系统与各个社会上现存的拥有具体功能的企事业单位等子系统的高速主干网、次级网络和局域网。这样公民就可以在办理各种业务、出入各种场所时,凭借其随身携带的几个证件和一些附带的身份识别技术,在各种终端登录验证,凭借背后的数据库与高速网络来高效快捷地办理各种业务。
在当今信息化社会,证件合一的表面形式只不过是公民所持有的实体证件的减少,其背后的支撑或实质则是证件所含不同种类信息的交汇处理平台,即证件合一的网络信息平台。证件合一就是要求各种证件发证机关将各自所掌握的相关信息实现共享,一起构建一个动态的信息收集、处理、存储与应用的共享平台。简单来说,证件合一网络信息平台就是一个连接众多职能部门与服务机关的信息网络数据库。例如公民持有的一张与医疗、劳动就业、保险、保健相关的证件,其功能涉及公民在进行有关医疗、劳动就业保障、获取和支付保险,以及个人保健的过程中所进行的身份核实认证、相关服务信息的录入登记等。证件合一中有关公民的所有信息由之前的各个部门系统所掌管转变为信息共享,可以指定其中的一个单位、部门进行信息的收集、录入与维护,也可以共同进行,使经过初步整理的信息可以在一个平台上共享。这样一来,居民在获得医疗服务时,由医疗服务单位收集到的本居民的医疗信息能及时上传更新到一个其他部门能够收到的信息平台上。当公民在办理、支付医疗保险时,相关保险机构只要通过该公民持有的证件核实一下该公民身份,就可以获得该公民详细而又准确的医疗信息,能在节约调查核实医疗信息所耗费的时间、精力与费用的基础上及时为公民办理保险业务,当然相关的保险信息也要及时上传到共享信息平台上。以此类推,劳动部门、保健机构也可及时获得相关信息,高效且低成本地完成与该公民相关的服务业务办理。
二、证件合一网络信息平台构建过程中的制约因素
证件合一网络信息平台的应用前景广阔,但要实现这一重大系统工程需要面对诸多问题与挑战,存在很多制约因素。具体说来,主要有以下几个方面。
1.涉及部门众多
证件合一网络信息平台的构建是一项巨大的系统工程,其所需信息来源多、分布广,在其构建过程中必定会涉及众多部门。除去原有颁发证件的部门外,还涉及许多服务性事业单位、公司、组织、行业协会、团体和支持这一平台本身的部门,大到公安系统、财政系统和交通系统,小到小区门卫、公路收费站和医院挂号处。所有涉及到的信息部门在整合各自信息时首先面对的就是技术的标准化问题。每个部门在证件信息的录入、整理、存储和应用时都有一套自己的技术标准,在整合时,依照谁的标准、以谁为主势必会产生一些分歧。与此同时,整合完成后由谁来主导证件合一后的信息工作,即由谁来负总责也会经过众多部门的博弈。如果没有一个强有力的部门统一领导,证件合一网络信息平台是无法构建起来的。
证件合一网络信息平台的构建是一个庞大的系统工程,涉及的方面众多,这是由其本身功能所决定的。因为它所服务的对象是广大公民,其所服务的内容涉及到居民工作、生活的方方面面。这就需要其所含信息要满足所有涉及到的系统的需要,而之前受到技术水平、生产力水平的限制,这些信息只能由不同系统部门分别或共同掌握。
2.需要规模庞大的软硬件支持
证件合一网络信息平台的构建需要规模庞大的软硬件支持,而这些软硬件背后则需要强大的技术储备和巨额资金的支持。不仅是建设初期,而且系统真正运行起来后的定期软件更新、不间断的设备维护,还需要数量众多的专业技术人员和持久稳定的资金注入。虽说证件合一网络信息平台的构建需要巨大的软硬件支持,但远远低于证件合一之前分散于各个部门系统的软硬件所耗费的资源,因为各个系统部门占用大量软硬件、重复建设浪费了大量资源。因此,从长期来看,证件合一网络信息平台的构建有利于优化资源配置,节约资源。
3.公民个人信息安全问题严峻
从公民个人隐私的种类来看,可以将其分为个人事务、个人信息和个人领域3类。[2]证件合一网络信息系统不仅涉及个人信息,还涉及个人事务、个人领域。把原来众多的证件信息综合于一体,甚至还会增加一些个人信息,这样的个人资料将联网式地被各个部门、单位、企业等应用,很容易被获取、另作他用。这样完备的公民个人信息极易被侵犯,却还不容易确定是被谁侵犯的。同时,作为证件合一之后出现的有限的几种证件(极其重要的个人凭证)一旦丢失,也就意味着证件的拥有者将不再拥有他其他所有的凭证,而拾到证件的人就拥有了一个新的身份和享有其他服务的凭证。
关于公民的信息安全,首先要明确一点,就是信息安全与信息传播的便捷性成反比。长期以来就有关于公民信息安全的无休止的争论,在这里我们应先搁置这些争论,在保证公民个人信息安全的同时,尽可能地为信息传播清除障碍,即在构建证件合一网络信息平台的过程中,找到信息安全与高效应用的平衡点。
4.信息录入维护困难
证件合一后,需要大量的个人信息(从出生日到当前阶段)用于给众多部门和服务性系统提供支持。例如公民的人身信息、金融信息、医疗教育信息、职业信息、诚信记录等。同时由于信息具有时效性,是不断发展变化的,所以就需要及时、不间断地收录、维护。信息录入维护困难的主要原因就是之前没有进行过系统的录入、定期的录入,具体表现就是各个系统部门各管各的,不定期地收集,致使信息重复收录且在时间节点上不具有连续性。这也是导致资源浪费与办理低效的原因之一。
5.立法滞后问题
证件合一网络信息平台的构建在立法层面上面临非常尴尬的境地:一是证件合一这一新兴的证件运行管理模式本身没有法律指导;二是证件合一所主要依靠的基础即网络信息在立法环节上与其自身的发展速度相比相对滞后,在许多重要方面基本上处于空白状态,很多网络信息行为在无任何法律法规约束下自由进行;三是现行的各种法律法规有的已经明显不适应社会发展需要,有关网络安全、信息认证、加密等方面的法律法规没有及时跟进,对网络犯罪的预防、监管、责任追究等也缺乏完备的法律依据。[3]尤其需要注意的是,网络安全同样缺乏法律保障,与之相对应的规范化管理制度建设相对滞后,从而造成网络安全管理漏洞,在立法方面存在网络信息安全隐患。
三、构建证件合一网络信息平台的建议
1.权威部门牵头,组织协调相关部门合力共建
构建证件合一网络信息平台需要众多部门协商、协调,因此首先要寻求国家层面的帮助、民众的广泛支持。这需要相关专家在广泛调研和充分论证的基础上提出完整、有效的构建思路,形成具体、成熟的构建方案,以获得政府和民众的支持,进而制定颁发相关法律法规,组建专门建设、管理该平台的部门或者是指定现有的权威部门牵头协调组织各部门系统进行建设、运行。为了保证证件合一网络信息平台建设的可靠性、可控性、效用性,可以先在部分地区进行试点,整合一部分证件功能,连接一部分系统,之后再逐步推进完善。
2.加大资金投入力度,整合利用原有资源
证件合一网络信息平台属于公共设施建设,构建这一平台投入大、见效慢、风险高,须由国家来进行强有力的统一协调,并由各个子系统、部门尤其是获益单位的共同努力来解决。从短期来看,将分散的证件信息收集整合,建设新的数据库、信息传输网络和证件信息终端会耗费大量的资金,但是从长远来看,这是一个资源优化配置的过程,一旦新的体系建立起来,在其运行过程中可以节省大量的资金。因此前期的资金投入是值得的。此外,构筑证件合一网络信息平台所需要的软硬件资源还可以从其他部门原有的硬件设备和技术人才整合中获取,可以对其他部门的硬件设备按照新的要求进行改造,成为新系统的一部分;还可以对原先分散于各个部门进行证件信息维护的专业技术人员进行统一的培训。这样既节省费用,又不浪费原有资源。
3.保障信息安全
可用一句大白话来描述如何平衡信息安全与高效应用问题——让该知情的人尽快知情,把不该知情者的路堵死。证件合一网络信息平台中的信息安全主要面临2方面危险,即“天灾”和“人祸”。“天灾”就是网络运行设备遇到自然原因而出现的问题。为应对“天灾”我们应注重数据库备份的建设,采用双机并行和多级网络结构,可以把存有重要证件信息的数据分存到几个数据库中,并将巨型数据库分散于不同地理区域中,通过通信网络将其连接。此外,应把证件信息平台的实体网络划分成多级别多层次多部分,形成相对独立的结构;每个部门的子系统、终端设备应有相应的权限设置,使其只能在权限内获取一部分信息。只有这样,才能实现网络设备的物理隔绝、单向运行、数据分流,确保各应用部门严格分离。“人祸”是指信息管理维护过程、信息资源传递过程、信息应用过程中各方面人员(包括黑客)对公民信息的窃取、破坏,以及公民自身因丢失、损坏证件设备,致使自身信息受到侵犯。为防止“人祸”,首先,在获取信息之前要确保通过一定级别的第三方认证;其次,每一个接触公民信息的单位或个人必须有相应权限和充足的理由,且在使用信息的过程中由本单位负责人监督、负责,每一次使用都有事后可查的记录。除此之外,还应建立行之有效的证件识别(包括对携带证件者本人的识别,如面部、指纹识别等)和挂失冻结制度等。
4.按照生命轨迹,不间断、有条理地收录、维护公民个人信息
个人信息要从个人生命的起点开始,按照生命的轨迹不间断且有条理地收集、维护。一种设想是从公民的出生开始,有关他的出生信息、生理特征就无差别地记录到他本人的证件之中,通过医院的证件信息收集终端传送到证件合一网络信息平台上;伴随其生命轨迹的运行,在进行每一次涉及身份认证业务活动的同时,与此相关的准确信息也同时记录在证件合一网络信息平台上。这样,收集和维护信息就变得简单,公民每使用一次证件、办理任何一项业务都是一次信息采集、更新和维护的过程。
5.完善相关立法
法律规章是确保证件合一网络信息平台运行的基础,从法律层面上给予证件合一网络信息平台一个法律身份,一方面可以规范其运行方式、程序,明确其中的权责关系;另一方面可以给予参与其中的各方(包括公民、各管理服务机构)以信心,为其提供法律保障。这样,参与各方会在法律框架下进行各种有关证件的活动,解决出现的各种问题,公民也会放心地将自己的信息交给证件合一网络信息平台,平台的管理部门也会权责明确地参与其中。有关证件合一网络信息平台的相关立法主要涉及居民证件信息保护、居民个人信息收集、信息管理部门的信息处理与使用权限,以及救济途径4个方面的法律规定。
四、结语
综上所述,证件合一网络信息平台的构建虽然面临着种种问题与挑战,但是构成这一平台无论是从技术层面还是从社会实践层面来看条件都已具备,是社会经济政治的快速运行以及公民生活的迫切需求,是信息化社会的必然结果。当然,证件合一网络信息平台的构建需要相关专家在广泛调研和充分论证的基础上提出完整、有效的构建思路,形成具体、成熟的构建方案,获得政府和民众的广泛支持,制定、颁发相关法律法规。
此外,证件合一网络信息平台的构建还需要注意以下2点:
其一,证件合一不是简单地把所有证件合为一种,而是按照科学的分类标准划分成几类,每一类实行一种证件;其二,证件合一还包含将众多系统转化为一个大系统中的若干子系统,例如将凭证系统、支付系统、诚信系统、地理信息系统等融合成为一个有机的大系统,以现代网络信息化背景下的数据库和高速网络通道为依托,综合、高效、科学地为参与其中的每位成员提供多方位的信息服务和支持。
[参 考 文 献]
[1]张蕾.减少证件种类,优化证件功能[N].亚洲中心时报(汉),2009-04-28(002).
[2] 吕欣,高枫.电子政务信息共享中的隐私保护问题研究[J].信息网络安全,2012(8):188.
一、对信息素养涵义的理解
关于信息素养的涵义有各种不同的观点与分类,如:
我国2003年推出的《普通高中技术课程标准》(实验)将信息素养的培养作为了课程目标,从理论与实践都给出了表述,它认为,学生的信息素养表现在:对信息的获取、加工、管理、表达与交流的基础上;对信息及信息活动的过程、方法、结果进行评价的能力;发表观点、交流思想、开展合作与解决学习和生活中实际问题的能力;遵守相关的伦理道德与法律法规,形成于与信息社会相适应的价值观和责任感,并从知识与技能、过程与方法、情感、态度与价值观三个方面给出了多达11条较详细的表述
李艺与钟柏昌的《信息素养详解》中认为信息素养由知识、技术、人际互动、问题解决、评价调控、情感态度与价值观六个部分组成 其中,知识为其他五个部分提供基础准备,而评价调控则为其他各个部分(包括知识部分)提供必要和重要的形成保证 因此,知识与评价调控组成了其他其他四个部分的共同载体;技术、人际互动、问题解决三部分有机相联并呈现一定的层次;情感、态度与价值观是一种精神的领航,渗透于技术、人际互动、问题解决之中,并相互影响 因此,六个部分组成一个有机的整体
对于以上信息素养的理解,我比较赞同以下观点:
1、信息意识 即使用信息技术解决工作和生活的问题的意识,这是信息技术教育中最重要的一点
2、信息常识 即信息科学技术常识,促使学生阅读有关的信息文章,参加有关讨论,便于了解信息技术的发展与应用
3、信息能力 包括信息系统的基本操作能力,信息的采集、传输、加工处理和应用的能力,信息系统的分析与查错能力,以及对信息系统与信息进行评价的能力等
4、信息道德 培养学生具有正确的信息伦理道德修养,使他们能够遵循信息应用人员的伦理道德规范,不组织和参与非法活动,并知道如何防止计算机病毒和其他计算机犯罪活动
李维维与李艺的《信息素养的内涵、层次及培养》中认为从横向上看信息素养包括信息意识、信息知识、信息能力、信息道德这几方面 其中信息意识是整个信息素养的前提,指的是个体对信息的敏感度 这要求个体具有敏锐的感受力和持久的注意力,能够意识到信息的作用,对信息有积极的内在需求 信息知识是个体具有信息素养的基础,指的是对信息的了解和对信源以及信息工具方面知识的掌握 信息能力是整个信息素养的核心 从狭义上来讲,指的是个体对信息系统的使用以及获取、分析、加工、评价信息并创造新信息、传递信息的能力;从广义上来讲,除了上述能力以外,还应该包涵语言能力、思维能力、观察能力、判断能力等间接能力 信息道德把握个体信息素养的方向,指的是个体在获取、利用、加工和传播信息的过程中必须遵守的一定的伦理规范,不得危害社会或侵犯他人的合法权益 因此,无论个体的信息意识如何强烈,信息知识如何丰富,信息能力如何强 如果他将其才能用在违法犯罪上,那么他的信息素养是非常低下的 参照马斯洛的需要层次理论,从纵向上看,他们吧信息素养分为三个层次,即基础性信息素养、自我满足性信息素养、自我实现性信息素养 基础性信息素养是指在信息社会中生存的所有人所必须具备的最基本的信息素养 它保证了人们的基本生存需要,因此是三个层次中最浅的一个层次,也是对其信息能力要求最低的一个层次,但它却是培养另俩个层次信息素养的基础;自我满足信息素养则是指人们为了更好地从事一定职业、承担一定工作或者陶冶自己的情操所应具有的应用信息技术的素养 在三个层次当中,他的要求处于中间水平,利用信息技术辅助管理、教学、工作的人如教师、会计等必须具有自我满足性信息素养;自我实现性信息素养是指人们为了实现自我价值,开发或设计新的信息系统供他人利用,以服务大众和社会为目的的高层次素养 所以是要求最高、培养难度最大的层次,如计算机系统设计人员、软件开发人员等必须具有自我实现性信息素养
二、对将信息素养的培养确定为课程目标的理解
课程目标的制定过程中,同样需要综合考虑学科、社会、学生三个因素,缺一不可 在这一原则指导下,我国非常重视信息技术对社会、学科建设和学生自身发展的影响和作用,重新调整课程培养目标,在面向学科体系、社会需要、学生个人发展三者之间找到合适的平衡点,以培养能够适应信息化发展的人才 我国早期的中小学计算机教育课程目标由于主要依托高等学校计算机专业人员,明显带有面向学科体系的特点,自成体系,逻辑性强 90年代受西方教育思想的影响,计算机教育课程目标的制定主要面向当时的社会需求,强调实用 而作为学习主体的学习者,在我国以往的计算机教育课程目标的制定中一直被置于次要的地位,有时甚至不在考虑之列 随着我国信息技术教育的发展,我们已经认识到很有必要加强对学习者的关注 标准中明确指出信息技术课程的总目标是在义务教育的基础上培养和提升学生的信息素养,这说明我国信息技术教育在关注学生个体发展方面也给予了充分的重视 正是由于培养信息素养能够较好的满足信息技术学科发展、信息社会需求及学生发展的要求,才被包括我国在内的世界各国和地区相继作为信息技术相关课程的目标,并日益得到重视 信息技术课是培养信息素养的主阵地 首先,利用信息技术课得天独厚的条件,培养学生运用信息工具的能力,如计算机的使用、各种信息处理软件、网络浏览器、网络通信工具的灵活使用等;其次,培养学生主动获取信息的能力,具有敏感的、主动的信息意识,能根据自己学习的目的去发现信息,收集、整理必要的信息;最后,是培养学生善于处理信息的能力,包括检索、筛选、鉴别、使用、表达和输入信息的能力,能言简意赅地表达自己的研究成果并将信息传递给他人;能充分利用信息工具进行各学科知识的学习和研究,为其他学科实施信息教育打好基础
综上所述,将信息素养的培养确定为课程目标,是现代教育技术的要求,也是社会发展的必然结果
三、如何进行中小学信息素养培养
李维维与李艺的《信息素养的内涵、层次及培养》中提到: 由于信息技术特别是计算机多媒体技术和网络技术的推广和普及时间还不是很长,再加上我国经济欠发达,信息技术产品对于大多数普通百姓特别是农村百姓来说还是“休闲的奢侈品”,未能渗透到中国的每一个角落,国人的整体信息素养并不高 所有,我们可以从纵向、横向俩个方面来考虑培养中小学生的信息素养
由于信息技术特别是计算机多媒体技术和网络技术的推广和普及时间还不是很长,再加上我国经济欠发达,信息技术产品对于大多数普通百姓特别是农村百姓来说还是“休闲的奢侈品”,未能渗透到中国的每一个角落,国人的整体信息素养并不高 所有,我们可以从纵向、横向俩个方面来考虑培养中小学生的信息素养
(一)从纵向——信息素养的层次出发
对小学生、初中生、高中生信息素养有着不同程度的要求,这是一个由低到高循序渐进发展的过程,应“因材施教”
(二)从横向——信息素养的内涵出发
从横向上看,信息素养的培养应当涵盖信息意识、信息知识、信息能力、信息道德这几个方面,可以通过以下“四结合”的途径来进行
1与信息技术课程融合 2信息技术与其他学科整合 3与现实生活结合 4全社会通力配合
四、个人理解与感悟
不知道从什么时候开始,身边总是会有人抱怨我们学习的书本知识在生活中一点作用也没有,为此有的人一直困惑于学习的目的,更有人还以此为借口不好好学习久而久之,我也从接收这个观点进而慢慢变成认同这个观点了 但通过对信息素养的理解,突然让我对这个问题有了更多的反思 的确,信息已从以前的形式单一,逐步发展到了现在的具有实用性,并且教师以及课本本身都在引导学生的实践能力 从课本内容选择及编排方式上我们可以找到很多这样的例子
如以英语为例 记得我们上初中那会儿,课本上的各种内容都被编排的很“正统”,单词一块儿,语法一块儿,之后就是课文,再接着就是与之相关的练习题 还记得以前考试中出现的选择题都是和语法内容相关的,阅读、完形填空甚至都会与课本上的某篇课文完全相同 在那个时候,我总是认为英语一点实用价值也没有,觉得它就是纯粹的知识,如果说学习它有什么用的话,那就是为了考试
现在上了大学了,我才慢慢认识到英语是一种手段,一种技能,一种工具,我们更多的是用它来与别人交流,来认识外面的世界 所以,当我看到现在中学生们使用的教材,我感到十分欣喜 会说会交流成为了现在中学英语课程中一个十分重要的部分 英语书的第一页不再是认识26个字母,而是如何与新同学新朋友打招呼;书本中有很多活动的设计,并要求同学们结成对子,尝试用英语练习对话 我认为这其中就在引导学生将英语作为手段来与别人进行交流
应该承认,我国现行的教育制度还是处于应试教育的阶段 但是我们不可以对其进行全盘否定,至少在教材内容的选择及编排上我们可以看到这些年来进步的痕迹,虽然过程漫长,但是我们还是要对其充满希望
此外,还有一点关于信息素养的感想 我如今在对自己当时的想法进行反思,但是庆幸的是我们当时传播信息仅限于口耳相传 而今,在这个网络盛行的年代,任何负面信息都会迅速广泛传播
参考资料:
随着计算机网络的迅猛发展,计算机网络的应用日益广泛,并且已经渗透到生活的方方面面,对人们的生活起着不可忽视的作用。在这个信息化的社会中,了解网络是当代大学生必不可少的一门课程。尤其是对我们信息专业的学生,认识计算机网络的基本理论,以及其在生活中发挥的重大作用,为今后我们进一步深入学习专业课程,奠定了良好的基础。
科学技术日新月异蓬勃发展,从20世纪90年代初迅速发展起来的internet,已经飞速改变了人们的生活和工作。人们被其丰富无穷的信息资源、方便快捷的交流方式深深吸引。如今计算机网络的教育更是早已深入大学校园,尤其是对于我们信息管理与信息系统这个专业,网络是信息传播、资源共享的重要媒介,这门课程也是我们必不可少的一课。
随着计算机技术的迅猛发展,计算机的应用逐渐渗透到各个技术领域和整个社会的各个方面。社会的信息化、数据的分布处理、各种计算机资源的共享等各种应用要求都推动计算机技术朝着群体化方向发展,促使计算机技术与通信技术紧密结合。网络是计算机的一个群体,是由多台计算机组成的,这些计算机是通过一定的通信介质互连在一起的,计算机之间的互连是指它们彼此之间能够交换信息。计算机网络属于多机系统的范畴,是计算机和通信这两大现代技术相结合的产物,它代表着当前计算机体系结构发展的一个重要方向。
计算机网络技术的发展和普及日益改变着我们的学习和生活,各种各样的网络应用让我们眼花缭乱,因特网让我们真正体会到信息爆炸的威力„„在信息管理系统认识实习课的第一讲上,张老师从网络的定义、基本概念、以及应用等三个方面,给我们介绍了计算机网络的基本理论,让我们对它有了最基础的认识。
计算机网络是多台地理上分散的、具有独立功能的计算机通过传输介质和通信设备连接,使用网络软件相互联系,实现数据通信与资源共享的系统。其目标就是信息资源共享和互效通信。计算机网络的组成分为硬件和软件,硬件又可分为主机、传输介质和通信设备,软件可分为操作系统和通信协议。所谓主机就是组成网络的各个独立的计算机。在网络中,主机运行应用程序;连接介质和通信网中的传输线路一样,起到信息的输送和设备的连接作用计算机网络的连接介质种类很多,可以是电缆、光缆、双绞线等“有线”的介质,也可以是卫星微波等“无线”介质,这和通信网中所采用的传输介质基本上是一样的;协议对于计算机网络而言是非常重要的,可以说没有协议,就不可能有计算机网。网络协议的定义:为了使网络中的不同设备能进行下沉的数据通信而预先制定一整套通信双方相互了解和共同遵守的格式和约定。每一种计算机网络,都有一套协议支持着。由于现在计算机网种类很多,所以现有的网络通信协议的种类也很多。典型的网络通信协议有开放系统互连(OSI)协议1、X.25协议等。TCP/IP则是为Internet互联的各种网络之间能互相通信而专门设计的通信协议。
其次,老师还给我们讲了讲关于网络的几个基本概念,包括IP地址和域名系统DNS,并以校园网举例,进行详细的说明讲解,使我们对逻辑地址和物理地址、子网、子网掩码等概念有了明确清晰的认识。开始很多概念对我来说都很陌生,但是短短两节课后,我便记住了它们,所以这一课是我觉得收获颇多,受益匪浅。
最后,我们对计算机网络的应用也有了进一步的了解。计算机网络的应用虽然已经渗透到生活的方方面面,但是在学习本课之前,很多人把对网络的认识还仅仅停留于浏览网页、收发邮件、网络聊天或游戏等日常生活的使用功能上,其实计算机网络的用途还有:资源共享、提供强大的通信手段、远程信息访问、娱乐、电子商务、远程教育、视频会议等。因此,我们也可以把所有的应有可以归结为资源共享、数据通信和分布式处理与分布式控制。
通过本课的学习,我对计算机网络的认识从最初接触得感性认识,也上升为现在较为理性的认识。计算机技术和通信技术的相互结合和迅速发展,产生和推动了网络的发展。当今社会
是信息化的社会,计算机网络是信息化的基础,在日常工作和生活中得到了广泛的应用。国际互连网Internet更是日益发展,并被人们所认识和使用。应用需求始终是推动技术发展的根本动力。作为高度综合各种先进信息技术的计算机网络,正是在人类社会信息化应用需求的推动下迅速发展起来的;而计算机网络也正是通过各种具体网络应用系统来体现对社会信息化支持的。比如我们专业所涉及的各种管理信息系统、信息检索系统等,因此,基于基本网络系统平台之上的各种网络应用系统已成为计算机网络系统不可分割的重要组成部分。因此作为一个信息专业的学生,这门课程对我们就是有着举足重轻的意义。
计算机网络的应用日益广泛、规模日益扩展而结构日益复杂。它是一种全球开放的,数字化的综合信息系统,基于计算机网络的各种网络应用系统通过在网络中对数字信息的综合采集、存储、传输、处理和利用而在全球范围把人类社会更紧密地联系起来,并以不可抗拒之势影响和冲击着人类社会政治、经济、军事和日常工作、生活的各个方面。因此,计算机网络将注定成为21世纪全球信息社会最重要的基础设施。
计算机技术的发展及网络技术的风靡,使我们的社会发生了翻天覆地的变化,人们的生活方式也有了很大的改变。作为新世纪的大学生,应该时刻走在时代的前沿,所以就更加需要我们了解并掌握计算机网络。我相信,计算机网络技术的发展将以其融合一切现代先进信息技术的特殊优势而在21世纪形成一场崭新的信息技术革命,并进一步推动社会信息化和知识经济的发展。因此,计算机网络也一定会遍及生活的每一个角落!
谈互联网对人们生活的影响及如何树立正确的价值观认识
互联网是以计算机通信技术为基本工具,通过开放式的网络进行信息获取、信息交换、信息发布而形成的一个方便快捷的庞大的信息传播平台。它一经出现,便以一种难以抵挡的神奇力量,潮水般的席卷了这个世界。互联网的迅速发展,源自其独特的技术特性:一是数字化,任何信息都可以转化成数字进行加丁处理;二是网络化,能把世界各地的用户“一网打尽”,形成即时互联互通;三是高速化,强大的处理能力和极高的传输速度,把距离和时间瞬间融化;四是互动性,改变了传统的单向传播方式,实现了双向互动;五是海量化,带宽和容量很大,为信息洪流提供了充足的快速通道和存储港湾。
互联网,简单的说就是一个由各种不同类型,,独立运行和管理的计算机网络组成的世
界范围的巨大计算机网络。
互联网的出现与发展,将人类带入了数字化时代,拓展了人类的第二生存空间——网
络社会。在这里,强调以“自我”为中心,个性的张扬,平等的交流,避免了直面交流的摩擦与伤害,满足了人们追求便捷与舒适的享受。
互联网是全球性的。按照“包交换”的方式连接的分布式网络。因此,在技术的层面上,互联网绝对不存在中央控制的问题。也就是说,不可能存在某一个国家或者某一个利益集团通过某种技术手段来控制互联网的问题。在互联网上绝对不能出现类似两个人同名的现象。这样,就要有一个固定的机构来为每一台主机确定名字,由此确定这台主机在互联网上的“地址”。然而,这仅仅是“命名权”,这种确定地址的权力并不意味着控制的权力。负责命名的机构除了命名之外,并不能做更多的事情。
互联网是开放性的。互联网上全球各种信息汇集、古今中外各种文化共存。它是一个
随时变换的开放信息系统。任何人只要遵守一定的协议,随时随地都可以从网上获取自己所需的任何信息。网络成为信息的万花筒,使超地域的文化沟通变得轻而易举,它带来了网络文化的多元化,既拓宽了人们的视野。
互联网是虚拟性的。网络的虚拟性表现在网民身份“隐形”、网络空间“虚拟”、网络
实际运行“无序”。网络通过其互联关系构成了一个社会,创设了一个虚拟空间。人的世界在互联网上发生了异化。互联网的虚拟性,给人们带来了巨大的表现空间,可以自由自在的发表自己的言论,把自己的内心世界表现出来,让我们有一种不同于现实世界的感受。
随着信息产业的高速发展,人们对于信息的需求越来越多,互联网成为了最好的传播
媒体,它整合了报纸、广播、电视三大媒介的优势,实现了文字、图片、声音、图像等传播符号和手段的有机结合。互联网媒体传播速度快捷,信息来源广泛,制作发布信息简便。因此,互联网媒体可以随时发布新闻,尤其是在报道突发性事件和持续发展的新闻事件,互联网媒体的“刷新”更换功能比传播媒体的“滚动播出”更胜一筹。网络信息传播速度很快,具有很强的时效性。
互联网在给我们带来巨大便利的同时,也对大学生产生了一些不容忽视的负面影响。
诸如:一些学生上网成瘾,专注聊天、游戏、暴力、灰色信息,通宵达旦,久而久之,出现厌学、逃学或者是因学业不过关而被退学;一些人长期沉湎于网络之中逐步远离集体,走向孤独,既而形成消极的处世态度,出现明显的网络病症;因此我们要树立良好的上网观念,正确的利用互联网。
众所周知,互联网给人们带来了许多好处,如互联网获知场所的变化,获知时间的变化,获知观念的变化,获知内容的变化,有利于激活大学生的创新意识,便于大学生产生协同学习的观念,开阔大学生的视野,节约学习时间等。
大学生应该以学为主,全面发展.在大学里,有很多事要做.大学主要培养学生自学和自
律的能力.用心的话,学习是很紧张的,主要靠自己.大学生活应该是丰富多彩的,同时以学本领为主,为就业做准备.学本领包含很多内容:1 专业技能2 自学能力(接受新知识新技术的能力)3 创新能力4 交际协调能力.5 进一步学习的能力(考研).等.大学生应该是幸运的!!要么那么多的人走这条“独木桥”.工程师,经济师,讲师等职位一般只对有大学学历的人开放.没有一个特定的价值观。取决于你的认识,你认为大学应该谈一场轰轰烈烈的爱情,那就去找个人真心爱她。前提是你能完成足够的学分情况下。不然会物极必反,两头空。假使你认为大学就是用来学习的,那你就博览群书,图书馆永远是你最好的归宿,当然自己有电脑那更好,互联网是把双刃剑。最后的当然是最不可取的,游戏小说,尽数美丽,但烟消云散也只是瞬间而已,你留下了什么,到头来才发现,除了大把大把的时间不翼而飞,其他也所剩无几。
互联网也让人们产生依赖,觉得互联网是无所不能的,什么问题都可以解决,将老师学
校布置得作业都放到网上,找人代答。至于当代大学生应该怎么做,首先要认清互联网的价值,它是做什么的,那些该让它做,那些该自己做,如果事事依靠互联网,人的存在还有意义吗?互联网只是一个辅助工具,真正起作用的应该是人。
大学生的价值观与他的世界观人生观相互联系密不可分的,所以我们要树立正确的价值
观就首先我们要树立马克思主义世界观。
马克思主义世界观是迄今为止最科学的世界观。辩证唯物主义和历史唯物主义是马克思
主义的基石。具体问题具体分析是马克思主义的活的灵魂,解放思想、实事求是、一切从实际出发是马克思主义理论精髓。中国共产党运用马克思主义理论指导中国的革命和建设,实现了两次历史性的突破,一是确立了毛泽东思想,二是确立了邓小平理论。不好,但只要善于总结,举一反三,认识规律,就可以变坏事为好事,把工作做得更好。
其次树立正确的人生观。首先幸福是人生追求的目的。要追求幸福一不要拿自己的错误惩罚自己,二不要拿自己的错误惩罚别人,三不要拿别人的错误惩罚自己。人的一生应当是不断的快乐的积累才构成幸福。
其次选择高尚的人生观。人生观是可以选择的。不同的人生选择,决定着不同的人生。不同的选择表现出不同的人生态度,体现着不同的人生观。再次人应当追求高尚的品格。树立积极进取、乐观向上、厚德载物、自强不息的人生态度。
再者应该树立正确的价值观。我们当前在校大学生们正面临着人生发展的最为关键的时期。时代要求我们要在学习生活各方面全方位面对和思考如何正确处理个体与社会的关系等
一系列重大问题。我们要学会生存、学会学习、学会创造、学会奉献,这些都是我们将来面向社会和生活所必须具有的最基本、最重要的品质。其中,我认为最核心的就是学会如何做人,学会做一个符合国家繁荣富强与社会不断进步发展所需要的人格健全的人;学会做一个能正确处理人与人,人与社会,人与自然关系并使之能协调发展的人;做一个有理想、有道德、有高尚情操的人。一句话,做一个有利于社会、有利于人民、有利于国家的人。这就要求我们每个在校大学生,必须从现在做起牢固树立正确的人生价值观。价值观对我们大学生来说,也是一个几乎每时每刻都会碰到的问题。我们做事说话经常考虑:“有没有
用?”“有没有利?”“值不值得?”“用”、“利”、“值”是一种价值判断,我们赞美杰出人物的高贵品质时常说“比金子还珍贵”,我们指责某些人的不道德时,常说真“不值钱”。“金子”、“钱”是一种价值判断。
我们要正确地对待权力、地位、金钱。“我哪有什么财富呢?作为一个大学生,买不
起车,买不起房,学费都交得紧紧张张,日子过得紧巴巴的,你看人家”经常有人发出这样的感慨,其实我们对财富理解片面了。财富并不只是权力、金钱,它们只是财富中比较引人注目的一种而已。人的一生如潮起潮落,起仗难定,在潮头风光时要看到落到潮底的危险性,在潮底的时候则要有向高峰冲击的信心和行动。当年林肯一生坎坷,屡受挫折,谁相信这位鞋匠的儿子能成为历史上最伟大的总统之一呢?邓小平三起三落,当年人们“批邓”时,谁会想到若干年后,他为中国设计一副崭新的蓝图呢?比尔 盖茨中途退学时,谁会想到他能成为世界首富呢?这样的例子多得数不胜数,世界上什么样的奇迹都可能发生,其前提只有一点:我还活着,我要努力行动,我有信心,这是人一生中最最宝贵的财富。第二个重要的财富就是今天我们所拥有的一切,请万分地珍视它们!你没什么大出息,可是你毕竟考上了大学,前途光明。家很温暖——这份亲情是财富,终生值得珍惜。虽然你没有发财又很想发财,但没有去偷去抢去骗去胡作非为,勤俭持家,虽然不富裕,可还是乐于助人,亲戚关系融洽,同学朋友们喜欢与你在一起——这种善良品德、气节操守、为人处世也是你弥足珍贵的财富。我们也许没觉察到它们的重要,但它们终究会给你一份回报。第三,你的抱怨表示你对现状有所不满意,你在试图努力改变它们,在追求你想要的东西。这种欲望、上进心也是财富。也许现在的不如意、逆境、挫折乃至苦难都让你觉得难过,但这都是你的财富!人们常说,苦难是最好的大学,古今中外,凡成就大事业者,无一不是从苦难中走来的。在逆境中,我们会经受各种考验与锤炼,百炼成钢,成就我们非凡的意志品质和能力,“苦费
心志,劳其筋骨,增益其所不能”。逆境并不可怕,可怕的是你把它看成结局而不是过程。
还有一点比较重要,就是正确处理理想与现实的关系。人是生活在现实和理想、物质和
随着互联网的飞速发展,各行各业都已逐步建立了以网络为主的推广渠道,凭借网络信息化平台以达到企业更好的营销效果。网络推广已经成为企业营销的重要组成部分。而与传统的营销渠道相比,网络推广具有传统营销所无法比拟的优势,首先网络广告的传播范围很广,可以无地域性的让全世界的人了解到相关信息,其次,它的成本低,不用付出很大的经济代价,而且网络推广也没有时间的限制,可以随时随地的查看和发布信息,让意向客户可以轻松的寻找到您。
民以食为天,食品行业的前景是不言而喻的,相较于其他行业来说,食品行业的门槛较低,但是市场集中度不够,身处于互联网时代,您是要固步自封,还是要锐意进取?或许只是转变一下方向,就可能得到意想不到的效果。条条道路通罗马,在面对选择的时候,有的人会长途跋涉、马不停蹄,但却发现目标离自己依然遥不可及,之后就会抱怨感叹时运不济;有的人则可以轻松敲击键盘、享受惬意时光。因为他们已经志在必得,目标已经稳攒在手。其实成功和失败也只是一念之差。据了解,中国食品招商网—是目前国内最专业的食品行业招商信息平台,网站为各类食品生产企业、半成品原料供应企业、原材料提供商、食品包装生产企业、食品机械设备供应企业、各地土特产供应商、食品生产技术提供商、食品营销策划机构以及全国各地的食品代理商企业提供了 一个网上招商与采购的综合信息交易平台。网站全方位地满足了各类食品生产企业的招商、采购、技术合作、营销策划等多方面的需求!同时也给广大的食品企业提供了一个资源共享的平台,在这里您可以轻松的寻找到意向客户,方便的解决企业难题,提高企业知名度。
顺应现代的发展趋势,食品招商信息可以利用互联网来进行,乘物网络信息化之快车,在中国食品招商网的强大平台支持下,食品企业的所有招商与采购方面的问题都可以迎刃而解,开启网上运作新篇章,带领企业进入快速发展新时代!
关键词:彝文网页,网络爬虫,信息采集,信息抽取
1 概述
彝文和汉语一样, 是为数不多的自创性文字, 有着非常悠久的历史, 是完善发展且具有独特特性的少数民族文字。随着信息时代的到来, 特别是计算机在彝族地区的普及, 彝文也慢慢出现在网络里。彝文的信息化给用计算机软件实现彝文网页的自动采集和处理提供了可能, 如果可以实现彝文网页的自动采集和处理, 将会给彝文信息处理工作带来很大的便利, 进而可以建立彝文网页数据库, 给彝文信息处理打下坚实的基础。
目前国内外对于少数民族语言网络信息获取的研究已经取得了一定的进展, 特别是藏文、蒙古文等少数民族语言网络信息获取已经取得了一定的进展。但由于彝文文字与中文有很大的不同, 很多熟悉彝文的语言学专家不是很了解计算机技术, 而很多计算机方面的专家又不熟悉彝语。从而导致对于彝文网络信息获取平台的研究一直处于起步阶段, 需要更深入的研究。
2 彝文网页采集技术
当前彝文网络信息获取平台的研究主要集中在两个方面:一是网页信息采集技术;二是网页信息抽取技术。网络爬虫是彝文网页信息采集技术研究的重点;而基于正则表达式的方法则是彝文网页信息抽取研究的重点。
2.1 网络爬虫技术介绍
网络爬虫通常分为以下四种:通用网络爬虫、聚焦网络爬虫、增量式网络爬虫、深层网络爬虫。通用爬虫也称为全网爬虫 (Scalable Web Crawler) , 爬行对象由小到大, 即从部分URL爬行到整个Web, 而且能够自动获取网页中的信息, 通过网络爬虫技术对目标网站进行爬取, 通用爬虫抓取流程图如图1所示:
为了进一步提高爬取效率, 通用网络爬虫一般会采用一定的爬行策略, 常用的爬行策略有两种, 一是深度优先搜索策略;二是广度优先搜索策略。
2.1.1 深度优先搜索策略
深度优先搜索策略从最初的网页开始, 选择一个URL进入, 并分析此网页中包含的URL, 选择一个再进入。这样一个链接一个链接地抓取下去, 处理完一条线路之后才会继续处理下一条线路, 深度优先策略的设计简洁易懂。但是, 通过此策略抓取的深度将会直接影响到抓取的可靠性及有效性, 对抓取深度的把握是使用此策略的重点。所有, 通常不采用此策略。
2.1.2 广度优先策略
广度优先策略通过页面目录层次的深浅来爬行网页, 首先爬行较浅目录层次的网页。爬行完同一层次中的网页后, 再进入更深层继续爬行。此策略能够有效的控制页面爬行深度, 可以防止爬取到一个无穷深层分支时无法结束爬行的弊端。而且此策略方便实现, 对于中间节点的数量没有很大的需求, 存在的问题是需要花费一定的时间才可以爬行到目录层次很深的页面。
根据彝文网页数量较少等特点, 并通过对彝文语法结构的分析, 本文决定选用通用网络爬虫, 并采用广度优先策略。
2.2 基于正则表达式的信息抽取技术
正则表达式 (Regular Expression, 一般写为regex) 是一种逻辑公式, 它的作用是对字符串进行操作, 即用已经定义好的一些特定字符和这些特定字符的组合, 组成一个“规则字符串”, 通过此“规则字符串”来表达对其它字符串的一种过滤逻辑。
对于彝文网页文本的分析, 本文主要采用正则表达式的方法, 主要包括彝文网页预处理、URL抽取和正文文本抽取。
2.2.1 彝文网页预处理
彝文网页预处理包括两个步骤:彝文网页的规范化和噪声过滤。第一步是彝文网页的规范化处理, 即将彝文网页转换成规范的XML文档;第二步是彝文网页噪声的过滤, 除去彝文网页中包括注释、script、from、style、object等与正文无关联的网页节点。除去无用的空白符号, 删除无实际意义的嵌套标记, 如<a></a>等空标签。最后去除网页噪声, 即广告图片及和正文无关的网页链接等。
2.2.2 URL抽取
URL由协议头、端口号、网络域、查询、路径、页内片断等部分组成, 每一个组成部分都有既定的分隔符和其既约的合法字符。URL的组成规则是一种特定的匹配方式。与此同时, 网页中超链接很容易识别, 因为它的组成有明确的标记, 即<a>与</a>, 标记<a>与</a>之间的内容称为锚文本, 锚文本即是用户浏览到的文字;实际的超链接地址存在于标记a的属性href中, 它把每个超链接片断限定在一个有界的区域中。所以, 抽取网页所有超链接可以通过正则表达式和超链接标记的方式对网页全文进行模式匹配。
3 彝文网络信息获取平台的实现
彝文网络信息获取平台主要包括彝文网络信息采集和彝文网络信息处理两个模块。采用微软公司的面向对象的C#语言开发, 并选用关系数据库ACCESS作为后台数据库。
彝文网络信息获取平台可以划分为彝文网络信息采集模块和彝文网络信息处理模块两部分, 如图2所示。
3.1 通用爬虫模块
通用爬虫模块的主要功能是从网络上抓取彝文网页, 本文以中国彝学网 (http://222.210.17.136:81/zgyx/index.html) 为例进行抓取。
第一步获取中国彝学网网页首页地址, 进而可以获取该页面的全部有效的URL, 最后将全部有效的URL添加到ACCESS数据库中, 主要代码如下:
string html=http.Get Html (url) ;
List<string>url List=get Url List (html) ;
int Count=Add Url (url List) ;
通用爬虫对中国彝学网网页抓取后, 已经把全部有效的URL保存到ACCESS数据库中, 下一步的工作是要进行网页筛选。
3.2 网页筛选模块
通用爬虫在遍历整个中国彝学网网页时, 会对每一个新的网页都进行遍历, 这样不可避免的会搜索到非常多重复的彝文网页。与此同时, 也可能会获取到一些错误或不完整的网址。但因为通用爬虫没有排除重复网页、不完整和错误网址的功能, 所以, 需要通过网页筛选模块来做此工作, 从而增强网页搜索的准确性和有效性。网页筛选模块采用正则表达式来匹配中国彝学网网址, 同时去除获取到的不完整、错误的网址或重复的网址。主要代码如下:
通过网页筛选模块, 去除了通用爬虫模块获取到的不完整、错误的网址或重复的网址, 下一步便可以进行网页信息抽取。
3.3 网页信息抽取模块
由于彝文网络信息在信息时代越来越重要, 彝文网页信息抽取获得了很多专家的关注。彝文网页信息抽取技术指的是通过对HTML网页的解析, 抽取彝文网页中有价值的彝文信息, 然后进行结构化存储的一系列技术的总称。
在对采集的彝文页面信息进行解析的基础上, 网页信息抽取模块将对彝文网页中文章的标题、发布时间、内容等进行抽取。网页信息抽取模块的主要代码如下:
3.4 数据存储模块
数据存储模块将抽取到的彝文网页中文章的标题、发布时间、来源及其对应的URL等信息存储到ACCESS数据库中, 并保存到以ID命名的TXT文档中, 这些文档被统一存放到文件名为“文章”的文件夹中。数据存储模块的主要代码如下:
3.5 界面设计
本彝文网络信息获取平台采用C#设计界面, C#是一种可视化的程序设计语言, 系统界面的设计遵循以下原则:
(1) 桌面软件界面设计原则。桌面软件界面可以给用户带来丰富的体验感, 具有较好的交互性。
(2) 简洁原则。C#可以采用Windows窗体和控件, 用它们进行界面开发, 可以为用户展示美观而又简洁的界面。
彝文网络信息获取平台可以获取彝文网页中文章的标题、发布时间、来源及其对应的URL, 并且通过对标题的搜索可以快速找到想要查询的信息。图3为彝文网络信息获取平台的主界面:
双击采集列表可以显示获取文章的详细信息, 包括ID、标题、来源、发布时间、对应的URL及网页内容。如图4所示:
网页采集的同时, 会将所获得的网页信息保存为以ID命名的TXT文档形式, 所有的TXT文档都存放在一个叫“文章”的文件夹中。
3.6 实验结果分析
彝文网页信息抽取效果评价的两个主要参数是召回率 (Recall Rate) Re和查准率 (Precision) Pr, 公式如下:
因为是在中国彝学网内部进行抓取, 所以本平台在性能测试时, 相关文档总数等于文档总数, 即Re=Pr。
在如下平台中测试本平台的性能:测试机器的CPU为3.6GHz, 内存8.0G, 操作系统是Windows 7。运行环境为Visual Studio 2010, 数据库是Access2003, 程序语言使用C#。实验数据来源于中国彝学网 (http://222.210.17.136:81/zgyx/index.html) 截止到2014年12月11日的网页信息。实验结果如表1所示:
表1中:N表示文档总数;E表示采集的相关文档数;T表示抽取时间;Re表示召回率;Pr表示查准率。
实验结果表明, 本彝文网络信息获取平台可以有效地完成彝文网页信息抽取工作, 采集、抽取花费的时间短, 准确率高, 基本上达到了实验预期目的。
4 结语
彝文网络信息获取平台是一个基础性的平台, 随着彝文网络信息应用的发展, 该平台也必将随之发展和完善。本彝文网络信息获取平台虽然实现了彝文网络信息采集处理的基本功能, 但还存在彝文网页信息解析不够智能等问题。在以后的工作中还将对基于用户学习机制的智能化网页解析和彝文信息抽取方案等方面展开更深入的研究。
参考文献
[1]朱建军.三十年来国内彝文研究综述[J].中国文字研究, 2006:042.
[2]陈顺强.信息处理用彝语词法分析研究[J].西南民族大学学报:自然科学版, 2013, 39 (4) :639-642.
[3]林春, 王嘉梅, 张建营, 等.彝文网页敏感信息监测系统的研究[J].中国新通信, 2013, (24) .
[4]孙立伟, 何国辉, 吴礼发.网络爬虫技术的研究[J].电脑知识与技术, 2010, 6 (15) :4112-4115.
[5]Diligenti M, Coetzee F, Lawrence S, et al.Focused Crawling Using Context Graphs[J].VLDB.2000:527-534.
[6]赵茉莉.网络爬虫系统的研究与实现[D].成都:电子科技大学, 2013.
[7]Broberg N, Farre A, Svenningsson J.Regular expression patterns[J].ACM SIGPLAN Notices.2004, 39 (9) :67-78.
[8]杨威.基于正则表达式的Web信息抽取系统的研究与实现[D].西安:西安电子科技大学, 2011.
[9]赖勇浩, 谢赞福.防干扰的不良网页过滤算法研究[J].计算机工程, 2007, 33 (11) :98-99.
[10]李魁, 程学旗, 郭岩, 等.WWW论坛中的动态网页采集[J].计算机工程, 2007, 33 (6) :80-82.
[11]游安弼.用C#二次开发UG NX[J].现代机械, 2007 (02) :79-82.
摘 要:文章针对政法系统各职能部门之间长期存在的各自为政的局面,提出了构建一个统一的信息共享平台。平台的网络架构有很强的灵活性、可扩展性和安全性,系统的建设还兼顾了实用性、易用性、通用性和可监控性。通过共享平台的建设达到了政法系统各职能部门信息交换、资源共享、业务联动、综合利用的目的。
关键词:政法信息;共享平台;网络架构;安全部署
中圖分类号:TP274.2 文献标识码:A 文章编号:1006-8937(2016)24-0103-02
1 背景概述
在自动化和信息化并存的时代,信息与数据的自动共享与交换已经轻而易举。政法职能部门例如法院、检察院、公安、司法等政法部门都已经拥有本部门的信息系统办公平台,各部门的信息资料得到了集中性的管理,并且信息的存储量非常大。在一些部门的工作中需要向其他部门采集相关的信息资料[1]。
政法系统中各单位已经建立了多个信息管理系统,这些系统在单位内已经进行了有机整合,但单位间仍处于隔断状态,形成单位间封闭独立运行,能耗较大、运行费用较高[2]。
由于是政法系统各部门的综合信息平台,数据来源多样[3-4]。这就要求系统能够通过软硬件的结合提供处理各种数据的能力,在网络构建时就需要通过设置相关的服务器来实现对用户需求的扩展,如给管理员提供了监控应用及数据库服务器,针对大量的图片信息提供了搜索及图片服务器,对ETL提供了数据抽取前置服务器等。如果今后对信息共享平台的功能需求增加了,只要增加相应的软硬件即可实现对功能的扩展[5-6]。
为了实现本共享平台的建设目标,需要实现如下建设内容。
1.1 实现数据统一集中管理
在共享平台门户上建立一套完整的数据安全管理体系,通过数据保护、授权使用、身份认证、安全审计、数据备份等技术手段,避免出现共享信息泄露、违规使用和数据遗失的情况。
1.2 实现高级别安全机制
政法信息共享平台对系统的安全性要求是非常高的,除了通过设置防火墙和安全网关来保护系统的安全外,平台还采用统一的身份认证和单点登录方式来保证安全[7-8]。为了确保用户账号的使用安全,每次登录必须填写发送到绑定账号手机的随机短信验证码,验证通过后才能成功登录[9-10]。
2 网络架构的设计
政法信息共享平台的网络拓朴结构,如图1所示。平台通过政法专线接入各职能部门。数据到达后要经过防火墙和安全网关的过滤到达门户服务器,保证服务器的安全运行。门户服务通过与ETL(Extraction-Transformation-Loading提取、转换和加载)服务器、搜索服务器、图片服务器相互协作完成数据处理功能,最终的数据存储在磁盘阵列中。
本系统采用由软硬件支撑层、数据共享层、应用平台门户、安全平台(边界保护安全隔离层)组成的多层平台体系结构,通过对多层平台的搭建即可以使日常复杂的计算机管理及维护变成简单化,又可以轻松搭建其他子系统,使管理计算机、管理系统软件,变得轻而易举。多层平台的体系结构可以综合管理计算机硬件、操作系统、数据库、JavaEEServer等,使管理变得统一有序,调整资源变得傻瓜化。该平台建成后,用户和技术人员就可以在平台上搭建各自的系统,同时该平台为各个系统提供统一的单点登录功能,并可以与政法系统各职能部门进行网络对接。
政法信息共享平台的建设大致包括平台门户的设计、数据共享层的设计和软硬件支撑层的设计。
2.1 平台门户设计
平台门户是共享平台统一对外的应用和管理入口,集成身份认证、综查服务、请求接口、数据监控、用户权限、数据备份等模块。
2.2 数据共享层设计
数据共享层将法院数据、司法行政数据、检察院数据、监狱数据、国家安全数据、劳教(戒毒)数据、公安数据实现同步整合,并提供给平台门户使用。
2.3 软硬件支撑层设计
主要包括支持数据清洗、转换、同步和整合的ETL工具、需要配置的硬件设备及其拓扑设计。
3 网络架构的实现
3.1 硬件配置
政法信息共享平台包括网络交换机1台,安全设备2台,服务器4台及存储器1台,详细硬件配置,见表1。
3.2 软件功能模块
政法信息共享平台根据需求分析划分出下列功能模块。
3.2.1 信息共享资源库
通过ETL工具将政法部门的资源数据全量抽取、清洗、转换、加载和整合到信息共享资源库集群中,并同时支持大数据的实时同步入库和普通定时入库两种增量抽取方式,实现数据同步。
3.2.2 身份认证
门户采用统一的身份认证,单点登录方式,为了确保用户帐号的使用安全,每次登录必须填写发送到绑定帐号手机的随机短信验证码。
3.2.3 综查工具
将信息共享资源库的政法信息归类索引起来,提供Web访问方式,实现全文模糊关联查询,并且可对结果数据集进行高级条件筛选。
3.2.4 数据监控
提供数据交换服务和数据同步服务的运行监控,监控ETL工具对各个异构数据库的抽取、清洗、转换、加载和整合的实时记录,监控增量数据同步入库统计(标记异常情况)等。提供安全审计日志,可查询用户的历史访问和操作日志记录等。
3.2.5 数据备份
采用备份ETL的抽取脚本方式,当出现数据损毁或丢失的情况,立即采用备份脚本重新抽取源数据,提供后台快捷备份和恢复功能。
3.2.6 用户管理
对用户账号、密码、姓名、联系电话、单位部门、用户角色、启用禁用等资料的CRUD管理。系统初始默认只有系统管理员,由系统管理员分配各个政法部门的用户权限。
3.2.7 角色权限
后台可以创建不同角色,每个角色设定不同功能单元、不同信息密级的使用权限。
3.2.8 信息密级
分别包括信息源分类表格的密级权限和數据表内单元数据的密级权限。
3.2.9 系统配置
包括平台的一般配置(查询信息类别的开启屏蔽等)、平台维护状态(是否关闭)、系统备份/恢复操作等。
3.2.10 服务接口
需要为公安部门的“人口信息”、“旅客住宿登记信息”的信息共享设计请求接口服务的方式提供查询服务。可调用国家安全部门的“港澳通行证信息”的服务接口在门户上提供查询服务。还能连接短信平台接口,用于身份认证时发送随机短信验证码所用。
4 结 语
现阶段政法系统各职能部门之间的信息数据交换多为人工方式或者接口定制开发。对交换共享出去的数据无法做到有效监控和管理,这样无疑是加大了工作的成本与时间,也无法实现部门与部门之间信息的迅速查询需求。
要实现政法各职能部门信息资源的互通共享、安全可靠的目的,前提条件是做好政法信息资源规划,建立信息系统的功能模型和数据模型。政法信息共享平台以信息互通、资源共享、业务联动、综合利用为建设总目标,在政法系统中实现了共享数据的网络接入、集中、更新维护和长效管理,大大提升了政法系统各部门的协作能力和工作效率。
参考文献:
[1] 王黎明,王红萍,张永峰.面向指挥信息系统的数据挖掘模型研究[J].微 处理机,2011,32(1):48-49.
[2] 张亮.基于公安情报的物联网信息挖掘技术研究[J].江苏警官学院学 报,2013,28(3):103-106.
[3] 曹胜华.集团企业网络架构及安全部署的设计与实现[D].长沙:中南大 学,2010.
[4] 翟东升,禾文汇.异构专利数据源集成方案设计与实现[J].现代图书情 报技术,2010(9):67-73.
[5] JonCroweroft.TowardanetworkarehiteeturethatdoesverythingConununieati
-ons[J].2008-3-21.No.1,Vol(51),74一77.
[6] 邱早丰.大型企业信息化应用系统网络平台研究[J].电子工程师,2008,
(8)
[7] 裴志宏.企业级网络构建与安全整体解决方案[D].成都:电子科技大
学,2009,(11)
[8] 陈兵,邹翔,周国勇.网络身份管理发展趋势研究[J].信息网络安全,011,
(3):5-8.
[9] VedPKafle,HldeklOtusukl,MasuglInoue.AnID/Locatorsplitarchitecturefo
rfu-turenetworks.IEEECommunicationsMagazine,2010,48(2):138-144.
【对网络信息平台的认识】推荐阅读:
社区服务信息网络平台01-27
谈谈对网络工程专业的理解和认识11-03
信息时代网络的利弊12-30
网络环境下图书馆信息服务的发展趋势05-31
公共信息网络发布信息保密管理规定07-20
互联网时代的网络信息安全看法及建议11-23
[信息技术论文]网络教学实践前后的思考11-26
浅淡信息技术教学中应用网络的重要性12-09
计算机网络信息安全存在的威胁探析论文12-26
网络信息检索与技巧05-27