系统分析与设计试卷

2024-10-10 版权声明 我要投稿

系统分析与设计试卷(精选7篇)

系统分析与设计试卷 篇1

关键词:试卷分析,功能模块,决策树算法

1 引言

在高校的日常教学管理中, 考试是一个非常重要的环节。而试卷数据经过分析处理可以提供许多重要信息, 对指导教学, 提高教学质量等具有重要意义。目前多数高校学生规模膨胀迅速, 考生数量大时, 试卷处理工作量非常大, 教师只能简单地提供考生成绩, 多数情况下试卷分析工作就难以展开[1]。针对上述试卷分析的研究现状, 我们设计实现了一套基于B/S的试卷分析系统。将计算机信息化技术引入到学生成绩统计和试卷分析领域, 利用计算机的优势, 减轻工作负担, 提高工作效率, 以完善教学和管理。

2 系统功能分析与设计

根据试卷分析的实际需求, 本系统设计时被划分成以下功能模块。系统功能结构设计如图1。

主要模块分析如下:

2.1 用户管理模块

用户登录系统, 根据要求输入个人信息, 输入方式对用户来说应该简单、方便, 并且提供完善的数据验证功能, 以保证信息输入的规范性和准确性。用户分为管理员和普通教师。管理员已经给普通教师分配相应用户名和初始密码。

2.2 试卷信息管理模块

(1) 试卷信息录入。试卷信息录入要求用户录入本次考试的基本信息:如学科名、试卷总分、试题总数、教师姓名、考试院系、主观题总分、客观题总分、考生人数、班级名称、考试时间、学分、学时、课程号、以及试卷各题的类型与总分等。

(2) 试题信息录入。输入已打开试卷或刚创建试卷的试题结构信息, 输入每个大题的类型、总分。如果需要得到更加详细的分析结果, 可将试卷中每个小题的信息录入。

2.3 试卷成绩管理模块

在创建好的试卷信息基础上, 录入该班级每个学生在本课程考试中每题的详细得分, 并由系统自动计算出总分, 并加以实时保存。对已有的学生姓名信息, 当进行再次分析时将其名单数据导入成绩表, 以减少用户对姓名输入的工作量。

2.4 试卷分析管理模块

(1) 成绩统计分析和试题分析。主要完成对学生最终总分成绩和标准分成绩的统计分析, 以查看个体在班级整体中成绩的实际情况。对不同题型的平均分、答对人数、难度系数、等进行单题分析, 以得出各类题型的考试效果。

(2) 试卷质量分析。按照经典测量理论进行试卷总体分析, 得出包括平均分、最高分、最低分、及格人数、优秀人数、及格率、优秀率、标准差、难度、区分度、信度等统计指标, 以验证考试是否符合教学要求。

3 系统关键技术介绍

下面对本试卷分析中决策树的应用进行举例说明。

决策树是最常用的数据挖掘技术, 在此系统中, 采用决策树算法对学生成绩进行数据挖掘, 找出不同课程之间的内在关联。

下面以大学某年级学生期末考试成绩为例, 如表1, 来说明决策树算法在成绩分析中的具体应用。

第1步:对数据进行规范化处理。第2步:选取训练实例集。第3步:利用信息增益度选取最能区别训练集中实例的属性[3]。第4步:创建一个树结点, 并创建该结点的子链, 每个子链代表所选属性的一个唯一值。第5步:将其它成绩作为检验集, 并用来检验所生成的决策树的准确度。

由此可构建出数据的决策树, 如图2所示。

由此可得:学生高等数学的学习程度将直接影响着其对大学物理的学习效果。哲学的学习对大学物理的学习也有一定的影响。因此教师在进行大学物理教学时, 应考虑学生的高等数学基础。高等数学程度较好而大学物理程度一般的学生应更重视哲学的学习。其他课程也可按照此方式通过分析学生考试成绩来发现相互之间的内在关联, 从而更加促进教学。

4 结语

本文首先介绍了当前试卷分析的现状, 然后针对整个系统的实现设计了该系统的各主要功能模块, 并对系统中决策树算法在成绩分析中的应用研究进行了分析。

参考文献

[1]黄颖, 林端宜.试卷分析研究现状综述[J].西北医学教育, 2005.

[2]李金平.考试质量分析[J].江南大学学报, 2004.

系统分析与设计试卷 篇2

【关键词】成绩管理;试卷分析系统;设计;实现

一、前言

随着教育事业的进步,自考过程的成绩管理与试卷分析工作变得更加艰难,在高效率、高要求的标准下,成绩管理与试卷分析系统成为了解决自考教学管理工作难点的重要工具。

二、网络环境下教育考试档案馆信息服务的优势

1.教育考试档案信息存取主动灵活。在网络环境下,考生用户与档案管理人员之间的关系将发生显著的变化,考生用户对档案管理人员的依赖和两者之间面对面的直接服务会逐渐减少。档案管理人员不再是被动地提供服务,而是主动地将档案信息存储、传递给考生用户。考生用户也可以完全根据自己的情况和需要,灵活地采用音频、视频等方式随时随地获取网上特定的教育考试的档案信息,从而满足自己的需要。2.教育考试档案信息管理高效智能。计算机和网络技术的支持,给教育考试档案信息管理带来极大的方便。它不仅能够解决档案馆馆藏数量不断膨胀带来的种种困难,还能改变档案馆传统的管理模式,促使档案管理从现今的以档案载体管理为主转变为以档案信息管理为主的格局。网络环境下的档案信息管理可以依托网络技术,借助计算机和各种现代化设备,实行网络化管理。教育考试档案网络化管理的实现,使教育考试档案的立卷归档工作都可以在网上进行。这样既能使档案人员从日益繁重的手工劳动中解脱出来,也能够实现教育考试档案的计算机排序、检索、借阅以及登记等智能化管理,教育考试档案馆的工作效率和工作质量必将大大提高。3.教育考试档案信息利用方便快捷。网络环境下建立的计算机档案信息检索系统,将大大提高教育考试档案信息的查全率和查准率,使档案信息资源得到较好的利用。

三、考籍档案电子化管理功能

1、日常的管理功能。自学考试考籍管理网络化系统的日常管理功能,主要包括统计、报表生成、查詢、打印课程合格证书等。因为这些项目转考、转专业、借考、免考、跨专业合并档案等均有论证性功能。致于统计、报表生成等功能,主要是统计在籍考生的人数、专业分布情况、考生的自然状况和统计各专业毕业生人数及自然状况并生成数据信息统计表,为考试管理部门的正确决策提供准确的数字依据。另外,日常管理中的查询功能。主要是对考生“电子档案”的各项信息随时调阅、查询,特别是在各省考办都使用统一的考籍管理计算机网络化管理系统后,对考籍管理中经常出现的诸如转考、借考及跨地区考试的情况,在办理转籍手续时,只需由转出地向转入地考试部门发送一个E-MAIL即可完成,这便使转籍手续的办理更准确、便捷和及时。

2、毕业生管理功能。检索、生成各专业毕业生名单,经严格审查后打印并制定毕业证书。其主要功能有:(1)无论是按专业管理还是按课程管理,电子档案系统都能对考生所考的全部课程进行自动检索,反映各科成绩情况,同时自动生成某一专业的毕业生名单。(2)制定毕业证书即考生“头像”档案库中提取考生“相片”及考生身份证号码后,采用统一的带有激光防伪标志的正文空白证书底样,毕业证书即制成。(3)积极研发并运用计算机汉字自动识别系统,以对自学考试毕业生的考籍档案进行审查,尤其是在对“电子档案”中考生试卷的汉字笔迹进行有效识别后,能进一步提高自学考试毕业生审定工作的准确性,减少人为误差。

3、毕业生信息咨询功能。该功能是指运用现代计算机网络技术,使自学考试管理部门和人才使用部门对自学考试毕业生档案信息资源实现共享。考籍管理中的“电子档案”一经建立,特别是自学考试毕业生档案信息库一经建立,就预示着它将产生重要的使用价值。由于计算机对所存储的每一个信息数据的检索,有着极为完整、准确、快速的功能,所以,它除了可随时为自学考试各管理环节提供所需要的指导性功能外,还可以为社会各行业提供大量有关的自学考试毕业生信息,为他们录用自学考试毕业生提供大量的人才资源。这样,就可极大地扩大考籍档案的使用价值。特别是随着计算机网络技术的日益普及,它作用更加明显。

四、对自学考试电子档案建设的思考

1、自学考试考生档案的数字化、传递网络化、存储海量化、服务自动化、信息共享化的巨大优势激发了自考界建设电子档案的热情。电子档案建设是一项庞大而又复杂的系统工程,而且需要巨额资金和高新技术作保证。在目前,自考界许多人都觉得建设数字档案所面临的主要困难仅仅是资金不足,其实电子档案的建设还处在探索阶段,除了存在资金不足的难题外,还有许多难题,其中既有技术因素,也有非技术因素。要实事求是地分析现状,逐步解决自学考试档案信息管理工程的数据压缩、数据组织、数据检索、海量信息存储与调配等技术和应用软件中存在的问题。2、做好电子文件的收集归档工作。电子档案的档案信息资源建设有两个方面:一方面是对考生档案的数字化处理;另一方面是做好电子文件的收集归档。对于后者它是今后电子档案建设的基础,做好电子文件的收集归档工作就成为电子档案建设的重要前提和步骤。因此,从现在起就要做好电子文件的归档管理工作,要对本地区各部门目前已经形成的应当归档的电子文件进行全面、系统地调查和了解并进行收集归档,还应采取相应的管理手段和技术措施以保证归档文件的真实、完整和有效。如果不采取有效措施做好电子文件的收集归档工作,就很容易使这些电子文件丢失或失真。做好电子文件的收集归档工作,不仅为数字化档案建设提供丰富的档案信息资源,而且还可以减少档案信息数字化的重复劳动。3、要求系统在设计之初应充分考虑到系统的安全应急措施、数据的异地备份等硬备份管理策略。同时要在网络的基础建设、系统升级、人文策略、系统权限等方面加强安全管理,保证档案电子数据的真实性、稳定性。

五、结束语

综上所述,成绩管理与试卷分析系统应用在自考工作中,可以提升管理水平,帮助自考办更好的掌握学生的学习情况和学习动向,能够更好的对学生信息的进行录入,同时也可以让学生方便地查询到自己的成绩。

参考文献

系统分析与设计试卷 篇3

一、概念题

1、语文课程资源

为语文教学服务的、有利于学生语文素养的形成和发展的校内、校外一切课程资源。

2、分解式目标

是按照“知识与能力”、“过程与方法”、“情感态度和价值观”三个维度进行设计,每个维度根据实际情况罗列若干小目标。

3、探究学习

在在教学中创设一种类似于学术(或科学)研究的情景,通过学生自主、独立地发现问题、实验、操作、调查、信息搜集与处理、表达与交流等探索活动,获得知识技能,发展情感与态度,培养探索精神和创新能力的学习方式和过程。

4、“三维目标”

“知识与能力”、“过程与方法”、“情感态度和价值观”。

二、简答题

1、语文课程的基本理念是什么?

全面提高学生的语文素养;正确把握语文教育的特点;积极倡导自主、合作、探究的学习方式;努力建设开放而有活力的语文课程。

2、什么是探究学习?请举例说明。

在教学中创设一种类似于学术(或科学)研究的情景,通过学生自主、独立地发现问题、实验、操作、调查、信息搜集与处理、表达与交流等探索活动,获得知识技能,发展情感与态度,培养探索精神和创新能力的学习方式和过程。举例略

3、你是怎样看待识字教学中的“复现”的?

在识字教学中采用各种方法进行“复现”,是识字教学的好方法。

•语文课程标准‣指出:“语文是实践性很强的课程。语文又是母语教育课程,学习资源和实践机会无处不在,无时不在。因而,应该让学生更多地直接接触语文材料,在大量的语文实践中掌握运用语文规律。”平常教师引导学生在生活中、在阅读中进行识字教学,就是一种很好的复现方式。

4、阅读教学应培养学生哪些能力?

•语文课程标准‣指出阅读教学应培养的能力是:使学生学会读书,学会理解;通过学生、教师、文本之间的对话,培养学生搜集处理信息、认识世界、发展思维、获得审美体验的能力,提高学生感受、理解、欣赏和评价的能力,使学生具有终身学习的能力。

5、“三维目标”整合有哪些策略?

三维目标的提出被认为是对过去教学大纲的最大发展,在“三维目标”整合时我们可以这样做:

1、重视情感态度和价值观的正确导向。

(1)明确“导向”的重点是“高尚的道德情操和健康的审美情趣”。(2)要重视熏陶感染、潜移默化,避免“贴标签”式的教育。(3)教师努力提高自身的语文素养。

2、关注学生的学习过程和学习方法。(1)多给学生听说读写的实践机会。

(2)善于将课内学习引向课外,将课外学习引入课内,有计划,有意识地做出安排,做好引导。

(3)课内的“扩展活动”和课外的综合性学习活动都要注意“量”的问题。

6、课程资源按获取途径分,有哪些种类?

分三种:一种是将课程资源直截了当的分为有形资源和无形资源。有形资源包括教材、教具、仪器设备等有形的物质资源;无形资源的范围更广,可以包括学生已有的知识经验、家长的支持态度和能力等。

一种是将课程资源分为素材性资源和条件性资源两大类。素材性课程资源包括知识、技能、经验、活动方式与方法、情感态度和价值观以及培养目标等方面的因素;条件性课程资源包括接决定课程实施范围与水平的人力、物力、财力和时间、场地、媒介、设施、环境,以及对于课程的认真状态等因素。

一种是将课程资源划分为校内资源、校外资源与网络化资源三大类。校内课程资源,主要是指本校教师、学生、实验室、教学用书等各类教学设施与实践机地。网络化资源主要是指以网络技术为载体开发的校内外资源。

三、观点辨析题

1、语文素养就是学生掌握的语文知识和语文能力。

错。语文素养是一种以语文能力为核心的综合素养,主要分为6个层次:必要的语文知识、丰富的语言积累、熟练的言语技能、良好的学习习惯、深厚的文化素养、高雅的言谈举止。

2、语文课程具有很强的实践性。

对。因为语言是一种约定俗成的社会现象,有不少语言现象,我们是很难从道理上讲得 清楚的。有些语言现象只能在反反复复的语言实践中掌握。

3、有观点认为,•语文课程标准‣淡化了语文知识的教学,这意味着语文知识教学不重要,语文知识教学是可有可无的。你怎么认为?

错。离开知识的能力是不可设想的,轻易否认语文知识对语文学习的指导和促进作用,容易使语文教学走向非理性主义的误区。在小学阶段,教学一定的汉字音形义的知识、常用标点知识、基本的语法和修辞知识等是非常必要的。

四、教学设计题

1、请写一两条解决“识字”与“写字”相结合的好方法。

答案参考:

1、营造轻松愉悦的识字写字氛围。

2、创设丰富多彩的教学情境,让学生在游戏活动中识字写字。

3、利用儿童的生活经验,将识字写字与学生生活、认识事物相结合。

2、北京将在2008年举办奥运会,请你以††奥运——北京‡‡为主题设计一个综合实践活动片段。

本设计题教师可根据自己特长自由发挥。

五、案例分析题

1、下面是一位教师执教•台湾蝴蝶谷‣的教学片段: 师:大家喜欢祖国的宝岛台湾吗? 生:喜欢。

师:在我们祖国的宝岛台湾有美丽的蝴蝶谷,大家听说过吗? 生:没有。

师:那老师今天就带领大家学习•台湾蝴蝶谷‣这一课,咱们现在就一块去认识这个闻名世界的“蝴蝶王国”,好不好?

生:好。

师:同学们,先让我们一起来欣赏美丽的蝴蝶谷是怎样的景象。„课件演示‟美丽的蝴蝶谷(生看画面)师:景色美不美? 生:美。(异口同声地说)

师:那么课文又是怎样描写的呢?让我们一起来读课文。(生读)

你认为这位教师的现代媒体使用恰当吗?请加以评述。

评析参考:在本案例中,教师使用多媒体组织教学,在激发学生的学习兴趣方面起了一定的作用。但并没有合理地使用教学媒体,以致于在教学中无法发挥教学媒体的优势。老师采用了先呈现画面,在读语言文字的方法,看上去是以画面理解语言文字,欣赏蝴蝶谷的美 丽景色,实质上是教学媒体替代了学生对语言文字的理解、感悟,限制了学生富有个性的想象,使学生的思维定格在画面上,不利于学生个性化阅读。语文学习应该提倡先阅读感悟,在学生有所理解、有所体验的基础上,借助教学媒体,加深学生头脑中的印象,引发情感上的共鸣,从而促进学生更深层次的感悟。

2、这是一位老师执教•早操‣巩固识字的片段:

师:请从“苹果树”上摘一个带有你认识的字的“苹果”贴到黑板上。(教师出示教具苹果树)

学生纷纷争抢“苹果”。(共10个字,没摘到字的同学又回到座位上)师:老师帮助你们贴到黑板上。(要贴的位置过高)生:“做操”贴到哪儿好呢?(还剩一个词语)师:大家一起看一看,贴到哪儿好呢? 生:贴在下边好!生:贴在题目旁边。生:……

师:还是贴在中间好一些。(教师把字贴在小露珠、小鸟、小蜜蜂画中间,形成环行板书)师:请把自己摘的苹果上的字领大家读一读。(学生依次领读词语)

你是怎样看待以上教学的?请发表你的观点。

评析参考:•语文课程标准‣倡导的自主在于学生有充分的时间读书,有足够的空间思考,有较多的机会实践。在此前提下自主选择学习内容、学习的方式、学习的伙伴,以饱满的情趣展开学习活动,才是有价值的。在本片段的识字游戏中,这种看似活跃的“自主”,其结果对于大多数学生来说是虚假的,是华而不实的自主。即使是参与活动的学生也不过随意摘抢一个而已,匆匆而过,期间又有多少思考与选择呢?摘抢后的支配权还在教师手中。

3、•找骆驼‣中,初读课文,了解课文大概意思后,教师提出:商人找到骆驼后,回来的路上再遇老人,会对老人说什么,你的理由是什么?学生通过自己读课文后,想法很多,例如:1、对老人说:“谢谢,对不起,我错怪你了。”2、不和老人说话,不理老人,自己偷偷走掉。3、一个老头,闲着没事干,出来瞎溜达啥?等等。学生说第一种想法时,教师引导他们从书上找理由,学生较快说出。当学生说到第二种想法时,教师问:“你的理由是什么?”

“这是一个忘恩负义的商人。”一生说。

“对,我童话书里看到很多商人都是坏蛋。”又一生说。

“那如果你看到这样的商人,你想对他说些什么呢?”教师试图通过这个问题让学生说出:“老人帮你找到了骆驼,你应该谢谢他。”之类的话,可是学生却说:“这个坏蛋,打他一拳,让所有人都打他一拳。”

……

用学习方式的有关理念对以上案例进行简单评析。

软考系统分析师下午Ⅰ试卷 篇4

阅读以下关于软件配置管理的叙述,回答问题1、问题2和问题3。

在—些大中型软件项目中,经常会出现一些混乱和差错,如版本错误、数据不一致等。在软件的开发过程中,随着工作的进展也会产生许多信息,如规格说明、设计说明、源程序、各种数据等,以及合同、计划书、会议录、报告等需要管理的文档。对于一个大中型软件项目来说,这些信息文档的数量可以达到几百个甚至上千个,如果没有一套严谨、科学的管理办法,出现混乱和差错几乎是必然的。软件配置管理为软件开发提供了一套管理办法和原则,以防止混乱和差错的产生,并且适应软件的各类变更。典型的配置问题有:多重维护、共享数据、同时修改、丢失版本号或者没有版本号。一般地,实施软件配置管理应完成以下几方面的任务:确定软件配置管理计划,确定配置标识规则,实施变更控制,报告配置状态,进行配置审核,进行版本管理和发行管理。

[问题1](12分)

(1)软件配置管理的一个重要内容就是对变更加以控制,使变更对成本、工期和质量的影响降到最小。用150字以内文字,说明软件配置管理中“变更管理”的主要任务。??(2)为了有效地进行变更控制,通常会借助“配置数据库”。请用200字以内文字,说明配置数据库的主要作用及其分类。

[问题2](7分

配置状态报告对于大型软件开发项目的成功起着至关重要的作用。请用200字以内文字,说明配置状态报告的主要作用及其包含的主要信息。

[问题3](6分)

软件的变更控制机制通常只能跟踪到工程变更顺序产生为止。为了获知变更是否正确完成,一般采用两种方法:正式的技术评审和软件配置审核。请用200字以内文字,说明这两种方法的区别和联系。

从下列的4道试题(试题二至试题五)中任选2道解答。如果解答的试题数超过2道,则题号小的2道解答有效。

试题二(25分)

阅读以下关于电子政务系统安全体系结构的叙述,回答问题1、问题2和问题3。

某城市计划建设电子政务系统,由于经费、政务应用成熟度、使用人员观念等多方面的原因,计划采用分阶段实施的策略来建设电子政务,最先建设急需和重要的部分。在安全建设方面,先投入一部分资金保障关键部门和关键信息的安全,之后在总结经验教训的基础上分2年逐步完善系统。因此,初步考虑使用防火墙、入侵检测、病毒扫描、安全扫描、日志审计、网页防篡改、私自拨号检测、pki技术和服务等保障电子政务的安全。

在—次关于安全的方案讨论会上,张工认为由于政务网对安全性要求比较高,因此要建设防火墙、入侵检测、病毒扫描、安全扫描、日志审计、网页防篡改、私自拨号检测系统,这样就可以全面保护电子政务系统的安全。李工则认为张工的方案不够全面,还应该在张工提出的方案基础上,使用pki技术,进行认证、机密性、完整性和抗抵赖性保护。

[问题1](8分)

请用400字以内文字,从安全方面,特别针对张工所列举的建设防火墙、入侵检测、安全扫描、日志审计系统进行分析,评论这些措施能够解决的问题和不能解决的问题。

[问题2](9分)

请用300字以内文字,主要从认证、机密性、完整性和抗抵赖性方面,论述李工的建议在安全上有哪些优点。

[问题3](8分)

对于复杂系统的设计与建设,在不同阶段都有很多非常重要的问题需要注意,既有技术因素阻力,又有非技术因素阻力。请结合工程的实际情况,用200字以内文字,简要说明使用pki还存在哪些重要的非技术因素方面的阻力。

试题三(25分)

阅读以下关于选择linux操作系统平台的叙述,回答问题1、问题2和问题3。

近年来linux的迅速发展,改变了操作系统市场份额的格局,虽然linux的市场份额在我国还不到10%,但已呈稳步上升的态势。针对这一情况,某大型企业(装机量大、信息化程度高)决定从战略层面上考虑linux在本企业的发展定位,为此,需要对linux及其典型产品进行测试和评估。假定由你担任这一评测工作的项目经理,你如何考虑以下问题。

[问题1](5分)

请用100字以内文字,说明你向企业决策层提交的评估报告应包括哪些主要方面的内容。

[问题2](6分)

采用linux时,安全性问题是必须慎重考虑的一个方面,通过研究,项目组认为开放源码和bug是linux自身特有的影响安全性的两个最主要方面。请仅就开放源码对安全性的影响,用150字以内文字,说明你的观点。

[问题3](14分)

请用400字以内文字,说明与目前广泛使用的windows操作系统相比,采用linux主要有什么优缺点?你如何看待目前基于linux操作系统的应用软件相对较少这个问题。

试题四(25分)

阅读以下关于数据仓库的叙述,回答问题1、问题2和问题3。随着计算机应用的不断普及,某集团公司先后建立了生产、销售、财务、人事管理等应用系统,并积累了大量的数据。面对日益激烈的市场竞争,公司领导希望建立一个分析环境,对积累的数据进行再加工,以支持高层决策。

公司技术部门的王总工程师提出建立一个数据仓库系统。他认为数据仓库能够将企业内部分散的、跨平台的数据重新组织与加工,建立数据仓库的最终目标是建立一个全面、完善的信息应用平台,利用该信息平台,进行数据分析和数据挖掘,支持公司高层的决策分析。

经过讨论,大家认为目前建立数据仓库需要完成的基础工作有:

(1)明确数据仓库的目的,了解公司的业务现状,特别要弄清数据源所在的系统和其中的数据状况。

(2)收集决策者的需求。分析领导的决策取向和当前最主要的工作目标,并初步建立系统的逻辑模型。

(3)构建数据仓库。包括数据仓库的设计、组织和管理以及决策信息的展示。

(4)数据仓库的应用推广和人员的培训。

(5)引进必要的产品和工具。

[问题1](7分)

在讨论中,有些工程师提出了不同的意见。有人认为由于缺乏经验,应该先建立小规模的数据集市,然后再升级到完整的数据仓库系统。

(1)请用150字以内文字,简要叙述与数据仓库相比,数据集市具有哪些特点。

(2)请用100字以内文字,简要说明这种开发方法的优缺点。

[问题2](12分)

王总工程师提出,对于数据仓库系统的开发,一般推荐采用增量的、演进的方式。请用200字以内文字,说明如何用增量的、演进的方式开发数据仓库系统。

[问题3](6分)

有工程师建议在数据仓库的模型中,采用db(源数据库)—ods(操作数据存储)—dw(数据仓库)的模式,以替代0b(源数据库)—dw(数据仓库)的模式,请用150字以内文字简要描述ods(操作数据存储)与dw(数据仓库)的最大差别。

试题五(25分)

阅读下列关于软件产品线方面的叙述,回答问题1、问题2和问题3。

a公司是一家中等规模的计算机企业,专门从事网络安全防护软件系统的开发。从最初仅开发基于windows的个人防火墙产品开始,现在已经延伸到基linux、windows系列、mac操作系统的个人防火墙、企业防火墙、入侵检测系统、病毒扫描系统、安全扫描系统等多种产品。公司原来的产品都是一个一个地开发,为每个软件对应地组织一个项目组。为了适应快速变化的市场,降低开发成本,公司想引入产品线方法。然而,软件产品线方法涉及了一个软件开发企业的多个产品,所以,公司的王总决定在弄清楚以下三个问题之后再做决定:首先就是本公司的业务范围是否适合使用产品线方法,其次是如何在原有产品的基础上建立产品线,最后是成功实施产品线的主要因素。

[问题1)(5分)

请用100字以内文字,说明a公司是否适合采用产品线方法,并说明理由。

[问题2](12分)

请用400字以内文字,说明在原有产品的基础上建立软件产品线的方式,并作简要评价。

[问题3](8分)

系统分析与设计试卷 篇5

课程编号 003023 拟题教研室(或老师)签名 马士英 教研室主任签名 课程名称(含档次)电力系统暂态分析(B卷)专业层次(本、专)本科 专 业

电气工程及其自动化 考试方式(开、闭卷)闭卷

一、判断题(下述说法是否正确,在你认为正确的题号后打“√”,错误的打“×”,每小题2分,共20分)

1、从严格的意义上讲,电力系统总是处于暂态过程之中。

()

2、无限大电源的频率保持不变,而电压却随着负荷的变化而变化,负荷越大,电源的端电压越低。

()

3、不管同步发电机的类型如何,定子绕组与转子绕组之间互感系数都是变化的。

()

4、对称分量法只能用于线性电力系统不对称故障的分析计算。

()

5、派克变换前后,发电机气隙中的磁场保持不变。

()

6、具有架空地线的输电线路,架空地线的导电性能越强,输电线路的零序阻抗越大。()

7、不对称短路时,发电机机端的零序电压最高。

()

8、同步发电机转子的惯性时间常数TJ反映了转子惯性的大小。

()

9、短路计算时的计算电抗是以发电机的额定容量为基准的电抗标幺值。

()

10、切除部分负荷是在电力系统静态稳定性有被破坏的危机情况下,采取的临时措施。()

二、单项选择题(在每小题的三个备选答案中,选出一个正确答案,并将正确答案的序号填在题干的括号内。每小题3分,共30分)

1、短路电流最大有效值出现在()。

A、短路发生后约半个周期时;

B、短路发生瞬间;

C、短路发生后约1/4周期时。

2、利用对称分量法分析计算电力系统不对称故障时,应选()相作为分析计算的基本相。A、故障相;

B、特殊相;

C、A相。

3、关于不对称短路时短路电流中的各种电流分量,下述说法中正确的是()。A、短路电流中除正序分量外,其它分量都将逐渐衰减到零;

B、短路电流中除非周期分量将逐渐衰减到零外,其它电流分量都不会衰减;

C、短路电流中除非周期分量将逐渐衰减到零外,其它电流分量都将从短路瞬间的起始值衰减到其稳态值。

4、不管电力系统发生什么类型的不对称短路,短路电流中一定存在()。

A、正序分量、负序分量和零序分量;

B、正序分量和负序分量;

C、零序分量。

5、在简单电力系统中,如某点的三序阻抗Z1Z2Z0,则在该地点发生不同类型短路故障时,按对发电机并列运行暂态稳定性影响从大到小排序,应为()。

A、单相接地短路、两相短路、两相短路接地、三相短路; B、三相短路、两相短路接地、两相短路、单相接地短路; C、两相短路、两相短路接地、单相接地短路、三相短路。

共3页第1页

6、发电机-变压器单元接线,变压器高压侧母线上短路时,短路电流冲击系数应取()。A、2;

B、1.8;

C、1.9。

7、电力系统在事故后运行方式下,对并列运行静态稳定储备系数KP(%)的要求是()。A、KP(%)>30;

B、KP(%)≧15~20;

C、KP(%)≧10。

8、下述各组中,完全能够提高电力系统并列运行暂态稳定性的一组是()。A、装设有载调压变压器、线路装设重合闸装置、快速切除线路故障; B、变压器中性点经小电阻接地、线路装设重合闸装置、快速切除线路故障; C、线路两端并联电抗器、快速切除线路故障、线路装设重合闸装置。

9、对于三相三柱式变压器,其正序参数、负序参数和零序参数的关系是()。

A、正序参数、负序参数和零序参数均相同;

B、正序参数与负序参数相同,与零序参数不同;

C、正序参数、负序参数、零序参数各不相同。

10、分析计算电力系统并列运行静态稳定性的小干扰法和分析计算电力系统并列运行暂态稳定性的分段计算法,就其实质而言都是为了求()。

A、t曲线;

B、Pt曲线;

C、故障切除极限时间。

三、问答题(每小题5分,共25分)

1、写出正序增广网络中,短路点串入的附加阻抗X在各种金属性短路故障情况下的表达式。

2、提高电力系统并列运行静态稳定性的根本措施是什么?具体措施有那些?(具体要求写出4种以上)

3、简单电力系统同步发电机并列运行暂态稳定的条件是什么?

4、写出电力系统中f点发生B相金属性接地的边界条件方程,并画出其复合序网。

5、采用重合闸可以提高电力系统并列运行的暂态稳定性,以下图所示的简单电力系统中f点发生单相接地短路为例,作图说明其工作原理。

四、作图题(9分)

画出下图所示电力系统f点发生金属性接地短路时的零序等值电路。

五、计算题(每小题8分,共16分)

1、用单位电流法计算下图所示网络中各电源与短路点之间的转移阻抗。(图中各元件参数为标幺值)

共3页第2页

2、系统接线如下图所示,设在一回线路始端突然发生三相短路,已知原动机机械功率PT1.5,双回线运行时系统的功角特性为PI3sin,切除一回线路后系统的功角特性为PIII2sin。试求极限切除角c.m?(15分)

共3页第3页 长沙理工大学标准答案纸

课程名称:

电力系统暂态分析

专业、班级:电力本科

一、判断题(下述说法是否正确,在你认为正确的题号后打“√”,错误的打“×”,每小题2分,共20分)

1、从严格的意义上讲,电力系统总是处于暂态过程之中。

(√)

2、无限大电源的频率保持不变,而电压却随着负荷的变化而变化,负荷越大,电源的端电压越低。

(×)

3、不管同步发电机的类型如何,定子绕组与转子绕组之间互感系数都是变化的。

(√)

4、对称分量法只能用于线性电力系统不对称故障的分析计算。

(√)

5、派克变换前后,发电机气隙中的磁场保持不变。

(√)

6、具有架空地线的输电线路,架空地线的导电性能越强,输电线路的零序阻抗越大。(×)

7、不对称短路时,发电机机端的零序电压最高。

(×)

8、同步发电机转子的惯性时间常数TJ反映了转子惯性的大小。

(√)

9、短路计算时的计算电抗是以发电机的额定容量为基准的电抗标幺值。

(√)

10、切除部分负荷是在电力系统静态稳定性有被破坏的危机情况下,采取的临时措施。(√)

二、单项选择题(在每小题的三个备选答案中,选出一个正确答案,并将正确答案的序号填在题干的括号内。每小题3分,共30分)

1、A;

2、B;

3、C;

4、B;

5、B;

6、B;

7、C;

8、B;

9、B;

10、A。

三、问答题(每小题5分,共25分)

1、写出正序增广网络中,短路点串入的附加阻抗X在各种金属性短路故障情况下的表达式。答:

三相短路:X=0;单相接地短路:XX(2)X(0);两相短路:XX(2);两相短路接地:XX(2)X(0)X(2)X(0)。(答对一项得1分,全部答对得5分)

2、提高电力系统并列运行静态稳定性的根本措施是什么?具体措施有那些?(具体要求写出4种以上)

答:

提高电力系统并列运行静态稳定性的根本措施是缩短“电气距离”。具体的措施有:

1)采用分裂导线

2)线路串联电力电容器;

3)采用先进的励磁调节装置;

4)提高输电线路的电压等级;

5)改善系统结构和选择适当的系统运行方式;(答对一项得1分,答对4项以上得5分)

3、简单电力系统同步发电机并列运行暂态稳定的条件是什么?

共4页第1页 答:

简单电力系统同步发电机并列运行暂态稳定的条件是受扰运动中加速面积小于最大减速面积。

4、写出电力系统中f点发生B相金属性接地的边界条件方程,并画出其复合序网。答:

1)电力系统中f点发生B相金属性接地的边界条件方程为:

Ufb(1)Ufb(2)Ufb(0)0、Ifb(1)Ifb(2)Ifb(0)(2分)

2)复合序网如下:

(3分)

5、采用重合闸可以提高电力系统并列运行的暂态稳定性,以下图所示的简单电力系统中f点发生单相接地短路为例,作图说明其工作原理。

答:

正常运行、单相接地短路、故障线路切除后和重合闸成功后发电机的功角特性分别如下图中曲线I、II、III和Ⅳ所示。无重合闸时的情况如图A;有重合闸时的情况如图B。

(4分)

由图可以看到有重合闸与无重合闸相比最大减速面积增大了Sfghh,根据电力系统暂态稳定的条件可知,采用重合闸装置可以提高电力系统并列运行的暂态稳定性。

(1分)

五、计算题(每小题8分,共16分)

1、用单位电流法计算下图所示网络中各电源与短路点之间的转移阻抗。(图中各元件参数为标幺值)

共4页第2页 解:

在下图中设电流I11,则

UUabUaj1、I2

2、I4I1I2

3、UbUaI4j1j1j3j4、I38j0.5j0.5II

11、EUIj0.5j4j5.5j9.5 If34fbf由此可得:

x1fEfI1j9.51j9.5、x2fEfI2j9.52j4.75、x3fEfI3j9.58j1.1875

2、系统接线如下图所示,设在一回线路始端突然发生三相短路,已知原动机机械功率PT1.5,双回线运行时系统的功角特性为PI3sin,切除一回线路后系统的功角特性为PIII2sin。试求极限切除角c.m?(15分)

解:

作出正常运行、故障时和故障线路切除后的功角特性曲线如下:

(4分)

由正常运行状态求得:0sin1P0PI.Msin1PTPI.Msin11.533000.5233(弧度)(3分)

共4页第3页 根据故障切除后的功角特性曲线可得:

h1800sin1PTPIII.M1800sin11.52 131.42.2922(弧度)

(3分)

0则极限切除角

c.mcos1PT(h0)PIII.McoshPII.Mcos0PIII.MPII.M0

cos11.5(2.29220.5233)2cos131.4020 48.29

(5分)

0

通用试卷生成系统的设计与实现 篇6

关键词:试题库,遗传算法,组卷策略

考试是衡量教学质量的一个重要指标,考试的主要方式是试卷。传统的教师组卷方式存在着命题随意性大、评分标准不一和试题取样不合理的缺点。而且随着学生对知识面需求的增加和当前考试类型的不断多样化及考试要求的不断提高,教师的工作量将会越来越大,而试题利用率却很低。同时试题的质量及难易程度的人为因素较大,不够客观。为收集和规范管理试题,现在一般采用建立试题库自动组卷的方式。

试题库的主要功能有两部分,一是前期试题的收集,这是试题库建立的基础。二是基于试题库的试卷生成系统,这是试题库的直接应用,直接根据相应算法生成一套满足测试要求的标准试卷。这个功能就直接对试题的收集提出了标准化的要求。自动组卷系统是考试系统的重要组成部分,其核心是组卷算法的研究。

1 试题库的建立

1.1 试题库的优势

试题库使标准化考试进一步地完善,具有以下优点:

1)科学:以一定的测量模型为基础的试题库是依据测量学理论建立起来的试题的集合。特别是这些试题具有相应的测量特征参数,保证了每一道试题的测量作用有据可查。

2)有效:试题库是按照一定规则将试题组织起来的命题技术,有效的减少了专家命题的繁复劳动,也保证了高质量的试题能够得到可靠的重复利用,并为试卷质量分析提供了必要的技术支持。

3)稳定:利用试题库的规则统一、形式规范特性和一定数量的试题,可以高效地提取多套具有稳定的测量特征的试卷,保证了测试工作的顺利进行。

4)保密。

1.2 试题库建设的原则

试题库是一个试题群体,这些群体内部结构必须满足合理组卷要求。因此在选题时,必须考虑以下整体原则:1)有一个成熟、稳定、明确的考试大钢;2)有标准的试题来源;3)分值分配原则;4)题型的分配原则;5)难度系统分配原则。

1.3 试题库建立的步骤

试题库的建立是一个系统的工程,是不同学科的人员相互协调、相互工作的过程。不同阶段的工作需要不同的人员参与,由此可见,优质试题库的建设是一个艰辛、复杂而繁琐的过程,一般包括若干个阶段,如图1所示。

2 组卷算法

组卷系统的关键是组卷策略,也就是组卷算法,现有的大部分组卷系统根据其核心算法大致分为三种:以随机算法为主的自动组卷系统;以回溯试探法为主的自动组卷系统;以人工智能与信息处理方法为主的自动组卷系统。遗传算法作为人工智能中比较成熟的分支,具有内在的并行性,全局寻优和收敛速度快的特点,这些都适宜于处理试题库中的自动组卷的问题。

2.1 遗传算法理论

遗传算法(Genetic Algorithm,简称GA)是近年来迅速发展起来的一种全新的智能优化算法,作为一种随机的优化与搜索算法,遗传算法与传统的优化算法相比,具有鲜明的特点:

1)遗传算法以决策变量的编码作为运算对象。传统的优化算法往往直接运算决策变量的实际值本身,而遗传算法处理决策变量的某种编码形式,使得我们可以借鉴生物学中的染色体和基因的概念,可以模仿自然界生物的遗传和进化机理,也使得我们能够方便的应用遗传操作算子。

2)遗传算法直接以适应度作为搜索信息,无需导数等其它辅助信息。

3)遗传算法使用多个点的搜索信息,具有隐含并行性。

4)遗传算法使用概率搜索技术,而非确定性规则。

2.2 基本遗传算法描述

在实际应用中遗传算法的形式出现了很多变型,但这些遗传算法都有共同的特点,即通过对自然界进化过程中自然选择、交叉、变异机理的模仿,来完成对最优解的搜索过程。基于这些共同的特点,Goldberg总结了一种统一的最基本的遗传算法,该算法被称为基本遗传算法(SimPle Genetic Algorithms,SGA),SGA只使用了选择算子、交叉算子和变异算子这三种遗传算子,其结构简单,易于理解,是其它遗传算法的雏形和基础。本文所设计的遗传算法也基于SGA。

SGA的基本步骤如下:

1)初始化,产生足够数量的个体,组成种群;

2)计算群体上每个个体的适应度值;

3)按由个体适应度值所决定的某个规则选择将进入下一代的个体;

4)按概率Pc进行交叉操作;

5)按概率Pm进行突变操作;

6)若满足设定的终止条件,则执行(7),否则转到(1);

7)输出种群中适应度值最优的染色体作为问题的满意解或最优解。

遗传算法的终止条件可以设定为:

1)达到了预先设定的进化代数;

2)种群中的最优个体在连续若干代中都没有再获得改进;

3)最优个体达到预先设定的满意解。

典型的遗传算法的核心过程可以如下描述为:

{随机初始化种群P(0);t=0;

计算每个个体的适应值;

执行选择操作;

While(不满足终止准则)do

{执行重组;

执行变异;

计算个体的适应值;

保留最好解;

执行选择产生新的种群P(t+l);t+1;}

输出结果;}

3 基于遗传算法组卷

3.1 编码方法的确定

遗传算法首先要对实际问题进行编码,用字符串表达问题,这种字符串相当于遗传学中的染色体。每一代所产生的字符串个体总和称为群体。传统型遗传算法组卷在编码方式中采用的是二进制编码,其长度对应于试题库的长度,若该题选中,则该位对应1,反之为0。

3.2 适应度函数设计

适应度函数是用来评判试卷群体中个体的优劣程度的指标,遗传算法利用适应度值这一信息来指导搜索方向。在实际的应用中,适应度函数的选择是影响智能组卷算法性能好坏的关键,常用的适应度函数采用对各种约束条件进行重要性的衡量,以求取综合指标的重要性达到最大或综合指标误差达到最小。

根据组卷的各种约束条件,建立目标函数为误差函数:

其中fi(0≤fi≤1)为个体满足第i项组卷约束程度的归一化相对误差;wi(0≤fi≤1)为相应的误差权值系数;i为对应n项指标中的第i项。

另外,根据实际组卷经验,对不同的约束条件可给定不同的允许误差(0-5%),只要试卷个体满足第i项组卷要求的误差在容差范围内,即可认为fi=0,这样以加快搜索到优化解的速度。

由目标函数,可设计适应度函数:

该适应度函数能很好的进行遗传运算。

3.3 进化停止条件

1)进化中连续若干代中的最优个体不被替换所持续的代数超过某一设定值,则搜索停止。

2)固定最大遗传代数MaxGen。当算法进行MaxGen代遗传后停止。最大遗传代数MaxGen依赖于模型复杂度,由试题库中题目的个数与模型中约束条件的个数共同决定。

4 系统整体架构和开发环境

4.1 系统框架和目标

系统主要分为3个部分:用户管理,试题库管理和试卷生成。

系统功能说明:

1)系统管理员可以对整个系统进行维护,设置登录人员的权限。

2)相关教师可以对中心试题库进行数据维护。

3)编写科学的试题:建立试题库之前必须首先确定学科的知识结构,试题的组织与编写必须以学科的知识点结构为依据。试题数量要足够多,每题应具有难度系数、知识点、分数、考试时间等属性,以便满足试题生成的要求。

4)选择科学的试题生成方法:设计合理的试题生成算法,本系统采用遗传算法作为组卷算法。

4.2 开发环境综述

1)试验环境:CPU:AMD 2000+;内存:512M;硬盘:40G;操作系统:Windows 2000。

2)开发工具:系统数据库:SQL Server 2000;

系统开发工具:VC++6.0;Microsoft Word。

5 测试分析

通过组卷试验表明,当选择合适的参数,即交叉概率PC取0.4~0.8,变异概率Pm取0.001~0.01,群体规模取50~60时,最大进化代数为60~100时,用本文所设计的遗传算法可以有效解决组卷问题,很快找到满足用户要求的试卷。由于遗传算法实行了全局并行搜索,搜索空间大,并且在搜索过程中不断向可能包含最优解的方向调整搜索空间,从而易于找到最优解。从实验结果可以看出,遗传算法能有效地解决试题库智能组卷问题。

参考文献

[1]黄丽雯,陈渝光,刘巍.一种有效的试题库框架设计算法[J].计算机应用,2000(1):60-61.

[2]胡中锋,李方.教育测量与评价[M].广东高等教育出版社,1999:193-196.

[3]马世哗.试题库理论与目前我国试题库的发展状况[J].教育理论与实践,1996.

[4]林雪明.基于考查点的试题库组卷算法的建立[J].徽机发展,2001(2):77-79.

网络行为分析系统设计与应用 篇7

关键词:网络行为;系统设计;网络行为分析系统;海珠教育科研网

中图分类号:TP393 文献标识码:A文章编号:1673-8454(2009)10-0070-05

一、 海珠教科网概述

广州市海珠教育科研网建设项目是海珠区教育基础设施项目之一,是海珠区社会信息化的重要组成部分,具有网络管理功能及数据中心功能,此中心之上将为基础教育、职业教育、成人教育和教师继续教育等提供全方位的教育教学信息资源服务,为相应群体提供电子教学的平台及内容,并为各教育实体提供相应的管理平台。海珠区教育科研网中心将集网络管理及教育管理信息化、教育教学资源、教育行政信息、远程教育、教师培训、社区成人教育等应用项目于一体。

所有的海珠区完成校园网建设的中小学校、幼儿园与海珠教科网中心之间实现高带宽、稳定、安全的连接,广州市海珠教育科研网以1000M的裸光纤连接广州市教育科研网,教科网成为全区各中小学校、幼儿园校园网和直属单位网络的唯一出口。图1为广州市海珠教育科研网拓扑图。以下是海珠区教育信息化的建设情况:

1.基本情况

海珠区教育局下辖中学28所;小学72所;中职技校2所。学生总数10万多人;在编教师7000多人。

2.网络环境

全区各级学校中,92%可以通过宽带教科网接入互联网,8%的学校通过拨号接入海珠教科网。经过持续建设后,短时间内即可建成支持教育信息化应用的宽带网络基础环境。

3.硬件设施

全区计算机总数达16496台。实现总生机比10.88∶1,其中小学11.7∶1;初中10.24∶1;高中5.49∶1。已达到或超过“校校通”工程的要求。为全区教育信息化应用提供了基本的硬件基础。

二、网络行为分析系统总体设计

1.设计目标

(1) 功能要求

①实现海珠区教育科研网所有用户上网行为详细记录,为保障网络安全提供了审计数据基础。系统应实现对广州市“教育e时代”教育专网用户的上网行为记录、审计、统计与分析,能给教育行政部门提供了未成年人上网行为、热门网站、潮流行为及其网上兴趣爱好等重要基础信息、分析数据和具体分析结果,能在通过流行的信息网络加强未成年人思想道德教育工作上提供大量准确可靠的决策依据。

②从海量的上网记录数据中,按要求、按规则及时排查分析出不良上网行为的信息。根据海珠区教育科研网网络出口的统计数据,平均每秒在线并发连接数是12000,并发连接数峰值是16000。这样每天网络审计的记录都是海量数据,利用人工排查分析出不良上网行为几乎是不可能的。系统应能自动根据入侵检测规则、防黄规则、防毒规则和其它安全规则进行自动排查分析,从而准确地获得不良上网行为的记录信息。

③对网上不良行为、犯罪活动进行跟踪和追查。对网内用户或冒充广州市海珠区教育科研网用户,进行危害国家安全与社会稳定行为进行追查:如对信息网络中存储、处理或者传输的数据和应用程序进行删除、修改或者增加的;故意制作、传播计算机病毒等破坏性程序的;宣扬封建迷信、淫秽、色情、赌博、暴力、凶杀、恐怖、教唆犯罪等行为。我们都能利用网络行为分析系统对这些行为进行分析,并严密的监控和跟踪。

④建立市、区、校的教科网联防安全机制,形成广州市教育科研网络统一安全阵线。系统能与海珠区教育科研网中的IDS系统、网络安全审计系统和千兆防火墙实现安全联动。对多次追查并列入黑名单的用户和上网行为进行自动深入跟踪并做详细记录,发现有不法网上行为和操作时,应立即向“教育e时代”专网IDS系统、“教育e时代”专网CA认证系统和防火墙报警,必要时实现强硬安全措施,通过自动防火墙设置立即中断该网上行为和用户登录。与此同时,要将分析报告出现的网上不良行为自动报告广州市教育科研网入侵检测系统并报警,另外,能与各区教育科研网防火墙联动,实现市区联防。

(2)性能要求

①系统的稳定性和安全性。系统是面向海珠区教育科研网的所有用户,记录学生每分每秒的上网动作和具体信息。区教科网共有10万多用户,系统的记录、分析和处理并发量非常大,而且尽量避免出现错记和遗漏等现象。所以网络行为分析系统的设计必须能够根据需求,充分考虑用户的并发数量,提供高度的稳定性和安全性。

②安全联动性。网络行为分析系统发现预设的非法网上行为时,要及时向网络管理员报警,并自动进行安全联防动作,即向IDS系统和防火墙发出防范动作请求,由防火墙实施安全保护策略。

③可扩展性。学生网络行为分析系统要具备网络流量监控和各种上网行为控制功能的可扩展性能。例如:上网流量分析、上网时间分析、上网浏览网站类型分析和黄色网站、病毒、网络入侵分析等功能。

2.总体架构

网络行为分析系统的主要架构为B/S架构,无论是前台操作或是后台管理,全部操作均使用通用浏览器进行,保证系统易于操作、易于使用、界面友好。利用服务器端IIS将网站架构在Internet平台,主体程序使用J2EE、

Microsoft Active Server Page作为网站的主体编写语言,利用XML技术,结合电子身份认证系统(NETCA),并提供用户管理、系统管理、日志管理等功能,为用户提供了信息安全平台。

系统基于面向服务的架构(Service-Oriented Architecture ,SOA)使服务器作为网络行为分析系统的核心。服务器用开放式标准,并通过远程登录的后即可进行操作。系统应能与入侵检测、原有防火墙进行B/S方式的联动,是利用加密的SSL消息建立安全的连接,构建一个安全数据传输通道和基于ActiveX DLL数据库连接实现的,这个方法和基于SAML的安全性令牌不相关。通过配置不同的Credential Mapper和Identity Asserter对,可以支持其他的安全性令牌类型。

图2是针对海珠区教科网用户及管理员的数据交换图。网络行为分析系统的体系结构如图3所示。

3.模块分析

系统主要分为数据采集模块、预处理模块、数据包解码模块、主题分析模块、行为分析模块,各模块之间的关系图4所示。

(1) 数据采集模块

网络监听技术本来是提供给网络安全管理人员进行管理的工具,可以用来监视网络的状态、数据流动情况以及网络上传输的信息等。当信息以明文的形式在网络上传输时,使用监听技术进行攻击并不是一件难事,只要将网络接口设置成监听模式,便可以源源不断地将网上传输的信息截获。网络监听可以在网上的任何一个位置实施,如局域网中的一台主机、网关上或远程网的调制解调器之间等。

网络行为分析系统的工作方式是:将要发送的数据包发往连接在一起的所有主机,包中包含着应该接收数据包主机的正确地址,只有与数据包中目标地址一致的那台主机才能接收。但是,当服务器打开工作监听模式,无论数据包中的目标地址是什么,服务器都将接收(通过镜像口复制流经网关的所有数据)。

本模块实现的功能到Libpcap库流程的循环抓包前为止通过OpenPcap函数依次调用图5的Libpcap库中的函数。

(2)预处理模块

预处理程序的模块化,使得网络行为分析系统的功能可以很容易地扩展,用户和程序员能够将模块化的插件方便地融入网络行为分析系统之中。预处理程序代码在探测引擎被调用之前运行,但在数据包译码之后。通过这个机制,数据包可以通过额外的方法被修改或分析。使用Preprocessor关键字加载和配置预处理程序,SetPktProcessor函数实现数据包解码,根据Datalink(由上面的Libpcap库函数得到)的值来判断并关联解码,函数解码结构如图6所示。

(3)应用协议解析模块

应用协议解析模块是网络行为分析系统中的核心模块。本文实现的应用层协议识别是基于正则表达式的分组内容模式匹配。

该模块从正则表达式规则库中载入各种应用协议的正则表达式特征字,实时对分组内容进行匹配。本文目前实现的正则表达式规则库总共包含78种应用协议的特征字。

(4) 主题分析模块

主题分析功能模块主要实现的功能是,对一些统计分析主题进行常用统计、相关分析、聚类分析和判别分析等,从而得出科学的统计分析信息。这些统计分析信息主要是以排行榜和统计报表的形式显示。

一些分析主题的例子包括:学生最喜爱的网站排行、学生最喜爱的搜索引擎排行、学生最喜爱的栏目排行、学生最喜爱的论坛排行等。

1)学生网上流行前线:记录学生上网最关注的时事、体育、娱乐热点话题,在一个固定的时间(如一个星期,一个月)系统自动得出学生最关心的网上流行话题统计表,用户也可以自定义时间段得出所需要的统计报表。

2)学生最喜爱的网站排行:记录学生所有曾经浏览的网站的IP地址,统计每一个IP地址的访问总人次和访问频率。

3)学生最喜爱的搜索引擎排行:记录学生所有曾经访问的搜索引擎的IP地址、URL和引擎名称,统计每一个搜索引擎的总访问人次和访问频率。

4)学生最喜爱的栏目排行:收集学生较多关注的网站栏目,记录该栏目的网页URL,把不同网站同一类型的栏目当成一个栏目统计其访问总人次。

5)学生最喜爱的资源排行:统计学生较多关注的网络资源,如电影、动漫、连续剧、MP3等,统计每一类的访问总人次得出排行榜。

6)学生最喜爱的软件排行:统计学生所有曾经下载的软件,浏览学习或者下载过其教程的软件。

7)学生最喜爱的论坛排行:记录学生所以曾经登录、发帖的论坛的IP地址和论坛名称,统计其访问总人次和访问频率,每星期更新排行榜。

8)学生最喜爱的聊天工具排行:统计学生所有曾经使用的聊天工具名称和其连接端口。

9)学生最喜爱的下载网站排行:记录学生所有曾经访问的主流专业下载网站的IP地址和网站名称,统计访问总人次和访问频率。

10)学生最喜爱的音乐站排行:记录学生所有曾经访问的主流音乐网站的IP地址和网站名称,统计访问总人次和学生上这类网站的目的(下载音乐、关注动向等)。

11)学生最喜爱的娱乐站排行:记录学生所有曾经访问的主流娱乐网站的IP地址和网站名称,统计访问总人次和学生关注的娱乐项目(电影、音乐、八卦新闻等)。

12)学生最喜爱的游戏站排行:记录学生所有曾经访问的主流游戏网站的IP地址和网站名称,统计访问总人次、学生关注的游戏类型(网游、大型单机游戏、游戏等)和学生在线玩小游戏的频率和所使用的端口。

13)学生最喜爱的新闻站排行:记录学生所有曾经访问的主流新闻门户网站的IP地址和网站名称,统计访问总人次和学生关注的新闻栏目(体育、时事)等。

14)学生最喜爱的电子邮局排行:记录学生所有曾经访问的电子邮局的IP地址和网站名称,统计访问总人次和访问频率。

15)使用匿名代理的统计分析:统计使用匿名代理上网的数量。

16)浏览性教育相关网站栏目的统计分析:记录学生浏览性教育相关网站、栏目的IP地址或者网页URL,统计访问总人次。

17)浏览暴力相关网站的统计分析:记录学生浏览暴力相关的IP地址,统计访问总人次。

18)浏览色情/性行为相关网站的统计分析:记录学生浏览色情/性行为相关网站的IP地址,统计访问总人次。

19)对指定关键字库进行搜索的统计分析:统计学生对指定关键字库中存在的关键字的搜索人次和搜索频率。

(5) 行为分析模块

行为分析功能模块是以数据仓库为基础,运用数据挖掘的各种技术,对历史的,综合的数据进行统计,以统计报表的形式输出统计结果,方便用户进行下一步的分析(如图7)。这个功能模块主要包括三方面统计数据:一是访问人群信息统计,主要包括新访问者与重复访问者的数据统计,具体信息还包括这些人群地理分布等;二是访问行为统计分析,主要包括以单篇日志为单位的访问量分布统计、以日志分类为单位的分布统计等;三是对网志站点向外链接与来访站点分布的统计,还包括通过搜索引擎访问网志的信息分布统计等。

下面介绍粗糙集对学生上网行为数据挖掘的实现原理。假设现有8种类型的信息记录构成了一个数据集合A,记为:A={x1,x2,x3,x4,x5,x6,x7 ,x8},每种数据记录都有信息属性,按照信息安全类别的不同,我们将这些信息分成R1={安全,普通,危险}三个大类,那么所有安全的信息构成集合X1={x1,x2,x6,x8},普通信息构成集合X2={x3,x4},危险的信息是:X3={x5,x7 }。按照信息安全类别这个属性我们就把数据集合A进行了一个划分(所谓A的划分就是指对于A中的任意一个元素必然属于且仅属于一个分类),那么数据集合属性就形成了一种知识。一种对集合A的划分就对应着关于A中数据的一个知识,假如还有其他的属性,比如还有访问类别R2={学习,娱乐,数据传输},传输方式R3={Http,FTP,流媒体},这样加上R1属性对A构成的划分分别为:

A/R1={X1,X2,X3}={{x1,x2,x6},{x3,x4},{x5,x7,x8}}

(安全类别分类)

A/R2={Y1,Y2,Y3}={{x1,x2},{x5,x8},{x3,x4,x6,x7}}

(访问类型分类)

A/R3={Z1,Z2,Z3}={{x1,x2,x5},{x6,x8},{x3,x4,x7}}

(传输方式分类)

这些所有的分类合在一起就形成了一个基本系统分析的知识库。除了安全的{x1,x2,x6}、Http传输的{x1,x2,x5}、学习类型的{x1,x2}这样的概念以外还可以表达例如:Http传输的学习类型{x1,x2,x5}∩{x1,x2}={x1,x2},危险的数据传输({x5,x7,x8}∩{x3,x4,x7}∩{x3,x4,x6,x7}={x7},危险的FTP传输{x5,x7,x8}∪{x6,x8}={x5,x6,x7,x8}。而类似这样的概念可以通过求交运算得到,比如X1与Y1的交就表示安全的学习访问。所有的这些能够用交、并表示的概念以及加上上面的三个基本知识(A/R1,A/R2.A/R3)一起就构成了一个知识系统记为R=R1∩R2∩R3,它所决定的所有知识是A/R={{x1,x2},{x3},{x4},{x5},{x6},{x7},{x8}}以及A/R中集合的并。

网络行为分析系统分析型数据库(DW数据)中的二维表如表1所示。

可以看出,这个表就是上面的那个例子的二维表格体现,而最后一列是我们的决策属性,也就是说评价什么样的数据集合正常。这个表中的每一行表示了类似这样的信息:安全的学习类型Http访问正常,危险的娱乐类型FTP访问异常等等。系统把所有的记录看成是论域A={x1,x2,x3,x4,x5,x6,x7,x8},任意一个列表示一个属性构成了对论域的元素上的一个划分,在划分的每一个类中都具有相同的属性,而条件属性:安全类别、访问类型、传输方式都是可以通过管理员添加设置。系统将管理员设置的条件属性发送至内部判断机制类,自动计算决策属性(最后一项的是否正常)的近似值,最后我们得到化简后的知识库R2,R3,从而能得到下面的决策规则:安全的学习->正常,学习Http->正常,危险的数据传输->异常,流媒体数据传输->正常,危险的FTP->异常,利用粗集的理论还可以对这些规则进一步化简得到:安全->正常,学习->正常,危险->异常。这就是上面这个数据表所包含的真正有用的知识,而这些知识都是从数据库有粗糙集方法自动学习得到的。

三、小结

本文详细描述了网络行为分析系统的设计实现细节,同时在真实的教育科研网络中进行了实验,验证了系统的功能。

首先介绍了本系统的应用背景——广州市海珠教育科研网,本系统的设计与应用完全针对该教育区域网,力求能对网内用户(主要是学生)的网络行为进行分析并在此基础上进行一定的引导和管理。第二部分是网络行为分析系统的设计实现细节,从总体设计目标,总体结构以及主要模块的设计三个角度加以阐述。最后还介绍了实验的环境、实验过程以及实验结果分析。

参考文献:

[1]殷肖川,刘志宏,姬伟锋,万映辉.网络编程与开发技术[M].西安:西安交通大学出版社,2003:33-92.

[2]卢开澄.计算机密码学——计算机网络中的数据预安全[M].北京:清华大学出版社,1998:12-23.

[3]陈蕾蕾,曲保章.IP数据报重组算法及实现[J].今日电子,1998.第7期:31-33.

上一篇:用友软件实习心得下一篇:财政局会计绩效考核