信息技术装备简介

2024-10-08 版权声明 我要投稿

信息技术装备简介(推荐9篇)

信息技术装备简介 篇1

光电信息技术是由光学、光电子、微电子等技术结合而成的多学科综合技术,涉及光信息的辐射、传输、探测以及光电信息的转换、存储、处理与显示等众多的内容。光电信息技术广泛应用于国民经济和国防建设的各行各业。

信息技术是一种综合技术,它包括四个基本内容,即感测技术、通信技术、人工智能与计算机技术和控制技术。感测技术包括传感技术和测量技术以及遥感、遥测技术;它使人类能更好的从外部世界获取各种有用的信息。通信技术:它的作用是传递、交换和分配信息,可以消除或克服空间上的限制,使人们能更有效的利用信息资源。人工智能与计算机技术:它使人们能更好的加工和再生信息。控制技术:它的作用是根据输入的指令,对外部事务的运动状态实施干预。因此一切与信息的收集、加工、存储、传输有关的各种技术可成为信息技术。

在当今时代,信息技术包括微电子信息技术、光电子信息技术和光信息技术等。作为核心的微电子信息技术是在传统的电子技术的基础上发展起来的一种渗透性最强大、影响面最广的电子技术,它通过控制固体内电子的微观运动来实现对信息的加工处理,并在固体的微区(小到几个晶格的数量级)内进行,可以把一个电子功能部件,甚至一个系统集成在一个很小的芯片上。

光子信息技术和微电子技术一样,是一种渗透性极强的综合技术,使以光集成技术为核心的有关光学元、器件制造的应用技术。与微电子技术类似,它利用外延、扩散、竹茹、蒸发工艺,把各种有缘何无源光学器件(激光器、光耦合器、光分路器、光调制器、光检测器等)集成在一起,构成能完成光学信息获取、处理和存储等功能的系统。

光电信息技术是将电子学与光学浑然一体的技术,是光与电子转换及其应用的技术。从广义上讲,光电信息技术就是在光频段的微电子技术,它将光学技术和电子技术相结合实现信息的获取、加工、传输、控制、处理、存储与显示。它将光的快速(世界上运动最快的物质光)与电子信息处理的方便快速相结合,因而具有很多无可比拟的优点。

信息技术装备简介 篇2

随着计算机技术的高速发展, 信息安全面临着越来越大的挑战, 传统的将秘密文件加密成密码文件的方法虽然可以防止非法拦截者从中获得秘密文件, 但是同样也存在着致命的缺陷。尤其是在硬件技术高速发展以及基于互联网的强大的并行计算逐步发展的今天, 传统的加密算法正经受着巨大的冲击。

在多媒体技术和互联网高速发展的今天, 如何通过有效的方法防止非法的拷贝以及非法的分发数字产品就成了现在急需解决的新的课题。

正因为这一新的课题不能够用传统的信息安全技术来解决, 信息隐藏技术就是在这一背景下逐渐发展起来的一项新的信息安全技术。

2 信息隐藏的基本概念

区别与传统的信息加密技术, 信息隐藏技术的目的是确保隐藏的数据不被发现和入侵, 而不是传统的限制以普通方式访问的形式。信息隐藏技术的基本概念是将秘密的重要的信息隐藏在普通的媒介中, 并在互联网上进行传递, 保密的信息伪装成普通的文件, 并且与其他不重要的信息没什么区别, 从而能够很容易的逃脱非法拦截者的入侵与注意。这正是传统的加密系统中缺失的部分。信息隐藏技术的主要目标是隐藏技术是更好的方式, 同时使嵌入了隐藏信息的媒介对质量的影响越小越好, 从而达到隐藏信息很难被发现的目的。

3 信息隐藏技术与传统的加密技术的区别

信息隐藏技术与传统的加密技术的主要区别就是:传统的加密技术只是隐藏信息的内容, 而信息隐藏技术不仅隐藏信息的内容, 而且还隐藏信息本身包含的子内容。信息隐藏技术相较于传统的加密技术, 提供了一个更安全的隐藏方式。在信息隐藏技术中, 信息在提的作用包含两个方面的内容, 换句话说就是它既是传递信息的载体, 又将伪装的信息隐藏在其中。

4 信息隐藏系统模型

信息隐藏系统模型如图1所示, 被隐藏的信息称之为隐秘文件, 普通信息被称之为载体信息。信息隐藏过程通过密钥来进行控制。隐秘信息通过某种嵌入算法嵌入到载体文件中去, 同时嵌入有隐秘信息的载体文件通过公共的频道进行传输, 然后收到载体信息的人通过从隐藏信息的人那里得到密钥, 从而将保密信息提取出来。

5 信息隐藏技术的特点

与传统的信息加密技术不同, 信息隐藏技术不是限制对普通数据的访问, 而是保证隐藏的数据不被侵犯, 因此, 根据这一目标以及相关的技术需求, 信息隐藏系统的主要特征有以下几点:

隐蔽性:检测不出隐秘宿主文件与原始载体文件的区别, 二者在特性上基本一致, 例如在统计噪声上表现出一致性, 因此非法入侵者不能判断出是否嵌入了隐秘文件。

鲁棒性:对原有的载体文件的质量只产生了较小的影响。

6 信息隐藏系统的分类与应用

信息隐藏技术主要可分为以下几类:隐写术, 隐蔽通道, 版权符号, 匿名通信。其中隐写术是比较普遍的一种信息隐藏技术。

隐写术:隐写术是信息隐藏技术的一个重要分支。在隐写术中我们试图将某些隐秘的信息如文本文件, 图片文件甚至是一些声音文件隐藏在载体文件或者说是宿主文件中。

7 信息隐藏技术的现状与展望

信息隐藏技术是现在数字信号处理, 图像处理, 加密应用, 通信原理, 算法设计等学术领域相结合的国际学术界研究的焦点技术。现已有很多著名的国外研究机构, 公司和大学投入了相当的人力与财力对信息隐藏技术进行深入且广泛的研究。目前, 信息隐藏技术的研究相较与其他领域还处于萌芽期。在信息隐藏技术出现的这几年, 对如何控制与引导其发展的方向是至关重要的。信息隐藏技术未来的研究方向将主要集中在改善信息隐藏技术理论以及信息隐藏技术算法的鲁棒性, 安全性上, 同时对信息隐藏技术在互联网中的应用进行进一步的探索。

8 总结

信息隐藏技术已经分成一些新的研究方向比如多媒体通信, 多媒体信号处理等等。它提出了一种新的信息安全技术的概念, 随着计算机技术的进一不发展, 信息隐藏技术将得到进一步的完善, 理论一将得到进一步发展, 并在商业应用上产生巨大的价值。

摘要:本文描述了信息隐藏技术中的基本概念, 对信息隐藏技术的原理、模式以及信息隐藏系统的特性进行分析, 讨论了现在信息隐藏技术的主要的分支领域, 信息隐藏的应用软件, 信息隐藏技术存在的问题以及对信息隐藏技术未来发展方向的展望。

关键词:信息安全,信息隐藏,隐写术,隐蔽通道

参考文献

[1]Advanced Steganography Algorithm using encrypted secret message, Joyshree Nath and Asoke Nath, International Journal of Advanced Computer Science and Application (IJACSA) Vol-2No.3, Page19-24, March (2011) .[1]Advanced Steganography Algorithm using encrypted secret message, Joyshree Nath and Asoke Nath, International Journal of Advanced Computer Science and Application (IJACSA) Vol-2No.3, Page19-24, March (2011) .

[2]Symmetric key cryptography using random key generator, A.Nath, S.Ghosh, M.A.Mallik, Proceedings of International conference on SAM-2010held at Las Vegas (USA) 12-15July, 2010, Vol-2, P-239-244.[2]Symmetric key cryptography using random key generator, A.Nath, S.Ghosh, M.A.Mallik, Proceedings of International conference on SAM-2010held at Las Vegas (USA) 12-15July, 2010, Vol-2, P-239-244.

信息技术装备简介 篇3

河西农产品市场建于1992年,前身即桥西综合批发市场。2002年,市场进行整体改扩建设,新建市场总占地335亩,总建筑面积11.9万平方米,总投资5.61亿元。新市场建有电子结算中心、电子监控中心、农药残留检测中心、贮藏中心等现代化设施。目前已成为带动全省,影响华北,辐射全国的农产品集散中心,充分发挥着龙头示范作用。

市场2007年商品交易量10.1亿公斤,交易额16.9亿元。蔬菜、水果、粮油调味品供应量占太原市总供应量的95%、90%、80%。市场培育营销户6000多人,农民经纪人5000余人,与全省20多万农民签订订单农业合同,并在清徐、娄烦、太谷、交城、文水等地建设高科技示范基地,有效带动了全省农业产业结构的调整。被评为国家级“龙头企业”、全国农产品“十佳市场”、全国服务业500强企业,是名副其实的省城“菜篮子”。

内蒙古包头友谊蔬菜批发市场

友谊蔬菜批发市场是包头市“菜篮子”工程的龙头企业、全国百强蔬菜批发交易市场,是自治区人民政府和包头市工商局命名的“文明市场”和自治区第一家“放心菜”、“放心肉”市场。

市场占地面积5万平方米,设有肉食水产厅、糖酒副食厅、蔬菜瓜果交易区、地下交易厅、仓储库房和冷库。年交易额4亿元,交易量达4亿公斤,其中蔬菜2.5亿公斤,日人流量5万人次以上。市场建有蔬菜农药残留检测中心、电子监控中心。

市场被农业部确定为农副产品定点市场,成为全国百强蔬菜批发交易市场,被自治区、包头市两级政府命名为“文明市场”,为丰富包头市人民的“菜篮子”、搞活流通、繁荣市场做出了积极的贡献。

山西晋城绿欣农产品批发市场

绿欣农产品批发市场是晋城市规模最大、设备齐全、功能较为完善的农产品批发市场之一,也是晋城市农业产业化龙头企业。

市场建筑面积13800平方米,总投资近4000万元,建有商业用房、恒温库、地下储藏室、交易大棚、办公用房及客商住房。市场以蔬菜、水果、农副产品批发零售为主,兼营粮油销售、农副产品加工、储运物流。为促进市场与基地衔接,市场对当地菜农、果农销售的优质无公害产品实行无偿服务,并对当地名优无公害农产品四季销售提供了配套服务。目前,市场已建成了集产品销售、仓储保鲜、加工运输、质量检测、信息发布为一体的农副产品流通大平台。

信息技术装备简介 篇4

区县管理员:

1、用区县管理员账号登陆web 考试端:http://10.0.2.40/web_bsexam/index.aspx

2、为学校添加管理员账号和密码:

3、通知学校下载“考生信息采集系统”。打开该系统,用学校编码和学校名称设置好后关闭,把excel模板文件录入后,根据考场微机数编排考场和场次。

4、让学校导出“.kw”文件报区县管理员。

5、区县管理员账号登陆web 考试端,逐个为每个学校批量导入考生信息。

6、上传成绩:

学校管理员:

1、用学校编码和密码登陆web考试端:http://10.0.2.40/web_bsexam/index.aspx 下载“考生信息采集系统”。

2、打开该系统,用学校编码和学校名称设置好后关闭,把excel模板文件(已经录入过考生信息的那个文件)导入,根据考场微机数编排考场和场次。

3、导出上报数据文件“.kw”给区县管理员。

4、打印准考证:

5、用学校编码和密码登陆web考试端:http://10.0.2.40/web_bsexam/index.aspx 下载3项考试数据:

6、、用学校编码和密码登陆web考试端:http://10.0.2.40/web_bsexam/index.aspx 下载“监考端系统“

7、按装监考端并打开:用户名:admin 密码:888

注:这里需要学校编码和密码登陆web考试端:http://10.0.2.40/web_bsexam/index.aspx 下载3项考试数据即上面的:考务数据文件和题库数据文件(还有一项学生信息册自已留存备查):

8、以上设置完成后再去“监考端”按装目录下把文件“ksd”复制到学生机,并运行:安装好后,就可以在教师机上,启动考试程序开始考试了。

济南鸣人信息技术有限公司简介 篇5

济南鸣人信息技术有限公司成立于2011年,是用友软件在济南地区核心合作伙伴。下设软件研发部、销售部、企管部等。

“专业创造卓越,敬业铸就辉煌”在为企业信息化服务的同时,我们更注重自身专业水平的提高,公司员工具有资深的行业经验,全体员工行业经验都在四年以上,能够更好的服务于企业信息化建设。公司员工先后参加了用友集团举办的多项培训课程与认证考试。我公司所有服务人员均通过了用友软件T6与T3的服务工程师认证考试,为给客户服务提供了有力的技术保证。

我公司在从事用友软件销售的同时,还致力于企业个性化管理需求的专项开发工作。公司组建有专业开发团队,开发人员均在行业内6年的资深工作经验,依靠自己在管理软件开发领域的强大技术实力,致力于企业管理软件的开发和销售。

我公司在软件研发方面与用友软件紧密合作,与用友软件T6产品线、U8产品线、NC产品线多次合作,并成为用友软件产品部合作伙伴。与用友软件的多个行业进行了项目的合作,形成了条码应用集成系统、地磅管理系统、凭证接口、金税接口系统、BOM导入维护插件、运输管理系统、部门用料计划管理插件、备品备件超市化管理插件、询价比价插件、生产排程插件、计划发货排程插件等多个行业插件,通过这些插件提升了企业ERP应用的高度,提高了客户满意度,也给我们用友代理商进行老客户经营创造了一个新的增加收入的途经与方式。

北京联方信科信息技术公司简介 篇6

简介

(一)成立背景

北京联方信科信息技术有限责任公司成立于2009年12月,位于北京市朝阳区CBD东扩区北京传媒总部基地,面对国内传媒、IT业方兴未艾的发展现状,投资方及公司主要负责人高瞻远瞩,制定了以楼宇智能化建设为核心,以政府、企业、团体等单位一站式服务为主营业务的发展战略。明确了基础建设与技术服务并重的发展方针,目前公司已经成功挤身于北京技术服务市场。

自2011年以来公司成立了流媒体事业部,并迅速发展壮大,于2013年正式取得美国WOWZAMEDIASYSTEM,LLC的中国区唯一授权代理。

(二)公司现状

公司目前主要从事信息咨询;流媒体直播产品研发与销售;楼宇智能化建设;计算机软硬件销售及维护;软件开发;人员信息技术培训; IT人员招聘面试代理、评定服务,以及其它与信息技术有关的业务。公司各专业人才齐全配套,专业有网络工程、安防工程、软件工程、计算机硬件、网络安全、数据库等;公司的人才优势和良好的客户关系形成了我公司在市场中的核心竞争力。

我公司严格执行信息技术外包服务标准,建立了一整套完善的质量服务体系。公司设有流媒体事业部、产品销售部、楼宇智能事业部、软件工程部、外包服务部、财务部、人事行政部等部门,所有服务项目均实行项目经理负责制,并制定了项目人员备份计划,有效的解决了因项目负责人离转岗客户服务受影响这一难题。

我公司有实力承担流媒体直播系统建设、研发、楼宇智能各子系统建设(包括但不限于办公装修、综合布线、机房工程、网络工程、电话语音系统、门禁考勤系统、背景音乐、流媒体播放系统、触摸查询系统、安防工程、楼宇对讲、多媒体会议系统、停车场系统)软件工程、硬件维护等信息化建设项目的全方位外包服务任务。

(三)、公司业绩

我公司先后承担了多家政府、企业、事业单位的楼宇智能化建设、IT基础系统建设及运维外包任务。项目工程遍及整个北京及周边省市。工程案例见附件

(四)公司优势

1、一流的技术服务队伍,丰富的人才储备

经过几年的工作实践,北京联方信科信息技术有限责任公司培养和造就了一支专业配备齐全、实践经验丰富的高素质技术队伍。我们的团队成员多数从事过大型楼宇智能、企业信息化、办公环境建设等项目,拥有丰富的实战经验,先后为多家政府机关、企事业单位制定了一站式综合解决方案,并成功组织实施。多年外企工作让这支队伍

养成了务实、严谨的工作作风。对客户他们真诚而不油滑,对技术他们精益求精、对待难题他们从容而又老练。服务一流、质量第一是联方信科人永远的追求,一经与我们合作必将成为永久的朋友。此外公司从北京高校聘有高级技术顾问2人,有力的保障了公司的服务质量和服务水平。

2、完善的技术服务与管理体系、先进的服务设备

在全体员工的不断努力下,公司技术团队的服务水平现已迈上了新台阶,并制定出一套科学的、规范的、符合行业标准的技术服务体系和服务制度,实现了制度化、规范化服务。培养出一支技术精、业务好、懂专业、善管理、爱岗敬业、吃苦耐劳、无私奉献的一流项目经理队伍。为适应公司业务发展的需要。公司先后购置测试仪器仪表、软件等,用于满足软件开发、网络测试等新业务日益增长的需要。

3、优质规范的服务体系

经过不懈努力,公司已把服务提高到一个新的水平,在团队中树立服务意识,在工作中贯穿服务理念、并建立了完整的服务工作程序,以此来提高一站式服务质量。同时我们制定了客户投诉处理回访信息反馈机制,力争最大限度地提高客户满意率。

4、优秀的企业文化

企业的价值观是企业发展的灵魂。企业能否持续发展的关键与企业文化价值取向息息相关。我们真正实现了用企业文化这个无形资产去带动公司发展的目标,通过总结和创新公司现已经建设形成一个有

战斗力、开拓创新、团结进取的领导集体;拥有一支以企业为家,具有较强集体荣誉感的员工队伍;并逐渐形成了目标明确、责任清楚、业绩评估公平、发展空间自由的人才管理机制。为向客户提供更优质的服务奠定了基础。

自成立以来北京联方信科信息技术有限责任公司先后多次承担,政 府、企事业团体的楼宇智能及信息化建设任务,得到客户普遍认可和一致好评。

公司地址:北京市朝阳区管庄西里建机商务楼423室

邮政编码:100024

联系电话:010-65432106

信息技术装备简介 篇7

我们评委会负责评审的专业有自动化技术、自动控制技术、工业自动化、仪器仪表自动化、机电一体化、信息处理技术、电子与信息技术等。

欢迎从事自动控制与信息处理技术的广大专业技术人员申报评审,我们于每年7月中下旬在广东省自动化研究所网站(网址:www.gia.ac.cn)公布开展评审工作的通知公告,请密切关注。

专业技术资格评审用表可在广东省人力资源和社会保障厅网站下载中心(网址:www.gdrst.gov.cn)下载。

受理申报材料时间为每年的8月15日至9月15日,如人保厅的工作安排有变动,以人保厅的安排为准。

申报材料整理申报程序:

一、从广东省人力资源和社会保障厅网站下载专业技术资格评审用表。

二、按要求填写好表格,并提交相应的证明材料。

三、所在单位人事部门对申报材料进行审核和公示,并加具意见。

四、省直单位的,由其上级主管部门在评审表(09版表二)第13页“上级主管部门或单位审核意见”和“市(省直主管部门)人事部门审核意见”加具意见;各市企、事业单位的,由其所在单位在评审表(09版表二)第14页委托评审申请栏加具意见,并由其所在市人事局在评审表(09版表二)第13页和第14页“市(省直主管部门)人事部门审核意见”加具意见。

五、将申报材料装订并密封后于9月15日前送广东省科学院自动控制与信息处理技术助理研究员资格评审委员会评审。

联系人:刘先生陈小姐

联系电话:020-87686011 020-37656283

联系地址:广州市先烈中路100号大院13号楼

发酵床养猪技术简介 篇8

发酵床养猪的最大特点是圈舍无臭味,猪排泄的粪尿被迅速降解。猪通过拱食还可采食垫料中有益菌繁殖形成的菌体蛋白,补充营养。垫料使用2~3年后一次性清理出圈,可作为优质有机肥还田,整个养猪过程实现了零排放,不会对周围环境造成污染。

1. 猪舍的建造

发酵床式猪舍选址同普通猪舍,一般要求远离交通要道,地势较高、干燥、平缓、向阳,地面坡度以1%~3%最为理想。猪舍建造也同普通猪舍,要求通风采光良好,东西走向,坐北朝南。猪舍一般宽4~6米、长8~20米,墙高约3米,脊高约4.5米,朝南开设可自由开闭的大窗,使阳光可以照射到猪床面积的1/3以上,且从早到晚尽可能让阳光照射到整个发酵床,阳光照射带来的热量可促进微生物的生长繁殖。猪舍北侧建自动给食槽,南侧建自动饮水器,可按对角线方式分布。屋脊应安放通风帽(或无动力风机),以利通风散热,这在夏季较为闷热的长江以南地区显得更加重要,因发酵床产热。猪舍面积可按1头哺乳及断奶仔猪占地0.8~1.2米2、育肥猪占地1.2~1.5米2建造。若采用大棚养猪,效果更好,因为大棚造价低,且采光、保温性能好,便于调节小气候,冬季保暖,夏季放下遮阳膜,把四周的裙膜卷起来,可创造非常好的通风降温环境。猪舍内部背阴面设置过道,以方便进料和日常管理。水泥饲喂台要紧挨着过道,其余的地方作为发酵床。南方地区水泥饲喂台的面积要大一些,以利于夏季猪趴卧休息。

2. 发酵床的建造

发酵床的建造并无严格要求,生产上常用的有地上式和地下式两种。我国南方地区较温暖湿润,地下水位较高,一般采用地上式发酵床为宜;我国北方地区较寒冷干燥,且地下水位较低,一般采用地下式发酵床为宜。地下式发酵床要求向地面以下深挖90~100厘米,生物垫料的厚度80~90厘米。地下水位低的地区,也可采用地上式发酵床。地上式发酵床在地面上砌成,要求高度80~90厘米,建好后填入已经制成的有机垫料,厚约80厘米。

3. 发酵菌种和活性劑的使用

发酵菌种的制作使用是发酵床养猪最为关键的环节。发酵床菌群主要有3种菌:乳酸菌、酵母菌和枯草菌,三者相辅相成。枯草菌是担任降解粪尿任务的主要菌群。不同菌种的配比、单位重量的有效活菌含量、活性以及适应性等方面直接决定了猪舍粪尿的降解效率和发酵床的使用年限。虽然发酵菌种可以自己动手制作生产,但难度较大,且不同地方制作的菌种分解粪尿效率相差很大,因此建议购买专门单位生产的发酵菌种。厂家出售的菌种已进行了菌种培养、纯化处理、分离与鉴定等操作,具有效果好、体积小、使用简便等优点,包装规范,有详细的产品使用说明和技术手册。目前市场上有多种成品发酵菌种,购买时注意选择有国家农业部正式批准文号的优质菌种。洛东酵素是目前市场上较常见的发酵菌种,是日本洛东化成工业株式研制生产的,因此我国部分地区把发酵床养猪又叫洛东发酵床养猪。

发酵床垫料使用一段时间后,生物降解速度降低,这时需要喷洒一定量的活性剂。活性剂是从植物生长点内提取、经发酵后形成的,包括天惠绿汁、氨基酸液等,主要用于调节垫料微生物的活性。活性剂已开发出多种商业产品,可在市场上购买,按说明使用。另外,平时发现某处猪粪堆积的比较多时,要向别处翻耙,以利于粪便的发酵降解。

4. 发酵床垫料的制作

垫料的制作是发酵养猪的重要环节。垫料原料可根据当地的资源优势选用。常见的垫料原料有如下几种:锯末,稻壳,花生壳,木质素较多的辣椒秸、棉花秸等农作物秸秆(秸秆要粉碎到40目左右)等。不提倡使用玉米秸秆,生产中发现玉米秸秆易产生黄曲霉菌,黄曲霉菌可产生毒性和致癌性很强的黄曲霉毒素。生产中常选用两种有机垫料混合使用,最常用的是“锯末+稻壳”、“锯末+花生壳”、“锯末+辣椒秸(或棉花秸)”。制作垫料一定要将保水性原料(锯末)、通透性原料(稻壳或花生壳或秸秆)的比例掌握好,一般按重量1∶1配比。垫料全用锯末会出现板结,全用稻壳或花生壳会影响使用年限。需要注意的是经过防腐剂处理的锯末不能使用(如三合板等高密板材加工后的锯末)。正常情况下垫料可连续使用2~3年。①垫料层组成。一般猪舍中垫料的总厚度为80~90厘米,每平方米垫料重约170千克,有条件的可先铺30~40厘米厚的木段作为疏松通气底层,然后再铺锯末与稻壳(或花生壳、秸秆)的混合物。有条件的场(户)垫料中加适量的米糠(或酒糟、麸皮)和粗盐有利于发酵,用量分别为垫料总重的0.1%~0.3%。将发酵菌种、锯末、稻壳等按一定比例混合均匀,使含水量达到60%,以保证功能微生物菌种能够大量繁殖。经5~7天即可开始发酵,20~30天后底层也进入发酵状态,中部形成白色的菌丝,温度可达50~60℃或更高(表层温度在25~30℃)。②活性剂的使用。发酵床经使用一段时间后,视具体情况决定是否需要使用活性剂。有的发酵菌种活性强,不需使用活性剂;如果发现有猪粪尿不能正常分解时,说明发酵菌种活性降低,此时将发酵菌种用活性剂稀释至适当的比例泼洒到发酵床床面,以提高微生物菌群对排泄物的降解速度。

以发酵床面积为20米2、垫料厚度80厘米、每平方米用垫料170千克计算,垫料原料用量如下:锯末,20米2×170千克/米2×50%=1700千克;稻壳,20米2×170千克/米2×50%=1700千克;发酵床菌种,20米2×170千克/米2×0.2%=6.8千克;粗盐,20米2×170千克/米2×0.2%=6.8千克;米糠(或酒糟、麸皮),20米2×170千克/米2×0.3%=10.2千克。然后将垫料原料(锯末、稻壳、菌种、粗盐、米糠的混合物)与水按重量比2∶1充分混匀,在搅拌混合过程中用水约1500千克(锯末、稻壳等自然风干材料含水量已超过10%),这样可使垫料水分达到60%左右。判断垫料含水量多少,生产中可采用手握法,即手握垫料成团、松手即散,指缝无水渗出即说明垫料含水量合适。

5.发酵床的使用与日常维护

猪进圈前,在猪圈内将垫料搅拌均匀堆积发酵5天左右,使微生物繁殖并洁净发酵床垫料环境。垫料也可在猪舍外搅拌、发酵好再铺到猪圈内。猪全部出栏后,将垫料放置干燥2~3天,用叉子或便携式犁耕机将垫料从底部翻一遍,视情况适当补充垫料和菌种,重新堆积发酵,间隔24小时即可再次进猪饲养。日常生产中还应做好以下几点:①保持发酵床的湿度适当。垫料具有一定的湿度利于微生物的繁殖,距床面20厘米左右的中心发酵层含水量一般控制在30%~60%,判断垫料含水量方法同上。如果水分过多可打开通风口,利用水分蒸发流动调节湿度;如果干燥可向发酵床喷洒水或活性剂溶液,否则可能引起猪呼吸系统疾病。②定期驱虫。入圈生猪应提前彻底清除体内寄生虫,避免将寄生虫带入发酵床,使猪在拱食菌丝时将虫卵吞入体内而感染。入圈后生猪每年进行4次驱虫基本可杜绝寄生虫病的发生。③注意微生物菌种的活性。必要时添加活性剂调节微生物菌种的活性,以保证发酵能正常进行。④饲喂量掌握。为促使猪拱翻发酵床垫料,饲料喂量应控制在正常量的80%,即喂八成饱。猪习惯在固定地点排粪尿,管理人员可待粪便成堆时挖坑填埋即可。⑤注意用药。发酵床式猪舍内不得使用化学消毒药品和抗生素类药物,避免杀伤垫料微生物,降低其活性。⑥及时补充垫料。当垫料下沉超过10厘米时应补充新料,补充的新料要与发酵床的表层垫料混合均匀。⑦定期人工翻动垫料。初建成的发酵床不需要天天翻耙,日常用叉子、铁锨等工具及时地将部分过于集中的猪粪散开或掩埋,把比较坚实区域的垫料翻松即可,避免发酵床压实板结,造成氧气供应不足,影响发酵。从进猪之日起每隔50天左右应深翻垫料1次,可用便携式犁耕机将垫料从底部反复翻动,把粪便较为集中区域的垫料分散开来。

发酵床养猪模式是新兴的环保养猪技术,虽然现在还处在发展初期,但它的经济性、环保性已充分显现,特别适合我国北方地区中小规模的养猪场(户)使用。随着社会的发展和人们环保意识的增强,发酵床养猪将逐步成为今后养猪的重要模式之一。但从目前的推广情况看,还有需要改进的地方。首先,我国大部分地区属温带,发酵床在冬季运作非常顺利,但夏天要进行通风或降温。猪场周围要栽植树木或速生爬蔓瓜菜类,以遮荫降温。当猪舍外气温达35℃以上时,应采取机械通风或湿帘降温,这在夏季闷热的江南地区尤为重要。其次,发酵床主要靠垫料中的微生物降解猪粪尿,但目前所使用的菌种分解效率不是很高,单位面积饲养的生猪数量较低,如何使菌种在不同的气候条件下发挥较高的效率也是一个需要解决的问题,分离培养高效、经济、适用范围广的菌种将是今后的发展热点。

生物信息学简介 篇9

生物信息学(Bioinformatics)是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学(Genomics)和蛋白质组学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。

具体而言,生物信息学作为一门新的学科领域,它是把基因组DNA序列信息分析作为源头,在获得蛋白质编码区的信息后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行必要的药物设计。基因组信息学,蛋白质空间结构模拟以及药物设计构成了生物信息学的3个重要组成部分。从生物信息学研究的具体内容上看,生物信息学应包括这3个主要部分:(1)新算法和统计学方法研究;(2)各类数据的分析和解释;(3)研制有效利用和管理数据新工具。

生物信息学是一门利用计算机技术研究生物系统之规律的学科。

目前的生物信息学基本上只是分子生物学与信息技术(尤其是因特网技术)的结合体。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。

1990年代以来,伴随着各种基因组测序计划的展开和分子结构测定技术的突破和Internet的普及,数以百计的生物学数据库如雨后春笋般迅速出现和成长。对生物信息学工作者提出了严峻的挑战:数以亿计的ACGT序列中包涵着什么信息?基因组中的这些信息怎样控制有机体的发育?基因组本身又是怎样进化的?

生物信息学的另一个挑战是从蛋白质的氨基酸序列预测蛋白质结构。这个难题已困扰理论生物学家达半个多世纪,如今找到问题答案要求正变得日益迫切。诺贝尔奖获得者W.Gilbert在1991年曾经指出:“传统生物学解决问题的方式是实验的。现在,基于全部基因都将知晓,并以电子可操作的方式驻留在数据库中,新的生物学研究模式的出发点应是理论的。一个科学家将从理论推测出发,然后再回到实验中去,追踪或验证这些理论假设”。

生物信息学的主要研究方向: 基因组学系统生物学-比较基因组学,1989年在美国举办生物化学系统论与生物数学的计算机模型国际会议,生物信息学发展到了计算生物学、计算系统生物学的时代。

姑且不去引用生物信息学冗长的定义,以通俗的语言阐述其核心应用即是:随着包括人类基因组计划在内的生物基因组测序工程的里程碑式的进展,由此产生的包括生物体生老病死的生物数据以前所未有的速度递增,目前已达到每14个月翻一番的速度。同时随着互联网的普及,数以百计的生物学数据库如雨后春笋般迅速出现和成长。然而这些仅仅是原始生物信息的获取,是生物信息学产业发展的初组阶段,这一阶段的生物信息学企业大都以出售生物数据库为生。以人类基因组测序而闻名的塞莱拉公司即是这一阶段的成功代表。

原始的生物信息资源挖掘出来后,生命科学工作者面临着严峻的挑战:数以亿计的ACGT序列中包涵着什么信息?基因组中的这些信息怎样控制有机体的发育?基因组本身又是怎样进化的?生物信息学产业的高级阶段体现于此,人类从此进入了以生物信息学为中心的后基因组时代。结合生物信息学的新药创新工程即是这一阶段的典型应用。

2、发展简介

生物信息学是建立在分子生物学的基础上的,因此,要了解生物信息学,就必须先对分子生物学的发展有一个简单的了解。研究生物细胞的生物大分子的结构与功能很早就已经开始,1866年孟德尔从实验上提出了假设:基因是以生物成分存在,1871年Miescher从死的白细胞核中分离出脱氧核糖核酸(DNA),在Avery和McCarty于1944年证明了DNA是生命器官的遗传物质以前,人们仍然认为染色体蛋白质携带基因,而DNA是一个次要的角色。1944年Chargaff发现了著名的Chargaff规律,即DNA中鸟嘌呤的量与胞嘧定的量总是相等,腺嘌呤与胸腺嘧啶的量相等。与此同时,Wilkins与Franklin用X射线衍射技术测

定了DNA纤维的结构。1953年James Watson 和FrancisCrick在Nature杂志上推测出DNA的三维结构(双螺旋)。DNA以磷酸糖链形成发双股螺旋,脱氧核糖上的碱基按Chargaff规律构成双股磷酸糖链之间的碱基对。这个模型表明DNA具有自身互补的结构,根据碱基对原则,DNA中贮存的遗传信息可以精确地进行复制。他们的理论奠定了分子生物学的基础。DNA双螺旋模型已经预示出了DNA复制的规则,Kornberg于1956年从大肠杆菌(E.coli)中分离出DNA聚合酶I(DNA polymerase I),能使4种dNTP连接成DNA。DNA的复制需要一个DNA作为模板。Meselson与Stahl(1958)用实验方法证明了DNA复制是一种半保留复制。Crick于1954年提出了遗传信息传递的规律,DNA是合成RNA的模板,RNA又是合成蛋白质的模板,称之为中心法则(Central dogma),这一中心法则对以后分子生物学和生物信息学的发展都起到了极其重要的指导作用。经过Nirenberg和Matthai(1963)的努力研究,编码20氨基酸的遗传密码得到了破译。限制性内切酶的发现和重组DNA的克隆(clone)奠定了基因工程的技术基础。正是由于分子生物学的研究对生命科学的发展有巨大的推动作用,生物信息学的出现也就成了一种必然。2001年2月,人类基因组工程测序的完成,使生物信息学走向了一个高潮。由于DNA自动测序技术的快速发展,DNA数据库中的核酸序列公共数据量以每天106bp速度增长,生物信息迅速地膨胀成数据的海洋。毫无疑问,我们正从一个积累数据向解释数据的时代转变,数据量的巨大积累往往蕴含着潜在突破性发现的可能,“生物信息学”正是从这一前提产生的交叉学科。粗略地说,该领域的核心内容是研究如何通过对DNA序列的统计计算分析,更加深入地理解DNA序列,结构,演化及其与生物功能之间的关系,其研究课题涉及到分子生物学,分子演化及结构生物学,统计学及计算机科学等许多领域。生物信息学是内涵非常丰富的学科,其核心是基因组信息学,包括基因组信息的获取,处理,存储,分配和解释。基因组信息学的关键是“读懂”基因组的核苷酸顺序,即全部基因在染色体上的确切位置以及各DNA片段的功能;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行药物设计。了解基因表达的调控机理也是生物信息学的重要内容,根据生物分子在基因调控中的作用,描述人类疾病的诊断,治疗内在规律。它的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”,解释生命的遗传语言。生物信息学已成为整个生命科学发展的重要组成部分,成为生命科学研究的前沿。

3、主要研究方向

生物信息学在短短十几年间,已经形成了多个研究方向,以下简要介绍一些主要的研究重点。

1、序列比对

序列比对(Sequence Alignment)的基本问题是比较两个或两个以上符号序列的相似性或不相似性。从生物学的初衷来看,这一问题包含了以下几个意义:从相互重叠的序列片断中重构DNA的完整序列。在各种试验条件下从探测数据(probe data)中决定物理和基因图存贮,遍历和比较数据库中的DNA序列比较两个或多个序列的相似性在数据库中搜索相关序列和子序列寻找核苷酸(nucleotides)的连续产生模式找出蛋白质和DNA序列中的信息成分序列比对考虑了DNA序列的生物学特性,如序列局部发生的插入,删除(前两种简称为indel)和替代,序列的目标函数获得序列之间突变集最小距离加权和或最大相似性和,对齐的方法包括全局对齐,局部对齐,代沟惩罚等。两个序列比对常采用动态规划算法,这种算法在序列长度较小时适用,然而对于海量基因序列(如人的DNA序列高达109bp),这一方法就不太适用,甚至采用算法复杂性为线性的也难以奏效。因此,启发式方法的引入势在必然,著名的BALST和FASTA算法及相应的改进方法均是从此前提出发的。

2、蛋白质结构比对和预测

基本问题是比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。蛋白质的结构与功能是密切相关的,一般认为,具有相似功能的蛋白质结构一般相似。蛋白质是由氨基酸组成的长链,长度从50到1000~3000AA(Amino Acids),蛋白质具有多种功能,如酶,物质的存贮和运输,信号传递,抗体等等。氨基酸的序列内在的决定了蛋白质的3维结构。一般认为,蛋白质有四级不同的结构。研究蛋白质结构和预测的理由是:医药上可以理解生物的功能,寻找dockingdrugs的目标,农业上获得更好的农作物的基因工程,工业上有利用酶的合成。直接对蛋白质结构进行比对的原因是由于蛋白质的3维结构比其一级结构

在进化中更稳定的保留,同时也包含了较AA序列更多的信息。蛋白质3维结构研究的前提假设是内在的氨基酸序列与3维结构一一对应(不一定全真),物理上可用最小能量来解释。从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。同源建模(homology modeling)和指认(Threading)方法属于这一范畴。同源建模用于寻找具有高度相似性的蛋白质结构(超过30%氨基酸相同),后者则用于比较进化族中不同的蛋白质结构。然而,蛋白结构预测研究现状还远远不能满足实际需要。

3、基因识别非编码区分析研究

基因识别的基本问题是给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置。非编码区由内含子组成(introns),一般在形成蛋白质后被丢弃,但从实验中,如果去除非编码区,又不能完成基因的复制。显然,DNA序列作为一种遗传语言,既包含在编码区,又隐含在非编码序列中。分析非编码区DNA序列目前没有一般性的指导方法。在人类基因组中,并非所有的序列均被编码,即是某种蛋白质的模板,已完成编码部分仅占人类基因总序列的3~5%,显然,手工的搜索如此大的基因序列是难以想象的.侦测密码区的方法包括测量密码区密码子(codon)的频率,一阶和二阶马尔可夫链,ORF(Open Reading Frames),启动子(promoter)识别,HMM(Hidden Markov Model)和GENSCAN,Splice Alignment等等。

4、分子进化和比较基因组学

分子进化是利用不同物种中同一基因序列的异同来研究生物的进化,构建进化树。既可以用DNA序列也可以用其编码的氨基酸序列来做,甚至于可通过相关蛋白质的结构比对来研究分子进化,其前提假定是相似种族在基因上具有相似性。通过比较可以在基因组层面上发现哪些是不同种族中共同的,哪些是不同的。早期研究方法常采用外在的因素,如大小,肤色,肢体的数量等等作为进化的依据。近年来较多模式生物基因组测序任务的完成,人们可从整个基因组的角度来研究分子进化。在匹配不同种族的基因时,一般须处理三种情况:Orthologous:不同种族,相同功能的基因;Paralogous:相同种族,不同功能的基因;Xenologs:有机体间采用其他方式传递的基因,如被病毒注入的基因。这一领域常采用的方法是构造进化树,通过基于特征(即DNA序列或蛋白质中的氨基酸的碱基的特定位置)和基于距离(对齐的分数)的方法和一些传统的聚类方法(如UPGMA)来实现。

5、序列重叠群(Contigs)装配

根据现行的测序技术,每次反应只能测出500 或更多一些碱基对的序列,如人类基因的测量就采用了短枪(shortgun)方法,这就要求把大量的较短的序列全体构成了重叠群(Contigs)。逐步把它们拼接起来形成序列更长的重叠群,直至得到完整序列的过程称为重叠群装配。从算法层次来看,序列的重叠群是一个NP-完全问题。

6、遗传密码的起源

通常对遗传密码的研究认为,密码子与氨基酸之间的关系是生物进化历史上一次偶然的事件而造成的,并被固定在现代生物的共同祖先里,一直延续至今。不同于这种“冻结”理论,有人曾分别提出过选择优化,化学和历史等三种学说来解释遗传密码。随着各种生物基因组测序任务的完成,为研究遗传密码的起源和检验上述理论的真伪提供了新的素材。

7、基于结构的药物设计

人类基因工程的目的之一是要了解人体内约10万种蛋白质的结构,功能,相互作用以及与各种人类疾病之间的关系,寻求各种治疗和预防方法,包括药物治疗。基于生物大分子结构及小分子结构的药物设计是生物信息学中的极为重要的研究领域。为了抑制某些酶或蛋白质的活性,在已知其蛋白质3级结构的基础上,可以利用分子对齐算法,在计算机上设计抑制剂分子,作为候选药物。这一领域目的是发现新的基因药物,有着巨大的经济效益。

8、生物系统的建模和仿真

随着大规模实验技术的发展和数据累积,从全局和系统水平研究和分析生物学系统,揭示其发展规律已经成为后基因组时代的另外一个研究 热点-系统生物学。目前来看,其研究内容包括生物系统的模拟(Curr Opin Rheumatol,2007,463-70),系统稳定性分析(Nonlinear Dynamics Psychol Life Sci,2007,413-33),系统鲁棒性分析(Ernst Schering Res Found Workshop,2007,69-88)等方面。以SBML(Bioinformatics,2007,1297-8)为代表的建模语言在迅速发展之中,以布尔网络(PLoS Comput Biol,2007,e163)、微分方程(Mol Biol Cell,2004,3841-62)、随机过程(Neural Comput,2007,3262-92)、离散动态事件系统等(Bioinformatics,2007,336-43)方法在系统分析中已经得到应 用。很多模型的建立借鉴了电路和其它物理系统建模的方法,很多研究试图从信息流、熵和能量流等宏观分析思想来解决系统的复杂性问题(Anal Quant Cytol Histol,2007,296-308)。当然,建立生物系统的理论模型还需要很长时间的努力,现在实验观测数据虽然在海量增加,但是生物系统的模型辨 识所需要的数据远远超过了目前数据的产出能力。例如,对于时间序列的芯片数据,采样点的数量还不足以使用传统的时间序列建模方法,巨大的实验代价是目前系 统建模主要困难。系统描述和建模方法也需要开创性的发展。

9、生物信息学技术方法的研究

生物信息学不仅仅是生物学知识的简单整理和数学、物理学、信息科学等学科知识的简单应用。海量数据和复杂的背景导致机器学习、统 计数据分析和系统描述等方法需要在生物信息学所面临的背景之中迅速发展。巨大的计算量、复杂的噪声模式、海量的时变数据给传统的统计分析带来了巨大的困难,需要像非参数统计(BMC Bioinformatics,2007,339)、聚类分析(Qual Life Res,2007,1655-63)等更加灵活的数据分析技术。高维数据的分析需要偏最小二乘(partial least squares,PLS)等特征空间的压缩技术。在计算机算法的开发中,需要充分考虑算法的时间和空间复杂度,使用并行计算、网格计算等技术来拓展算法的 可实现性。

10、生物图像

没有血缘关系的人,为什么长得那么像呢?

外貌是像点组成的,像点愈重合两人长得愈像,那两个没有血缘关系的人像点为什么重合?有什么生物学基础?基因是不是相似?我不知道,希望专家解答。

11、其他

如基因表达谱分析,代谢网络分析;基因芯片设计和蛋白质组学数据分析等,逐渐成为生物信息学中新兴的重要研究领域;在学科方面,由生物信息学衍生的学科包括结构基因组学,功能基因组学,比较基因组学,蛋白质学,药物基因组学,中药基因组学,肿瘤基因组学,分子流行病学和环境基因组学,成为系统生物学的重要研究方法。从现在的发展不难看出,基因工程已经进入了后基因组时代。我们也有应对与生物信息学密切相关的如机器学习,和数学中可能存在的误导有一个清楚的认识。

4、生物信息学与机器学习

生物信息的大规模给数据挖掘提出了新课题和挑战,需要新的思想的加入.常规的计算机算法仍可以应用于生物数据分析中,但越来越不适用于序列分析问题.究其原因,是由于生物系统本质上的模型复杂性及缺乏在分子层上建立的完备的生命组织理论.西蒙曾给出学习的定义:学习是系统的变化,这种变化可使系统做相同工作时更有效。机器学习的目的是期望能从数据中自动地获得相应的理论,通过采用如推理,模型拟合及从样本中学习,尤其适用于缺乏一般性的理论,“噪声”模式,及大规模数据集.因此,机器学习形成了与常规方法互补的可行的方法.机器学习使得利用计算机从海量的生物信息中提取有用知识,发现知识成为可能.机器学习方法在大样本,多向量的数据分析工作中发挥着日益重要的作用,而目前大量的基因数据库处理需要计算机能自动识别,标注,以避免即耗时又花费巨大的人工处理方法.早期的科学方法——观测和假设——面对高数据的体积,快速的数据获取率和客观分析的要求——已经不能仅依赖于人的感知来处理了.因而,生物信息学与机器学习相结合也就成了必然.机器学习中最基本的理论框架是建立在概率基础上的,从某种意义来说,是统计模型拟合的延续,其目的均为提取有用信息.机器学习与模式识别和统计推理密切相关.学习方法包括数据聚类,神经网络分类器和非线性回归等等.隐马尔可夫模型也广泛用于预测DNA的基因结构.目前研究重心包括:1)观测和探索有趣的现象.目前ML研究的焦点是如何可视化和探索高维向量数据.一般的方法是将其约简至低维空间,如常规的主成分分析(PCA),核主成分分析(KPCA),独立成分分析(Independent component analysis),局部线性嵌套(LocallyLinear embedding).2)生成假设

和形式化模型来解释现象[6].大多数聚类方法可看成是拟合向量数据至某种简单分布的混合.在生物信息学中聚类方法已经用于microarray数据分析中,癌症类型分类及其他方向中.机器学习也用于从基因数据库中获得相应的现象解释.机器学习加速了生物信息学的进展,也带了相应的问题.机器学习方法大多假定数据符合某种相对固定的模型,而一般数据结构通常是可变的,在生物信息学中尤其如此,因此,有必要建立一套不依赖于假定数据结构的一般性方法来寻找数据集的内在结构.其次,机器学习方法中常采用“黑箱”操作,如神经网络和隐马尔可夫模型,对于获得特定解的内在机理仍不清楚.5、生物信息学的数学问题

生物信息学中数学占了很大的比重.统计学,包括多元统计学,是生物信息学的数学基础之一;概率论与随机过程理论,如近年来兴起的隐马尔科夫链模型(HMM),在生物信息学中有重要应用;其他如用于序列比对的运筹学;蛋白质空间结构预测和分子对接研究中采用的最优化理论;研究DNA超螺旋结构的拓扑学;研究遗传密码和DNA序列的对称性方面的群论等等.总之,各种数学理论或多或少在生物学研究中起到了相应的作用.但并非所有的数学方法在引入生物信息学中都能普遍成立的,以下以统计学和度量空间为例来说明.1、统计学的悖论

数学的发展是伴随悖论而发展的.对于进化树研究和聚类研究中最显著的悖论莫过于均值了,就说明了要采用常规的均值方法不能将这两类分开,也表明均值并不能带来更多的数据的几何性质.那么,如果数据呈现类似的特有分布时,常有的进化树算法和聚类算法(如K-均值)往往会得错误的结论.统计上存在的陷阱往往是由于对数据的结构缺乏一般性认识而产生的.2、度量空间的假设

在生物信息学中,进化树的确立,基因的聚类等都需要引入度量的概念.举例来说,距离上相近或具有相似性的基因等具有相同的功能,在进化树中满足分值最小的具有相同的父系,这一度量空间的前提假设是度量在全局意义下成立.那么,是否这种前提假设具有普适性呢,我们不妨给出一般的描述:假定两个向量为A,B,其中,则在假定且满足维数间线性无关的前提下,两个向量的度量可定义为:(1)依据上式可以得到满足正交不变运动群的欧氏度量空间,这也是大多数生物信息学中常采用的一般性描述,即假定了变量间线性无关.然而,这种假设一般不能正确描述度量的性质,尤其在高维数据集时,不考虑数据变量间的非线性相关性显然存在问题,由此,我们可以认为,一个正确的度量公式可由下式给出:(2)上式中采用了爱因斯坦和式约定,描述了变量间的度量关系.后者在满足(3)时等价于(1),因而是更一般的描述,然而问题在于如何准确描述变量间的非线性相关性,我们正在研究这个问题.6、统计学习理论在生物信息学中应用的困难

生物信息学中面对的数据量和数据库都是规模很大的,而相对的目标函数却一般难以给出明确的定义.生物信息学面临的这种困难,可以描述成问题规模的巨大以及问题定义的病态性之间的矛盾,一般从数学上来看,引入某个正则项来改善性能是必然的[7].以下对基于这一思想产生的统计学习理论,Kolmogorov复杂性[98]和BIC(Bayesian Information Criterion)[109]及其存在的问题给出简要介绍.支持向量机(SVM)是近来较热门的一种方法,其研究背景是Vapnik的统计学习理论,是通过最大化两个数据集的最小间隔来实现分类,对于非线性问题则采用核函数将数据集映射至高维空间而又无需显式描述数据集在高维空间的性质,这一方法较之神经方法的好处在于将神经网络隐层的参数选择简化为对核函数的选择,因此,受到广泛的注意.在生物信息学中也开始受到重视,然而,核函数的选择问题本身是一个相当困难的问题,从这个层次来看,最优核函数的选择可能只是一种理想,SVM也有可能象神经网络一样只是机器学习研究进程中又一个大气泡.Kolmogorov复杂性思想与统计学习理论思想分别从不同的角度描述了学习的性质,前者从编码的角度,后者基于有限样本来获得一致收敛性.Kolmogorov复杂性是不可计算的,因此由此衍生了MDL原则(最小描述长度),其最初只适用于离散数据,最近已经推广至连续数据集中,试图从编码角度获得对模型参数的最小描述.其缺陷在于建模的复杂性过高,导致在大数据集中难以运用.BIC准则从模型复杂性角度来考虑,BIC准则对模型复杂度较高的给予大的惩罚,反之,惩罚则小,隐式地体现了奥卡姆剃

刀(“Occam Razor”)原理,近年也广泛应用于生物信息学中.BIC准则的主要局限是对参数模型的假定和先验的选择的敏感性,在数据量较大时处理较慢.因此,在这一方面仍然有许多探索的空间.7、讨论与总结

人类对基因的认识,从以往的对单个基因的了解,上升到在整个基因组水平上考察基因的组织结构和信息结构,考察基因之间在位置,结构和功能上的相互关系.这就要求生物信息学在一些基本的思路上要做本质的观念转变,本节就这些问题做出探讨和思索.启发式方法

Simond在人类的认知一书中指出,人在解决问题时,一般并不去寻找最优的方法,而只要求找到一个满意的方法.因为即使是解决最简单的问题,要想得到次数最少,效能最高的解决方法也是非常困难的.最优方法和满意方法之间的困难程度相差很大,后者不依赖于问题的空间,不需要进行全部搜索,而只要能达到解决的程度就可以了.正如前所述,面对大规模的序列和蛋白质结构数据集,要获得全局结果,往往是即使算法复杂度为线性时也不能够得到好的结果,因此,要通过变换解空间或不依赖于问题的解空间获得满意解,生物信息学仍需要人工智能和认知科学对人脑的进一步认识,并从中得到更好的启发式方法.问题规模不同的处理:Marvin Minsky在人工智能研究中曾指出:小规模数据量的处理向大规模数据量推广时,往往并非算法上的改进能做到的,更多的是要做本质性的变化.这好比一个人爬树,每天都可以爬高一些,但要想爬到月球,就必须采用其他方法一样.在分子生物学中,传统的实验方法已不适应处理飞速增长的海量数据.同样,在采用计算机处理上,也并非依靠原有的计算机算法就能够解决现有的数据挖掘问题.如在序列对齐(sequence Alignment)问题上,在小规模数据中可以采用动态规划,而在大规模序列对齐时不得不引入启发式方法,如BLAST,FASTA.乐观中的隐扰

生物信息学是一门新兴学科,起步于20世纪90年代,至今已进入“后基因组时代”,目前在这一领域的研究人员均呈普遍乐观态度,那么,是否存在潜在的隐扰呢不妨回顾一下早期人工智能的发展史,在1960年左右,西蒙曾相信不出十年,人类即可象完成登月一样完成对人的模拟,造出一个与人智能行为完全相同的机器人.而至今为止,这一诺言仍然遥遥无期.尽管人工智能研究得到的成果已经渗入到各个领域,但对人的思维行为的了解远未完全明了.从本质来看,这是由于最初人工智能研究上定位错误以及没有从认识论角度看清人工智能的本质造成的;从研究角度来看,将智能行为还原成一般的形式化语言和规则并不能完整描述人的行为,期望物理科学的成功同样在人工智能研究中适用并不现实.反观生物信息学,其目的是期望从基因序列上解开一切生物的基本奥秘,从结构上获得生命的生理机制,这从哲学上来看是期望从分子层次上解释人类的所有行为和功能和致病原因.这类似于人工智能早期发展中表现的乐观行为,也来自于早期分子生物学,生物物理和生物化学的成就.然而,从本质上来讲,与人工智能研究相似,都是希望将生命的奥秘还原成孤立的基因序列或单个蛋白质的功能,而很少强调基因序列或蛋白质组作为一个整体在生命体中的调控作用.我们因此也不得不思考,这种研究的最终结果是否能够支撑我们对生物信息学的乐观呢 现在说肯定的话也许为时尚早.8、总结

上一篇:刘云山在中国工会第十六次全国代表大会上的祝词下一篇:牢记历史缅怀先烈