数字图像处理心得
——学习数字图像处理后对于车牌识别过程的认识
本人导师张崎,主要从事智能交通方面的研究。高年级学长曾做过车牌识别的研究。在学完数字图像处理这门课后,于是有了这篇关于车牌识别系统的心得体会。
仔细翻阅了几遍平时上课做的笔记,梳理了下各种图像处理方法在各中图像处理中起到的作用。结合对实际车牌识别过程的了解,谈谈自己对图像处理的各种方法在识别过程中起到的作用。
老师总说图像处理就是不讲道理,我觉得这就是最大的道理。为什么有人能够把不讲道理的东西做出来?这其中实际上蕴藏着深刻的道理。就像爱因斯坦证明布朗运动是毫无规律的运动一样,你发现他是毫无规律的,这其实就是他最大的规律。我想,只有对图像有了深刻的认识,才能完成这种你也说不出道理的事。好了,现在我想结合这门课和车牌识别展开说说。
有时候,计算机跟人相比真的很傻,扔一张车牌尾号过来,不管它多么破旧、不清晰,人们能够轻而易举的读出上面的数字。而计算机呢?他要不停的运算、识别,而你算法上的一个小小漏洞,更会导致识别的大大不同。通过数字图像处理这门课的学习,我觉得可能通过下面的一些列步骤能较好的识别出车牌上的号码数字。
首先,我觉得我们需要将彩色的图片转换为灰色图像,这样便于计算机分析,计算机跟人刚好相反,好看的不一定好处理,而灰色的图像虽然不美观,但是正好适合计算机来处理。另一方面,将彩色图像转化为灰色图像也能减少图像所占的存储空间,简化和加快后续处理的工作。
其次,我觉得我们需要根据实际需要,对图像就行简单的预处理。我们应当让我们所关心的图像内容,显现的更加突出。而弱化那些我们所不关心的背景类似的东西。这里我觉得,我们就可以利用我们上课所学到的图像增强的知识了。需要注意的是,图像增强并不能增加原始图像的信息,只是通过某些技术有选择的突出对某一具体应用有价值的信息,即图像增强只通过突出某些信息,以增强对这些信息的辨识能力,而其他信息信息则被削弱,这就是我对图像增强的理解,我认为他是我们后期识别车牌的重要准备,增强的好坏直接影响了后期识别的准确度和速度。
然后,图像增强后,我觉得我们就应该对处理后的图像就行边缘检测,这里就直接会用到我们上课所学到的边缘检测的各种方法,边缘是图像的最基本特征,边缘部分集中了图像的大部分信息。边缘确定和提取对于整个图像场景的识别是非常重要的。而上一部的图像强也增强了边缘信息。
下一步,我认为就应该进行图像分割了,把各个字母数字单独分割出来,便于后续的进一步识别。
最后,就应该开始识别这些分割出来的图像,这一部分,我们课上内容并没有涉及,查阅了些资料,找到了比较可行的办法。即模式识别。我理解的过程是,首先我们应该建立一个标准模版库,然后通过将提取出来的样品与标准模版进行比较,来识别他们。
这就是上完数字图像处理课,我所能想到的车牌识别的整个过程,基本上需要用到我们所学的所有内容,而且都是比较基础的知识,我觉得,往往一个图像处理的问题,就是应该分成很多小问题来解决,一步步简化问题。一步步将图像中我们所最关心的内容提取出来。
1 数字图像处理技术概要
1.1 数字图像处理技术的概念
在图像处理技术中, 低级处理涉及初级技术, 如噪声降低、对比度处理和锐化处理。 中级处理涉及分割、缩减对目标像素群的定义, 以便于对不同像素或像素群的识别及计算机计算处理。 高级处理是算法对图像分析中被识别像素群的总体分析结果, 以及运算与视觉效果相关的分析函数等处理技术。
在应用数学理论时, 将图像定义为二维函数f (x, y) , x和y为空间坐标, 在任意一组空间坐标f (x, y) 的幅值f称为图像在该坐标位置的强度或灰度。当x, y和幅值f是离散的、有限的数值时, 称该坐标位置是由有限的元素组成的, 每一个像素都有一个特定的位置和幅值。
1.2 数字图像处理技术的发展
数字图像处理技术最早出现于20 世纪中期, 图像处理的目的是提高图像的呈现质量。 图像处理的是视效较低的图像, 要求输出尽可能提高效果后的图像。 主要采用噪声减弱、灰度变换、几何校正等方法进行处理, 并考虑了明暗效果和对比度等诸多因素, 由计算机进行更为复杂的图像处理。
20 世纪初期, 图像处理技术首次应用于提升通讯传输后的图像质量提升。 到20 世纪中期, 计算机发展到了一定的技术水平后, 数字图像处理才广泛应用于各种高质图像需求的领域。 计算机对飞行器发回的天体照片进行图像处理, 收到明显的效果。进而不断地推广和发展, 数字图像处理形成了较为完备的学科体系。 目前, 各个应用领域对数字图像处理技术提出更高的需求, 促进了这一学科体系向更高的技术方向发展。 特别是在像素群的理解与识别处理方面, 已经由二维图像处理发展到三维模型化的定义方法。
2 数字图像处理技术的方法
2.1 数字图像处理技术的特点
数字图像处理的信息源基本是二维数据, 处理信息量较大。 对计算机运算速度、存储空间等要求高。
数字图像处理的传输频带要求高。 与语音信息相比, 传输占用的频带要高几千倍。 所以, 就对图像压缩技术形成了有效的研究需求。
数字图像中每一个像素并非独立的, 相互关联性较高。 很多相邻像素之间有相同或相近的数值。所以, 图像处理技术中数据压缩的可能性较高。
由于图像是视觉三维意识的二维映射。 因此, 计算机要识别和处理三维形态就要进行适当的模糊处理或附加量的匹配。
处理后的数字图像是形成人为视觉理解和应用评估的依据, 因此处理结果必然受到人为的意识形态的影响。 所以, 在计算机视觉研究中, 人为的感知机理必然对计算机视觉的研究产生影响。
2.2 数字图像处理技术的基本方法
由于在图像处理中, 像素阵列很大, 在空间域中涉及计算量对计算机硬件的要求非常高, 所以, 必须引入图像的函数变换进行计算简化。 利用函数变换的间接处理方法, 如傅里叶变换、离散余弦变换、Walsh变换等, 不但可以降低计算强度, 而且可以得到高效的计算。
图像的像素矩阵编码压缩技术可以降低定义图像数据的比特数量, 并减少图像处理和传输时间, 进而节省存储空间。
图像的增强处理过程中不涉及图像质量降低的主要成因, 目的是要突出图像矩阵中敏感的像素群。 图像的复原处理需要对图像质量降低的主要成因进行调查, 进而采取相应滤波处理技术, 复原和重构原有的像素矩阵。
图像分割处理是数字图像处理中的关键处理手段之一。 是将图像中敏感的主要像素群作为主要处理对象, 包括区域特征、边缘特征等, 是对敏感像素群进行识别、理解和分析的基础数据特征。
作为最简单的二值图像可采用其几何特性识别物体的特性, 一般图像的理解方法采用二维形状理解, 它有边界理解和区域理解两类方法。 对于三维物体理解, 有体积理解、表面理解、圆柱体的广义理解等。
图像识别处理基本采用传统的模式识别方式, 有统计模式识别和结构模式识别两种, 随着研究广泛进行, 人工神经网络模式识别和模糊模式识别也得到不同程度的重视, 进行广泛研究。
3 数字图像处理技术的优点
数字图像处理技术与模拟图像处理技术在基本原理上的差异之处, 是数字化处理技术不可能在图像的传输、存储或复制等操作处理过程中, 使图像质量有所降低。 图像在数字化过程中精确地再现了原模拟图像, 则在数字图像处理过程中就能够确保无损于图像的各项数字化指标。
依据现有的数字化技术, 在图像数字化设备的性能满足要求的情况下, 完全可以数字化模拟图像成为目标精度的二维数组。 目前的数字化扫描仪能够将各个像素的灰度等级量化处理为48 位甚至更高, 这就说明数字化图像的精度可以满足几乎所有的应用需求。 对于数字化处理设备来说, 无论二位数组的规模, 也不考虑像素的量化位数, 处理过程基本是相同的。 从原理的角度来看, 无论图像的量化精度达到什么程度, 在技术上都是可以完成的, 只需要在处理修改过程中的数组技术参数。 而在图像的模拟量化处理过程中, 要想把量化处理精度提升, 就需要采用非常高等级的硬件设备或大规模提升处理装置的技术参数等级, 从技术经济方面考虑, 是非常不合理的。
图像的信息来源是多样化的, 一般情况下是可见光的感光图像, 也可以是不可见光的波谱图形图像。从图像映射物体感官的角度, 微观至电子显微镜采集的图像, 宏观至大规模空天望远镜采集的图像。不同信息来源的图像转换为数字化编码后, 都可以表示为二维数组的灰度级图像, 进而完成数字化处理过程。 对于图像的不同信息来源, 使用对应的图像信息量化技术, 图像的数字化处理技术可以用于任何一类图像。
图像数字化处理技术基本上可以归类为图像的质感提升、像素分析和区域重构等手段。因为图像的模拟技术处理从数学上分析只可以进行线性分析, 就局限了模拟图像处理技术可以完成的工作需求。
4 数字图像处理技术的展望
提高计算机对数字图像处理的速度, 提高采集分辨率和显示分辨率, 提高多媒体技术关键中图像数据的压缩, 进行计算机识别和理解研究中按照人类的认知和思维方式工作并考虑到主观概率和非逻辑思维技术, 规划统一的标准以实现图像的处理、传输和存储研究健康发展, 以上几点都是数字图像处理技术合理发展的基本融汇技术基础。
同时, 信息数据量更大的三维数字图像必将得到广泛应用研究, 图像与图形相互融合后形成三维成像或多维成像的发展方向也正在众多应用中广泛推进。
5 总结
数字图像处理技术在社会的每个行业、 每个领域都得到广泛的应用, 数字图像处理的技术应用随时、随处都可以见到, 得到充分的研究发展和应用推广, 还不能充分满足日益增长的技术需求。数字图像处理技术不断地在自身发展和完善的同时, 还与多个计算机分支学科的发展密不可分, 有多个新的技术方向需要研究和创新, 对数字图像处理技术的发展方向进行研究、探讨的重要性就显得尤为突出。
参考文献
[1]朱睿.数字图像处理技术现状与展望[J].中国科技博览, 2011 (14) :7-28.
[2]李红俊, 韩冀皖.数字图像处理技术及其应用[J].计算机测量与控制, 2002 (9) :35-36.
[3]李立芳.浅谈数字图像处理技术及应用[J].中国科技信息, 2012 (3) :45-46.
【关键词】数字图像处理;内容;特点;关键技术;应用;展望
【中图分类号】TP391.41【文献标识码】A【文章编号】1672-5158(2013)02-0129-02
1.数字图像处理技术的内容及特点
1.1 研究内容
不管应用到哪个领域的图像处理图像数据都要输入、加工和输出图像,其研究内容:
(1)获取、表示和表现图像——把图像信号转化为计算机可以识别的形式,并把数字图像显示和表现出来。
(2)图像复原——已知图像发生退化的缘由时,对图像进行修复,关键是建立退化模型。复原是以模型和数据的图像恢复为基础,消除退化的影响。
(3)图像增强——对图像质量的常规改善。当不知道图像退化原因时,还可用此技术比较主观的改善图像。
(4)图像分割——人类视觉系统可以轻松地将观察到的对象区分开来,但计算机却很难。分割的基本问题目前是将各种方法融合使用,以此提高处理的质量。
(5)图像分析——检测和测量图像中的目标,获取其客观信息,是从图像到数据的过程。
(6)图像重建——指从数据到图像的处理。
(7)图像压缩编码——为减少数据容量、降低数据率、压缩信息量,在不影响其效果的前提下减少图像的数据量。
1.2 数字图像处理技术的特点
(1)图像再现性好——不会因为对图像的变换操作而影响到图像质量;
(2)图像处理精度高——可以将图像数字处理为任意大小的数组;
(3)适用面宽——来自不同信息源的图像被变换为数字编码形式后,都可以用数组来体现灰度图像。
(4)灵活性高——图像处理可完成线性及非线性处理。
2.应用领域
数字图像处理技术被应用到越来越多的领域中,如医疗保健、航空航天、交通通信、军事、工业、农业、林业等。下面选取几方面进行分析:
(1)试听资料证据——视听资料证据是重要的诉讼证据,在司法诉讼活动中发挥着越来越重要的作用,数字图像处理技术是视听资料证据中图像证据资料技术性司法鉴定的常用手段,是图片原始性、真伪性、相关性认定的基本方法,如名捕监控录像模糊图像处理系统,该系统是手印、足迹、枪弹痕迹、工具痕迹、印章检验、文件检验以及录像带处理等痕检、文检、视频图像处理工作的必备工具;以及实时视频降噪仪,能够实时处理现场录像流,增强视频的清晰度,该在录像安全系统中加强监视录像的清晰度,或者在警方实地调查拍摄录像后回到警署再进行降噪。
(2)电子商务——当前的电子商务中,图像处理技术也大有可为,如身份认证、产品防伪和水印技术等。
(3)军事公安领域——军事的目标是侦察、制导和警戒系统和自动灭火器的控制及反伪装;公安部门的现场照片、指纹、手迹、印章和人像等的处理和辨识;历史文字和图片档案的修复和管理等。而数字图像处理技术将数码摄影和图像处理技术结合起来以其独特的优势在公安领域中逐步开始担当重任,在刑事摄影、档案管理、痕迹检验、文件检验、法医、物证提取以及公安教学或宣传中发挥着巨大作用,为广大的公安人员开阔了视野、拓展了思维空间,为执法的公正性提供了有力保证,应用提高了工作效率,减少了人、财、物的消耗,大大提高了工作效率。
(4)智能交通——图像处理具有算法柔性大、适应能力强等特点,在智能交通系统中取得了广泛的应用价值,例如车牌识别(车牌定位、车牌倾抖校正与字符分割、车牌字符识别变换等)和车辆检测与跟踪系统(包括感兴趣区域提取、车辆检测、车辆跟踪等),智能车辆导航、车型识别、交通控制等。
(5)航空航天通信——包括图像传输、电视电话和视会议等,主要是进行图像压缩甚至理解基础上的压缩。
(6)遥感技术——航空航天和卫星摇撼图像获取中和获取后都要用图像处理技术进行加工处理,提取出有利用价值的信息。主要用来对地形地质、矿藏资源搜索以及农业、水利、森林和海洋等资源调查研究,对自然灾害进行预测预报、检测环境污染、处理气象卫星云图以及识别地面军事目标。
(7)生物医学领域——图像处理在医学界的应用非常广泛,图像处理首先应用于细胞分类、染色体分类和放射图像等,临床诊断和病理研究中都大量接住了图像处理技术。它的直观、安全方便、无创伤的优点受到医生和患者的青睐。
(8)工业生产中的应用——在生产线中对产品及部件进行无损检测
(9)机器人视觉——机器视觉相当于智能机器人的重要感觉器官,可以对三维景物进行理解,医院、工厂、邮政以及家庭中的智能机器人,识别和定位装配线工件,太空机器人的自动操作。
(10)视频及多媒体系统——目前,电视制作系统中广泛使用图像处理、变换和合成技术,使电视效果更佳。在多煤体系统中广泛使用静止图像和动态图像的采集、处理、存储、传输和压缩,以达到使用者的目的。
(11)科学可视化——图像处理和计算机图形学的紧密结合,使科学研究得各个领域有了更为新颖的研究工具。
(12)宇宙探测——由于探索太空的需要和太空技术的快速发展,需要用数字处理技术来处理从外太空获取的大量星体照片。
(13)地质勘探——近年来发展起来的以数字图像处理技术为基础、综合多门学科知识的地学信息处理新技术的多源地学信息综合图像处理,使用一些特定的图像处理方法,实现了多源地学信息综合图像处理,用来辅助地质填图,构造地质研究,进行寸产资源的预测和评估,成为当前地质工作者正在研究和探讨的一个问题。
由图像处理技术在以上几个领域中的应用可以看出,图像处理技术在各领域中的重要程度:计算机图像生成技术在航空航海中可以充当仿真训练系统,还可以应用到广告和动画制作,跟友人将其应用到网游中;图像传输与通信还可在多媒体教学、网络视频领域得到广泛应用;在医学上,医学图像处理和材料分析也日益重要,如超声成像、X光成像、Y光成像以及核磁共振成像,对医生工作产生了巨大的辅助;图像跟踪和光学制导在战略技术武器中发挥了重要作用。
3.发展方向
随着计算机的发展,图像处理技术将越来越成熟,对各领域的影响也越来越大,总的来说,图像处理技术的发展有以下几个趋势:
(1) 在目前的基础上,图像处理速度越来越快,分辨率越来越高,多媒体应用光来月广泛,标准化、立体化程度越来越高,并产生智能化的趋势;
(2) 在目前二维基础上将出现多维成像的趋势;
(3) 芯片广泛运用到图像处理技术中,使用起来更加方便;
(4) 将出现新的算法与理论。
图像处理技术在各个领域的应用与发展,大大降低了相应领域的工作难度,效率更高,质量也无可挑剔,使人类受益匪浅。日后图像处理技术将进一步根据人类需求,在相关科研人员的努力奋斗下而实现新的突破,在更为广阔的领域造福人类事业。
参考文献
[1] 李红俊,韩冀皖.数字图像处理技术及其应用. 计算机测量与控制,2009.
[2]W.K.Pratt.DIGITAL IMAGE PROCESSING.Johnwiley & Sons,inc, 2008.
[3]杨枝灵,王开.Visual C++数字图像获取、处理及实践应用.人民邮电出版社,2003
[4] 聂颖,刘榴娣. 数字信号处理器在可视电话中的应用.光电工程, 1997.24(3):67~70
[5] 侯遵泽,杨文采. 小波分析应用研究.物探化探计算技术,1995. 17(3):1 ~9
1、引言
随着Internet与数字媒体技术的飞速发展,信息安全问题日益突出,主要表现在数字媒体被非法复制、篡改、传播与攻击等。因此,数字媒体的版权保护与信息完整性保证已逐渐成为人们迫切需要解决的一个重要问题,数字水印技术就是在这种需求下迅速发展起来的。
数字水印是一类信息隐藏技术,其基本思想是通过一定的算法将一些标志性信息嵌入到公开信息中,以达到隐匿信息的目的。其在知识产权保护、保密通信与内容鉴别等领域都具有广泛的应用价值。数字水印技术最初由Van Schyndel等人在1994年的ICIP会议上提出,他们针对灰度图像提出了两种向图像最低有效位嵌入水印的算法。1996年在英国剑桥召开了信息隐藏领域的第一次学术研讨会,标志着信息隐藏作为一个新学科的诞生。十多年来,数字水印技术得到了长足的发展,在水印的嵌入和检测方面,都取得了较多的成果。
目前,国际上剑桥大学、IBM研究中心、NEC美国研究所、麻省理工学院等都对数字水印进行了深入的研究。国内在数字水印方面的研究起步稍晚,但发展迅速。1999年12月召开了第一届全国信息隐藏学术会议。2000年1月,由国家863计划智能计算机专家组织展开了“数字水印技术学术研讨会”,体现了我国对这一领域研究的高度重视。目前,国内清华大学、北京大学、北京邮电大学、中科院自动化所、浙江大学、国防科技大学等都在该领域取得了不菲的成果。
2、数字水印的研究现状 2.1文本水印
文本水印就是将代表著作人身份的信息(水印)嵌入到电子出版物中,在产生版权纠纷时来验证版权的归属。其主要分为三大类:基于文档结构的水印方法、基于自然语言处理技术的水印方法、基于传统图像的水印方法。基于文档结构的各种水印方法都只是提留在文本的表层,无法抵抗对于文本结构和格式的攻击,简单的重新录入攻击就能使之失效,因此这些水印方法普遍存在鲁棒性差的缺点。自然语言文本水印方法相对提高了抗攻击的能力,但普遍存在容量不足的问题。基于传统图像的文本水印普遍存在鲁棒性不高、操作复杂的缺点。2.2图像水印
根据水印的实现过程,图像水印算法可分为空域算法和变换域算法。空域算法是通过直接改变原始图像的像素值来嵌入水印,通常具有较快的速度,但鲁棒性差,且水印容量也会受到限制;变换域算法是通过改变某些变换系数来嵌入水印,通常具有很好的鲁棒性和不可见性。其实现一般是基于图像变换,如DCT、DFT、DWT等。重点介绍一下变换域算法。2.2.1离散傅里叶变换(DFT)
该方法是利用图像的DFT来嵌入信息。通信理论中调相信号的抗干扰能力比调幅信号的抗干扰能力强,同样在图像中利用相位信息嵌入的水印也比用幅值信息嵌入的水印更稳健。实验表明该方法的抗压缩能力比较弱。2.2.2离散余弦变换(DCT)
DCT能把空间域的图像转换到变换域上进行研究,从而能很容易了解到图像的各空间频域成分,进行相应处理。基于DCT的水印方法与基于DFT的水印方法相比有较好的鲁棒性,但是无法做到对图像信号内容的自适应,因此往往会造成对图像特征的明显损害,不可感知性不是最佳。2.2.3离散小波变换(DWT)
DWT是一种时间-频率信号的多分辨率分析方法,在时频两域都具有表征信号局部特征的能力。实验表明,与DFT、DCT变换相比较,基于DWT的水印算法的鲁棒性最优,且与JPEG2000,MPEG4压缩标准兼容,利用DWT产生的水印具有良好的视觉效果和抵抗多种攻击的能力,且不可感知性最好。2.3音频水印
音频水印利用音频文件的冗余信息和人耳听觉系统的特点来嵌入水印,其可以保护声音数字产品不被随意复制和篡改,如CD唱片,广播电台的节目内容等。有学者提出了音频水印的三种基本方法:扩频嵌入方法、回声隐藏方法和相位编码方法。2.4视频水印
视频水印是通过对视频载体的时间和空间冗余来嵌入水印,其既不影响视频质量,又能达到保护节目制作者的合法权益和控制数字产品的复制。视频水印从算法要求上同图像水印有许多相似之处,但视频水印也有一些独特之处,如能够在压缩和未压缩的格式下实时完成水印的检测,对MPEG压缩、串谋攻击、A/D和D/A转换等都有较好的稳健性。
3、数字水印算法
从水印嵌入方式的角度来看,数字水印算法主要分为两大类:空间域水印算法和变换域水印算法。3.1基于空间域的水印算法
空间域的水印算法将水印信息直接嵌入在图像的灰度值中,该算法大都是基于最不显著位LSB(Least Significant Bit)方法。这种水印算法的特点是对水印的嵌入和提取简单、快速,嵌入的水印信息量大,但由于它位于图像的LSB上,稳健性较差,容易受到有损压缩、量比、有噪信道传输的影响。比较典型的空间域算法包括Schyndel算法和Patchwork算法等。Schyndel算法把一个密钥输入一个m序列发生器来产生水印信号,然后将该序列重新排列成二维水印信号,并按像素点逐一插入到原始图像像素值的最低位。Patchwork算法处理对象为256个亮度级和线性量化的图像且所有的亮度级的概率相等,图像中的任一像素值与其余的像素值是不相关的。该算法首先随机选取N对像素点,然后通过增加像素对中一个点的亮度值,而相应降低另一个点的亮度值的调整来隐藏信息。李旭东等人分析了现有的抗几何攻击算法的不足,并提出了一个新的抗几何攻击的图像数字水印算法。该算法在水印嵌入时,先对原始图像进行分块,然后对各个子块图像根据量化策略重复嵌入相应的1bit水印信息;在水印提取时,先将含水印图像进行分块,然后对从各个子块图像中提取出的水印信息根据多数原则判定相应子块图像所含的1bit水印信息。3.2基于变换域的数字水印算法
基于变换域的水印算法是目前应用最广泛的方法,这种方法是将图像变换到频域中,然后通过改变某些频域系数来嵌入水印。频域中能量分布较集中,且图像像素点间有一定的相关性,这有利于保证水印的不可见性,鲁棒性好。常用的变换有:离散余弦变换(Discrete Cosine Transform,DCT)、离散傅立叶变换(Discrete Fourier Transform,DFT)、离散小波变换(Discrete Wavelet Transform,DWT)。Cox算法是典型的离散余弦变换水印算法,该算法首先计算图像DCT系数,然后选择那些视觉重要部分的系数嵌入水印。文献[6]首先把图像分成8×8的不重叠像素块,经过分块DCT变换后,得到由DCT系数组成的频率块,然后随机选取一些频率块,将水印信号嵌入到由密钥控制选择的一些DCT系数中,其特点是数据改变幅度小,透明性好,但抵抗几何变换等攻击的能力弱。C.T.Hsu等人提出了基于可视化模型的算法,在8×8图像块的DCT系数中,选择4×4个中频系数组成小块,通过比较相邻两个小中频系数块中相应位置上系数的大小,进行水印的嵌入,由于采用了可视化模型,提高了水印的不可见性。黄继武等人利用人类视觉系统的照度掩蔽特性和纹理掩蔽特性,将空域中的图像块(8×8)分成三类,然后将不同强度的伪随机序列的水印分量自适应地嵌入到不同类图像块的DCT低频系数中,实现水印的嵌入。肖俊等人将多级离散小波变换的“多级”思想引入到离散余弦变换中,并对多级离散余弦变换的特性进行了分析,在此基础上提出了一种基于多级离散余弦变换的数字水印算法,该算法从多级离散余弦变换系数中选择适当的位置嵌入水印信息。离散傅立叶变换可以很好地表达图像的构造分布,其平移、放缩和旋转特性常常被用来构造几何变换的鲁棒水印。V Solachdis等人构造了一个环带状对称水印,水印信息为(1,-1),将其嵌入到DFT的中频子带中,可以抵抗压缩、旋转、剪裁等操作。J.J.K.O.Ruanaidh等人在水印算法中使用Mellin-Fourier变换,将水印嵌入在只与傅立叶变换的振幅有关的子空间中。Jce Ruanaidh等人提出了一种基于相位调制的水印算法。赫明钊等人提出一种基于分数傅里叶变换和随机相位编码的光学加密数字水印技术,该数字水印技术对于噪音叠加和常见的图像处理操作具有较强的稳健性。
小波变换是一种比较特殊的变换方式,它具有多分辨率分析的特点,而小波基和小波变换级数的选择更是给小波变换域数字水印算法的设计带来了很大的灵活性和优越性。Hsu和Lwu提出了多分辨率分析的水印算法,首先对水印和原始图像同时进行多分辨率分析,然后将水印在分辨率下的分析系数嵌入到具有相应分辨率的图像块中,这样,即使含水印的图像质量受到了攻击,丢失了部分信息,较低分辨率的水印仍然保存在较低分辨率的图像块中,因此水印具有较高的稳健性。X.G.Xia等人选用满足正态分布的伪随机序列做水印,在整幅小波分解生成的图像中,用由高分辨率到低分辨率、同一分辨率下由高频到低频逐个子带添加水印的方法进行嵌入。这种水印算法的优点是水印检测按子带分级扩充水印序列进行,在水印图像质量破坏不大的情况下,水印检测可以在搜索少数几个子带后终止,提高了水印检测的效率。H.M.Wang等人在上述方法的基础上进一步利用渐进编码的思想进行水印的嵌入和检测。首先通过一定的阈值选择一个小波分解的重要子带,在子带中从处于高位平面的系数到处于低位平面的系数上,添加水印直到所有水印点嵌入到图像中,该算法给出了一种不使用原始图像的盲检测方案。Lu Jiang和ZhangRan采用基于2维离散小波变换的数字水印方法,可以在不影响图像视觉效果的情况下,将水印信息嵌入到高通小波系数中,可以在一定程度上抵制压缩攻击和几何攻击。3.3基于融合的数字水印算法
图像融合主要有两种方式。一种是将两幅图像按照某种方式叠加生成一个新的图像,使新图像中包含两个图像的信息。采用较好的融合算法能保证恢复时无需原始公开图像。另一种是利用数字图像的自相关性,通过放大原始公开图像来隐藏与公开图像同样大小的数字图像。此方法对于彩色图像的隐藏比较实用,尤其适用于BMP彩色图像的加密隐藏,而且对所要隐藏的图像进行置乱处理后,安全性更高。
除了以上数字水印算法外,还有其他一些算法,比如分形水印、基于特征的水印算法等。
4、数字水印的应用领域 4.1 版权保护
版权保护是数字水印的最主要应用领域,其思想是数字作品的所有者通过密钥产生水印,利用一定的嵌入方法,将水印嵌入原始数据(图像、声音、视频等),然后公开发布嵌入水印的作品。当该作品被盗版或出现版权纠纷时,所有者可利用水印提取、检测、验证等方法,使嵌入的水印成为鉴定、起诉非法侵权的证据,从而保护所有者的权益。4.2 来源追踪
为避免未经授权的拷贝和发行,出品人可以将不同用户的ID或序列号作为不同的水印(数字指纹)嵌入作品的合法拷贝中。如果发现未经授权的拷贝,就可以根据此拷贝所恢复出的水印(数字指纹)来确定它的来源。4.3 信息标注
数字作品具有很多属性信息,如作品的标题、创作者等,利用数字水印技术将这些信息嵌入到作品中,不但不需要额外的带宽和存储,而且不易丢失。另外,国防和情报部门还可以利用数字水印技术实现隐蔽通信。4.4 访问控制
利用数字水印技术可以将访问控制信息嵌入到媒体中,在使用媒体之前通过检测嵌入到其中的访问控制信息,以达到访问控制的目的,它要求水印具有很高的鲁棒性。DVD防拷贝系统是访问控制的一个典型的应用例子,它将数字水印信息加入DVD数据中,并在DVD播放机中增加验证模块,使用DVD播放机之前,可以事先检测DVD数据中的水印信息来判断其合法性和可拷贝性,从而保护制造商的商业利益。还可以通过计算使用次数和复制次数进行控制,防止用户无限制地复制使用。
4.5 认证和完整性校验
★
1、数字图像处理的内容:
(1)图像获取、表示和表现(图像的数字化和图像变换)(2)图像增强(3)图像复原(4)图像重建(5)图像压缩编码(6)图像分割(7)图像分析(8)模式识别(9)图像理解
★
2、数字图像处理的层次关系(P 3):
狭义图像处理-------图像分析-----------图像理解。
抽象程度
低
高
数据量
大
小
语义
低层★编码效率 = 熵 /平均码长
★
4、霍夫曼(Huffman)编码的特点和步骤(P 118):
思想:在信源数据中出现概率越大的符号(灰度值),编码以后相应的码长越短
步骤:
(1)把输入符号按出现的概率从大到小排列起来,接着把概率最小的两个符号的概率求和;(2)把它(概率之和)同其余符号概率由大到小排序,然后把两个最小概率求和;(3)重复(2),直到最后只剩下两个概率为止
(4)在上述工作完毕之后,从最后两个概率开始逐步向前进行编码。对于概率大的消息赋予0,小的赋予1。特点:
(1)编码是唯一可译码。短的码不会成为更长码的启始部分;
(2)编码的平均码长接近于熵;编码效率略高于费诺仙侬Fano-Shannon编码。
5、算术编码的特点:
(1)码字本身定义一个介于0和1之间的实数区间,该区间中的任何一个实数就代表要编码的消息序列。(2)信源符号与码字之间不存在一一对应的关系。一个码字不是赋给某个信源符号,而是赋给整个消息序列。(3)当消息中的符号数目增加时,用于描述消息的间隔变得更小,而表示间隔所需要的信息单元(如编码位数)变得更多了。
第七章
图像分割
1、图像分析的步骤:
(1)把图像分割成不同的区域或把不同的对象分开(2)找出分开的各区域的特征
(3)识别图像中要找的对象或对图像进行分类
(4)对不同区域进行描述或寻找出不同区域的相互联系,进而找出相似结构或将相关区域连成一个有意义的结构
2、图像分割的基本策略
(1)分割算法基于灰度值的两个基本特性:不连续性和相似性
(2)检测图像像素灰度级的不连续性,找到点、线(宽度为1)、边(不定宽度)。先找边,后确定区域。
(3)检测图像像素的灰度值的相似性,通过选择阈值,找到灰度值相似的区域,区域的外轮廓就是对象的边
★
3、图像分割的方法
(1)基于边缘的分割方法:先提取区域边界,再确定边界限定的区域。(2)区域分割:确定每个像素的归属区域,从而形成一个区域图。(3)区域生长:将属性接近的连通像素聚集成区域
(4)分裂-合并分割:综合利用前两种方法,既存在图像的划分,又有图像的合并。
4、边缘检测算子:
基本思想:计算局部微分算子
一阶微分:用梯度算子来计算
特点:(1)对于阶跃状变化,会出现极大值(两侧都是正值,中间的最大)
(2)对于屋顶状变化,会过零点(两侧符号相反)不变部分为零。用途:用于检测图像中边的存在 二阶微分:通过拉普拉斯来计算
特点:(1)对于阶跃状变化,会过零点(两侧符号相反)
(2)对于屋顶状变化,会出现负极大值(两侧都是正值,中间的最大)不变部分为零。用途:用于检测图像中边的存在
★
5、几种常用的边缘检测算子:
梯度算子:仅计算相邻像素的灰度差,对噪声比较敏感,无法抑止噪声的影响。Roberts算子:与梯度算子类似,效果略好于梯度算子 Prewitt算子:在检测边缘的同时,能抑制噪声的影响 Sobel算子:(1)对4邻域采用带权方法计算差分
(2)能进一步抑止噪声,但检测的边缘较宽
Kirsch算子(方向算子): 在计算边缘强度的同时可以得到边缘的方向,各方向间的夹角为45º
用法:取其中最大的值作为边缘强度,而将与之对应的方向作为边缘方向(共8个模板)★Laplacian算子:
优点:(1)各向同性、线性和位移不变;
(2)对细线和孤立点检测效果较好。
缺点:(1)对噪音的敏感,对噪声有双倍加强作用;
(2)不能检测出边的方向;(3)常产生双像素的边缘。
注意:由于梯度算子和Laplace算子都对噪声敏感,因此一般在用它们检测边缘前要先对图像进行平滑。
Marr算子:马尔算子是以拉普拉斯算子为基础,首先用一个二维高斯函数对图像卷积以减低图像噪声的影响(平滑);再用二阶导数差分算子(拉普拉斯算子)计算 优点:是快速,能得到一个闭合的轮廓。缺点:由于使用二阶导数,对噪声敏感。
曲面拟合法:求平均后再求差分,因而对噪声有抑制作用
5、单方向锐化处理:
定义:单方向的一阶锐化是指对某个特定方向上的边缘信息进行增强。因为图像为水平、垂直两个方向组成,所以,单方向锐化实际上是包括水平方向与垂直方向上的锐化。
特点:处理结果对于人工设计制造的具有矩形特征物体(例如:楼房、汉字等)的边缘的提取很有效。但是,对于不规则形状(如:人物)的边缘提取,则存在信息的缺损。后处理:这种锐化算法需要进行后处理,以解决像素值为负的问题
方法1:整体加一个正整数,以保证所有的像素值均为正。
这样做的结果是:可以获得类似浮雕的效果。
方法2:将所有的像素值取绝对值。
这样做的结果是,可以获得对边缘的有方向提取。
方法3:为了检测边缘点,选取适当的阈值T,对梯度图像进行二值化
这样形成了一幅边缘二值图像g(x,y)
6、交叉方向锐化处理:
特点:这类锐化方法对边缘的方向没有选择,又称为无方向的锐化算法。交叉Priwitt锐化算法:与Sobel相比,有一定的抗干扰性。图像效果比较干净 交叉Soble算法:锐化的边缘信息较强
7、Canny边缘检测算子:
定义:Canny边缘检测——最优的阶梯型边缘检测算法
原理:图像边缘检测必须满足两个条件:一能有效地抑制噪声;二必须尽量精确确定边缘的位置。根据对信噪比与定位乘积进行测度,得到最优化逼近算子。这就是Canny边缘检测算子。
★最优边缘检测算子应有的指标:
(1)低误判率
(2)高定位精度
(3)抑制虚假边缘
8、边缘跟踪:
出发点:由于噪音的原因,边界的特征很少能够被完整地描述,在亮度不一致的地方会中断。因此典型的边检测算法后面总要跟随着连接过程和其它边界检测过程,用来归整边像素,成为有意义的边
概念:将检测的边缘点连接成线就是边缘跟踪(线是图像的一种中层符号描述)由边缘形成线特征的两个过程:
(1)可构成线特征的边缘提取(2)将边缘连接成线
连接边缘的方法:
(1)光栅跟踪:一种采用电视光栅行扫描顺序,结合门限检测,对遇到的像素进行分析,从而确定是否为边缘的跟踪方法(2)全向跟踪:跟踪方向可以是任意方向,并且有足够大的跟踪距离的跟踪方法
特点:全向跟踪改进了光栅扫描跟踪法,跟踪时把初始点的八邻点全部考虑进行跟踪
9、阈值分割法:
基本思想:确定一个合适的阈值T,将大于等于阈值的像素作为物体或背景,生成一个二值图像,在四邻域中有背景的像素,既是边界像素。特点:(1)适用于物体与背景有较强对比的情况,重要的是背景或物体的灰度比较单一
(2)这种方法总可以得到封闭且连通区域的边界。通过交互方式得到阈值: 实施方法:(1)通过光标获得样点值f(x0,y0)
(2)选取容忍度R(3)if(|f(x,y)–f(x0,y0)| R)
set 255 通过直方图得到阈值:
基本思想:边界上的点的灰度值出现次数较少
取值的方法:取直方图谷底,为最小值的灰度值为阈值T 缺点:会受到噪音的干扰,最小值不是预期的阈值,而偏离期望的值;
改进:取两个峰值之间某个固定位置,如中间位置上。由于峰值代表的是区域内外的典型值,一般情况下,比选谷底更可靠,可排除噪音的干扰
else
set 0
10、复杂图像区域分割的主要步骤:
(1)自动直方图平滑(2)确定区域分类数(3)自动搜索阈值
11、特征空间聚类的步骤:
(1)任意选K个初始聚类中心值
(2)使用最小距离判别,将新读入的像素分到k类中的某一类(3)重新计算中心值,中心值等于这类中元素的平均值(4)当新旧差异不大时停止
12、质心区域增长法
(1)选择一个为划分类型的像素作为起点(2)起点周围未被划分的点与起点所在区域的灰度平均值差异小于阈值合并为一区域,并标记
(3)从新合并来的像素开始,反复进行第(2)步
(4)反复进行(2)(3),直到不能合并
(5)对图像中所有未被划分的像素反复(1)—(4)步
第八章 二值图像处理与形状分析
★
1、如何判断像素是否可删除:
二值图像上改变一个像素的值后,整个图像的连接性不改变,则这个像素可删除
★
2、腐蚀算法的思想和步骤:
思想:设计一个结构元素,结构元素的原点定位在待处理的目标像素上,通过判断是否覆盖,来确定是否该点被腐蚀掉。步骤:(1)扫描原图,找到第一个像素值为1的目标点;
(2)将预先设定好形状以及原点位置的结构元素的原点移到该点;
(3)判断该结构元素所覆盖的像素值是否全部为1:
如果是,则腐蚀后图像中的相同位置上的像素值为1;
如果不是,则腐蚀后图像中的相同位置上的像素值为0;
(4)重复(2)和(3),直到所有原图中像素处理完成。
作用:腐蚀处理可以将粘连在一起的不同目标物分离,并可以将小的颗粒噪声去除。
★
3、膨胀算法的思想和步骤:
思想:设计一个结构元素,结构元素的原点定位在背景像素上,判断是否覆盖有目标点,来确定是否该点被膨胀为目标点。步骤:(1)扫描原图,找到第一个像素值为0的背景点;
(2)将预先设定好形状以及原点位置的结构元素的原点移到该点;
(3)判断该结构元素所覆盖的像素值是否存在为1的目标点:
如果是,则膨胀后图像中的相同位置上的像素值为1; 如果不是,则膨胀后图像中的相同位置上的像素值为0;(4)重复(2)和(3),直到所有原图中像素处理完成。
作用:膨胀处理可以将断裂开的目标物进行合并,便于对其整体的提取。
4、图形线性化:
思想:图像压缩或是图像分析的过程中需要用图形部分像素来代表整个图形,因此提出图形线化的思想 方法:图像线化通常使用骨架法和图形细化两种方法 骨架法:(1)骨架是从距离变换图得来,是距离变换图中灰度值最大的像元集合,(2)即使是无空洞的连通图像它的骨架不一定连通。
(3)骨架可看作是图像压缩表示之一,对骨架图经过加粗运算(加粗量=骨架像元灰度值-1)可近似恢复成原图像。
细化:(1)细化是从二值图像中提取线宽为1像素的中心线的操作。
(2)细化与骨架化不同,只要原图像连通(不管有无空洞),细化的结果总是连通的。
5、边界跟踪法:
理论基础:先根据某些严格的“探测准则”找出目标物体轮廓上的像素,再根据这些像素的某些特征用一定的“跟踪准则”找出目标物体上的其他像素。
跟踪准则:边缘跟踪从图像左上角开始逐像点扫描,当遇到边缘点时则开始顺序跟踪,直至跟踪的后续点回到起始点(对于闭合线)或其后续点再没有新的后续点(对于非闭合线)为止
实现步骤(1)获得原图像的首地址,及图像的高和宽。
(2)开辟一块内存缓冲区,初始化为255。
(3)将图像进行二值化处理。
(4)跟踪边界点,找到1个边界点,就将内存缓冲区中该点相应位置置0。(5)按照跟踪准则,重复执行(4),直到回到初始点。
KLT:理论上的最佳变换。
优点:完全去相关,能量最聚集。
缺点:无固定变换矩阵,无有效快速算法。
直方图均衡本质:减少图像的灰度等级以换取对比度的扩大。
空间域线性平滑——低通掩膜法(系数为正):
优点:算法简单,交互性好,噪声适应性强。
缺点:会造成轮廓的模糊。
空间域非线性平滑———中值滤波(统计排序滤波器)
优点:在平滑的同时适当保护轮廓。
缺点:对噪声有选择性,对随机噪声不理想,对高斯噪声效果不好,对椒盐噪声效果好,但不适于点,线,尖顶细节较多的图像。
锐化比较:
梯度算子:对小细节不敏感,抗干扰强。
SOBEL算子:由于引入了平均因素,对图像中的随机噪声有一定的平滑作用。由于它是相隔两行或两列之差分,边缘两侧元素得到了增强,故边缘显得粗而亮。
拉普拉斯运算:各向同性,所以对点的检测有较强的响应。
优点:对细线和孤立点的检测较好,可以突出细节
缺点:抗干扰能力差。
无约束恢复:去卷积。方法:逆滤波。
特点:噪声越大,误差越大,只适合信噪比很高的情况下。存在病态解。
有约束恢复:去卷积,抑制噪声,克服状态解。
映射器是去相关的过程,决定压缩的效果。
恢复质量取决于量化器,失真来自于量化误差。
预测编码:利用图像中相信像素的相关性,对预测差值编码
特点:缺点:误差传递,抗干扰能力弱。
优点:算法简单,易于硬件实现。
最佳预测是预测差值在均方意义上的最小值。
变换编码:利用图像内所有像素的相关性,对变换系数进行编码
特点:优点:抗干扰能力强。
缺点:计算复杂,不易于硬件实现。
变换的比较:
KLT:完全去相关,最佳变换。
DFT:压缩时接近KLT,但存在大量复杂计算,计算成本高,且有吉布斯效应。
WHT:计算简单,压缩速度快,但去相关较弱,压缩效果差。
关键词:数字图像处理,重要工具,新型学科
一、数字图象处理技术的发展现状
20世纪20年代, 图像处理技术首次得到应用。20世纪60年代中期, 随电子计算机的发展得到普遍应用, 图像处理技术不断完善, 逐渐成为一个新兴的学科。随着图像处理技术的深入发展, 从70年代中期开始, 随着计算机技术和人工智能、思维科学研究的迅速发展, 数字图像处理向更高、更深层次发展。到20世纪90年代, 机器人技术已经成为工业的三大支柱之一, 人们已开始研究如何用计算机系统解释图像, 实现类似人类视觉系统理解外部世界, 这被称为图像理解或计算机视觉。很多国家, 特别是发达国家投入更多的人力、物力到这项研究, 取得了不少重要的研究成果。
数字图像处理主要是为了修改图形, 改善图像质量, 或是从图像中提取有效信息, 还有利用数字图像处理可以对图像进行体积压缩, 便于传输和保存。随着技术的发展, 数字图像处理主要应用于通讯技术、宇宙探索遥感技术和生物工程等领域。数字图像处理因易于实现非线性处理, 处理程序和处理参数可变, 故是一项通用性强, 精度高, 处理方法灵活, 信息保存、传送可靠的图像处理技术。主要用于图像变换、量测、模式识别、模拟以及图像产生。广泛应用在遥感、宇宙观测、影像医学、通信、刑侦及多种工业领域。
二、数字图象处理技术的应用
视觉是人类最高级的感知器官, 所以图像在人类感知中扮演着最重要的角色, 这是毫无疑问的。然而, 人类的感知仅限于电磁波谱的可见视觉波段, 成像机器则可覆盖几乎全部电磁波谱, 从伽马射线到无线电波。它们可以对非人类习惯的那些图像源进行加工, 这些图像源包括超声波、电子显微镜及计算机产生的图像。因此, 数字图像处理涉及各种各样的应用领域。
(一) 机器人方面
水下机器人因其工作环境的特殊性, 对其进行智能化有较高要求。一方面, 水下环境未知因素多而复杂, 机器人在水下作业时必须具有灵敏而全面的感知能力, 这就要求机器人携带更多的传感器。另一方面, 水下作业时机器人会受到水的阻力, 自身体积过大必将使阻力大增而降低工作效率, 这就要求机器人本体设计尽量要小巧、轻便, 同时它携带的传感器也应该尽可能的少。综合这两方面要求, 最好能找到一种能全面且准确的感知水下环境的传感器对水下机器人进行智能化, 摄像机是目前最为理想的选择。机器人用摄像机作为唯一传感器感知周围环境, 一般是采用双目立体视觉技术结合三维重建技术。双目视觉技术需要用到两个摄像机, 再加上配套的桅杆支架以及缆线, 体积仍然很大。这对于水下工作的机器人来讲, 携带的难度依然不小。
由于双目立体视觉直接模拟了人类的视觉处理景物的方式, 因此成为计算机视觉研究的重点。双目立体视觉体用两台位置固定的摄像机, 从不同的方位获得两幅或多幅图像, 通过摄像机标定技术获得内外参数, 通过图像采集得到图像进行立体匹配, 获得两幅图像的视差图, 通过三角测量原理进而获得三维信息, 完成模型的三维重构。
因此用一个摄像机来取代双目立体视觉系统, 进而通过软件算法把单目视觉转换到双目视觉技术。这样既能满足机器人在水下作业时只携带一个摄像机作为唯一传感器的要求, 又能使用已经比较成熟的双目立体视觉技术来恢复现场的三维信息。
三维图像重构根据三维数据来源不同:可以分为两类。第一类是基于图像的建模方法。这种方法是从摄像机获得两幅或多幅图像, 利用图像间的关系进行建模。目前使用较广泛的有双目立体视觉的方法和修改标准模型的方法。基于立体视觉理论的三维重建采用一台或两台摄像机从不同的角度拍摄物体, 对获得的多幅图像进行立体匹配, 然后采用三角测量的方法, 从匹配后的数据中恢复物体的三维数据。基于修改标准模型的方法, 即将标准模型作为基础, 通过刚体变换等技术对具体的模型数据拟合完成标准与具体模型的匹配, 再利用图像合成纹理的信息建立三维模型;第二类通过激光扫描仪得到三维数据, 通过调整已经有的标准网格模型来拟合特定模型。这种方法可以高速精准的获得三维数据, 但是由于设备是入侵式的而且价钱昂贵, 所以目前第一类方法的使用更受欢迎。基于立体视觉的单双目重建方法设备简单, 采集信息相对便利, 因此成为机器人视觉研究领域的研究热点。
(二) 通信工程方面
当前通信的主要发展方向是声音、文字、图像和数据结合的多媒体通信。具体讲是将电话、电视和计算机以三网合一的方式在数字通信网上传输。所谓“三网合一”就是指电信网、广播电视网和计算机通信网的相互渗透、互相兼容、并逐步整合成为全世界统一的信息通信网络。“三网合一”是为了实现网络资源的共享, 避免低水平的重复建设, 形成适应性广、容易维护、费用低的高速宽带的多媒体基础平台。即电信网、广播电视网、互联网分别在向下一代的电信网、广播电视网、互联网的发展和演进过程中, 网络的功能趋于一致、业务范围趋于相同, 都可以为用户提供打电话、上网和看电视等多种服务。其中以图像通信最为复杂和困难, 因图像的数据量十分巨大, 如传送彩色电视信号的速率达100Mbit/s以上。要将这样高速率的数据实时传送出去, 必须采用编码技术来压缩信息的比特量。在一定意义上讲, 编码压缩是这些技术成败的关键。除了已应用较广泛的熵编码、DPCM编码、变换编码外, 目前国内外正在大力开发研究新的编码方法, 如分行编码、自适应网络编码、小波变换图像压缩编码等。
(三) 地震检测方面
2008年5月12日14时28分04秒, 四川汶川、北川, 8级强震猝然袭来, 大地颤抖, 山河移位, 满目疮痍, 生离死别。这是新中国成立以来破坏性最强、波及范围最大的一次地震。对于地震勘测中, 地震信号的初至时间常用于获取表层的速度、厚度及进行静校正, 而初至时间的检测精度极大制约着解决这些问题的精度和效率, 这也是地震预测中最难解决的问题。采用数字图像这种检测是地震信号处理的一个重要环节。在地震波接收记录上, 初至波振幅大于噪声振幅, 初至时间位于纯噪声信号与地震有效信号和噪声之叠加信号之间的分界处。根据这些特征, 如果把地震信号幅值数据处理成256级灰度图, 在把灰度图二值化, 然后通过检测二值图像的边缘, 获得地震波的初至时间是具有较高的精度和效率的。如果能够合理的利用数字图像处理技术在地震将至前检测出相应的预警信号, 就能有效地减少地震对人们造成的巨大损失, 这一领域的深入研究将是人类发展进步中的一项尖端课题。
(四) 军事公安方面
在军事方面图像处理和识别主要用于导弹的精确制导, 各种侦察照片的判读, 具有图像传输、存储和显示的军事自动化指挥系统, 飞机、坦克和军舰模拟训练系统等;公安业务图片的判读分析, 指纹识别, 面部识别, 不完整图片的复原, 以及交通监控、事故分析等。
面部识别技术通过对面部特征和它们之间的关系来进行识别, 这需要人工智能和机器知识学习系统。大部分研究生物识别的人都公认面部识别是最不准确的, 也是最容易被欺骗的。面部识别技术的改进依赖于提取特征与比对技术的提高, 并且采集图像的设备会比其技术昂贵得多。然而指纹识别作为识别技术已经有很长的历史了, 有着坚实的市场后盾, 从指纹中抽取的特征值可以非常的详尽, 以便可靠地通过指纹来确认一个人的身份。指纹是人体独一无二的特征, 并且它们的复杂程度足以提供用于鉴别的特征;如果想要增加可靠性, 只需登记更多的指纹, 鉴别更多的手指, 最多可以多达十个, 而每一个指纹都是独一无二的。指纹采集也变得越来越方便, 读取指纹时, 用户只需将手指与指纹采集设备相互接触, 就可得到可靠的指纹图像。指纹采集设备可以更加小型化, 并且价格会更加的低廉。也许有人会非难它在采样时手指必须与采集头相接触, 但这样可以得到最可靠的图像, 保证了识别的准确率。可以见到, 指纹识别技术是目前最方便、可靠、非侵害和价格便宜的生物识别技术, 对于市场的应用有着很大的潜力。
(五) 文化艺术方面
目前这类应用有电视画面的数字编辑、动画的制作、电子图像游戏、纺织工艺品设计、服装设计与制作、发型设计、文物资料照片的复制和修复、运动员动作分析和评分等等, 现在已逐渐形成一门新的艺术——计算机美术。传统的动画片大部分由人用手工来完成, 最后再由摄像机拍摄并连接在一起。由于使用了电子计算机辅助制作卡通片, 使制作周期大幅度的缩短, 因而引起了动画片商的兴趣, 使动画片制作的计算机化进程大大加快。在一些复杂的科学及工程项目中, 资金投入比较大, 如果实际的实验失败, 所造成的损失是巨大的。例如航天工程、导弹及机器人等复杂的系统工程。为了避免这种损失, 往往采取动画或仿真动画软件来预演, 以发现问题、修改工程方案。通常对这复杂项目进行分析和研究, 建立适应系统的各种模型, 然后利用计算机动画技术模拟真实系统的动力学、运动学和控制等行为, 从而达到检测系统设计质量及可靠性的目的。通过仿真动画, 调整系统模型的参数, 使得系统运行于较优状态。计算机动画技术在许多的复杂的系统工程研究中已经成为必不可少的工具。
三、数字图象处理技术的前途
数字图像处理技术的发展彻底改变了传统工作的观念和方法, 体现了其非常高的优越性, 使得图像的采集处理从模拟走向了数码, 从后期处理走向了现场实时处理, 从档案袋走向了数据库, 实现了全数字化的飞跃。尽管有一些问题制约着这门新型学科的发展, 比如提高精度的同时着重解决处理速度的问题, 巨大的信息量和处理速度仍然是一对主要的矛盾。但是伴随着计算机系统的不断升级, 不断完善, 数字图像处理技术将会出现空前的发展。未来的发展笔者相信几乎不存在与数字图像处理无关的技术领域, 这门学科的发展无论是对社会科学还是人文科学势必都会产生巨大的推动作用。
参考文献
[1]谢凤英, 赵丹培.Visual C++数字图像处理[M].北京:电子工业出版社, 2008.
【关键词】数字图像技术 数字图像处理 应用
一、数字图像的优点
(一)再现性好。数字图像处理与模拟图像处理的根本不同在于,它不会因图像的存储、传输或复制等一系列变换操作而导致图像质量的退化。只要图像在数字化时准确地表现了原稿,则数字图像处理过程始终能保持图像的再现[2] 。
(二)处理精度高。按目前的技术,几乎可将一幅模拟图像数字化为任意大小的二维数组,这主要取决于图像数字化设备的能力。现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高,这意味着图像的数字化精度可以达到满足任一应用需求。对计算机而言,不论数组大小,也不论每个像素的位数多少,其处理程序几乎是一样的。换言之,从原理上讲不论图像的精度有多高,处理总是能实现的,只要在处理时改变程序中的数组参数就可以了。回想一下图像的模拟处理,为了要把处理精度提高一个数量级,就要大幅度地改进处理装置,这在经济上是极不合算的。
(三)适用面宽。图像可以来自多种信息源,它们可以是可见光图像,也可以是不可见的波谱图像(例如X射线图像、射线图像、超声波图像或红外图像等)。从图像反映的客观实体尺度看,可以小到电子显微镜图像,大到航空照片、遥感图像甚至天文望远镜图像。这些来自不同信息源的图像只要被变换为数字编码形式后,均是用二维数组表示的灰度图像(彩色图像也是由灰度图像组合成的,例如RGB图像由红、绿、蓝三个灰度图像组合而成)组合而成,因而均可用计算机来处理。即只要针对不同的图像信息源,采取相应的图像信息采集措施,图像的数字处理方法适用于任何一种图像。
(四)灵活性高。图像处理大体上可分为图像的像质改善、图像分析和图像重建三大部分,每一部分均包含丰富的内容。由于图像的光学处理从原理上讲只能进行线性运算,这极大地限制了光学图像处理能实现的目标。而数字图像处理不仅能完成线性运算,而且能实现非线性处理,即凡是可以用数学公式或逻辑关系来表达的一切运算均可用数字图像处理实现。
二、数字图像处理的特点
(一)数字图像处理的信息大多是二维信息,处理信息量很大。如一幅256×256低分辨率黑白图像,要求约64kbit的数据量;对高分辨率彩色512×512图像,则要求768kbit数据量;如果要处理30帧/秒的电视图像序列,则每秒要求500kbit~22.5Mbit数据量。因此对计算机的计算速度、存储容量等要求较高[4]。
(二)数字图像处理占用的频带较宽。与语言信息相比,占用的频带要大几个数量级。如电视图像的带宽约5.6MHz,而语音带宽仅为4kHz左右。所以在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本亦高,这就对频带压缩技术提出了更高的要求。
(三)數字图像中各个像素是不独立的,其相关性大。在图像画面上,经常有很多像素有相同或接近的灰度。就电视画面而言,同一行中相邻两个像素或相邻两行间的像素,其相关系数可达0.9以上,而相邻两帧之间的相关性比帧内相关性一般说还要大些。因此,图像处理中信息压缩的潜力很大。
(四)由于图像是三维景物的二维投影,一幅图像本身不具备复现三维景物的全部几何信息的能力,很显然三维景物背后部分信息在二维图像画面上是反映不出来的。因此,要分析和理解三维景物必须作合适的假定或附加新的测量,例如双目图像或多视点图像。在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题。
三、数字图像处理的应用
图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及到人类生活和工作的方方面面,主要包括:
(一)航天和航空技术方面的应用。数字图像处理技术在航天和航空技术方面的应用,不仅应用于对月球、火星照片的处理,还应用于飞机遥感和卫星遥感技术中。例如,LANDSAT系列陆地卫星,采用多波段扫描器(MSS),在900km高空对地球每一个地区以18天为一周期进行扫描成像,其图像分辨率大致相当于地面上十几米或100米左右。这些图像在空中先处理(数字化,编码)成数字信号存入磁带中,在卫星经过地面站上空时,再高速传送下来,然后由处理中心分析判读。这些图像无论是在成像、存储、传输过程中,还是在判读分析中,都必须采用很多数字图像处理方法。
(二)通信工程方面的应用。主要应用于声音、文字、图像和数据结合的多媒体通信。例如,将电话、电视和计算机以三网合一的方式在数字通信网上传输。
(三)军事应用。在军事方面图像处理和识别主要用于导弹的精确末制导,各种侦察照片的判读,具有图像传输、存储和显示的军事自动化指挥系统,飞机、坦克和军舰模拟训练系统等。
四、结语
随着数字技术、成像技术、计算机技术的不断研制和开发,其模糊模式识别和人工神经网络模式分类在图像识别中也越来越受到重视。数字图像处理技术,在今后的国家现代化建设、航天航空、通信、军事应用等领域,必将发挥更大的作用
参考文献:
[1]王继军,张显全,张军洲,韦月琼.一种新的数字图像分存方法[J].计算机工程应用,2007,31:79~81
[2]郭武,张鹏,王润生.独立分量分析及其在图像处理中的应用现状[J].计算机工程应用,2008,23:172~177
[3]秦晴,杨晓元,王育民,王志刚.一种新的数字图像隐秘检测方案[J].计算机工程应用,2004,32:73~75
【数字图像处理心得】推荐阅读:
数字图像处理心得体会06-12
数字图像处理介绍07-14
数字图像处理实验全09-23
数字图像处理技术的方法及发展方向论文11-09
DSP数字图像取反课程设计06-06
数字信号处理实验程序10-25
数字信号处理浙江大学06-02
数字信号处理应用领域07-05
数字化教育教学心得体会06-13
中传数字媒体艺术考研经验心得体会10-12