图像数字化

第1篇：图像数字化

图像转向中的生控复制和生物数字图像

摘要：21世纪初的图像转向是生命图像转向，这意味着当代社会的生产方式已经更新换代到生控复制范式。生控复制的生产方式在图像生产领域中则表现为数字复制生物数字图像中的形象基因以实现图像的生产与再生产。显然，米歇尔的以生控复制和生物数字图像为基础的图像生产理论要比本雅明和波德里亚的走得更远些。

关键词：图像转向;生控复制;生物数字图像;图像生产

一、从图像转向到生命图像转向

W.J.T.米歇尔在1992年首次提出“图像转向”(the pictorial turn)。他认为理查德·罗蒂的语言转向(the linguistic turn)之后在人文研究领域出现了新的转向，这个转向发生在20世纪后半叶的后现代主义时期。他说：“哲学家们所谈论的另一次转变正在发生，又一次关系复杂的转变正在人文科学的其他学科里、在公共文化的领域里发生。我想要把这次转变称作‘图像转向’。”①米歇尔还列举了图像转向在英美学术研究中的各种变体：皮尔斯的符号学、尼尔森·古德曼的艺术语言、欧洲的现象学、德里达的文字学、法兰克福学派的大众媒体研究、福柯的权力的眼睛、维特根斯坦的《逻辑哲学论》、潘诺夫斯基研究的复兴、居伊·德波的景观社会等等。显然，图像转向跟随在语言转向之后意味着“图像构成了跨越广泛的知识探讨领域的一种特别的冲突和不适。现在这个图景在托马斯·库恩所说的‘范式’和‘异常’之间找到了一个位置，就仿佛语言一样成了人文科学理论中的一个核心话题”②。因此，如果图像转向能够承继语言转向的文化重任，那么，图像就必须像语言一样成为人文研究的一个核心话题或显著问题。20年之后，米歇尔对这个理论预设充满信心。他说：“它(图像转向)已经在文化、社会和政治批评中被广泛采用。我的这个观点是说(很难说是始源性的)，形象不论在大众文化还是在艺术、媒体、文化理论和哲学研究中都已经成为一个显著的问题，从语言到形象的转向在这种情形下似乎正在发生。换言之，理查德·罗蒂的语言转向正被另一个转向所承继，这个转向正朝向跨媒体的图像、形象和图符。”③米歇尔的理论自信有其道理，尼尔·柯蒂斯主编的论文集《图像转向》(2010)集中探讨了图像转向的话题，诸多视觉文化研究的学者如詹姆斯·赫伯特、桑德尔·霍尼克、凯斯·默克希、索尔·科恩也纷纷撰文回应米歇尔的这个理论命题。毋庸置疑，米歇尔的图像转向与戈特弗雷德·伯姆的“图符转向”(ikonische Wendung，the iconic turn，1994)、马丁·杰伊的“视觉转向”(the visual turn，2002)一道组成了发生在新世纪之交的“视觉文化的转向”。总之，图像转向把图像推至学术研究的荧光灯下，探讨当代社会的文化生产自然绕不开米切尔的图像生产理论。

当人们还在为其图像转向争执不休或根本没有搞清楚这个术语的内涵时，米歇尔在21世纪初又提出了“生命图像转向”(the biopictorial turn)①。米歇尔的图像生产理论从图像转向到生命图像转向的发展中慢慢浮出水面。首先，我们需要纠正人们对图像转向的误识。人们通常会认为图像转向意味着我们现在生活在一个以视觉为主的读图时代。而听觉、触觉等人类其它感官在视觉文化时代已然萎缩，这自然延伸出“图文对立”的流俗浅见。米尔佐夫的“现代生活就发生在荧屏上”②无疑是丹尼尔·贝尔“当代文化正变成一种视觉文化”③的翻版，这些都是对图像转向的误识。米歇尔曾严厉批判了这类误识：“我当时并不想宣称现代社会是一个被视觉和视觉表征所笼罩的独特的或空前的时代。我的目的是想对作为一种普遍现象的视觉或图像的转向的感知。”④他指出对图像转向误识的根源在于人们“建构了一个宏大的、二元的历史模型，而只把重点放在这些转折点中的一个之上，并宣称在(例如)读写时代与视觉时代之间只有一个分界点”。⑤换言之，图像转向的误识是将人类历史截然分为二元对立的两端——读写时代与视觉时代——图像转向就发生在历史两端在分界点上，而这个唯一的分界点就是我们所处的时代。如此，米歇尔一针见血地指出了人们误识图像转向的思维根源。

其次，我们需要理解米歇尔眼中的图像转向。其一，图像转向是一个比喻性的循环现象。米切尔说：“图像转向是一个比喻，是从古代以来就被多次重复的一种修辞用法。……图像或视觉的转向并不是我们这个时代所独有的东西。它是一个被重复了无数次的叙事性象征，只是在我们这个时代采用了一个非常明确的外形，但它在各种不同的其他情况下也会采取其他的显现形式。……摄影、油画、人造景观、塑像铸造、因特网、书写、模仿自己等技术手段的发明都是非常重要的时刻，不管怎么说，制造视觉图像的新方法标志着历史的转折点。”⑥如前所述，米歇尔认为图像转向不是历史长河中的一个独特的、唯一的现象，而是一个普遍的、循环的现象。因此，图像转向的转折点在历史中不是独特唯一的，而是循环重复的。图像转向与生产方式的变革直接相关，每一次生产方式的变革都会产生一种图像转向的文化现象。因而，图像生产的方式变革是图像转向的经济基础，而图像转向则是图像生产的方式变革的文化表征。其二，图像转向是一个混合性的学术概念。图像转向混合了该术语历时性和共时性的意义。米歇尔说：“图像转向的概念是一个混合观念，它混合了一个具体历史事件的观念与一个循环现象的观念，而这个循环现象是人类社会的永恒特征。……重要的是要把图像转向理解为既是共时的又是历时的观念，是一个具有不同形式的循环现象。”⑦因此，图像转向在历时性中是具有不同形式的、具体的历史事件，而在共时性中则是对这些具体事件的总体性表述。

最后，生命图像转向是历时性图像转向中的一个具体事件。历时性图像转向是一个循环重复的文化现象，米歇尔指出了两个典型的历时性图像转向：一个是文艺复兴时期的人工透视;另一个是19世纪摄影机的发明。进入21世纪，米歇尔敏锐地察觉到新的图像转向已然发生，他把这次图像转向称为生命图像转向。米切尔说：“在21世纪，我想我们必须升级‘图像转向’的概念以认识它自身的新发展，我把这种发展称为‘生命图像转向’。生命图像转向是关于鲜活的机体和器官的复制、模仿和再生产的生产，伴随这种生产而来的是人们对复制品、双面恶魔、身份丧失的古老恐惧得以复活。……我的意思是图像转向自十二年前我首次提出以来已经产生了新的意义。这种新的意义来自本雅明所谓的生产与再生产的新模式。新的生产模式是生物学和信息科学的双重革命即我所谓的‘生控’。”①换言之，生命图像转向是图像转向在历时性意义上的新版本，它可以如同有机体器官的生产与再生产一样生产图像。因而，生命图像转向源自“生控复制”(biocybernetic reproduction)的生产方式，是对这种新的生产与再生产模式的文化表征。可见，米歇尔的图像生产理论的独特之处在于，他一方面从具体的生产方式的变革入手得出图像转向的文化征候，另一方面又从图像转向的文化背景中展开图像生产在新的生产方式下的具体情况。总之，生命图像转向的文化表征显现了生控复制的生产方式和生物数字图像(biodigital picture)的生产对象。米歇尔的图像生产理论在于他阐述了这种新的生产方式和生产对象。这与本雅明的图像生产理论迥然有别，二者的比较更能凸显米歇尔图像生产理论的独创性和时代性。

二、生物数字图像与生控复制

生物数字图像是生控复制的生产对象。生物数字图像既是数字形式的又是生物形式的文化商品。米切尔说：“图像转向的新版本大约在晚近的二十年中产生。它是朝向‘生命图像’或准确地说是‘生物数字图像’的转向，这些鲜活的图像借助生物学和信息科技被给予了生命的姿态和外表。计算机和基因工程的发明在这个图像转向的古老比喻中，特别是在形象和生命形式的比拟中产生了一个新的转折。”②这里需要强调的是，米歇尔的生命图像(biopicture)是生物数字图像的简称或略称，因为无论是生命图像还是生物数字图像都涉及生物学和计算机两个方面的内容，而“生物”和“数字”正是对这两个方面内容的体现。米歇尔认为，史蒂芬·斯皮尔伯格导演的电影《侏罗纪公园》(1993)中的一帧元图像(metapicture)恰当地阐述了生物数字图像的观念。该电影中一只失去控制的迅猛龙冲进计算机控制室中企图吃掉工作人员，此时控制室中的投影机将计算机中的DNA编码投射到这只恐龙的皮肤上。被打上DNA编码的恐龙图像很好地阐释了生物数字图像中的生物和数字的双重性。因而，米歇尔反复强调生物数字图像是建立在信息科学和基因工程的基础之上。生物数字图像有别有于以往图像的地方在于，它如同有机体生命一样携带着数字的基因密码。那么，这种生物数字图像中的基因是什么?

生物数字图像的数字基因是形象。首先，米歇尔区分了形象(image)与图像(picture)的关系。图像与形象在米歇尔那里当表示二维平面内的视觉再现时常常被他交替混合使用。但是，米切尔意识到图像与形象显然也存在三个区别：其一，图像与形象是具体客体与虚拟现象的区别;其二，图像与形象是故意的再现行为与自动的想象行为的区别;其三，图像与形象是特定的视觉再现(形象家族中的图像)与整个形象家族(the family of images)的区别。③概括起来，图像是实体的、个别的的文化客体，而形象则是虚拟的、总体的的心理现象。当图像传达出一个形象时，无论我们如何破坏这个图像，该形象都不会被取消。这个保留着生命基因的形象出现在其它图像中并借助大众媒体获得最大范围的传播。因而，段炼说：“米歇尔的当代图像学，关注形象怎样变成了图像，关注形象所携带的信息，以及形象经过了加工或人为的扭曲而成为图像后，这图像所具有的信息传播和宣传功能。”①其次，形象与生命形式间是双向的隐喻关系，形象是生命的模仿而生命也是形象的模仿，这就如同DNA与有机体的关系。米歇尔说：“种类如同一般形象一样可以辨认出在不同个体样本中重复的品种和模板。……相反，这些样本如同图像一样是种类或形象的具体、物质的体现。……形象与图像如同种类与样本、家族与成员间的关系。”②因此，形象是图像的DNA，而图像是形象的身体。罗兰·巴特在《明室》中曾隐约地意识到了图像身体中的形象基因，但是他并未深究这个问题。③其实，任何具有伦理道德的人都不会故意地把一张母亲的照片撕碎。米歇尔提出的生物数字图像很好地解释了这个话题。因为照片中生活着母亲的伟大形象，这个形象如同母亲的DNA一样是克隆母亲的全息替身。换句话说，照片中的母亲与现实中的母亲处于克隆关系中。因此，撕碎这张照片意味着对长辈的不敬和僭越，是一种伦理的禁忌。总之，当福柯宣布我们已经走进生命政治时代的时候，米歇尔认为对图像的认识应该提升到生物数字图像层次。此时，米切尔的生物数字图像与福柯所谓的生命权力和生命政治共鸣。④

何为“生控”(biocybernetics)?生控是“生物控制”的简称，这个概念在“生物”(bios)与“控制”(cybernetics)之间存在着辩证的张力。控制在古希腊语中是船的舵手，意味着操纵和管理。而生物则意味着有机生命，它对来自机器的控制采用或屈服或抵抗的策略。显然，米歇尔对后现代主义、数字时代等划分时代的概念表示不满。米切尔认为，后现代主义只是命名当下新事物的占位符号，无法阐释新事物产生的方式和原因。而数字时代、信息时代和计算机时代都是对我们时代的一种简化称呼和肤浅表达，无法完整浓缩当代社会的文化精神。⑤因此，米歇尔主张用生控范式的观念描述当今时代的文化精神。因为“生控不仅涉及到控制、交流领域，而且涉及到逃避控制、拒绝交流领域”⑥。在米歇尔看来，人体炸弹是生物沦为机器控制，而智能炸弹则是生物控制机器，二者正是生物与控制间冲突的典型案例。因此，当代社会不是简单的数字时代或克隆时代而是二者糅合的时代，起于20世纪晚期的生控范式是当代社会的表征。

生控范式在社会生产领域表现为生控复制。首先，生控复制的思想诞生在米歇尔对恐龙这个生物数字图像的研究中，恐龙图像完全是生控复制的直接产物。米歇尔认为，史蒂芬·斯皮尔伯格的侏罗纪公园是世界上第一个生控复制的工厂，它生产远古恐龙作为旅游文化商品。因此，米歇尔在《最后的恐龙书》(1998)中首先提出生控复制时代(the age of biocybernetic reproduction)的概念。2000年秋季，米歇尔开始撰写同年11月份应柯柏联盟学院人文学科系主任约翰·哈灵顿(John Harrington)的请求发言的草稿。⑦这篇发言稿就是《生控复制时代的艺术作品》，此文在2003年9月于《现代主义/现代性》期刊中发表，后在2005年收入米歇尔的专著《图像何所欲》中。可见，恐龙图像作为一个具体的生物数字图像促使米歇尔抽象出生产这种图像的生产方式即生控复制。其次，米歇尔分别从广义和狭义的角度界定生控复制。狭义的生控复制指计算机技术和生物科学的结合实现了有机体的基因克隆，而广义的生控复制涉及新的技术媒体和政治经济结构对有机体现状的改变。⑧在当代，计算机的升级换代直接引出了新媒体和自媒体，这无疑对政治经济结构的更新起着催化作用，所以计算机深刻影响着处在这个社会环境和媒体形式中的有机体。因此，生控复制主要以DNA解码和信息科学为标志，是在有机体和计算机紧密结合的基础上实现的生产与再生产。人机一体是生控复制的主要特征，它深刻影响了后人文主义时期人们的身心结构。当代人有与机器融于一体的强烈愿望，人类与机器开始了形影相随、寸步不离的蜜月时期。心脏起搏器、人工心肺机……这些都从不同方面切实地表征着人机一体欲望的征候。无独有偶，唐娜·哈拉维(Donna Haraway)提出“赛博格”(cyborgs)的概念来描述后人文主义时期生命与机器的杂糅现象。①生命与机器间糅合的产物在荧幕中有诸多形象，如钢铁侠、终结者、蝙蝠侠等。但是，人机一体在这里不仅意谓人类与机器间的紧密相随，而且特别指人类与手机、人类与电脑间的相互融合、相互锁定。“手机”意味着“手+机”，“电脑”意味着“电+脑”，它们是人机一体的典范代言。显然，这里的手机是指与计算机密切联系的智能手机而非普通的移动电话。当代人可以宅在私人空间与电脑翩翩起舞;当代人可以遁入赛博空间谈一场网络恋爱;当代人可以贴身放置智能手机让世界触手可及。手指与键盘、手掌与机身间的黏稠关系是人机一体的征兆，而“网瘾”、“鼠标手”、“手机控”、“刷屏狂”则是人机融合过程中出现的显著病症。诚如肖恩·库比特所言，“我们使用这种键盘就像控制括约肌一样灵便自如。”②米歇尔通过两种方式瓦解了机器的和有机的之间的对立：一是生命像机器;二是机器像生命。米歇尔比较强调的是生物在控制的腹地培养了诸多具体形式的“湿件”(wetware)，如计算机病毒和在失真压缩中信息的破坏衰减。米歇尔说：“从更大的角度来看，生物体和计算机之间的关系正是对自然与文化、人类与人造世界(工具、人工产品、机器和媒体)间传统辩证关系的重写。”③总之，生控复制技术建立在人机一体的基础之上。米歇尔从本雅明那借用马克思的生产与再生产理论，从生产方式的具体更新中体察社会、历史和文化的变迁，并借此阐释当今复杂的社会文化和时代精神。生控复制的观念描述了后人文主义时期人机一体的时代走向。米歇尔让生控复制时代承担起划分历史代际的文化重任。

生控复制是图像生产范式的新近发展，是生物数字图像的生产方式。首先，图像生产的生产方式在历史中经历了柏拉图的洞穴和旋转镜子、亚里士多德的蜡版、洛克的暗箱、图灵机(数字复制)和基因克隆等范式。达·芬奇的镜子说、艾布拉姆斯的镜与灯、理查德·罗蒂的镜式真理都是柏拉图旋转镜子的演进。雕刻塑像、工业设计、机床冲压则发展了亚里士多德的蜡版模式。本雅明的机械复制(胶卷照片)则是洛克暗箱的现代应用。图灵机的出现才有了戴维·哈维的电子复制(数字照片)。米歇尔则依据图灵机和DNA编码的结合，提出了具有克隆性质的生控复制(生物数字图像)。其次，米歇尔依据历时性中的三个图像转向(即人工透视、暗箱摄影、基因克隆)④把近代以来的图像生产范式划分为三个历史阶段：手工复制、机械复制和生控复制。⑤图像生产的范式演进再现了资本主义社会发展的三个历史形态：前生产社会、生产社会和消费社会。⑥某种意义上，米歇尔的图像转向三阶段或图像生产三范式与波德里亚的“拟像的三个等级”具有高度的齐整性。波德里亚指出，拟像(simulacra)自文艺复兴以来经过三个等级：古典时期的仿造、工业时期的生产和数字时代的仿真(simulation)。⑦大体而言，手工复制与仿造、机械复制与生产、生控复制与仿真在相同历史阶段中萌发了相似的图像生产范式。具体到图像生产的第三个阶段，米歇尔的生控复制显然比波德里亚的仿真更复杂和更全面，同时也更贴切地表征了社会的现状。波德里亚的仿真仅仅建立在数字符号的基础之上，而米歇尔的生控复制不仅包括数字信息科学而且更强调生物基因技术，例如克隆。最后，图像生产领域中的生控复制范式。克隆是生物学领域中的生控复制，也就是说，生控复制是生物学领域有机体生产的现代范式。那么，生控复制范式在图像生产领域中又是如何运作的呢?米歇尔说，克隆的发明“将信息科学的革命与生物科技结合起来开创了‘生控复制’的时代，它许诺以字面地和技术地实现生命权力和生命政治的许多预言式幻想。在形象制造的层面来说，这种创新预示着数字想象的来临，这对视觉再现有革命性的效果，其深刻性如同基于化学的摄影发明对于手工的形象制造产生的效果。在至少两个世纪以来的空间中，人类已经从手工制造转移到机械生产再到数字形象生产，而这对媒体、日常生活和形象概念都产生了重大影响。这种转变的首要征兆就是我所说的‘生物数字图像’”①。因此，我们以生物学中的生控复制为类比阐述图像生产领域中的生控复制范式。生物学领域的生控复制范式可以表述为：人们通过糅合计算机和生物学的克隆技术从有机体的DNA中生产出新的有机体。以此类推，图像生产领域中的生控复制则是，人们通过生控复制技术从生物数字图像中的形象中生产和再生产出新的生物数字图像。如前所述，生物数字图像中的形象犹如有机体中的基因。换言之，生物数字图像可以通过生物学的克隆和计算机的复制实现无性繁殖，可以生控复制该图像中的形象实现图像生产。生控复制范式下的生物数字图像的生产与再生产往往表现为病毒式、指数级的繁殖和增生。例如，出自新闻照片的奥巴马头像可以在世界范围内无限制地传播和生产，人人都可以借助生控复制技术随便涂鸦奥巴马头像，借以生产出带有奥巴马形象的新图像。因而，形象的价值则体现在内含该形象的生物数字图像的生控复制的数量和速度上。毋庸置疑，奥巴马头像的广泛流行意味着奥巴马形象极高的商业价值和政治价值。

三、图像生产：从机械复制到生控复制

生控复制挑战了机械复制下的诸多观念，如机器大工业、流水线、摄影和电影。众所周知，本雅明在20世纪30年代曾提出机械复制时代的概念，并认为电影是机械复制时代产生的一种颠覆崇拜价值、强调展览价值的艺术形式。②当本雅明的这个概念业已深入人心的时候，米歇尔却认为本雅明的机械复制已经落后于时代的发展，应该启用生控复制才能描述新的社会文化现象。生控复制范式下的图像生产不再依靠摄影中的物理机械和化学过程，而是依据由电子和数字编码的、可以被用来生产出任何视觉幻象的数据串。③图像此时不是由胶卷而是由数字组成，并且它将携带着大量的形象基因如克隆般增殖传播，图像生产的生产方式则由机械复制转向生控复制而生产对象则从无机实体图像到生物数字图像。具体而言，如果说电影是对人文主义时期工业流水线的艺术模仿(电影对胶卷的化学刻录如同流水线对钢材的机械锻造)，那么微电影则是对后人文主义时期人机一体的艺术反映。

生控复制与机械复制在图像生产中存在三个相互关联的差异。首先，机械复制中灵韵的消失和生控复制中形象的遗传。本雅明认为，图像原本中存在着一种令人敬仰的灵韵，但是当图像原本经机械复制产生图像复本后，这种灵韵则在图像复本中消失。与此相反，米歇尔的图像生产理论却认为，图像原本中存在一种类似生物基因的形象，这个形象不但不会消失而且会在生控复制中向基因一样遗传到图像复本中。有时，图像复本比图像原本更具有灵韵。④米歇尔的形象在生物数字图像中得到遗传，而本雅明的灵韵则在无机实体图像中消失。其次，机械复制中图像的退化和生控复制中图像的进化。在本雅明那里，图像复本没有图像原本中的灵韵意味着机械复制的图像是退化的、更差的和无价值的图像。而米歇尔生控复制的图像复本因为保留了图像原本中的形象，因此，图像复本不会比图像原本显得更差或更糟。甚至很多时候，生控复制往往会修改、升级图像原本中的形象，从而生产出更先进、更强大的图像复本。①生物基因工程中的转基因食物和转基因生物就是通过修改原来食物和生物的基因来提高食物的可口感和生物的存活率。米歇尔的生物数字图像是对图像原本的遗传和进化，而本雅明的机械复制图像则是对图像原本的破坏和退化。再次，机械复制中图像本身的复制和生控复制中图像基因的复制。本雅明的机械复制是对图像本身(作为物体的图像)的复制。因此，机械复制使得图像与现实、图像原本与图像复本间紧密相连。换言之，图像原本必定来自社会现实，而图像复本也必定来自图像原本。米歇尔的生控复制是对图像基因即图像中形象的复制。因此，生控复制打断了图像与现实、图像原本与图像复本间的锁链。生控复制的生物数字图像在这里类似于波德里亚的仿真拟像，这类图像复本可以是虚拟的，与图像原本和社会现实相脱节的。

总之，21世纪初的图像转向是生命图像转向，这意味着当代社会的生产方式已经更新换代到生控复制范式，从斯皮尔伯格的侏罗纪公园中的数字恐龙到生物学家伊恩·威尔马特和基思·坎贝尔的克隆绵羊，从转基因食物和转基因生物再到本·拉登的恐怖主义，生控复制范式作为一种社会生产方式已经深入到人们的日常生活中。生控复制的生产方式在图像生产领域中则表现为数字复制生物数字图像中的形象基因以实现图像的生产与再生产。显然，米歇尔的以生控复制和生物数字图像为基础的图像生产理论要比本雅明和波德里亚的走得更远些。

【责任编辑付国锋】

作者：孙恒存

第2篇：欧美发达国家图像数字化标准研制进展及启示

摘要论文调研欧美发达国家图像数字化标准建设成果，为我国公共数字文化融合工程数字图像资源建设标准的制定提供参考。论文采用网站调研、文献调研等方法收集欧美发达国家公开发布的9个图像数字化标准，系统梳理标准的特征，认为我国在研制图像数字化标准时应统一部署，吸引各类文化机构参与，按需更新内容，注重版权问题，完善质量指标和评估体系，制定数字化建设方式的选择原则。

关键词公共数字文化图像数字化标准

分类号 G250.76

DOI 10.16810/j.cnki.1672-514X.2021.03.013

Development Progress and Enlightenment of Digital Image Standards Construction in Developed Countries in Europe and America

Wang Cailian， Huang Yuting

0 引言

图像资源建设是公共数字文化建设的重要内容之一，其中建立并完善图像数字化标准是图像资源建设的基础。20世纪80年代开始，国际图书馆界已有图像数字化的探索和数字化标准的制定实践[1]。美国国会图书馆1990年开启“美国记忆（American Memory）”计划[2]，持续发布和完善数字化标准。荷兰皇家图书馆于1995年开始馆藏数字化的工作，2010年推出图像数字化指南[3]。在理论研究方面，国外有研究比较了经典图像数字化指南的优缺点和应用现状[4];有学者从理论角度总结开展图书馆数字化项目需考虑的问题[5]，但缺少操作细节;国内有学者分析了美国FADGI和澳大利亚数字化标准的内容及对我国的启示[6-7]，但调研范围较小。

我国现行图像标准有三个，分别为2011年国家图书馆发布的《国家图书馆图像数据加工标准和操作指南》（下简称《操作指南》）、2012年文化部发布的文化行业标准《图像数据加工規范》和2014年国家标准《图书馆馆藏资源数字化加工规范第3部分：图像资源》。但现行标准在技术参数、流程上存在差异，未能跟上当前技术的发展，引用的国际标准文件不是最新版本，且未明确规定数字化中的版权事宜，在实践中引发了著作权侵权的争议。现行标准未能完全满足当前图像加工的需求，制定统一、先进、适用的图像数字化标准势在必行。由此，本文拟以欧美发达国家图像数字化指南为对象，梳理研制情况及内容特征，以期为我国图像数字化标准建设提供启示。

1 发达国家图像数字化标准研制成果及特征

本文调研的欧美发达国家的国家级公共图书馆、相关协会或联盟、资助机构等公开的图像数字化标准文件共9份，如表1所示。文件以指南（Guidelines）、建议（Recommendations）或最佳实践（BestPractices）等形式发布，后文统称为指南。

1.1 指南研制主体多样

图像数字化指南的研制主体多样，包括国家级图书馆、图书馆联盟和科研资助机构。国家级图书馆推进图像数字化工作不仅有利于提升本馆数字化信息服务水平，还能推动国家文化遗产的保存和传播。荷兰皇家图书馆、西班牙国家图书馆、瑞士皇家图书馆和美国国会图书馆均为国家级图书馆，拥有丰富的馆藏、先进的技术以及充足的人才和资金储备，为图像数字化标准编制工作奠定了坚实基础。

IMPACT、ALCTS和CARLI等图书馆联盟作为区域型图书馆组织，促进了资源的数字化、共享和交流。IMPACT是服务于欧洲地区的非盈利组织，旨在“更好，更快，更便宜”地推进历史印刷文本数字化。ALCTS是美国图书馆协会（American Library Association，ALA）成员之一，旨在推动技术服务、馆藏管理、开发、保存和重新格式化技术的发展。CARLI旨在通过共享专业知识、产品、服务，促进伊利诺斯州学术和研究图书馆的教学、研究和创新。

德国研究基金会和美国国家人文基金会均为其资助的数字化项目制定了指南。《DFG数字化指南》用于指导申请人设计规划项目，保证数字化项目评审的公平和规范。美国国家人文基金会与国会图书馆研制的《国家数字报纸计划（NDNP）技术指南》避免了因申请单位的差异造成的数字化资源质量不稳定，便于数字化成果的统一管理。

1.2 更新频率不一

半数以上指南在研制过程中经历过版本更新，根据时代发展修订指南内容，保证指南的先进性。另一些指南为确保指南具备稳定性，在现有版本能够满足使用需求的情况下，未发布更新版本。

美国NDNP指南由专门的项目组维护，总结实践中遇到的扫描、元数据等问题，检查格式文件更新，在每年上半年推出新版本。瑞士国家图书馆2014年将策略型文件更新为实操型指南，并于2017年进一步完善，其最新版原计划于2019年前后推出，但目前暂未发布。美国国会图书馆的《文化遗产材料数字化技术指南：光栅主图像的创建》与原指南相比，规范了数字化流程，细化了不同类型资源和不同质量等级的参数，还增加了质量评估系统和元数据的内容。指南由FADGI的静态图像小组专门维护，计划在未来一到两年内推出新版本。这些指南根据实践需求及时完善，时效性高。但值得注意的是，更新过快也会导致实际应用中数字化的流程、图像参数等变更频繁，从而对实际工作造成影响。

在实际应用中，稳定性也是指南应具备的特性之一。DFG于2013年更新后未发布新版本，ALCTS和IMPACT没有公开更新信息，主要原因是这些机构的指南仅作为数字化思路指导，不涉及图像数字化具体实践。荷兰皇家图书馆的指南于2012年推出，目前仍在使用，虽然更新频率较低，但保证了图像数字化的持续性和稳定性。

2 国外图像数字化标准内容分析

2.1 高度重视版权问题

国外指南对版权的要求较为严格，通常根据本国或地区的法律要求限制数字化对象的使用范围，在选择数字化资源时考虑潜在的版权问题，规避版权风险。

对受版权保护的原始资源，要以遵守当地法律法规要求为原则。在瑞士，作品自存在起就受版权保护，在对资源数字化前必须获得版权所有者的授权。瑞士国家图书馆要求有版权的原始资源在数字化前要与出版商达成授权使用协议。在国际社会，当数字化项目为馆藏、教育或研究等非盈利性目的使用时，可通过版权合理使用制度获得数字化权利[16]，但用于传播时，需获得授权。DFG要求在提交项目申请前解决材料的版权问题，包括出版权、人格权、邻接权和档案权，这一规定使项目避免了潜在的法律风险，保证了数字化图像能被合法传播和利用。

为避免潜在的版权纠纷，首先考虑选用公共领域的文献。西班牙国家图书馆和NDNP要求数字化对象的原件是公共领域资源，即由公众共享并可免费使用的不受版权、商标、专利或任何其他知识产权法保护的创造性材料[17]。公共领域的文献使用限制少，不需要获得作者授权，仅需要保护作者的精神权利即可。西班牙国家图书馆和NDNP数字化的目的均为免费展示和网络传播，选用公共领域的文献可避免潜在的版权纠纷。

2.2 强调质量控制与评估

指南对图像质量的控制和评估体现在数字化的整个流程中，包括在数字化前规定国际统一的图像质量维度并明确参数，数字化过程中应用完整的评估系统保证质量，数字化结束后多维检测成品。

首先规定统一的图像质量维度。大多数指南都将图像分为主图像和派生图像两类，其中主图像用于长期保存，采用未压缩的TIFF格式，派生图像由主图像压缩生成，用于传播，有JPEG、PDF、PNG等格式。色彩（灰度或彩色）、色彩深度、分辨率等是普遍采用的图像质量指标，各指南的具体参数要求差异较大，如表2所示。

多数指南对图像分辨率的要求都在300dpi及以上，最低为CARLI中对缩略图要求的100ppi。指南对颜色和位深的要求基本一致，灰度图像多数要求8位，彩色图像要求16位或24位。CARLI中还出现了二值图像的要求，即图像中仅有黑白两种颜色，这在满足需求的前提下，大大减少了存储空间。

此外，还有指南对色彩空间（又名色域，Color Space）进行了限定，色彩空间是对颜色进行编码和组织的方法，影响颜色表现的丰富程度，扫描加工时色彩空间会影响数字图像对原始文献的色彩还原度。常用的色彩空间有eciRGBv2、Adobe RGB（1998）和Gray Gamma 2。eciRGBv2通过人眼感知色调差异的方式构建，适用于高质量印刷品的数字化，Gray Gamma 2.2主要用于灰度图像。FADGI的指南建议将当今彩色显示器上广泛使用的色彩空间sRGB用于以传播为目的的派生图像。

其次完善评估系统。数字化流程的质控需要在不同阶段设定技术目标，并使用测试图表进行质量检查。荷兰皇家图书馆使用的测试图表有Q-13、mini ColorChecker和通用测试目标（Universal Test Target，UTT），FADGI自主研發了图像评估系统——数字成像一致性评估项目（The Digital Imaging Conformance Evaluation Program， DICE）。质控主要检查色彩准确度、曝光、对比度和白平衡等，保证图像清晰度和对原始资源呈现的忠实度。

最后对图像进行多维度检测。图像成品的质控是对数字化过程中的质控的补充，保证了图像及其相关描述、链接的完整性和准确性。西班牙国家图书馆在质检中要求随机抽取小部分页面，检查图像可靠性是否达到一定水平，检查图像的标签、名称和显示状态是否正确。NDNP数字化成品在交付给国会图书馆前均需完成质量检测，项目组开发了JHOVE工具包用以核对文件标识、格式和特征描述，该工具包囊括了NDNP特有的核对规则，可保证数字化成品的质量合格。

2.3 数字化建设方式选择灵活

图像数字化建设依赖于专业的数字化人员、设备和经验，建设方式包括自建或外包。多个指南提出了数字化建设方式的选择原则，图书馆可根据自身数字化资源、能力、成本等灵活选择。

指南规定的数字资源建设方式包括自建和外包两种。自建是指由专门设立的数字化部门负责，其他部门配合完成的建设方式。自建可为未来的项目建立起专业知识储备和基础设施，减少材料损坏的风险，便于控制图像质量，但对图书馆设备和人员的要求较高。外包是指将数字化任务交由合作者或外部服务提供商完成，具体操作过程中，既可以将原始文件带离图书馆，也可以将文件保存在图书馆，由外部服务提供商在现场进行数字化。外包可节约成本和时间，减轻馆员的工作压力，但仍需要内部员工管理项目，保证数字化的质量。

在选择自建还是外包的问题上，DFG、FADGI和瑞士国家图书馆都提出需要同时评估机构的能力、项目和数字资源的性质。评估机构能力的维度有人力资源、职工的数字化技能、物理空间、数字化设备及可用的资金或资源水平;评估项目和数字资源的维度包括项目的紧迫性、文档的类型和数量，文件的保存状况和脆弱性、文件的价值和安全性，及最终产品的预期质量等。综合权衡这些维度可保证决策的正确和科学。此外，根据实际需求，即使在同一个项目中，也可同时采用两种建设方式，通过优势互补完成数字化任务。

3 国外图像数字化标准对我国的启示

3.1 统一部署，吸引各类文化机构参与

欧美发达国家指南的研制主体多样，图书馆、联盟和科研资助机构都积极进行标准的研制工作，丰富了标准的成果，但也造成了标准混乱的问题。我国积极推进统一的标准建设，2019年4月颁布的《公共数字文化工程融合创新发展实施方案》[18]要求统一标准规范体系，编制统一的图像资源建设标准和技术标准。国家的统一部署可以有效避免标准混乱的问题。

吸引各类公共文化机构积极参与标准研制保证了标准内容的科学规范。图书馆拥有丰富的实践经验，可保证内容的专业;图书馆联盟可从数字化共享传播的角度提供建议;科研资助机构可从数字化项目可行性维度提供思路。各类机构积极参与、群策群力，从不同立场提供标准研制的建议，可以使标准更好地指导图像数字化实践。

3.2 按需更新内容

2011年发布的《操作指南》是我国现行最详细的数字化指南。尽管2012年、2014年分别发布了行业标准和国家标准，但是《操作指南》尚无更新版本。FADGI、NDNP、瑞士国家图书馆和DFG的指南在发布后均有修订，有效地保证了指南的先进性和科学性。我国应以实践需求为导向，以先进性和兼容性为基本原则，根据社会发展和科技进步情况及时修订指南文件。随着扫描、显示和存储能力的提升，实践对图像清晰度、色彩丰富性的需求不断升级，图像的分辨率和色彩位深等参数应及时调整。随着技术的成熟，三维建模、环物摄影的三维展示技术被广泛应用[19]，“全景虚拟游览”进入人们的视线，新兴技术改变了保存和展示实物文献资源的方式，在指南的更新中应充分考虑应用需求，以决定是否需要纳入指南。

3.3 注重版权问题

版权问题在欧美发达国家的指南中被广泛提及，但在我国现行图像数字化标准中缺乏版权相关规定。在数字化材料的选择中，西班牙国家图书馆、瑞士国家图书馆和美国NDNP项目都要求审查数字化原件的版权情况，要求征得版权所有人的许可或仅选择公共领域的文献，避免版权纠纷。随着我国法制建设不断推进，完善知识产权相关规定的需求被提上日程，国家版权局、文化部等四部门联合发布了《关于加强图书馆著作权保护工作的通知》[20]，提出要不断提高图书馆的著作权保护水平，在资源数字化工作中重视版权问题。我国《著作权法》和《信息网络传播权保护条例》将图书馆、档案馆的数字化行为认定为复制行为，在版权问题上对馆藏数字化进行了严格限制。在数字化立项前，应根据法律规定严格审查版权情况。对用于传播的数字化图像，可参考西班牙国家图书馆和DFG的规定，优先数字化公有领域的资源，严谨处理可能存在版权问题的资源。

3.4 完善质量指标和评估系统

在图像的质量维度上，我国与国外基本一致，包括格式、色彩、色彩深度、分辨率，但未将色彩空间纳入指南，色彩空间影响对原始文献的色彩还原度，对包含重要色彩信息的馆藏十分重要，我国指南可参考荷兰皇家图书馆和FADGI，将色彩空间作为图像质量标准评估的维度之一。在图像资源的应用级别划分上，国外一般分为主图像和派生图像，我国指南中的长期保存级对应主图像，复制加工级和发布服务级对应派生图像，其中复制加工级属于过渡级别，可减少对长期保存级资源的使用损耗，比国外指南考量更长远。

在数字化过程的质控上，荷兰皇家图书馆和美国FADGI分别建立起了专用的质量评估工具，而我国指南的过程管理仅用于保证项目的按时按量完成，缺少质控工具。可综合参考FADGI和荷兰皇家图书馆的指标，围绕图像色彩准确性、白平衡等多个维度，建立质量评估系统，保证数字化过程质量。

3.5 提供數字化建设方式的选择原则

DFG、FADGI和瑞士国家图书馆基于图书馆能力、项目复杂度和专业公司能力选择数字资源建设方式。《操作指南》在建设方式的选择时仅考虑了文献类型，尚未提供更具体的判断维度，下一步可从人力资源、设备、资金、馆藏资源的数量和珍贵性、预期成品质量、项目难度等方面建立统一的判断指标。

融合是文化机构未来发展的方向，图书馆在开展数字化工作时，除自建或外包于专业公司外，还可考虑与其他单位合作共建，《操作指南》对此有所述及。跨机构公共数字文化合作[21]是近年来的研究热点之一，合作共建促进了馆藏资源的开发和流通，有利于为用户提供深层次、一体化的信息服务[22]。随着统一的建设标准相继出台，馆际资源共享共建的困难将得到很大程度的缓解，但如何建立高效的沟通合作模式，值得各馆共同探讨和解决。

参考文献：

Library of Congress.The Library of Congress technical standards for digital conversion of text and graphicmaterials

[EB/OL].[2020-08-11].http：//memory. loc.gov/ammem/about/techStandards.pdf.

杨宗英.电子图书馆的模式[J].现代图书情报技术，1993（2）：37-42.

National Library of the Netherlands.Metamorfoze Preservation Imaging Guidelines[EB/OL].[2020-04-11].https：//www.metamorfoze.nl/english/digitization.

GAMULIN L.Application of ISO standards， FADGI and Metamorfoze guidelines for digitization of two-dimensional cultural-heritage objects[J].Portal-godisnjak Hrvatskog Restauratorskog Zavoda，2018（9）：159-170.

NYIDE B C， WELLINGTON B， ZONDI B. Planning for a successful digitization of library material： a theoretical perspective[J]. Opcion， 2018， 34（14）：293-313.

蔡舜. FADGI的标准化行动及其启示[J].图书馆工作与研究， 2014（3）：47-50.

张文亮，陈丁.澳大利亚数字化标准规范应用现状及其对我国的启示[J].图书馆学研究， 2017（17）：67-77.

Deutsche Forschungs Gemeinschaft.DFG Practical Guidelines on Digitisation[EB/OL].[2020-04-11].https：//www.dfg.de/download/pdf/foerderung/programme/lis/praxisregeln_digitalisierung_en.pdf.

IMPACT.Recommendations on formats and standards useful in digitisation[EB/OL].[2020-04-11]. https：//www.digitisation.eu/knowledge/library/recommendations-for-digitisation-projects/recommendations-formats-standards-recommendations/.

Biblioteca Nacional deEspa?a. Proceso de digitalización en la biblioteca nacional deespa?a[EB/OL].[2020-04-11].http：//www.bne.es/webdocs/Catalogos/ProcesoDigitalizacionBNE.pdf.

Schweizerische National Bibliothek.Digitization guidelines[EB/OL].[2020-04-11].https：//www.nb.admin.ch/dam/snl/en/dokumente/e-publikationen/publikationen/digitalisierungsleitlinienb.pdf.download.pdf/ligne_de_conduitepourlanumerisationbn.pdf.

ALCTS.Minimum digitization capture recommendations[EB/OL].[2020-04-11].http：//www. ala.org/alcts/resources/preserv/minimum-digitization- capture-recommendations.

FADGI.Technical guidelines for digitizing cultural heritage materials：creation of raster image master files[EB/OL].[2020-04-11].http：//www.digitizationguidelines.gov/guidelines/FADGI%20Federal%20%20Agencies%20Digital%20Guidelines%20Initiative-2016%20Final_rev1.pdf.

CARLI.Digitization best practices for images[EB/OL].[2020-04-11].https：//www.carli.illinois.edu/sites/files/digital_collections/documentation/guidelines_for_images.pdf.

NDNP.The National Digital Newspaper Program （NDNP） technical guidelines for applicants[EB/OL].[2020-04-11]. https：//www.loc.gov/ndnp/guidelines/NDNP_202022TechNotes.pdf.

范春雪.數字图书馆版权合理使用制度的立法完善[J]. 河北法学， 2019（7）：177-184.

张洋.论出版界对公有领域作品的著作权保护[J]. 科技与出版， 2019（4）：115-119.

文化和旅游部全国公共文化发展中心.文化和旅游部办公厅关于印发《公共数字文化工程融合创新发展实施方案》的通知[EB/OL][2020-04-16].http：//zwgk.mct.gov.cn/auto255/201904/t20190422_843023.html？key words=.

朱成，朱开梅，胡伟群，等.三维图书馆可视化馆藏文献信息查询系统的应用[J].实验室研究与探索，2012，31（7）：79-82，201.

中华人民共和国国家版权局.国家版权局文化部教育部全国“扫黄打非”工作小组办公室关于加强图书馆著作权保护工作的通知[EB/OL].[2019-10-11].http：//www.gapp.gov.cn/chinacopyright/contents/518/134257.html.

肖希明，李琪.公共数字文化服务合作机制研究[J]. 图书与情报， 2016（4）：31-37.

王雪芬，朱庆华，朱学芳.云环境下基于图博档数字化资源的中华文化资源平台构建研究[J]. 数字图书馆论坛， 2014（1）：30-34.

王彩莲武汉大学信息管理学院情报学专业2018级硕士研究生。湖北武汉，430072。

黄雨婷武汉大学信息管理学院图书馆学专业2020级博士研究生。湖北武汉，430072。

（收稿日期：2020-08-19 编校：陈安琪，左静远）

作者：王彩莲黄雨婷

第3篇：图像数字水印的现状及其发展趋势

摘要: 随着网络技术和多媒体技术的飞速发展,如何保护多媒体信息的安全成为研究的热门课题,介绍目前图像数字水印的现状,近年来的新用途及未来的发展方向。

关键词: 数字水印;数字水印技术;版权

0 引言

因特网的迅猛发展和数字记录存储设备的普及使得轻易地制造、复制、传输和分发数字媒体成为可能。同时,随着计算机通信技术的迅速发展,传播数字多媒体信息也越来越方便快捷。迅速兴起的因特网以电子印刷出版、电子广告、数据仓库、网络视频和音频以及电子商务等新的服务和运作方式为商业、科研、娱乐等带来了许多机会。然而,这也使得盗版者能以低廉的成本复制及传播未经授权的数字产品内容。出于对利益的考虑,数字产品的版权所有者迫切需要解决知识产权保护问题。

1 图像数字水印现状

数字水印是近年来出现的数字媒体版权保护技术。所谓数字水印技术就是通过一定的算法把一些标志性信息嵌入到多媒体内容中去,但不影响原来内容的价值和使用并且不会被人感知到或被人注意到。水印信息可以是作者的序列号、公司标志和有特殊意义的文本等。它可以标识作者、所有者、发行者和使用者,并携带有版权保护信息和认证信息,目的是鉴别出非法复制和盗用的数字产品,保护数字产品的合法复制和传播。

数字水印技术为版权保护提供了一个潜在的有效的解决方法。它还被广泛应用于数字文件真伪辨别、网络的秘密通信、隐含标题与注释、使用控制等。

一方面,数字水印技术在当今数字化时代作为一种信息安全和版权保护的重要手段,在应用时必然会受到各种形式的攻击,能否抵抗对水印的各种攻击已成为衡量数字水印技术先进可靠的重要标准。因此稳健性是水印系统的一项基本要求,也是近年来图像水印的主要研究内容。针对水印处理的不同阶段,对水印系统的攻击可分为信号去除攻击、表达攻击、解释攻击和合法攻击四类。其中表达攻击又称为同步攻击,它将水印变形到监测器检测不出来,导致水印检测失败。这类攻击最典型的就是几何变形攻击。在几何失真后,尽管被攻击的数字媒体中水印仍然存在,但水印信号已经错位,与嵌入时完全不同,因此,几何攻击破坏了水印分量的同步,使得水印嵌入和水印检测这两个过程不同步,导致不能提取水印或不能检测水印的存在。目前,已经提出了许多数字水印算法,但绝大多数算法所强调的稳健性只是针对抵抗常见的攻击,如图像压缩、低通滤波、图像量化与图像增强、格式变换等一般信号处理。但是,从水印攻击的角度来看,破坏水印的同步比直接破坏数据更为严重,难以防御,而绝大多数数字水印对于甚至很小的诸如缩放、剪切、旋转、拉伸、长宽比改变等几何攻击都无能为力,即现有的数字水印技术抵抗几何攻击的能力很差,抵抗几何攻击的数字水印技术被认为是数字水印技术走向商用的瓶颈。因此,研究抵抗几何攻击的数字水印技术是一项富有挑战性的工作。

另一方面,数字水印技术在当今数字化时代作为一种实现多媒体版权保护与信息完整性保证的有效方法,根据嵌入的路径不同,大致上可以分为两大类:空间域和变换域。空间域方法是通过直接改变图像某些像素的灰度值来加入水印,如最低有效位算法(LSB,Last Significant Bit)、Patchwork方法等;而变换域方法是先对图像作某种变换,然后通过改变某些系数来加入水印。与空间域水印技术相比,变换域水印技术的优点如下:① 变换域中嵌入的水印信号能量可分布到空域所有像素上,有利于保证水印的不可见性;② 在变换域中,可以更方便地将人类视觉系统(HVS,Human Visual System)的某些特性结合到水印算法中;③ 变换域方法可与现有的图像压缩方法兼容,从而实现压缩图像的水印嵌入。因此研究变换域水印技术具有更高的价值。目前,已提出的水印算法绝大多数是基于离散余弦变换(DCT,Discrete Cosine Transform)或小波变换的,特别是基于小波变换的数字水印技术,已成为近年来研究的热点。但这些变换往往本身就不够完善。近年来,出现了一种新的变换Contourlet变换,它是小波变换的新拓展。Contourlet变换克服了小波变换的方向局限性,已发展成为一种“真正”的能够捕捉几何结构的二维信号表示,已被应用到图像去噪、图像增强等领域,并取得了较好的效果。因此,研究Contourlet域的数字水印具有较大的价值,也是将来的一个新的方向。

2 数字水印的新用途

目前数字水印技术已经得到了广泛的应用,除了用于标注版权信息,还在多媒体作品的销售、播放和使用的各个环节中产生了新的用途。

2)广播监测。广播监测即监测影视节目和音乐作品在电视台和广播电台上播出的时间和次数。广告是电视台的主要收入来源,但让广告客户放心不下的是,电视台有没有把自己的广告播放足够的时间长度;作曲家想确定电台播出他们的作品的次数,以便收取版税;制片商要防止自己的影视产品被电视台非法重播。这些都可以通过广播监测来解决,也就是在影视或音乐作品播出前嵌入特别的水印,然后由自动监测台接收广播,搜索其中的水印,从而确定这些作品在什么时候、由什么电台播放。

3)图像认证。在鉴定应用中,使用水印的目的是对数据的修改进行检测。通常可用易碎水印来实现图像认证。认证水印与其他水印相比,对鲁棒性要求最低。

5)拷贝控制。实际上,无论版权证明还是交易水印都不能彻底阻止非法拷贝,只能作为有力的威慑和调查取证的工具,要杜绝非法拷贝最终离不开硬件上的改进。比如,让录制设备检测到一个表明禁止转录的水印就停止复制。要做到这点,所有录制设备都要增加检测水印的电路。DVD的非法拷贝对电影制造业来说是致命的打击,今天,制片商正在和DVD影碟机厂家联手开发利用水印技术阻止非法拷贝DVD节目的措施。

6)标题与注释。即将作品的标题、注释等(如一幅照片的拍摄时间和地点等)以水印形式嵌入作品中,这种隐式注释不需要额外的带宽,且不易丢失。

3 数字水印的未来发展方向

数字水印是一门相当复杂的新技术,还有许多未触及的研究课题,现有技术也需要改进和提高。通过对现有技术的分析,数字水印今后可能的研究方向为:

1)水印基本原理和评价方法的研究,包括水印理论模型、水印结构、水印嵌入策略、水印检测算法、水印性能评价以及水印的标准化等。

2)现有水印算法分析。通过对现有的数字水印算法的鲁棒性、安全性、抗攻击性等特性的研究,并结合数字信号处理技术,寻找出它们之间的关系,从而发现更好的数字水印技术。

3)零水印技术在版权保护方面的推广和应用,以及对零水印技术的进一步研究和完善。

4)基于特征的数字水印技术。因基于统计特征的数字水印技术容易受到非线性等变换方法的攻击,而基于图像高层特征的数字水印技术如基于边界信息等则具有较好的鲁棒性,因此可能成为今后的研究重点。

5)其他数字水印技术。如对基于图形、矢量图和动画等媒体的数字水印研究得比较少,这也是今后数字水印技术的一个研究方向。

4 结语

数字水印正处在迅速发展的过程中,掌握其现状及发展方向对指导数字水印的研究有着重要的意义,今后数字水印的技术研究将侧重于完善数字水印理论、提高数水印算法的稳健性、安全性、研究其在实际网络中的应用及建立相关标准等方面。数水印技术将对保护各种形式的数字产品起到重要的作用。

参考文献:

[1]邓小颖,图像数字水印算法研究[J].扬州大学,2006.

[2]孙圣和、陆哲明、牛夏牧,数字水印技术及应用[M].科学出版社,2004.

[3]王炳锡、陈琦、邓峰森,数字水印技术[M].西安电子科技大学出版社,2003.

[4]龚岩,图像数字水印技术研究与实现[J].西安电子科技大学,2007.

[5]钟桦、张小华、焦李成,数字水印与图像认证-算法与应用[M].西安电子科技大学出版社.

作者：王丽丽

第4篇：BMP数字图像的认识与应用

摘要：“图”是物体透视光或反射光的分布，“像”是人的视觉系统对图的接收在大脑中形成的印象或认识，图像是客观景物通过某种系统的一种映射，是自然界景物的客观反映。而BMP图像文件格式是Microsoft公司为Windows视窗系统开发的图像文件格式，且已成为Windows环境的一种图像标准。目前，BMP图像通过图象处理以后在工业检测、邮件筛选、交通管理、高空侦察、生物医学等领域应用越来越广。

关键词：BMP 图像数字图像应用

图像是指描述的物体信息，图像是物体反射或透射的光信息，经过人的视觉系统的接收、处理后，在人的大脑中形成的认识或印象。对于实际获得的图像，如果是直接从观察系统(输入系统)获得，未经采样与量化处理的图像，即为模拟图像。模拟图像在亮度和空间分布值域上都是连续呈现。然而，模拟图像经过采样和量化后在空间分布和亮度取值都是呈离散分布的图像称为数字图像[1]。随着科技迅猛发展，数字图像应用将更加广泛。

1 BMP数字图像内涵及结构

1.1 数字图像的概述

对于图像数字化而言，就是将所谓的模拟图像通过一系列的转换成为离散图像的具体行为过程统称为图像数字化，其过程要两部实现分别为：采样和量化。对于采样，就是把任一在空间上模拟图像采样为M×N个网格值，每个网格的采样点值的亮度均值称为网格亮度值。由于其采样值是一个样点值序列，所以该过程成为点阵采样。采样点值中的每个网格被称为像元或象素。M×N的域值大小决定了序列图像的空间分辨率。采样使具体的模拟图像在空间上呈离散化分布，然而采样点上图像的(取值)亮度值依然在原来幅度区间呈连续分布。把采样网格点上相对应的亮度连续变换取值区间转换为单个特定数码的过程，称之为量化[2]。量化后的象素点的整数值叫灰度级，灰度层次值一般用2n表示，N大，图像的密度分辨率高，图像看上去柔和具体逼真。

1.2 数字图像文件格式

通常，用计算机二进制数列表示数字图像的阵列，把像素按不同的组合样式实行整合或保存，获得不一样的图像信息样式，把图像数据信息存储为文件即获得图像信息文件。图像信息文件按照离散图像样式的差异一般具有不一樣的扩展名，最常见的图像模式是位图格式，则文件名以BMP为扩展名。

识别信息与图像数据是数字图像信息文件不可或缺的主要组成部分，其中识别信息包含文件识别和图像识别两种。文件识别包含图像文件识别码和版本代号。文件识别码是确定文件数据格式，版本代号是指相同格式文件属于该产品具体版本，不同版本的同一格式图像文件其数据结构略有的区别。通常情况下版本代号越高(大)，漏洞越少，数据结构就越完善，使用越简便。图像识别信息包含图像文件的大小，即宽度和高度，一幅图像像素所需的比特数与彩色位平面数、数据压缩格式和调色板个数。调色板数仅限于颜色深度小于等于28的圖像，压缩方式码为可选项。如用户需要还可以再改变其余各参数，如图像文件每行对应的字节数等。识别信息组成文件头，其之后是图像数据信息。

1.3 BMP数字图像文件结构

Windows使用的图形文件格式主要是BMP图形信息文件，在Windows背景下交换、运行与位图相关的信息的标准格式，同时BMP图像信息文件格式是全部图像信息处理软件都支持。Windows显示图像信息标准与绘画图像均以BMP图像信息格式。

Windows3.0前期的BMP图像数据信息格式和显示器参数相关联，故将此类BMP格式图像信息文件称之为设备参数相关位图DDB(device-dependent bitmap)文件数据格式。Windows3.0后期的BMP图像数据信息和显示器参数无关联，故将此类BMP格式图像信息文件叫作设备参数无关位图DIB(device-independent bitmap) 数据格式，目标主要是让Windows可以在任一类别的显示设备上呈现所留存的数据文件。BMP位图信息数据采用文件后缀名是BMP或bmp。

标准的位图图像文件结构是包含四部分组成：位图文件头、位图信息头、调色板和定义位图的数据序列，其具体的数据文件格式特点和形式，位图文件结构如图1所示。

支持单色、16色、256色和全彩色(目前最高位为32位)四种图像方式;每个位图文件仅一幅存储图像;图像存储时提供两种模式为非压缩和压缩。BMP图像数据的文件头有两部分别为BITMAPFILEHEADER，定义文件标识、文件大小及图像数据的偏移量和BITMAPINFOHEADER，则要用于指定BMP图像自身的很多调整参数。具体是：

typedef struct

{

unsigned char bfType; unsigned long bfSize; unsigned int bfReserved1; unsigned int bfReserved2; unsigned long bfOffBits;

} BITMAPFILEHEADER;typedef struct

{

unsigned long biSize; unsigned long biWidth; unsigned long biHeight;

unsigned int biPlanes; unsigned int biBitCount; unsigned int biCompression; unsigned long biSizeImage; unsigned long biXPelsPerMeter; unsigned long biYPelsPerMeter; unsigned long biClrUsed; unsigned long biClrImportant;

} BITMAPINFOHEADER;

2 BMP数字图像处理应用

图像是主要的信息交流媒介，对于人类进行信息接收和信息交流来说，非常重要。BMP数字图像处理的应用范畴与人类活动紧密相关。不仅在理论范畴获得成功，然而在实际应用前景中也起到了至关重要作用。

然而对于BMP数字处理有两种重要方式：基础性处理和内容处理。对于基础处理，主要是通过数学形态学的各类算法去改变图像的参数基础，如：傅立叶变换、伽马变换等改变图像变换域参数。但对于内容处理是对图像内容的复原与重建。如：图像识别、图像分割和特征提取。

在实际的科研和工程中，BMP数字图像处理的应用前景广泛，为获得高分辨率的广角图像，这就需要对数字图像拼接技术。可将一些小视角的图像拼接成广角的全景图像，完成多幅图像的融合。

3 结语

数字图像具有再现性好、处理精度高、适用面宽、灵活性好等优点。随着电子计算机的不断发展和对数字图像处理越来越高的要求，数字图像处理技术将向更优化，处理速度更快，处理更高清图像，从而最终实现图像的智能生成、处理、识别和理解。

参考文献

[1] 傅得胜.图形图像处理学[M].东南大学出版社，2005：160-208.

[2] 景晓军.图像处理技术及其应用[M].国防工业出版社，2005：76-99.

作者：李威张银玲赵婷婷

第5篇：浅谈数字媒体图像“美”的形式

摘要：从古至今，人们从未停止对“美”的追求，而审美价值的确立是基于群体性的经验判断和意识选择。随着科技发展，数字媒体图像正在成为人们接受信息的主要来源，作为审美客体，尽管从创作工具和材料方面，已经对传统艺术语言和表现技巧进行了重构和拓展，但在艺术语言和表现形式上与传统视觉艺术仍存在共性，因此画面的组织和构成应符合人们的审美习惯，遵照一定的审美规律。数字媒体图像“美”的形式具体表现为：对称与均衡;对比与调和;比例与尺度;节奏与韵律;变化与统一。

关键词：数字媒体图像;审美价值;审美样式;美学

人类对美的探索开始于意识觉醒，审美价值的确立是基于群体性的经验判断和意识选择。“美”是艺术创作的最高目标和终极追求。那么究竟什么是“美”?在毕达哥拉斯学派看来：美是“数”的和谐;苏格拉底认为：美是“灵魂”的理性，是生理的快感;亚里士多德认为：美是对自然秩序的“模仿”;鲍姆嘉通认为：美是感性认识与实践经验的极致“完善”;现代美学理论则普遍认为：“美”是主客体的统一，是合规律性与合目的性的统一。然而，从本体论到认识论，从古希腊到21世纪的今天，关于“美”似乎都没有一个准确的答案，似乎印证了贡布里希的观点，“现实中根本就没有艺术，只有艺术家和他们创作的艺术作品”。由此不难发现“美”是极致的、是崇高的，但却是不确定的、飘渺的，通过追求“美”的艺术家和表现“美”的艺术作品，我们可以从中发现并总结出“美”的形式和规律。数字图像尽管本质是无数的数字编码和像素点，但作为审美客体，是基于数字信息技术的人造物和可视化的感知对象，包含结构、色彩、明暗、比例、节奏等基本要素，是创作者的审美追求以图像形象和色彩形式被感知和传递。尽管在艺术创作工具和材料方面，数字化艺术创作已经对传统艺术语言和表现技巧都进行了重构和拓展，但在艺术语言和表现形式上与传统视觉艺术仍存在共性，因此画面的组织和构成应符合人们的审美习惯，遵照一定的审美规律。

一、对称与均衡

对称与均衡包含两层含义，一个是对称产生的平衡，另一个是不对称形成的均衡。对称与均衡主要表现为构成要素在空间排布和组织中的稳定关系，是画面构图应该遵循的基本原则，关系到画面的整体感和稳定性。

“对称”单从概念上理解，是指以一条线为中轴，左右或上下两侧均等，或以中心点互为镜像的相同形态，主要有表两种现形式：轴对称对称和旋转对称。对称是一种绝对的均衡，具有和谐、庄严、整齐、肃穆的特点，比如，人和动物的面孔、古代宫廷建筑都是一种对称形式。其在数字图像中的运用和使用，多体现在政治、权力、仪式等题材方面，以体现稳重、庄严、隆重氛围，达到形式与内容的统一。但绝对的对称容易产生乏味和审美疲劳，为了避免这种情况的产生，可以在主体对称中寻求细节的变化。比如，在一个画面中表现两个对称的图案，一个可以采用阳刻效果，另一个采用阴刻效果，由此产生分离和跳跃的视觉美感。

“均衡”并不是实际重量均等，而是视觉的感官平衡，是指将不同属性的构成要素，通过有意识的编排，使彼此间产生相对的稳定状态，是各种不同大小和方向的力相互碰撞、叠加、抵消的结果。“均衡”的主要目的是将不同的元素错落分布形成整体秩序感，是一种审美感觉的塑造，比如，一棵枝繁叶茂的大树，尽管枝叶大小不一、高低错落，但作为一个整体它们保持着内在的稳定和平衡。相对于对称来说，均衡显得更加活泼、灵动，给人一种放松、愉悦的审美感受，在题材选择和运用方面相对比较宽泛，是画面构图的主要组织形式。

图1是典型的对称式构图，主体建筑物和前景的窗扇以中轴线对称排布，画面呈现出稳重、大气的视觉效果;图2采取的是均衡式构图，主体建筑物被平移到画面左侧位置，使原本对称式构图的左右平衡被打破，借助右侧的松枝、窗扇和水面灯具的点缀，让画面的整体气韵重新回归稳定，呈现出优雅、祥和的视觉感受。

在实际运用中，对称结构容易造成呆板的审美感受，选择相对比较谨慎，但作为画面的构成形式而言，对称与均衡并没有好坏、优劣之分。对称形式之所以易产生审美疲劳，正是因为太过于经典，日常生活中人们几乎无时无刻不感受到对称的存在，比如前面提到的人脸，再比如汽车、飞机等，对称其实存在于我们生活的方方面面。对称均衡作为画面组织形式，关键是与主题内容相统一，构建画面的平衡与稳定。

二、对比与调和

对比与调和是画面各个构成要素间的相互依存关系，是矛盾双方的对立与调和，二者在画面的构建中相辅相成，借助“对比”构成物像的主次关系，利用“调和”形成画面秩序，它们是塑造画面情绪的主要表现手段。

“对比”是画面构成元素同类属性间的不同量级比较。例如，体量的大与小、光线的明与暗、色彩的色相与纯度等。不同属性间无法形成对比，例如，高山和蓝天分别表现的是体量和色彩，二者在属性上不存在矛盾关系，也就无所谓对比。在画面构成中主要从形体、光比、色彩、质地等屬性方面构建对比关系。此外，在连续的影像画面中还存在前后镜头画面的对比关系。“对比”能够加深视觉印象，凸显主题内容，还可以营造明快、活泼、刺激的画面情绪。

“调和”是对矛盾双方的化解，是将不同量级的对比关系保持在相对稳定的依存状态，让矛盾双方和谐、有序地组织在一起，形成画面的整体秩序感。应结合“矛盾”双方的特性采取相应的“调和”方法，主要有大小变换、明暗调节、色彩混合、材质叠加等调节方式。“调和”可以使画面变得柔和，产生朦胧的视觉效果，让人产生温馨、浪漫、空灵的审美意念。

图3是通过“对比”的形式表现画面主体，利用光线的明暗、色彩的冷暖，以及颜色的饱和度，让钟楼与周围其他物体形成显著对比，凸显其在画面中的主体地位;图4是采用“调和”的方式塑造画面整体，通过曲线、色彩平衡工具对相关对比数值进行调节，让钟楼与周围环境的明暗对比、色相饱和度趋于缓和，并使用镜头模糊工具对钟楼与背景进行虚化处理，让画面场景呈现出整体性氛围。

三、比例与尺度

比例与尺度是对画面构成要素之间依存关系的取舍，通过对主次矛盾“量”的控制，达到“质”的稳定或转变，是塑造画面美感、营造场景氛围的主要手段。“美产生于度量与比例”，法国建筑师布隆代尔说。

“比例”是画面的整体与局部、局部与细节之间的比较关系，主要表现为构成元素在数量、尺寸、体量等方面的比值差异。比例关系可以产生透视效果，营造画面的空间感，“近大远小”正是利用这一原理，依据物体的前后关系，设置近景和远景的大小比例，使画面产生纵深感;也可以通过比例关系改变画面的主次结构，表达不同的画面主题，例如地平线的高低，让天空与地面的比例关系发生变化，使画面形成不同的表现内容。古希腊数学家、哲学家毕达哥拉斯认为“数”是世界万物的本源，并由此推断出“黄金分割比”为0.618，这一比例关系成为画面构图的黄金比例。

“尺度”是衡量某一事物属性的标准或规范，在图像画面中包含两层含义，一个是对构成要素客观属性的量化比较，可以通过具体的数据进行表示和衡量，比如高度、长度、深度等数值参数;另一层意思是指对审美主体心理感受的把握和权衡，主要表现为画面构成要素与观赏者之间的情感觀照。普罗泰戈拉有一句名言，“人是万物的尺度”，不同的人对于同一事物，有着千差万别的“尺度”标准。很难以标准数值进行衡量。在实际运用中要求创作者具有敏锐、丰富的审美感受。

比例与尺度是相辅相成的关系，比例是尺度的量化，尺度是对比例关系的把握，这种依存关系基于人们在生活中建立的审美经验。合适的尺度比例可以塑造画面的美感，相反，过大的比例关系会造成画面失衡，给人产生不舒服的心理感受，比如前景物体过大会造成压迫感。但有时为了营造特殊的视觉效果，也会刻意夸大比例关系。

图5中的两个人物尽管存在色调的对比，但体量大小和位置排布相当，在画面中构成对等的比例相关系，展现出双方实力相互抗衡的视觉效果;图6中左右双方在画面中的比例关系发生显著变化，左侧人物缩小到画面的左下角，右侧人物体量被放大，并占据了画面的大半部分面积，展现出左右双方实力的失衡，形成压倒、逼迫性的视觉效果。

四、节奏与韵律

康定斯基在《论艺术的精神》中说：“色彩好比琴键，眼睛好比音槌，心灵仿佛是绷满弦的钢琴，艺术家就是弹琴的手，它有目的地弹奏各个琴键来使人的精神产生各种波澜和反响。”节奏与韵律这两个源自音乐的概念，用于表述画面的气象变化，表达对艺术的审美理想追求，是赋予画面生命力的重要形式手段。

“节奏”是有规律的变化，是画面中某一元素或几个元素以组合形式，有规律地重复出现，是画面要素的排列、组合。“节奏”使画面产生规律性和秩序感，倘若画面没有“节奏”，会显得杂乱无章，而单一的“节奏”容易造成视觉的枯燥与乏味，有变化的“节奏”可以使画面更具趣味与活力。

“韵律”是将不同的“节奏”作为基本单元，并融合画面的所有元素，进行有秩序的组织和编排，形成画面的整体韵味。“韵律”包含着创作者的情感与意念，通过阴阳顿挫的旋律变化，使画面产生视觉感染力，赋予画面情感与意境。

图7台阶作为视觉元素，按照一定规律反复出现，形成画面“节奏”，尽管每一层台阶在透视的作用下逐级缩小，但并没有产生结构上的变化，仍属于单一“节奏”，整体画面呈现出一定的秩序感;图8是高山上层叠的梯田画面，梯田顺着山势层叠有序，形成画面“节奏”，而每一层梯田蜿蜒交错，形成“节奏”的变化，梯田、水面光影以及劳作的水牛相互映衬，共同组成优美的“韵律”，让画面呈现出灵动的美感。

五、变化与统一

变化与统一是形式美法则的总结和概括，蕴含着“美”的普遍规律，世间万物虽变化万千，但都统一在自然规律中轮回运转。德国哲学家莱布尼茨说过：“世上没有两片完全相同的树叶。”树叶的不同形状和纹理产生个体的“变化”，在同一棵树上生长形成整体的“统一”。

“变化”是指画面构成要素的差异性和多样性，通过结构性的改变产生差别，比如结构的变化、光线的变化、颜色的变化等，“变化”可以丰富画面层次，吸引视觉注意力。画面缺乏“变化”会造成视觉的枯燥和无趣，无法分清主次关系，缺乏视觉焦点。

“统一”是指画面构成要素之间存在的有机关联，呈现出整体性的秩序和规律。“统一”不是千篇一律，更不是整齐划一，而是画面保持的整体基调，比如相同的结构、统一的色调、一致的光源等，让各元素间形成内在的秩序，增强画面凝聚力和视觉感染力。画面不“统一”会造成视觉的突兀感，让画面失去灵魂。

变化与统一是个体与整体的辩证关系，是求同存异的美学理念。画面是一个有机整体，个体元素的“变化”应遵循整体的“统一”秩序，在“变化”中保持统一，在“统一”中寻求变化。过度的“变化”会让画面显得杂乱无章，需要利用“统一”的秩序进行约束，以确保画面的整体性。

图9中，身着白色衣服的人物，她们的坐姿和服装颜色都基本一致，并按一定的规律重复出现，构成了画面的“统一”秩序，然而小孩俏皮的表情、跳跃的服装颜色，与整体秩序形成鲜明的“变化”，成功地吸引了视觉注意力，让小孩成为画面的焦点;图10中，屋顶的形状、房屋的结构多种多样，画面中充满了各种“变化”，为了避免视觉的杂乱，利用了地平线、河流和阳光进行画面组织，地平线使画面分为上下结构;河流让建筑物形成左右排序，温暖的阳光营造出“统一”的基调。

综上所述，形式美法则是“美”的普遍性规律，可作为数字媒体图像创作的基本参照，实际运用中不应简单地照搬和套用，而是要根据特殊效果灵活变通，要善于利用反向形式美法则，通过夸张和变形塑造画面的戏剧效果。

参考文献：

[1]陈永东，王林彤，张静.数字媒体艺术设计概论[M].北京：中国青年出版社，2018.

[2]邱正伦.审美价值取向研究(上)[M].北京：文化艺术出版社，2007.

[3]郭福平.转向与超越——美学的历程与审美价值[M].海南：南海出版公司，2011.

[4]胡妙胜.舞台设计美学[M].上海：上海文艺出版社，2002.

[5]贾秀清.重构美学：数字媒体艺术本性[M].北京：中国广播电视出版社，2006.

作者简介：

金鑫，南京航空航天大学艺术学院硕士研究生;上海舞台技术研究所。

陈启林，南京航空航天大学艺术学院副教授。

作者：金鑫　陈启林

第6篇：数字图像处理技术的应用研究

摘要：随着计算机信息技术的不断发展，数字图像处理技术的应有范围变得越来越广，其内涵与外延得到了无限的扩大，本文简要分析了数字图像处理技术的概念内涵、功能特点与应用领域等，使我们对该技术有一个基本的了解，从而能够更好地为日常工作服务。

关键词：数字图像处理;概念内涵;功能特点;应用领域

Digital Image Processing Technology Applied Research

Jia Guangbin

(Southwest University of Science and Technology,School of Information Engineering,Mianyang621010,China)

图像处理也就是按照人们视觉、心理或实际应用的需要，对图像信息进行加工修改的过程，在不同的时期、不同的领域往往会采用不同的图像处理技巧。数字图像处理技术是伴随着计算机信息功能的日益强大以及人们对高精度图像的需求而产生的，随着社会的发展，尤其是计算机信息技术的进步，数字图像处理技术被广泛应用于各个领域，其重要性变得日益突出。

一、数字图像处理技术的概念内涵

当前，我国通常采用的图像处理技术主要有两种，即光学处理法和数字(电子)处理法。前者产生的时间较早，从最开始的光学滤波技术到现在的激光全息技术，无论是理论研究，还是应用技巧，光学图像处理法已日臻完善。但其图像处理精度低、稳定性差以及操作不便的特点极大地限制了其应用领域拓展，在这种情况下，数字图像处理技术便应运而生。

数字图像处理，也即是Digital Image Processing，产生于20世纪50年代，是指人们采用计算机及其它数字硬件设备，对图像信息转换而来的电信号根据数学运算的方式，进行增强、提取、复原、分割以及去除噪音等处理的方法和技术，以此提高图像的实用性，因此，该技术的产生与发展建立在计算机运用、离算数学理论的产生与完善以及社会诸多领域的需求之上的。其最大特点是不仅图像处理精度高，而且可以通过改进硬件系统配置和优化软件系统功能的方式来提高图像处理效果，一切以计算机运行为基础，操作极为方便。最初，由于数字图像处理技术的数据需求量大，处理速度慢，极大地限制了其应用领域，但随着计算机技术的快速发展，尤其是运算速度的提升，这一瓶颈早已被突破。

二、数字图像处理技术的功能内容分析

(一)增强图像的视觉效果。在某些特殊领域，图像在传输与转换的过程中容易造成信息的丢失，从而形成失真现象，比如航天拍摄的图片在传回地球的过程中，由于光学系统、大气流、空气介质等原因造成图像模糊;在图像扫描、采样、量化的过程中，所形成的噪音污染等等。我们可以采用数字图像处理技术，一方面突出重要信息而衰减次要信息;另一方面根据失真原因，补偿丢失的信息因素，从而使改善后的图像效果尽可能的接近原始图像。

(二)图像的重建功能。随着电子计算机体层摄影技术的发展，图像的重建成为一种新兴的数字图像处理技术，它主要是对目标对象进行观察和测量，重新构建出图像中的大量信息的直观显示，从而在计算机模拟系统中进行二维或者三维的图像处理，这也是对特殊实体进行图像回归的过程。

(三)模式识别功能。模式识别也是数字图像处理技术的一个重要应用方向，它主要是借助计算机设备，对人类外部环境中的某一客体行为的数据信息识别过程，比如听觉、视觉、触觉、判断等，进行自动模拟的过程。

(四)正交变换。主要是采用数字图像处理技术将图像信息从空域转换到变换域，其中包括离散余弦变换、离散傅立叶变换、沃尔什变换以及小波变换等。

除此之外，数字图像处理技术还能够进行点运算、几何处理、图像复原、图像编码等一系列操作，使最终图像满足人们的现实需求。

三、数字图像处理技术的应用范围研究

当前，随着计算机信息技术的快速发展，数字图像处理技术的应用领域得到了极大的拓展，总体来说，其在以下领域的应用尤为突出：

(一)医学领域图像处理。医学图像处理是数字图像处理技术的传统应用领域之一，医生为了诊断、科研与教学的需要，往往要对医学影像进行一些操作，比如对图像进行直方图、编辑图像、影像均衡、边缘增强处理、正负像旋转、伪彩色绘制与计算等等。其中PhotoshopCS便是该领域最常采用的图像处理软件之一。

(二)航空与卫星领域遥感图像处理。正如上文所说，航天图片在传往地球的过程中，由于各方面的原因造成图像失真现象，这就要利用数字图像处理技术的精确性、点运算、重建功能等，对图像进行辐射校正和几何纠正、图像整饰、投影变换、特征提取、嵌饰等处理，从而得到原始的图片影像，这对当前土地规划、天气预报、地质灾害预防、军事活动等带来重要影响。1964年，美国利用该技术对“徘徊者七号”太空船发回的月球照片进行处理，收到明显的效果。因此，航天也是数字图像处理技术的传统应用领域之一。

(三)在工业规划与工程设计领域的应用。在工业规划与工程设计领域，设计师经常利用数字图像处理技术的精确性、图像复原性特征，来进行无损探伤、质量检测和过程制动控制方面的操作，比如流场分析、应力分析、机械零件的设计、检测与识别、印刷电路板的疵病检查等，从而极大地提高了工作效率与工作质量。

(四)军事领域的应用。由于数字图像处理技术的模式识别功能特别突出，因此，在军事领域，飞行导航、模拟地理、运动目标控制、导弹打靶的景物图像模拟与分析等对其应用需求最为强烈。该技术通过对卫星侦察照片的修复与处理，从而进行图像匹配识别和跟踪，尤其是图像的传输、存储与再现的自动化军事指挥系统，步兵推进演练，飞机、坦克和军舰的模拟训练等等，也到需要精确、快速的数字图像处理技术。

四、结束语

随着现代信息技术的高速发展以及人类对图像信息需求的不断扩大，数字图像处理技术将会和其他多门学科相互结合、相互渗透，势必将会和流媒体技术相结合，以及与视频处理相结合，从而使图像处理技术更广泛的被用于电影制作、视频会议、等领域。

参考文献：

[1]景敏.数字图像处理技术的应用[J].机械管理开发,2011,2

[2]周金芝.基于Matlab的形态学图像处理研究[J].现代交际,2010,4

作者：贾光斌

第7篇：数字图像处理图像变换实验报告

数字图象处理实验指导书

实验一图象变换实验

实验

实验名称：图像处理姓名：刘强

班级：电信

学号：

报告

1102

1404110128

数字图象处理实验指导书

实验一图象变换实验

实验一图像变换实验——图像点运算、几何变换及正交变换

一、实验条件

PC机数字图像处理实验教学软件

大量样图

二、实验目的

1、学习使用“数字图像处理实验教学软件系统”，能够进行图像处理方面的简单操作;

2、熟悉图像点运算、几何变换及正交变换的基本原理，了解编程实现的具体步骤;

3、观察图像的灰度直方图，明确直方图的作用和意义;

4、观察图像点运算和几何变换的结果，比较不同参数条件下的变换效果;

5、观察图像正交变换的结果，明确图像的空间频率分布情况。

三、实验原理

1、图像灰度直方图、点运算和几何变换的基本原理及编程实现步骤

图像灰度直方图是数字图像处理中一个最简单、最有用的工具，它描述了一幅图像的灰度分布情况，为图像的相关处理操作提供了基本信息。

图像点运算是一种简单而重要的处理技术，它能让用户改变图像数据占据的灰度范围。点运算可以看作是“从象素到象素”的复制操作，而这种复制操作是通过灰度变换函数实现的。如果输入图像为A(x,y)，输出图像为B(x,y)，则点运算可以表示为：

B(x,y)=f[A(x,y)] 其中f(x)被称为灰度变换(Gray Scale Transformation，GST)函数，它描述了输入灰度值和输出灰度值之间的转换关系。一旦灰度变换函数确定，该点运算就完全确定下来了。另外，点运算处理将改变图像的灰度直方图分布。点运算又被称为对比度增强、对比度拉伸或灰度变换。点运算一般包括灰度的线性变换、阈值变换、窗口变换、灰度拉伸和均衡等。

图像几何变换是图像的一种基本变换，通常包括图像镜像变换、图像转置、图像平移、图像缩放和图像旋转等，其理论基础主要是一些矩阵运算，详细原理可以参考有关书籍。

实验系统提供了图像灰度直方图、点运算和几何变换相关内容的文字说明，用户在操作过程中可以参考。下面以图像点运算中的阈值变换为例给出编程实现的程序流程图，如下：

数字图象处理实验指导书

实验一图象变换实验

2、图像正交变换的基本原理及编程实现步骤数字图像的处理方法主要有空域法和频域法，点运算和几何变换属于空域法。频域法是将图像变换到频域后再进行处理，一般采用的变换方式是线性的正交变换(酉变换)，主要包括傅立叶变换、离散余弦变换、沃尔什变换、霍特林变换和小波变换等。正交变换被广泛应用于图像特征提取、图像增强、图像复原、图像压缩和图像识别等领域。

正交变换实验的重点是快速傅立叶变换(FFT)，其原理过于复杂，可以参考有关书籍，这里不再赘述。至于FFT的编程实现，系统采用的方法是：首先编制一个一维FFT程序模块，然后调用该模块对图像数据的列进行一维FFT，再对行进行一维FFT，最后计算并显示幅度谱。程序流程图如下：

四、实验内容

图像灰度直方图

点运算：图像反色、灰度线性变换、阈值变换、窗口变换、灰度拉伸和灰度

数字图象处理实验指导书

实验一图象变换实验

均衡

几何变换：图像镜像变换、图像转置、图像平移、图像缩放和图像旋转正交变换：傅立叶变换、离散余弦变换、沃尔什变换、霍特林变换和小波正反变换

注意：

1、所有实验项目均针对8位BMP灰度图像进行处理，其它格式(如JPG)的图像可以利用系统提供的图像格式转换工具进行转换，再进行处理;

2、本次实验的重点是图像的灰度直方图和点运算，几何变换和正交变换只作一般性了解。

五、实验步骤

以图像灰度阈值变换为例说明实验的具体步骤，其它实验项目的步骤与此类似。

1、打开计算机，在系统桌面上双击“数字图像处理实验教学软件系统”的可执行文件“图象处理”的图标，进入实验系统;

2、执行文件→打开，在OPEN对话框中选择待处理的图像，按【OK】后系统显示出图像;

3、执行查看→图像基本信息，将显示图像基本信息对话框，如图所示;

数字图象处理实验指导书

实验一图象变换实验

4、执行查看→灰度直方图，查看图像的灰度直方图，如图所示;

5、执行图像变换→正交变换→傅立叶变换，查看图像的频率域分布情况，如图所示;

数字图象处理实验指导书

实验一图象变换实验

6、执行图像变换→正交变换→小波变换，查看图像经过小波变换的效果，如图所示;

7、执行图像变换→点运算→阈值变换，修改阈值变换对话框中的阈值参数，如图所示;

数字图象处理实验指导书

实验一图象变换实验

8、设置完阈值参数后按【OK】,系统显示阈值变换后的图像，与原图像进行比较，观察阈值变换的效果，如图所示;

9、重复步骤4，查看阈值变换后图像的直方图分布情况;

数字图象处理实验指导书

实验一图象变换实验

10、重复步骤5，查看阈值变换后图像的频率域分布情况;

11、执行文件→保存或另存为，保存处理后的图像;

12、执行文件→重新加载，重新加载原始图像，但要注意先前对图像的处理将会丢失; 注意：

13、在执行步骤2时可能会出现有些图像文件不能打开的情况，如图所示，此时可以先利用图像格式转换工具将图像文件转换为8位BMP图像，再利用系统进行处理。步骤14和15是使用图像格式转换工具的方法;

14、在桌面上双击图像格式转换工具Jpg2bmp的图标，进入转换工具界面，如图所示;

15、按照界面提示，把JPG格式的图像文件转换成8位BMP图像。

数字图象处理实验指导书

实验一图象变换实验

步骤13示意图

步骤14示意图

六、思考题

1、图像灰度线性变换、阈值变换、窗口变换、灰度拉伸和灰度均衡之间有何区别?

灰度线性变换就是将图像的像素值通过指定的线性函数进行变换，以此增强或者减弱图像的灰度。

灰度的阈值变换可以让一幅图像变成黑白二值图。

灰度的窗口变换也是一种常见的点运算。它的操作和阈值变换类似。从实现方法上可以看作是灰度折线变换的特列。窗口灰度变换处理结合了双固定阈值法，与其不同之处在于窗口内的灰度值保持不变。

灰度拉伸又叫做对比度拉伸，它与线性变换有些类似，不同之处在于灰度拉伸使用的是分段线性变换，所以它最大的优势是变换函数可以由用户任意合成。

灰度均衡是增强图像的有效方法之一。灰度均衡同样属于改进图像的方法，灰度均衡的图像具有较大的信息量。从变换后图像的直方图来看，灰度分布更加均匀。

2、利用图像镜像和旋转变换可以实现图像转置吗?如果可以，应该怎样实现?

可以。进行一次镜像变换，顺(逆)时针旋转两次，再以与第一次相反的方向镜像变换。

数字图象处理实验指导书

实验一图象变换实验

实验二图像增强及复原实验

七、实验条件

PC机数字图像处理实验教学软件

大量样图

八、实验目的

1、熟练使用“数字图像处理实验教学软件系统”;

2、熟悉图像增强及复原的基本原理，了解编程实现的具体步骤;

3、观察图像中值滤波、平滑、锐化和伪彩色编码的结果，比较不同参数条件下的图像增强效果;

4、观察图像退化和复原的结果，比较不同复原方法的复原效果。

九、实验原理

1、图像增强和复原的基本原理

对降质图像的改善处理通常有两类方法：图像增强和图像复原。

图像增强不考虑图像降质的原因，只将图像中感兴趣的特征有选择地进行突出，并衰减图像的次要信息，改善后的图像不一定逼近原始图像，只是增强了图像某些方面的可读性，如突出了目标轮廓，衰减了各种噪声等。图像增强可以用空域法和频域法分别实现，空域法主要是在空间域中对图像象素灰度值直接进行运算处理，一般包括中值滤波、模板平滑和梯度锐化等，空域法可以用下式来描述：

g(x,y)=f(x,y)*h(x,y) 其中f(x,y)是处理前图像，g(x,y)表示处理后图像，h(x,y)为空间运算函数。图像增强的频域法是在图像的频率域中对图像的变换值进行某种运算处理，然后变换回空间域，系统涉及的各种滤波器属于频域法增强，这是一种间接处理方法，可以用下面的过程模型来描述：

其中：F(u,v)=[ f(x,y)]，G(u,v)= F(u,v)H(u,v)，g(x,y)=1[ G(u,v)]，和1分别表示频域正变换和反变换。实验系统提供了图像增强相关内容的文字说明，用户在操作过程中可以参考。

图像复原是针对图像降质的原因，设法去补偿降质因素，使改善后的图像尽可能逼近原始图像，提高了图像质量的逼真度。关于图像复原的详细原理可以参考相关书籍，这里不再赘述。本系统提供了图像的噪声退化、卷积退化和运动模糊退化操作，并提供了相应的逆滤波复原、维纳复原和运动模糊复原操作。本次

数字图象处理实验指导书

实验一图象变换实验

实验中图像复原只作一般性了解。

2、编程实现步骤

下面以图像增强中的中值滤波操作为例给出编程实现的程序流程图，如下：

十、实验内容

图像增强：中值滤波、图像模板平滑、理想低通滤波器平滑、巴特沃斯低通滤波器平滑、梯度锐化、拉普拉斯锐化、理想高通滤波器锐化、巴特沃斯高通滤波器锐化和伪彩色编码

图像复原：图像的噪声退化、卷积退化、卷积加噪声退化、运动模糊退化、逆滤波复原、维纳复原和运动模糊复原

注意：

3、所有实验项目均针对8位BMP灰度图像进行处理;

4、本次实验的重点是图像增强中的中值滤波和模板平滑，图像复原只作一般性了解。

十一、实验步骤

以图像中值滤波操作为例说明实验的具体步骤，其它实验项目的步骤与此类似。

11、打开计算机，在系统桌面上双击“数字图像处理实验教学软件系统”的可执行文件“图象处理”的图标，进入实验系统;

12、执行文件→打开，在OPEN对话框中选择待处理的图像，按【OK】后系统显示出图像;

数字图象处理实验指导书

实验一图象变换实验

13、执行查看→图像基本信息，将显示图像基本信息对话框，如图所示;

14、执行查看→灰度直方图，查看图像的灰度直方图，如图所示;

数字图象处理实验指导书

实验一图象变换实验

15、执行图像变换→正交变换→傅立叶变换，查看图像的频率域分布情况，如图所示;

16、执行图像增强→中值滤波，选择或自定义对话框中的滤波器参数，如图所示;

数字图象处理实验指导书

实验一图象变换实验

17、设置完滤波器参数后按【OK】,系统显示中值滤波后的图像，与原图像进行比较，观察中值滤波的效果，如图所示;

18、

重复步骤4，查看中值滤波后图像的直方图分布情况;

数字图象处理实验指导书

实验一图象变换实验

19、重复步骤5，查看中值滤波后图像的频率域分布情况;

10、执行文件→保存或另存为，保存处理后的图像;

11、执行文件→重新加载，重新加载原始图像，但要注意先前对图像的处理将会丢失。

数字图象处理实验指导书

实验一图象变换实验

十二、

思考题

1、图像中值滤波和模板平滑之间有何区别?

图像平滑处理就是用平滑模板对图像进行处理，以减少图像的噪声。而中值滤波是一种非线性的信号处理方法。

2、图像增强和图像复原之间有何区别?

图像增强：利用一定的技术手段，不用考虑图像是否失真(即原始图像在变换后可能会失真)而且不用分析图像降质的原因。针对给定图像的应用场合，有目的地强调图像的整体或局部特性，将原来不清晰的图像变得清晰或强调某些感兴趣的特征，扩大图像中不同物体特征之间的差别，抑制不感兴趣的特征，使之改善图像质量、丰富信息量，加强图像判读和识别效果，满足某些特殊分析的需要。

图像复原：针对质量降低或者失真的图像，恢复图像原始的内容或者质量。图像复原的过程包含对图像退化模型的分析，再对退化的图像进行复原。图像退化是由于成像系统受各种因素的影响，导致了图像质量的降低，称之为图像退化。这些因素包括传感器噪声、摄像机聚焦不佳、物体与摄像机之间的相对移动、随机大气湍流、光学系统的象差、成像光源和射线的散射等。图像复原大致可以分为两种方法：

一种方法适用于缺乏图像先验知识的情况，此时可对退化过程建立模型进行描述，进而寻找一种去除或消弱其影响的过程，是一种估计方法;

另一种方法是针对原始图像有足够的先验知识的情况，对原始图像建立一个数学模型并根据它对退化图像进行拟合，能够获得更好的复原效果。

3、图像维纳复原为什么比逆滤波复原效果好?

维纳滤波复原的原理可表示为

对于维纳滤波，由上式可知，当

时，由于存在项，所以数字图象处理实验指导书

实验一图象变换实验

不会出现被0除的情形，同时分子中含有项，在处，。当时，，此时维纳滤波就变成了逆滤波;当时，，表明维纳滤波避免了逆滤波中出现的对噪声过多的放大作用,也就是说图像维纳复原比逆滤波复原效果好。

第8篇：数字图像作业

数字图像处理大作业，请转发。

要求每个同学完成1题，按照学号进行分配，

1、

11、

21、

31、

41、51完成第一题，

2、

22、

32、

42、52完成第二题，以此类推。每道题要求有理论说明和实验验证，完成后撰写报告并打印，报告页数不少于5页，包括，理论、实验代码和实验结果，报告完成后由班长收齐后交到计算机楼530，时间7月2日截止。

1、什么是图像增强，常用的图像增强方法有哪几种?请举例并用实验说明。

2、什么是图像复原，图像复原常用的方法有哪些?请举例并用实验说明。

3、什么是灰度直方图，直方图的作用是什么，请用实验说明。彩色图像如何利用直方图法进行增强，利用例子说明之。

4、常用的图像分割方法有哪几种?请举例并用实验说明。

5、分析几种常用边缘分割的方法的特点并用实验说明。

6、什么是频域滤波，什么是空域滤波，它们的特点是什么?用实验说明。

7、常用的数字图像处理的格式有哪些?它们的特点是什么?编程实现不同类型图像的平移、镜像、旋转和缩放。

8、数字图像噪声的有哪些类? 常见的噪声有哪几种，它们的特点有哪些，有实验图像说明之，如何消除这些噪声，效果如何，实验说明之。

9、查找资料，叙述车牌识别的基本过程，并用matlab进行仿真

10、查找资料，说明什么是图像膨胀，什么是图像腐蚀，它们的作用是什么，用并用实验说明。

图像数字化

第1篇：图像数字化

第2篇：欧美发达国家图像数字化标准研制进展及启示

第3篇：图像数字水印的现状及其发展趋势

第4篇：BMP数字图像的认识与应用

第5篇：浅谈数字媒体图像“美”的形式

第6篇：数字图像处理技术的应用研究

第7篇：数字图像处理图像变换实验报告

第8篇：数字图像作业

热门文章

相关推荐