广东省政府文件pdf(共12篇)
方法一:
利用Adobe公司的Adobe Acrobat Professional进行转化。注意,一定是Professional版本的,Reader版本没有这个功能。
首先安装Adobe Acrobat Professional(目前最高版本为7.0),系统会自动产生一个虚拟打印机PDFMaker,这下明白了吗?你可以打开要转化的文档,用钢产生的虚拟打印机进行打印就可以了。不过,对于Word、Excel、PowerPoint等来说,最好还是直接转化。仔细观察你的Word程序,是不是发现多了一个PDFMaker工具栏呢?电力面的第一项,就可以了。
安装了Adobe Acrobat Professional后最大的好处是,利用Adobe Acrobat Professional可以对PDF各式的文档进行编辑,如果你已经安装了该软件,我想你很快会使用的。
而且,Adobe Acrobat Professional还可以将你电脑上的图片转化为PDF文档,在你需要的时候,在用Adobe Acrobat Professional将PDF文档另存为图片。
方法二:
安装pdfFactory Pro,同样也会产生一个虚拟打印机,这样,你就可以把你所能打印的一切材料都转化为PDF格式。
方法三:
利用Macromedia FlashPaper进行转化。
在FlashPaper安装之后,会自动在在Word等软件中会添加一个名为“FlashPaper”的菜单和一个有三个按钮的工具栏(与Adobe Acrobat
Professional类似),从左到右依次为:将当前文档转换成Flash动画;把文档转换成pdf文档;转换成pdf文件并用Email发送。利用该工具栏,可以轻松的把Word文档转换成swf或pdf文件。
在其他程序中,如记事本中打开一个文件,单击“文件→打印”,打印机选择
“Macromedia FlashPaper”,单击“首选项”可改变其页面属性。单击“确定”,会自动启动FlashPaper进行打印,并把打印结果显示出来。
关键词:动态数据交换,插件,动态控制,PDF文档
0 引 言
目前信息安全产品的研发和研制对企业甚至国家而言都是至关重要的。从安全市场的产品分布而言,传统的“老三样”:防火墙、入侵检测和防病毒产品占据着整个安全市场的半壁江山。但同时,有85%-95%的攻击来自网络内部,“内部人”泄密风险自然成为网络安全防范的重点。而控制内部员工对文件的操作又是保证内网安全的重中之重。比如针对不同文件,用户有不同操作权限,有些文件可以打印,而有些文件不可以打印,因此人们迫切需要找到一种能够根据用户权限动态控制其文件是否应该被屏蔽修改或打印等等操作的方法。与此同时,针对目前广泛使用的PDF文档,如何对其有效控制自然成为内网安全必须解决的问题之一。比如对非授权用户屏蔽其PDF文件工具条上的保存、打印、发送等按钮;屏蔽菜单下的保存、打印等等子菜单;控制其利用快捷键对文件进行保存操作等等。本文提出用Plug-in和DDE联合控制PDF文件,同时将DDE程序生成DLL文件并引入用户权限,再使用DLL钩挂技术并且不断查询用户针对当前PDF文件的操作权限,则可以达到根据用户权限动态控制PDF文件的目的。这样可以在不影响用户对PDF文件正常使用的同时,又能有效地控制用户对文件的操作。
1 DDE使用机理
DDE(动态数据交换)是Windows所制定的程序间通信的一种常见协议。Windows系统总共定义了三种通信方式供应用程序使用,除功能最强的DDE外,还有剪贴版和动态连接库。DDE正是建立在Windows内部消息系统、全局原子和共享全局内存基础上的一种协议,用它来协调Windows应用程序之间的数据交换和命令调用。近些年来,虽然随着OLE和COM技术的逐渐成熟,使用DDE方式的程序间通信有所减少,但这并不意味着使用DDE不再具有任何价值,由于DDE技术比较成熟,而且在某些领域有广泛应用,在很长时间内COM和DDE将会共存。
客户程序和服务器程序可以通过以下三种链接方式进行数据交换:
(1)冷链接 客户程序申请数据,服务器程序立即给客户程序发送数据。
(2)温链接 服务器程序通知客户程序数据数据项发生了改变,但是并没有将已发生的值发送给客户程序。
(3)热链接 当数据项发生变化时,服务器程序立即把变化后的值发送给客户程序,这是最常用、最方便的方法。
在DDE中,有两个应用程序能够以类似联机对话方式交换数据,从而完成数据的请求、应答、传输。这两个应用程序分别称为服务器和客户。服务器是数据的提供者,客户作为数据的请求和接受者。以下通过冷链接方式来简要介绍DDE通信流程[2]:
(1) DDE服务器和客户端以先后顺序处于运行模式,服务器端应当先于客户端处于运行模式等待客户端的请求。DDE服务器要事先向操作系统以原子(Atom)注册会话建立所必须的三大元素:程序对象(Application),也就是服务器程序的执行文件名;通信主题(Topic),所有的DDE服务器程序至少要支持的一项通信主题,也可以同时创建数种通信主题,达到数据交换的目的;数据项目(Item),在每个通信主题中,DDE服务器可以支持一个以上的数据项。
(2) DDE客户端向服务器端提出连接请求。DDE通信由客户端发起,客户端向系统内的所有顶层窗口广播发送WM_DDE_INITIATE消息,并将客户窗口的句柄、服务器端向操作系统注册的程序对象和通信主题相对应的原子值作为参数发送出去。
(3) DDE服务器响应客户端的连接请求,建立DDE会话连接。
(4) DDE客户端向服务器提出数据请求。
(5) DDE服务器响应数据请求并加以处理。
(6) 客服端取得数据。
(7) 结束DDE会话,当客户端不再需要服务端的DDE服务时,向服务端发送WM_DDE_TERMIINATE消息,服务器收到消息后,做一些数据和内存的清理工作并注销连接的客户端的记录,从而结束本次DDE会话,并释放资源等。
2 plug-in使用机理
Plug-in类似Windows平台下的DLL文件,可以动态被Acrobat和Adobe Reader调用[3]。简单说Plug-in就是一个应用程序,它用Acrobat或Adobe Reader作为主机环境,这意味着Plug-in并不需要复杂的用户接口元素,但所有Plug-in必须放在Program FilesAdobeAcrobatplug_ins目录下面。当Acrobat启动时会自动加载这个目录下的插件,由于每个插件可以实现相应的功能,从而就可以实现对菜单、工具条、快捷键等的控制。
3 具体实现流程和核心代码
3.1 利用DDE控制Acrobat流程及对应核心代码
要使用DDE达到对acorbat控制的目的,首先要对DDE会话初始化,也就是使用API函数DdeInitialize,在DDEML中注册应用。然后使用DdeCreateStringHandle为特定的字符串创建句柄,本DDE程序是为了实现对acroview控制,所以服务器端使用字符串用acroview,topic name使用control。其次建立会话,客户端使用DdeConnect与特定的服务器应用程序建立连接。最后使用DdeClientTransaction向特定的子菜单发送控制消息。需要注意的是当完成操作后,必须释放资源,图1描述了具体实现流程。
具体实现代码如下:
3.2 实现Plug-in的流程及对应核心代码
开发Plug-in的流程如下,首先建立一个C工程,然后将Acrobat的头文件加入进来,并添加PIMain源文件到工程里面,再针对Plug-in要达到的目标编写对应程序。本程序是建立在PIMain源文件和头文件已经加入的基础上,图2描述了针对Plug-in开发的流程。
(1) 实现Plug-in的具体代码如下:
(2) 回调函数中的核心代码,本例实现让“文件”下“保存”按钮失效[4]:
(3)SetMenuItemDisabled也是需要我们实现的回调函数,根据具体需要实现。
图3-图5就是通过DDE方式发送失效消息后在Adobe Acrobat Standard 6.0实现的效果图。
4 结 语
最终程序在Adobe Acrobat Standard 6.0、7.0以及Adobe Acrobat Professional 6.0、7.0、8.0测试并都能达到预期目的。需要注意的是Reader版本下Plug-in开发和Standard与Professional版本下的Plug-in开发大体一致,但Reader下的Plug-in需要注册[5]。
Acrobat提供了OLE、DDE以及Plug-in来控制PDF文件,然而 OLE和DDE提供的方法有限而且缺乏灵活性,不能够很好地满足对PDF文件的控制[6]。利用Plug-in却能够很好满足需要,但是Plug-in一旦被加载,所有屏蔽都将生效。而在实际应用中,往往是需要根据用户权限来决定其当前操作的文件是否应该被屏蔽相应操作。针对以上问题本文提出使用DDE和Plug-in来联合控制PDF文件,主要思想是通过Plug-in在菜单栏下加入子菜单,将需要的控制写在子菜单对应函数下,通过DDE向这些子菜单发送消息,这样可以利用DDE程序在外部来控制插件的作用效果。需要注意的是为了让用户不能操作子菜单,应该将对应子菜单隐藏,同时将DDE程序生成DLL文件并引入用户权限,然后利用DLL钩挂技术并用一个线程不断查询用户针对当前PDF文档的操作权限,最后针对查询结果决定是否屏蔽,从而实现通过用户权限动态控制其当前PDF文件操作的目的。
参考文献
[1]梁庚,白焰,李文.基于Windows DDE的客户/服务器应用开发[J].计算机工程与设计,2004.
[2]新编Windows API参考大全编写组.新编Windows API参考大全[M].北京:电子工业出版社,2000.
[3]Adobe公司.Developing Plug-ins and Applications[DB/OL].http://www.adobe.com/devnet/acrobat/pdfs/plugin_apps_developer_guide.pdf.
[4]Adobe公司.Guide to SDK Samples[DB/OL].http://www.adobe.com/devnet/acrobat/pdfs/samples_guide.pdf.
[5]Adobe公司.Developing for Adobe Reader[DB/OL].http://www.adobe.com/devnet/acrobat/pdfs/reader_overview.pdf.
一、必备条件——装一台虚拟打印机
首先,你需要有一台特殊的打印机——虚拟打印机。这台打印机是随抓图软件SnagIt附带的一种虚拟打印机,有两种安装方法。
1. 自动安装虚拟打印机
如果选择用安装版安装7.0以上版本的SnagIt抓图软件,通过完全安装的方法,安装完成后会获得这台打印机。
2. 手动安装虚拟打印机
如果你使用的是不用安装的绿色版SnagIt软件,那么你不会在控制面板中找到SnagIt打印机的影子。你需要通过设置的方法进行安装。
二、格式转换——下达一个打印命令
1. 打开任意文档
2. 执行打印命令
3. 选择虚拟打印机
4. 进行输出设置
5. 得到输出结果
6. 输出结果预览
如果您收到较大的 PDF 文档,您可以使用“减小文件大小”命令通过重新取样和重新压缩图像、解除嵌入字体、压缩文档结构以及整理元素,例如重复的背景图像和无效书签来尝试减小文件大小。如果文件大小已经足够小,本命令不会起作用。
注:减小数字在不破坏签名有效性的同时减少已数字签名的文档的文件大小,数字签名文档将使签名失效。
您也可以通过限制与旧版本的 Adobe Acrobat 的兼容性来减小文件大小。如果您可以确保所有用户都使用 Acrobat 7.0,建议使用本方法。
要减小文件大小:
1.请选择“文件”>“减小文件大小”。
2.请选择您需要的兼容版本,然后单击“确定”。
注:如果您选择“ Acrobat 4.0 和更新的版本”,而且文档含有透明度,透明度将被拼合。
从某些数据库上下的pdf文献,往往尺寸很大,比如APS上下载一篇关EAM的文章prola.aps.org/abstract/PRB/v29/i12/p6443_1
由于文件里是图像,而不是文本内容,所以仅11页,尺寸却达2.46M。储存、传输都不方便。这里介绍一下减小尺寸的办法。
我这里用的是acrobat3D v8.1,首先打开那个pdf,主菜单选Document-OCR Text Recoginition-Recognize Text Using OCR
对话框中,选All pages,Primary OCR Language:English,PDF Output Style.:Searchable Image,Downsample:Lowest(600dpi),然后OK
acrobat对文档内容进行OCR识别,变成了可检索的文本形式,这时可以先保存一下,看到文件已变成1.79MB,说明OCR识别除了本职功能,还有减小文件尺寸的功效。
然后Document-Reduce File Size,由于一般都用的7.0以上阅读器,所以选7.0及以上,
看看存完的新文件,已减小为368KB。若选8.0及以上并不会使文件更小。
如果再压缩成rar,还可以减小到336KB,但意义不大了
从2.46MB减小到336KB,成效明显,而且显示质量没有任何损失,文本还顺便变成了可检索、复制的形式。
顺序很关键,如果先Reduce File Size,再OCR,结果是2.46MB->940KB->832KB
acrobat还有个功能,Document-Optimize Scanned PDF,也可以减小尺寸,但对于这类文字很干净清晰的pdf文件,功效甚微,而且使显示质量下降。
文献数据库那些文献pdf,基本上都是格式工整,文字清晰规范,这类都能OCR,我有篇slater 1931年的文章,从4MB多处理到700KB。
只是其中文OCR识别效果不好,不如紫光,虽然紫光也不怎么样。
至于Optimize Scanned PDF,处理出来的大小,看滑动条拉到偏重质量或是文件尺寸,同时能顺便消除低噪,修正字体,对这类数据库的的文献基本毫无意义。对这类数据库文献,拉到最偏重大小,大概能减小15%左右尺寸,但文字效果也差了,不值得。
文献数据库那些文献pdf,基本上都是格式工整,文字清晰规范,这类都能OCR,我有篇slater 1931年的文章,从4MB多处理到700KB。
只是其中文OCR识别效果不好,不如紫光,虽然紫光也不怎么样。
至于Optimize Scanned ...
讨论:如何减小PDF文件大小?
有些输出的PDF文件大小超过我们的要求,这时我们就需要把它压缩一下,我尝试了一下几种办法:
1、 从Adobe Acrobat 7开始,提供了“PDF 优化器”(“高级”选项卡里),我们可以利用它来进行PDF文件的压缩。
2、 利用PDF Enhancer压缩,调整。
3、将你的PDF文件再使用PDF虚拟打印机打印,一般情况下可以压缩PDF大小至30%-70%,视你的PDF文件的构成。
PDF虚拟打印机,我试过Adobe Acrobat 专业版自带的,Bullzip PDF Printer,PDF Factory.感觉这时候用Bullzip PDF Printer最好。
把PDF格式文件转换为TXT格式文件
,
需要注意的是,经过这样处理后PDF文件里的图片、文字格式和排版样式都会丢失。
★ 将PPT文档转换为Word文档
★ Word快速转换为PPT文稿
★ 教你怎样把Oracle查询转换为SQL Server综合教程
★ 如何把职场委屈转化为个人成长
★ 求职信范文中文
★ 中文自荐信 格式
★ 如何写中文求职信
★ 中文绕口令
★ 中文书信格式范文
本文实例讲述了Python实现简单拆分PDF文件的方法,分享给大家供大家参考。具体如下:
依赖pyPdf处理PDF文件
切分pdf文件
使用方法:
1)将要切分的文件放在input_dir目录下
2)在configure.txt文件中设置要切分的份数(如要切分4份,则设置part_num=4)
3)执行程序
4)切分后的文件保存在output_dir目录下
5)运行日志写在pp_log.txt中
P.S. 本程序可以批量切割多个pdf文件
from pyPdf import PdfFileWriter, PdfFileReaderimport osimport timeimport sysdef part_pdf(input_file, output_file, config_count, f_w, now, file_name): file1 = file(input_file, ‘rb‘) pdf = PdfFileReader(file1) pdf_pages_len = len(pdf.pages) if config_count <= pdf_pages_len: ye = pdf_pages_len / config_count lst_ye = pdf_pages_len % config_count part_count = 0 part_count_ye = 0 for fen in range(config_count):part_count += 1if part_count == config_count: part_ye = ye + lst_yeelse: part_ye = yewrite_pdf(pdf, part_count_ye, part_count_ye+part_ye, fen, output_file)part_count_ye += ye else: f_w.writelines(‘time: ‘+now+‘ file name: ‘+file_name+‘ status: part_num > pdf pages [error]n‘) sys.exit(1)def write_pdf(pdf, part_count_ye, part_count_ye_end, fen, output_file): ut = PdfFileWriter for pp in range(part_count_ye, part_count_ye_end): out.addPage(pdf.getPage(pp)) us = file(output_file+‘_‘+str(fen+1)+‘.pdf‘, ‘wb‘) out.write(ous) ous.close()def pdf_main(): f = open(‘configure.txt‘, ‘r‘) f_w = open(‘pp_log.txt‘, ‘a‘) now = time.strftime(‘%Y-%m-%d %H:%M:%S‘) for i in f: i_ = i.strip() aa = i_.split(‘=‘)[1] if i_.find(‘part_num=‘) != -1 and aa.isdigit():config_count = int(aa) else:f_w.writelines(‘time: ‘+now+‘ status: part_num in configure.txt is error [error]n‘)sys.exit(1) files = os.listdir(‘input_dir/‘) for each in files: input_file = ‘input_dir/‘+each file_name = input_file[input_file.index(‘/‘):input_file.index(‘.‘)] output_file = ‘output_dir/‘+file_name part_pdf(input_file, output_file, config_count, f_w, now, file_name) f_w.writelines(‘time: ‘+now+‘ file name: ‘+file_name+‘ status: successn‘)pdf_main()
关键词:PMID编号,自动链接PDF,自动更名,自动分类,采编检
1 研究背景
对于零散的PDF文件进行保存在国内外都是一个难题,图书馆参考咨询部门对此又有强烈的需求。于是我们通过“电子文献网络结构技术”研究,将零散的PDF文件名通过云计算自动采集题录入库,形成PDF文件名对照表。再将PDF文件名按照PMID编号重新命名,将PMID编号重新命名的PDF文件重新入库,建立主关键字索引文件和搜索引擎,实现PDF文件名自动更名、自动分类、自动编辑、时时检索管理工具。
2 项目介绍
要想建立数字资源即采、即编、即检管理系统,首先要解决好知识产权问题。目前电子资源即采、即编、即检管理系统已经成为世界各国十分关注的问题。用户电子资源存档和知识产权问题成为研究的焦点[1]。近年来,许多国际出版社考虑到用户的核心利益,在保护知识产权前提下,允许图书馆在中心馆和专业馆进行不同方式的电子资源存档,作为特殊情况下馆藏使用[2]。特别值得注意的是,很多数据库厂商都授予国内单位数据存档权,在合同中标明在数据库发生故障无法使用时,或者合同到期订购关系终止时,购买单位可以启用电子存档数据。电子资源存档得到出版社的许可,是电子资源进行长期合法保存的关键[3]。
2.1 目前出版社许可的电子资源存档方式
第一种方式:允许用户购买电子资源停定以后,数据库厂商将电子数据库给用户安装在本地进行存档和长期使用,给用户安装所有购买过的数据并允许用户永久使用。
第二种方式:购买电子资源后,数据库厂商提供给用户一套全文光盘进行存档,允许单台计算机上永久使用。
第三种方式:允许用户购买电子资源后,在中心馆或专业馆由用户自己做电子馆藏。还可以提供给用户存档工具,存档数据在订购的数据库发生自然灾害时供给读者使用。
第四种方式:允许用户保存开放获取(OA)电子资源。免费数据库允许用户作为馆藏永久使用。因此用户不仅具有对所购买的电子资源在IP范围内的访问权,还具有永久使用权。
2.2 研发的基本条件和用途
在尊重知识产权的前提下,首先在国际互联网上收集OA电子期刊全文,以及与全文相对应的题录。根据读者零散保存的PDF文件PMID编号,采集Pub Med中的Summary题录入库,将文献PDF文件名按照PMID编号进行更名入库,再按照PMID作为主索引字段进行索引,最后在本地发布,提供本地检索查询使用。
研发使用硬件环境:P2.8 G处理器,G内存,500G硬盘。
软件运行环境:Windows XP,.Net2.0以上,Offi ce2003中的ACCESS数据库。
通过对开放获取和有存档权的医学电子资源进行手工和自动即采、即编、即检管理系统机制的研究,通过医学网络文献结构和自动挖掘方法,以及云计算、自动更名、自动分类、自动发布等技术,进而实现采、编、检一条龙文献馆藏查询系统。
数据使用:平时师生个人、参考咨询部门学习和科学研究;遇到不可抗拒的自然灾害及政治因素等特殊情况导致数字资源终端不能使用时使用;作为数字资源馆藏缴存和战略容灾储备。
3 项目实施
3.1 技术开发思路
由于该系统建设主要采集有存档权的OA医学电子期刊作为图书馆的馆藏,整体设计思路是教师在知道文章出处情况下在本地计算机上查找馆藏,因此以查找为主设计思路。目前采用Windows XP平台,.NET软件,数据库采用Office Access 2003数据库。随着数据库数据量的增多,可以将数据导入到SQL,ORCL数据库进行编辑、发布使用。因此该系统适合个人以及大、中、小图书馆用来建设医学图书馆电子期刊馆藏使用。
3.2 文献网络结构设计思路
按照Pub Med编号对采集的PDF文件名重命名,就可以将不同期刊的电子文档PDF文件命名统一化,用PMID编号作为数据库的唯一主关键字字段。通过云计算和PMID编号在Pub Med数据库采集该篇文献的题录信息入库。这样就可以根据题录信息中的刊号、年、卷、期、页、作者、题名、摘要等字段查找文献。由于不同出版社数据库的PDF文件名组织形式各不相同,首先要解决PDF文件名组织形式统一问题,如何将各个出版社和数据库厂商PDF文件名组织形式统一化是解决问题的关键。
为什么不采用DOI国际上对文件名统一编号的主关键字?因为国际文献编码例如DOI:10.1016/j.acra.2009.10.031是以数字串和字符串混合组成,更难记忆,而且DOI编号只对出版社提供,不对用户提供,要获得DOI编号还需要交费。老的文献还没有DOI编号,DOI编号不能覆盖所有的文献,因此没有采取DOI进行编号作为关键字。
如何手工和自动对文件名进行更名?手工对文件更名:将零散下载的文献和文献传递的PDF文件在Pub Med中查找到后,每一个Pub Med文献都标注了PMID编号,因此很容易按照PMID重新给PDF命名。利用采集工具自动对PDF文件更名,可以利用采集的文献题录库自动给不同编号PDF更名为统一按照PMID编号的PDF文件。
“Pub Med中PMID编号自动链接到PDF全文”功能。图书馆大量开放存取文献如果没有人进行整理,全文文件则不能作为图书馆的馆藏。新的读者要索取同一个有存档权的全文文件,只有再发出索取同一个文件的全文传递请求,造成重复传递。而且互联网出口流量增加,需要重复花费文献传递费用,文献传递时间也很长。针对上述问题,在遵守知识产权保护法规的基础上,采用垂直搜索技术,将原始PDF文件的文件名转换PMID编号的PDF文件名,成功地实现了Pub Med中PMID编号自动链接到PDF全文功能。
3.3 技术研究路线
第一步,采用手工方法将文献传递来的PDF文件通过Adobe Acrobat打开,在工具栏上选取[文本]工具,选定文章“题名”,将PDF的“题名”转换成文本文件“题名”,核对无误后,将文本文件“题名”复制到剪贴板。再打开“Pub Med”,在输入框中粘贴“剪贴板”中的文章“题名”后,点击[GO]按钮,进行“题名”检索。检索到该篇文章,在题录中寻找如:PMID:17615536的编号,将PMID的编号“17615536”复制下来,将PDF的文件名更改为PMID编号的PDF文件名。
第二步,将按PMID更名的PDF文件入库,进行索引倒排,生成按PMID编号PDF文件的搜索引擎。然后进行发布,读者就可以找到的PMID编号文献进行检索,直接下载文献传递过的全文文件,实现馆藏建设。
第三步,考虑如何使用垂直搜索技术实现Pub Med中PMID编号自动链接PDF全文功能。首先,分析了手工操作方法在Pub Med中找到既有PMID:17615536的编号,又有PDF链接的页面。使用信息采集工具,按既有PMID:17615536的编号,又有PDF链接的页面进行配置共有字段的主键,将PMID:17615536,PDF文件名、文章题名、PDF链接地址链接成一个库。然后进行索引倒排,将PDF文件名用PMID编号成批替换更名后,再按照PMID字段进行索引倒排,生成新的数据库,从而实现Pub Med中PMID编号自动链接PDF全文功能。
第四步,读者需要全文传递时,首先在免费的Pub Med中进行检索,检索到文章摘要中的PMID编号,将PMID编号输入到可以自动链接PDF全文的检索框中,只输入PMID编号就可以进行全文检索,为读者提供“立等可取”的全文文献提供服务。这个检索查询系统减少了互联网出口流量,节省了有存档权的全文传递的成本,实现了PDF全文本地化建设,增加了图书馆全文馆藏,提高了图书馆文献传递的速度和服务质量。
4 结果讨论
经天津大学、南开大学、天津高等教育文献信息中心、北京大学医学部、北京首都医科大学、中国人民解放军图书馆、中国医学科学院医学信息研究所、武汉大学图书馆、天津医科大学总医院、天津医科大学第二附属医院、天津市人民医院等单位测试或试用得到好评。2011年6月28日通过了天津市高新技术成果转化中心组织的科研成果专家鉴定会。
该成果实现了本地允许保存零散的PDF文件再标引,通过云计算技术实现了对文献题录的时时采集、时时编辑、时时发布,从而达到了即采、即编、即用的理想目标。通过Pub Med中PMID编号自动链接PDF,实现允许保存的零散PDF电子资源即采、即编、即检管理系统的馆藏建设。特别适合参考咨询部门保存、管理、查询零散的PDF全文,是一件具有实用价值的软件工具。
5 未来发展
该系统是单机版进而开发网络版文献整合管理工具,目前只适合Pub Med收录的期刊进而扩大到OA期刊所有期刊,用同样方法就可以实现理、工、农、医全学科的本地PDF数据采、编、检。
参考文献
[1]翟建雄,图书馆馆际互借和文献提供中的版权问题:美国的立法和司法判例介绍[J].法律文献信息与研究,2006(3):1-11.
[2]翟建雄,信息开放存取中的版权问题及图书馆的对策[J].法律文献信息与研究,2006(4):1-28.
打不开?在线拉着转一圈
PDF文件需要专门的PDF阅读器,如Adobe Reader、Foxit Reader等才能将其打开。你固然可以选择下载安装其中一个,也可以不安装,直接使用一些在线服务打开它。比如这里要为大家介绍的Samurajdata,就是其中的佼佼者。
进入http://view.samurajdata.se/页面,右键点击“File View-Upload a file from your computer”文本框中的“浏览”按钮,打开“选择要加载的文件”对话框。在其中选择好要在线阅读的PDF文档,单击“打开”按钮,待文件路径出现在文本框中后,单击“View”按钮(如图1),在经过短暂的处理后,该文档的内容就显示在界面上了。
当然,如果你要查看的PDF文件是来自网络也简单,只需在“WEB View-Fetch the document from the web”文本框中,输入PDF所在的网址,再单击“View”按钮即可。
加密了?用点暴力整一下
对于重要的PDF文档,制作者为防止被他人随意阅读而设置了访问密码。那么,对于这样的文档,是不是就只有放弃呢?当然不是,利用“PDF Password Remover”这款工具,就能将其解密后再阅读。
安装并运行程序后,右键点击主界面中左下方的“打开PDF”按钮,打开相应的对话框,选择好要解密的文档,点击“打开”按钮,程序会自动识别目前打开的PDF文档是否被加密,如果没有加密,会在文件列表中显示“错误,文件没有被加密”字样,如果的确为加密文档,则会直接打开“另存为”对话框(如图2),只需在其中设置好新文档的保存路径及文件名,点击“保存”按钮,文档密码就会被移除,并以我们指定的文件名保存到指定的路径中,最后用PDF阅读软件打开即可。
锁定了?轻松解锁拷一番
为了防止PDF文档被他人非法修改,有些提供者会将PDF文档锁定。锁定后的PDF文档可以打开,但阅读者无法复制其中的内容并进行编辑操作。这对亟需利用其中内容的朋友来说,绝对是一件非常不爽的事。这时,我们可以利用PDF UNLOCKER这款工具将其解锁。
注:如果没有找到“MicrosoftOfficeDocumentImageWriter”项,使用Office2003安装光盘中的“添加/删除组件”更新安装该组件,选中 Office 工具 Microsoft DRAW转换器,
第二步:运行MicrosoftOfficeDocumentImaging,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。
注:对PDF转DOC的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。
我想出一种方法,使得Windows用户不必学习Linux命令,只需简单地将文件“打印”,就可以完成转换,下面就来介绍一下。
基本原理
此方法的基本原理就是利用Ghostscript将PostScript文件转换成PDF格式,然后,通过Samba在Linux下创建一台虚拟的PS-Printer打印机,再使用该虚拟打印机把转换后的PDF格式文件输出到一个共享目录中,供Windows用户使用。下面简单介绍一下所应用到的软件。
1.Samba
Samba是一个运行于Linux环境下的软件,它提供了Windows访问Linux的桥梁,让用户能够在不同的系统环境下方便地共享文件和打印机。
2.Ghostscript
在Ghostscript中包含了一个ps2pdf工具,该工具能将PostScript转为PDF格式。如果系统有gs命令,则说明已经安装了Ghostscript,否则需要根据系统版本自行安装。
设置方法
1. 创建“打印”脚本
创建一个脚本,将打印池中的PostScript文件转化成PDF格式,并把它输出到指定的目录下。通过Samba共享该目录后,用户就可以阅读所创建的PDF文件了。
首先,为相关用户设置文件输出目录的读、写权限:
#chown nobody /home/becks/pdf#chmod 740 /home/becks/pdf
然后,根据实际需要设置其它人的权限。
权限设置完毕后,创建如下内容的脚本,用于将PostScript文件转换为PDF格式:
#!/bin/shNAME=`date +%b%d-%H%M%S`#下面填写要输出PDF文件的路径UTDIR=/home/becks/pdfps2pdf $1 $OUTDIR/$NAME.tempmv $OUTDIR/$NAME.temp $OUTDIR/$NAME.pdfrm $1
将此脚本存放到Linux系统下的/usr/bin目录中,并命名为printpdf,
该脚本也可以到www.ec-base.com/download/printpdf. 。
2.设置Samba
修改smb.conf文件为如下内容:
[global] guest account = nobody hosts allow = 192.168.1.0 security=share workgroup=ec-base.com[PDF] path = /home/becks/pdf browseable = yes writeable = yes guest k = yes force user = nobody[pdfprinter] path = /tmp printable = yes guest k = yes print command = /usr/bin/printpdf %s use client driver =yes lpq command = lprm command =
在以上的配置中,创建了一个发布PDF文件的共享目录(/home/becks/pdf),并强制规定在此目录下创建的文件都属于nobody用户,然后创建一台PDF虚拟打印机,并命名为pdfprinter,而且指明使用客户端的驱动程序(use client driver =yes)。
3.Windows端的设置
Samba服务启动后,Windows用户可以通过网上邻居浏览到pdfprinter打印机,双击它进行安装,然后,随便选择一个PostScript. Printer驱动即可。笔者选择的是HP LaserJet 5P/5MP PostScript。
最近笔者就曾遇到了这么一个情况,我的老板搞到一份50多页的Pdf格式的文件,由于删除、编写的不方便,让我将这篇文档转换为Doc格式的文件,他以为很简单的事情,让我熬了一个通宵,才复制、粘贴完成,而且得到的文件格式与原来的Pdf格式相去甚远。所以,寻找合适的两种格式的转换方式,是一件“功在当代”的大事。
1、Doc格式文件转换为Pdf文件
Doc文件向Pdf格式转换还是比较容易的,主要通过Adobe公司提供的AdobeDistiller虚拟服务器实现的,在安装了AdobeAcrobat完全版后,在Windows系统的打印机任务中就会添加一个AcrobatDistiller打印机,如图1所示:
图1
现在比较流行的DoctoPdf类软件如Pdfprint等的机理都是调用AdobeDistiller打印机实现的,如果想把一个Doc文件转换为Pdf文件,只要用OfficeWord打开该Doc文件,然后在“文件”?>“打印”中选择AcrobatDistiller打印机即可,如图2所示:
图2
这样,就可以很轻松的将Doc格式的文件转换为Pdf文件。
2、Pdf格式文件转换为Doc文件
Pdf格式文件向Doc文件转换相对比较难,因为Pdf格式与Doc格式解码格式不同,在Pdf下的回车符、换行符以及相关的图片格式无法直接转换为Doc文件,笔者之前一直使用复制文本,然后粘贴到Word中实现Pdf向Doc格式的转换,
今天突然发现了一款非常好的Pdf向Doc格式转换的工具,ScanSoftPDFConverterforMicrosoftWordv1.0。它是由ScanSoft公司同微软共同组队开发了一个全新的Office2003插件。该插件可以帮助你通过Word直接将Pdf文档转换为Word文档,并且完全保留原来的格式和版面设计。
这个名为ScanSoftPDFConverterforMicrosoftWord的插件是首先捕获Pdf文档中的信息,分离文字同图片,表格和卷,再将其统一到Word格式。现在你可以重新利用早先你从网络上下载或Email中收到的Pdf文件中的信息,而无需添加任何其他软件。
ScanSoftPDFConverterforMicrosoft已经非常紧密的同Office2003整合在一起了,有两种方式可以将Pdf格式转换成Doc文件。
第一种方式,在MicrosoftWord2003中你可以直接通过“文件”?>“打开”来打开Pdf文件。ScanSoftPDFConverterforMicrosoftWord插件会自动弹出了,如图3所示,经过转换后我们就可以得到想要的Doc文件。
图3
第二种方式,ScanSoft公司也已经开发了基于此的SmartTag(Office2003中重要的功能元件)能够轻松的通过右键来将PDF文件转换成为MicrosoftWord文件(如图4所示)。
图4
注意,在安装ScanSoftPDFConverterforMicrosoftWord的时候建议关闭正在运行的OfficeWord,InternetExplorer和Outlook等软件。
简
报
第1期(总第16期)
广东省红十字会办公室 2006年1月24日
彭珮云会长视察广东省红十字会工作
1月中旬,中国红十字会总会会长彭珮云在广东省人大常委会副主任李兰芳,广东省副省长、省红十字会会长雷于蓝等领导的陪同下,视察了广东省红十字会的工作。
在粤期间,彭珮云会长先后听取了副省长、省红十字会会长雷于蓝和深圳、珠海、中山等市红十字会的工作汇报,对广东省红十字会的工作给予了充分肯定。她指出,广东省红十字会第五次会员代表大会召开以来,在雷于蓝会长的带领下,广东省红十字会在理顺地级以上市红十字会管理体制、制定地方法规和社会筹资、卫生救护培训及志愿服务等方面做了大量的、卓有成效的工作,取得可喜成绩。希望广东省红十字会再接再厉,进一步做好理顺红十字会管理体制工作,万家”活动正式启动。
同日,省红十字会还邀请省医师协会,组织十多位医学专家到三排镇南岗卫生院开展义诊活动,共为250多位瑶族同胞提供了免费医疗和体检等卫生保健及健康咨询服务。
此次,省红十字会共筹集了350多万元款物,分别发放到梅州、河源、惠州、韶关、清远、肇庆、湛江、茂名、阳江、云浮、潮州、汕尾等16个市山区和去年受灾严重的部分贫困群众,受益家庭6500多户,人口达25000多人。
(社会赈济部)
省红十字会召开以“三个走在前面”为主题
2006排头兵实践活动动员大会
1月23日,根据省委的部署,省红十字会召开了以“三个走在前面”为主题排头兵实践活动动员大会。会机关和直属单位的全体党员和干部职工参加了会议。会党组书记、常务副会长徐火周在会上作了动员讲话。
徐火周同志在讲话中指出,今年省委决定在省直机关中开展以在树立科学发展观上走在前面,在构建和谐社会上走在前面,在加强党的建设上走在前面的“三个走在前面”为主题的排头兵实践活动。我们要统一思想,充分认识开展以“三个走前面”为主题排头兵实践活动的重大意义,紧紧围的开局之年,也是省红十字会树立科学发展观,转变工作思路,开拓创新的重要一年。努力推进我省红十字事业的发展,是各级红十字会的使命和责任,我们要团结一心,倍加努力,积极工作,勇于进取,为构建和谐广东作贡献。省红十字会副会长兼秘书长华建主持团拜会。
团拜会在祥和、温馨的气氛中进行,新老同志聚集一堂,喜迎新春,同庆佳节,共祝我省红十字事业兴旺发达,再创新高。
中国红十字会总会备灾救灾工作研讨会在广州召开
2005年12月26—28日, 中国红十字会总会备灾救灾工作研讨会在广州召开。来自中国红十字会总会及各省(市、区)红十字会,新疆建设兵团红十字会和香港、澳门特别行政区红十字会的70多位代表出席了会议。中国红十字会总会赈济救护部部长史解放、省红十字会常务副会长徐火周到会并讲话。
会议总结了2005年全国红十字会系统备灾救灾工作情况,通报了国家彩票公益金备灾救灾项目绩效考评情况。广东、上海、黑龙江、湖南、江西、云南等6个省级红十字会以及香港特别行政区红十字会在会上交流了开展备灾救灾工作的经验。省红十字会副会长莫益勇代表广东介绍了我省红
着中国造血干细胞捐献者资料库广东省分库工作正式启动。
捐赠一点造血干细胞,可以挽救一个人的生命。2005年12月29日,捐献造血干细胞热线电话公布当天,广东省分库的捐赠热线电话就络绎不绝,许多市民主动咨询骨髓捐赠的信息并表达了希望能成为造血干细胞捐赠志愿者的意愿。截至1月15日,报名登记的人数已超过200人。与此同时,中国造血干细胞捐献者资料库广东省分库为白血病患者提供检索服务的工作也已开始。目前,已为17名白血病患者检索到相合的造血干细胞,为白血病患者带来了福音。
(中国造血干细胞捐献者资料库广东省分库)
广州“一元捐”活动共筹善款93万元
2005年12月,广州市红十字会与市卫生局在广州联合组织开展了一次与全国联动的“抵御艾滋病,你我齐参与”的红丝带爱心“一元捐”公益活动。这次活动得到了广州市各级政府以及新闻媒体的大力支持,社会各界人士的踊跃参与。截至1月16日,共筹到善款93万元。目前,这批善款已按有关要求汇到了中国预防性病艾滋病基金会。
本次活动不仅体现了广州人民的人文关怀和社会责任,更是一次人人参与,共同抵御艾滋病的具体行动。
(广州市红十字会)
深圳市红十字会为梅州山区送去温暖
1月7日,深圳市红十字会带着由深圳金光华商场FCK品牌捐助的价值13万元近3000件衣物及广州大旺食品公司深圳分公司捐赠的价值22万元的食品,为梅州市丰顺县丰良镇人民送去了新年的问候。
(深圳市红十字会)
汕尾市红十字会举行博爱送万家活动
1月18日,汕尾市红十字会2006年“红十字博爱送万家”慰问物资发放仪式在汕尾市海丰县鹅埠镇政府大院内举行。省红十字会副会长莫益勇、汕尾市副市长刘小静以及海丰县、鹅埠镇领导出席了放发仪式。当地100户贫困少数民族(畬族)和困难群众兴高采烈地领到了省红十字会慰问小组送来的慰问金和慰问品,海丰县红十字会也给每户送上了慰问金。
这次活动,省红十字会下拨的慰问款物使400多户畬族贫困家庭和特困群众受益,让他们能够过上一个欢乐祥和、温暖的春节。
【广东省政府文件pdf】推荐阅读:
广东省教科文卫工会文件11-29
广东省人民政府行政执法证管理系统01-12
少先队广东工作委员会文件02-25
广东省水库管理11-16
广东省面试真题12-12
广东省安监局01-05
广东省导游考试02-09
广东省农业厅05-30
广东省语言文字06-18
广东省金融运行报告09-22