少数民族语言网络舆情论文

2022-04-29 版权声明 我要投稿

摘要:互联网的普及运用,使得网络舆情高发,网络舆情对社会主义意识形态产生重要影响。在新疆特殊地缘政治环境中,网络舆论对于各民族价值观的影响的作用越来越大,能否实现网络舆情的有效引领,关系到党的执政地位和新疆的长治久安。用社会主义核心价值观引领网络舆情、净化网络舆情空间、形成良性舆情机制至关重要。下面小编整理了一些《少数民族语言网络舆情论文 (精选3篇)》,供大家参考借鉴,希望可以帮助到有需要的朋友。

少数民族语言网络舆情论文 篇1:

中国少数民族语言网络舆情研究述评

〔摘 要〕中国少数民族语言网络舆情研究是网络信息资源管理的重要内容。本文在介绍国内少数民族语言网络舆情研究现状和问题的基础上,总结了少数民族语言网络舆情研究的4个特征:政治性、交叉性、跨境性和超前性,分析了少数民族语言网络舆情研究整体趋势,指出语义分析、情感倾向分析、多语种分析等有待突破的研究方向。本文的研究结论对于中国少数民族语言网络舆情监测和分析体系的建立和少数民族语言网络舆情科学研究的开展具有一定的参考价值。

〔关键词〕少数民族语言;网络舆情;民族信息学;述评

DOI:10.3969/j.issn.1008-0821.2014.02.034

西方国家舆情研究可以追溯到19世纪兴起的民意调查。近年来,国内外各类政府组织都将网络舆情作为民意的重要形式予以关注,网络舆情分析与监测已成为传播学、情报学、社会学、公共管理等学多个学科共同关心的热点问题。网络舆情(Internet Public Opinion)是在特定的时间和社会空间内,个人和社会群体在以互联网为媒介进行信息沟通和传播的过程中所反映出来的对相关公共事务所持有的态度、情绪、意愿和行为倾向的集合[1]。网络舆情的功能具有两面性:一方面它是现实舆情民意在网络空间直接体现,可以作为公共决策的重要依据;另一方面,网络舆情可能带有情绪宣泄的色彩,有可能成为重大公共危机的“导火索”,对社会的稳定和发展构成严重影响。

1 中国少数民族语言网络舆情研究的概况中国是统一的多民族国家,多民族、多语言、多文字是国情的基本特征。近年来,在国家通用语言文字网络信息资源飞速增长的同时,以蒙古文、满文、维吾尔文、哈萨克文、柯尔克孜文、藏文、朝鲜文、彝文、傣文等为代表的一大批少数民族文字网站也在互联网上相继亮相。国家语言资源监测与研究中心少数民族语言分中心调查显示,2011年我国大陆地区少数民族语言文字网站总量在389个左右,其中维吾尔文网站175个、藏文网站109个[2]。随着支持少数民族文字的计算机软件和移动通信设备应用范围逐步扩大,越来越多的少数民族人口开始熟悉和掌握网络应用的使用方法,互联网成为我国民族地区人口表达意愿、交流信息和共享文化重要空间的趋势已经开始显现。采用科学的理论和方法进行少数民族语言网络舆情的分析和研究,是政府在数字时代实现科学、民主决策的基本需要,也是民族地区社会稳定和繁荣的重要保障。我国民族地区大多处在祖国的边疆地带,在国家稳定和团结的整体格局中具有举足轻重的地位,与少数民族事务相关的各类事件大多是国际国内各类机构所关注的焦点。随着互联网在民族地区的逐步普及,建立网络舆情的分析和监测体系已经成为民族地区公共管理体系创新的重要内容。少数民族语言网络舆情分析与监测具有重大的社会意义,主要有:第一,通过对少数民族语言网络舆情的分析和监测,可以倾听广大网民用少数民族语言文字所表达的心声,了解民族地区广大网民对公共事务的意见和建议,从而为科学决策和改进工作奠定基础;第二,通过对少数民族语言网络舆情的分析和监测,可以及时发现可能导致严重公共危机的事件,提前进行预警和处置,将危机消灭在萌芽状态;第三,通过对少数民族语言网络舆情的分析和监测,可以掌握网络舆情信息传播的规律,采取必要措施合理干预,防止引发重大危机事件,引导网络舆情朝积极、健康的方向发展。近年来,我国一些学者已经开始探索少数民族语言网络舆情分析的理论与方法。例如,江涛等人设计了基于的藏文网页舆情监控系统,讨论了藏文网页的判定算法、不同藏文编码向国家标准扩A转换的算法以及格助词与藏文舆情分词词典相结合的自动分词算法等[3];邓竞伟等根据复杂网络理论的研究方法对藏文网络舆情传播规律进行实证分析,构建了基于藏文网络的舆情传播模型[4];阿布都瓦依提·尼亚孜研究了维吾尔文网站网络舆情的引导和控制问题[5];卢修配等人探讨了维吾尔文网络舆情分析目前国内外的研究状况和要解决的关键技术问题[6];王嘉梅等人以云南跨境民族语言彝文为例,对跨境多民族语种网络舆情内容进行深入分析与理解,构造了基于人工免疫系统的网络舆情信息智能滤取系统[7]。近年来,少数民族语言网络舆情分析领域的研究基金课题逐渐增多,例如中央民族大学闫晓东主持的“藏、维文网络敏感信息自动发现和预警技术研究”、新疆大学艾斯卡-艾木都拉尔主持的“新疆多民族语言网络舆情监测预警系统开发与应用”、新疆大学禹龙主持的“维吾尔语网络舆情信息自动获取与分析方法研究”等[8]。一些IT企业近年来也开始研发少数民族语言网络舆情分析软件,例如北京中科点击公司研发的“军犬网络舆情监控系统”[8]、山东鲁网开发的“政府网络舆情监测系统”[9]据称都可以实现藏文、维吾尔文、蒙古文、彝文、朝鲜文等少数民族文字网络舆情的自动采集和分析功能。从已公开的资料来看,少数民族语言网络舆情研究的重大意义已经得到普遍认同,国家相关机构在少数民族语言网络舆情研究领域的投入呈现递增趋势。然而,受制于少数民族语言文字信息技术普及率不高、少数民族语言文字网络信息资源的数量有限、少数民族语言文字信息深度处理所需的语言学基础还不成熟等各类因素的综合影响,目前我国的少数民族语言网络舆情研究整体上还处于起步阶段,研究成果总体数量不多,主题较为分散,还没有形成相对完整的理论体系。其次,对涉及的各类深层次问题关注不够,偏重于单一语种舆情分析系统的技术实现,对于各语种少数民族语言网络舆情分析当中的共性需求关注不多。再次,目前少数民族语言网络舆情分析领域的研究目标过于单一,大多强调从公共安全视角进行的网络舆情监测与控制,从网络问政角度进行网络舆情民意分析的成果相对较少。上述问题的出现是对目前我国民族地区信息化发展现状的直接反映,客观地说具有一定的必然性,需要来自民族学、情报学、传播学、公共管理学、社会学等领域的学者共同探讨,基于对少数民族语言网络舆情管理特殊需求的思考,推动少数民族语言网络舆情管理理论体系的构建和系列重大问题研究的开展,为民族地区网络舆情管理体制的完善提供理论支持。

2 中国少数民族语言网络舆情研究的特征中国少数民族语言网络舆情研究是一项具有高度综合性和复杂性的任务,涉及网站、博客、微博、论坛等多样化的信息来源,网页、图形、图片、视频、音频、文本、数据等多种信息类型,藏语、蒙古语、维吾尔语、哈萨克语、柯尔克孜语、彝语、傣语、朝鲜语等多种少数民族语言文字。由于和民族问题紧密相关,少数民族语言网络舆情研究除了具有国家通用语言网络舆情研究的基本特征之外,还有一些具有自身特色的需求特征,主要体现在以下方面:

2.1 少数民族语言网络舆情研究的政治性少数民族语言网络舆情研究是以少数民族语言文字的广泛应用为前提的,从侧面显示了国家保护少数民族语言文字和少数民族文化的政治立场。目前,我国的《宪法》《国家通用语言文字法》和各少数民族自治地方的语言文字工作条例当中都明确规定:国家尊重和保护少数民族人口使用和发展本民族语言文字的权力。在西藏、新疆、内蒙古等省区,特定语种的少数民族语言文字和国家通用语言文字同为官方语言,使用少数民族文字的法律文书与使用国家通用语言文字的法律文书具有同等效力。从网络问政的角度来看,少数民族语言网络舆情研究又是政府倾听少数民族群众意见和建议的一种方式。从维护社会管理秩序的角度来看,少数民族语言网络舆情监测的目的在于是及时识别不利于民族团结和社会稳定的负面信息并采取措施进行干预和引导,从而主动化解社会危机。因此,少数民族语言网络舆情并不是单纯的网络信息分析问题,它始终与我国多民族国家的政治整合和社会稳定紧密联系在一起。

2.2 少数民族语言网络舆情研究的交叉性网络舆情研究是传播学、情报学、社会学、公共管理学等学科相互交叉形成的新的学科领域。少数民族语言网络舆情在这些学科的基础上,又融合了民族学、语言学的知识,使这一问题变得更加复杂。少数民族语言网络舆情研究当中的大多数难题主要是源于语言学基础支持程度不够。例如,目前舆情分析当中普遍使用的敏感关键词检索和追踪技术,这项技术必须以成熟的自然语言分词技术为基础,否则检索结果的准确度会受到很大影响。网络舆情研究当中的网络信息资源情感倾向分析技术同样必须以典型情感用语词库为基础才可以进行计算和判断。在实践中,要实现语音信息、图像信息等多媒体网络舆情的内容分析时,还必须将多媒体信息转换为文本信息后再信息分析,因而又需要语音识别、图像文字识别等领域专业知识的支持。从民族学角度来看,少数民族语言网络舆情也是少数民族文化的一种表现形式,其形成和传播有其特殊的规律性,例如与国家通用语言网络舆情的共生和关联规律等。总之,少数民族语言网络舆情研究是一个高度交叉性的研究领域,需要对多个学科的专业知识进行综合集成。

2.3 少数民族语言网络舆情研究的跨境性中国56个民族中,有28个民族的语言是跨境的,如蒙古、藏、维吾尔、朝鲜、哈萨克、苗、瑶、壮、傣、哈尼、景颇、怒、独龙、佤、京等民族的语言[10]。这些跨境语言是在长期历史演进过程中形成的,目前正在被我国特定地区的少数民族人口和境外其他国家相同民族人口所共同使用,例如蒙古语是我国内蒙古自治区的蒙古族人口与境外的蒙古国共同使用,朝鲜语是我国的延边朝鲜族自治州的朝鲜族人口与境外的朝鲜、韩国共同使用,哈萨克语是我国新疆自治区的哈萨克族人口与境外的哈萨克斯坦国共同使用。这些跨境语言的存在,在一定程度上会对少数民族人口的国家认同产生影响,因而互联网发展之初,一直就是我国政府与境外相关国家争夺文化自主权,保卫边疆民族地区文化安全的重要阵地。此外,境外一些敌对势利也企图利用互联网的跨时空传播特性,专门在互联网上建立少数民族网站,制造和传播对民族团结和国家稳定有害的言论。因此,少数民族语言网络舆情研究除了分析我国少数民族人口所形成的网络信息资源之外,也要关注境外相关国家和社会组织所建立的特定语种的网络信息资源。

2.4 少数民族语言网络舆情研究的超前性由于少数民族语言网络信息资源整体数量较少,目前各民族地区进行少数民族语言网络舆情监测主要还是依赖人工方式,而一些开通博客、微博等服务功能的少数民族语言网站则按照“先审核、再发布”模式进行信息发布[2]。例如,人民网的舆情监测室所提供蒙古、藏、维吾尔、哈萨克、朝鲜等少数民族语言舆情报告全部是采用人工分析方式完成的。以人工方式进行网络舆情管理具有简单易行的优势,但是由于人认知能力的局限性,往往更注重表层信息的理解,对于各类数据之间的深层次关联关系很难把握,不容易发现舆情信息背后所隐含的规律性,对于处在酝酿期的网络舆情危机事件往往难以识别。此外,人工方式费时费力,工作效果受到分析人员状态的影响而呈现出波动性特征,目前之所以没有自动分析系统的辅助,主要还是相关领域技术和方法的还不够成熟,无法满足网络舆情分析的精确度要求。未来随着少数民族语言网络信息资源数量的持续增加,这种模式肯定会难以为继。从推进民族地区民主管理和社会稳定的长远需求来看,尽管现阶段我国少数民族语言网络舆情信息数量不多,进行少数民族语言网络舆情领域的理论研究,开发具有智能分析功能的舆情监测系统,探索人工与自动相结合的少数民族语言网络舆情分析模式,对维护民族地区社会的繁荣和稳定具有非常重要的现实意义。总之,少数民族语言网络舆情研究要以民族学、语言学知识为支撑,通过人工分析与自动分析相结合的方式,实现传播学、情报学、社会学、公共管理学等多个学科知识的集成与融合,共同服务于少数民族文化保护、民族地区民意获取、边疆地区公共安全保障等国家大局。

3 中国少数民族语言网络舆情研究的展望少数民族语言网络舆情研究必须以少数民族语言网络信息资源为基础,其发展必然受到少数民族语言信息处理技术的发展水平和普及程度的制约。目前,藏语、蒙古语、维吾尔语等影响较大的几种少数民族语言文字的文本编辑排版和网页制作技术已经成熟,在互联网上使用少数民族语言文字的人口数量正在持续增长。以藏语信息技术为例,网络的普及正在改变藏族民众的生活方式,据报道,一些藏传佛教寺庙里的佛学院也为修行的学僧开设了计算机课程,学习打字、排版和网页设计等内容,并将推出自己的网站[2]。可以预见,未来从事少数民族语言网络舆情研究者也会随之增多,除了中央民族大学和西北民族大学之外,越来越多的学者和研究机构会开始关注这一领域。伴随着这一趋势,研究内容也会随之出现变化,主要体现在:第一,少数民族语言网络舆情研究所关注的语种由藏语和维吾尔语扩展到多个语种的少数民族语言,例如朝鲜语、彝语、傣语等语种网络舆情的分析方法也会受到关注;第二,少数民族语言网络舆情研究的深度会继续增加,由目前基于维护社会稳定的单一目的向着网络问政、危机预警、社会治理等综合型目标体系转型;第三,少数民族语言网络舆情分析的方法由目前的人工定性分析为主,向着基于网络舆情自动分析系统加人工辅助判断的复合型分析模式转型;第四,从事少数民族语言网络舆情研究人员的学科背景将会更加多元化,从传播学、社会学、公共管理学等角度研究少数民族语言网络舆情的研究成果会不断增多。在少数民族语言网络舆情研究持续推进的同时,以下3个重要的研究方向值得特别关注:

3.1 基于本体的少数民族语言网络舆情语义分析技术 目前的少数民族网络舆情自动分析主要依赖基于关键词检索的话题发现和跟踪技术,进行文本的简单比对和匹配,不能结合上下文语境和用户需求进行智能检索。按照语义网(Semantic Web)的发展趋势,未来的网络信息资源将会根据领域知识本体(Ontology)模型进行语义标注,检索时可以结合本体进行逻辑推理,从而增加检索的查全率和查准率,更好地满足少数民族语言网络舆情分析的深层次需求。少数民族语言网络舆情语义分析的关键是构建各语种的知识本体词网模型,这是一项非常复杂和艰巨的任务,必须在参考WorldNet,How Net等通用词网的基础上,结合对各语种叙词逻辑关系的分析,建立各语种叙词本体词网模型,作为语义标注和智能检索的参照体系。

3.2 少数民族语言网络舆情信息情感倾向自动分析技术 目前基于关键词的网络舆情分析技术还无法处理不包括敏感词但是内容却具有一定社会危害的网络信息。少数民族语言网络舆情的深度分析,必须在敏感词检索的基础上,通过倾向性分析可以明确网络传播者所蕴含的感情、态度、观点、立场、意图等信息,从而提高网络舆情分析的准确性。少数民族语言网络信息情感倾向分析是具有挑战性的研究任务,需要建立对应语种的情感倾向词语料库,通过比对和计算对网络信息资源的情感倾向做出判断。

3.3 以国家通用语言为中介的多语种少数民族语言网络舆情分析技术 民族信息学(Minzu Informatics)是研究信息化背景下多民族语言信息共享规律的科学领域[11]。按照民族信息学观点,为了便于实现多民族语言信息资源共享,少数民族语言网络信息资源在发布时应当遵循“双语原则”,也就是同时提交少数民族语言和国家通用语言文字两者版本。该信息在网络当中显示可以根据需要进行双语对照显示或者隐藏国家通用语言文字版本,将其作为语义元数据进行嵌入式保存。按照民族信息学原则进行网络信息资源发布后,少数民族语言网络舆情分析可以借助发展较为成熟的国家通用语言文字网络舆情分析技术进行,而且可以非常方便地进行不同语种舆情信息之间的比较研究。当然,这种方法以高质量的少数民族语言网络舆情信息为基础,必须以严格的管理制度为保障。

4 研究总结中国少数民族语言网络舆情研究是随着民族地区信息化建设的推进而受到关注的重要研究领域,与政治问题紧密联系,需要综合多学科的专业知识对境内外使用我国少数民族语言文字产生的网络信息进行监测和分析,满足民意分析、危机预警、公共治理等多方面的社会需求。目前,我国少数民族语言网络信息资源数量整体不多,少数民族语言网络舆情分析还处在起步阶段,未来需要结合民族地区社会发展进一步完善,建立少数民族语言网络舆情分析的基础理论和方法体系,并争取在语义分析、情感分析、多语种分析等研究方向取得突破。

参考文献

[1]刘毅.网络舆情研究概论[M].天津:天津社会科学院出版社,2003.5.

[2]李光,钟雅琼.大陆研拟藏维文网络舆情监测系统,监控分裂风险[N].凤凰周刊,2012-06-25.

[3]江涛,于宏志,李刚.基于藏文网页的网络舆情监控系统研究[C].上海:全国第23届计算机安全学术交流会论文集,2008.10.

[4]邓竞伟,邓凯英,李永生,等.基于藏文网络的舆情传播模型[J].计算机系统应用,2013,(3):209-211.

[5]阿布都瓦依提·尼亚孜.浅析维吾尔文网站网络舆情的引导和控制[J].新闻世界,2010,(7):204-205.

[6]卢修配,齐向伟,艾斯卡尔.维吾尔文网络舆情研究现状及几个关键问题[J].新疆师范大学学报:自然科学版,2012,(2):86-88.

[7]王嘉梅,张建营,赵继勇.云南跨境多民族语言复杂网络舆情内容分析[J].信息与电脑:理论版,2013,(6).

[8]中科点击,军犬网络舆情监控系统实现多民族语言监控功能[EB/OL].http:∥www.54zk.com/contents/152/1988.html,2013-10-05.

[9]鲁网舆情频道,鲁网政府网络舆情监测系统——少数民族语言网络舆情监测[EB/OL].http:∥service.sdnews.com.cn/yuqing/#3dtx,2013-10-05.

[10]戴庆厦.跨境语言研究[M].北京:中央民族学院出版社,1993.12.

[11]赵生辉.民族信息学的学科定位与理论体系初探[J].图书情报工作,2012,(5):56-61.

(本文责任编辑:马 卓)

作者:赵生辉

少数民族语言网络舆情论文 篇2:

以社会主义核心价值观引领新疆网络舆情工作

摘 要: 互联网的普及运用,使得网络舆情高发,网络舆情对社会主义意识形态产生重要影响。在新疆特殊地缘政治环境中,网络舆论对于各民族价值观的影响的作用越来越大,能否实现网络舆情的有效引领,关系到党的执政地位和新疆的长治久安。用社会主义核心价值观引领网络舆情、净化网络舆情空间、形成良性舆情机制至关重要。

关键词: 社会主义核心价值观;新疆;网络舆情;媒体生态;舆情场

一、新形势下做好新疆网络舆情工作的重要性

随着移动互联网和智能移动终端的发展和普及,网上信息源头和传播渠道急剧增多,网络舆论规模与影响越来越大,互联网日益成为各种社会思潮、各种利益诉求汇聚的平台。据2015年2月3日CNNIC的《第35次中国互联网络发展统计报告》显示,截至2014年12月底,中国移动互联网网民达到6.86亿人,手机网民为5.57亿人。伴随着移动互联网的全球普及运用,党的舆论工作呈现新的特点、面临新的形势。2013年8月19日,习近平总书记在全国思想宣传工作会议上发表重要讲话:“把网上舆论工作作为思想宣传工作的重中之重来抓。全面提升网上舆论工作水平,牢牢掌握网上舆论工作的领导权、管理权、话语权,进一步巩固马克思主义在意识形态领域的指导地位。”[1]由于新疆特殊的地理位置和多文化、多民族、多宗教及复杂的国际势力的干扰等多重因素的影响使得舆情工作变得异常复杂和困难。2014年,自治区宣传部长李学军同志谈及反分裂斗争时指出,新疆的意识形态工作要前移关口,做好重点网络的审读、审看、审听。[2]当前,新疆的舆论环境异常复杂,互联网已经成为新疆意识形态分裂与反分裂斗争的最前沿,成为舆论斗争的前沿阵地。

二、新疆网上舆论的影响因素分析

新疆网络舆情除了具有网络舆情共有的开放性、互动性、快捷性等特点之外,还具有新疆作为边疆民族地区特点的民族性、敏感性和跨境性特征。

第一,意识形态影响因素。长期以来,美国等西方反华势力一直不遗余力地对我国意识形态领域进行渗透,他们通过“新疆问题”来歪曲、诋毁社会主义制度,对中国展开“西化”“分化”的活动,与我国争夺舆论主动权。他们手段多样,通过培养“网络写手”,在互联网上发表大量有害信息,重点针对涉及民族、宗教的相关政策反复炒作,扰乱人们的思想;在新疆周边设立百家网站和电台,采用维吾尔、阿、英、德、日等多种语言发布歪曲报道和不实言论;利用语音聊天室、QQ群、微信等新型社交媒体工具进行渗透,影响舆情;西方的社交网站——Facebook、Youtube、Twitter等网站成为美国政府灌输其价值观的工具。Facebook、Youtube、Twitter等网站传播反动思想,积极进行思想渗透,推行“从思想上打入新疆”的计划。针对这些境外网络舆情,我们的舆情管理部门通常只能及时监测和研判,但不能进行有效管理和控制。虽然我们建立有国家防火墙,但境外用户通常利用技术漏洞互相进出,传播敏感舆情。

第二,文化因素。新疆是一个多民族、多宗教和多元文化并存的地区,不同民族在历史发展中由于不同的思维方式、文化背景和宗教信仰,使得不同民族在语言文字、风俗习惯、心理认同等方面存在差异。新疆多元文化的存在给网络舆情增添了诸多不确定的因素。

第三,网络舆情传播的民族因素。新疆是个多民族地区,在网络舆情传播中,民族之间的文化差异、利益纠纷是网络舆情产生、发展和演变的内在驱动因素,因此,要重视民族特性对网络舆情的影响。加之新疆有9个跨境民族,大部分分布在中亚、西亚和南亚地区,这些民族与境外同一民族政治、经济、文化、宗教信仰等领域交往频繁,近年来,中亚国家提出的“民族回归历史故乡”的口号,相继召开了会议,号召境外的人回国,并为回国者提供优惠政策。跨境民族网络信息是影响新疆安全稳定的重要因素。

三、新疆舆情工作中需要重视的几个问题

(一)新疆舆情生态更加复杂,媒体生态改变和形成复杂的舆情格局

网络媒体的快速发展改变了我国的媒体生态和舆论格局。这一点,新疆和全国具有同步性。

1.传统媒体对舆论引导的作用被削弱。随着传播技术的发展,网络和手机这些新兴媒介的普及和对大众日常生活的深度介入,改变了长期以来所形成的媒介格局。在大数据时代来临后,4G时代已经到来,刷微博、摇微信已经成为很多人的日常行为,媒介格局的这种变化使得传统媒介对舆论的引导作用被分化和削弱。

2.移动舆情场初步形成。目前,新疆移动互联网用户已经超过1 000万。新疆移动于2013年全面启动4G网络建设, 2014年上半年,新疆移动建成4G基站5 000个,覆盖全区16个中心城市、部分县城及团场,同步开通4G业务;2014年底,建成1.2万个4G基站,覆盖所有县市、团场、5A级景区和重点乡镇,并加快向农牧区、连队等区域覆盖。以微博、微信、新闻客户端等为代表,移动互联网在一些突发事件和公众议题上成为信息源,移动舆论场已经初步形成。

3.官方舆情场和民间舆情场重心的转移。随着互联网手机新媒体的普遍使用,民间舆情声势浩大。自互联网发展至今,社交工具的多样化以及传播网络的复杂关联化,推动了民间舆论场的快速发展。有了微博、微信、论坛等公众平台的承载,民间舆论场的话语权正在渐渐赶超官方舆论场,甚至某些特殊事件可以倒逼官方舆论场的舆论生态。用人民网舆情监测室的话说:“依托于口口相传特别是互联网的‘民间舆论场’,人们在微博、BBS、QQ、博客上议论时事,针砭社会,品评政府的公共管理,互联网改写了‘舆论引导新格局’。”[4]

4.国际舆论中“西强我弱”舆论格局没有改变。新疆与8个国家接壤,目前全球化语境下新一轮极端主义思潮严重冲击着中亚、西亚地区的安全,国际舆论一致把“新疆问题”作为遏制中国发展的强大突破口。清华大学国际传播研究中心经研究得出结论:西方三大通讯社、五大电视网等西方主流媒体通过对国际问题设置议程和舆论宣传,控制着国际舆论的主导权,“西强我弱”的国际舆论格局没有根本改变。[3]西方媒体强大的舆情场对“新疆问题”的报道,一致带有价值观念的偏见。

(二)从信息技术角度而言,移动互联网与大数据使得网络舆情工作面临巨大挑战

近年来,随着中国信息技术的不断发展,3G网络覆盖着新疆越来越多的人群,同时,得益于智能手机、平板电脑等移动设备的快速普及,移动互联网正高速渗透到中国社会人群之中。2013年12月10日,新疆移动举行网络开通仪式,标志着新疆正式进入4G时代,在南疆,更多的少数民族青少年使用电脑、手机。移动互联网与社交网络的兴起将“大数据”带入新的征程。一方面,移动互联网的崛起极大地充实了用户的数据源,互联网庞大的用户“行为痕迹”使得通过对这些大数据资源的挖掘精细处理成为可能。另一方面,在移动互联网背景下大量的用户生成内容、文本、视频、音频、图片等非结构化的数据,有效地丰富了大数据的类型,海量信息的爆炸也增加了数据处理的难度。目前,移动互联网成为网络舆情的新信源,微信、新闻客户端等移动端的传播模式兴起,对传统的舆情监测方式带来了新的挑战;舆情传播的不确定性使舆情监测陷入盲区;海量信息使舆情“大数据”分析难度加大;传播空间的封闭性使舆论引导工作难度加大。

(三)各类宗教网站的舆情监测和引导

近几年,新疆的宗教群体也逐渐利用网络媒体的跨时空、快速、隐蔽的特点进行网络宗教活动。调研显示,网络空间中有关宗教的内容逐渐增多,成为少数民族青年获取宗教知识的主要平台。据《宗教与世界》杂志提供的一个材料,具有浓厚宗教色彩的中文网站大约就有1 040个,多数为天主教、基督教,还有一些伊斯兰教网站等,其中一些网站已经成为境外势力利用宗教对我国进行渗透的重要渠道之一。[5]361个人电脑、手机数字化终端具有的文字、图像、音频、视频等多种功能为宗教的宣传提供了便利的同时,也被一些宗教极端分子或境外分裂势力所利用。以电子邮件、QQ等传播宗教资料的活动日益频繁,这些网络宗教传播往往采用隐秘的语言、符号。由于技术、资金、人才等方面的限制,有些内容很难被破译。此外,一些境外敌对势力还自设了一些非法网站进行“传教”,对信教群众进行反政府煽动。

(四)新疆的少数民族语言网络舆情

第一,新疆少数民族语言网络舆情的跨境性。在新疆居住着哈萨克、俄罗斯、柯尔克孜、乌孜别克、塔吉克等跨境民族,其中维吾尔、哈萨克、蒙古、俄罗斯等民族的语言是跨境的。跨境语言指的是分布在不同国境中的同一语言,这些跨境语言是在长期的历史过程中形成的。从新疆近几年意识形态领域的事态来看,这些跨境语言在一定程度上对少数民族民众的国家认同产生了一定影响,是我国与境外媒体争夺舆论阵地、争夺文化主权的重要方式,也是保卫新疆地区文化安全的重要阵地。由于少数民族语言网络舆情的研究是一项具有高度复杂性的任务,涉及网站、博客、微博、论坛等多样化的信息类型和藏、维吾尔、蒙古、哈萨克、柯尔克孜等多种少数民族语言文字。同时,利用互联网传播宗教极端思想、破坏民族团结和社会稳定的活动猖獗。据统计,新疆周边的反动网站达到50多个,分裂势力还专门在境外建立少数民族网站,大肆传播有损于新疆民族团结和社会稳定的有害信息,毒害少数民族民众的思想。因此,新疆少数民族语言网络舆情的研究除了分析新疆本土少数民族人口所形成的网络信息资源外,还要关注国外周边国家的网络信息资源,努力实现网络资源共享。做好新疆少数民族语言网络舆情的工作对于当前新疆的发展至关重要。

第二,少数民族语言网络舆情的交叉性。少数民族网络舆情是少数民族文化的一种外在表现形式。少数民族网络舆情研究涉及多种学科,包括新闻传播学、语言学、社会学、公共管理学;除此之外,还包括民族学、宗教学、政治学、法学,这种交叉性使得少数民族语言网络舆情工作变得异常艰巨和复杂。

第三,少数民族语言网络舆情的政治性。由于新疆一直处于意识形态领域分裂与反分裂斗争的前沿,意识形态工作的好坏事关新疆文化安全和国家稳定,少数民族语言网络舆情工作始终和新疆的政治稳定联系在一起。当前,互联网技术的发展使得“网络问政”成为执政者了解老百姓思想和意见的最便捷和最主流的执政和管理方式。在新疆,网络舆情也成为各级政府了解各民族群众生产、生活和思想动态的最重要的窗口。对于新疆而言,稳定压倒一切,对少数民族语言网络舆情进行监测,可以甄别不利于民族团结的言论和宗教极端思想,从而有效化解网络舆情危机,避免各类突发事件、群体性事件在现实社会中的发生,维护新疆稳定的大局。

(五)“两个舆情场”力量的博弈

“两个舆情场”指的是境外舆情场与境内舆情场。由于意识形态价值观的差异,境外舆情场传播境内舆情时带有偏见,境外舆情场对于新疆舆情场带有攻击性和仇视性,其言论主要利用新疆境内发生的突发事件,煽风点火,进行攻击和抹黑,煽动民族仇恨。在西方舆情场对新疆的报道中,往往缺乏客观公正,带有偏见性。他们采用的方式主要有:一是片面夸大、遗漏、拼接、选择性报道方式。新疆境内一个事件的发生容易被不良用心的西方媒体夸大成一个重大事件,选择性地遗漏掉一些重要信息,扰乱境内舆情,扰乱人们对一个事件的理性判断。二是拼接或移花接木的报道方式。“7·5”事件以后,欧美的《纽约时报》《法新社》等西方媒体都口径一致地将事件描述成民族冲突,故意挑起民族矛盾。西方媒体在选择素材方面刻意使用假照片,通过拼接的方式把本来是毫无关系的照片掐头去尾地拼在一起。例如,法新社报道出的“维族妇女单枪匹马面对武警”的一张照片;2013年,乌鲁木齐23中学生带花帽上课被罚事件也是境外分裂分子拼接的假照片,其目的就是挑起民族矛盾,扰乱新疆境内舆情。因此如何在境外舆论场的打压下沟通联合民间舆论场,并且能够真正压制境外舆论场,在国际上发出符合我国利益的声音,是我们的舆情工作中一项任重道远的工程。

(六)新疆突发事件、群体性事件的舆情引导

近几年,新疆各地州突发事件呈现增长的态势,显示出境内外“三股势力”对新疆的分裂活动日趋严峻的形势。在突发事件、群体性事件发生后,最关键的是有效及时地进行舆情引导,以消除民众的怀疑和恐慌情绪。在舆情引导上,要先发制人,抢占先机,坚持“黄金40分钟”地原则。面对明显偏离理性轨道的网络热点要敢于发声,避免失语,更不能失控,确保公众对危机的知情权。

(七)社会转型期诸多网络舆情热点事件的处理

在我国改革进入深水期的关键时刻,多种事件频发,例如交通事故、矿难事故、官员贪污腐败、食品安全、教育公平、房价问题、医疗改革、土地拆迁、收入差距等等,这些问题都与老百姓的切身利益相关,也是百姓茶余饭后议论最热点的问题,这些事件的发生都会第一时间在互联网空间迅速传播。如何有效引导网络舆情,这无疑是对党的执政能力的巨大考验。有效增强党和政府的网络执政能力、积极有效地引导舆情,这是摆在新疆各级政府面前一个重要课题。

四、用社会主义核心价值观引导网络舆情工作的措施

多民族地区舆论结构复杂,面对主流媒体和新媒体并存,社会舆论多元、多变的局面,必须不断提高舆论引导能力,如何用社会主义核心价值体系引领舆情、增强文化认同、弥合文化冲突、尽量挤压不良舆论的生存空间,是做好新疆网络舆情工作的关键所在。用社会主义核心价值体系引导网络舆情、净化网络舆情空间,是新疆当前一项非常紧迫的任务。

(一)掌握网络空间意识形态的话语权。网络意识形态的话语权指的是网络空间控制舆论的权力。掌握了话语权就掌握了社会舆论的导向。建立一支网络传播志愿者队伍,包括少数民族文化精英,正确引导社会思潮,使互联网成为传播社会主义核心价值观、拓展社会主义核心价值体系影响力的新平台。当前,网络舆情的蓬勃兴起为社会主义的导向功能提供了新的政治生态。事实证明,多起网络舆情事件的发生客观上起到了推动政府解决问题的作用,成为监督政府作为的一个利器。同时,网络舆情的无秩序性和各民族网民参与政治的盲目性更加凸显了社会主义核心价值体系舆论导向作用的重要性。此外,为牢牢把握党在意识形态领域的话语权,要增强党员领导干部善用新型媒体的能力。增强政府网络舆情引导的能力,具体的做法就是善用政务微博,熟练掌握网络问政的本领。

(二)营造网上正面舆论的强大舆情场,重视网上舆论的引导。互联网新媒体已经不仅仅是一种技术、一种手段,它更重要的是一种文化。社会主义核心价值观发挥着引领社会思潮的重要作用。牢牢把握正确的宣传方向,营造正面舆论的强大舆情场,立足于新疆多民族、多宗教的区情,以社会主义核心价值体系建设为核心,以新疆发展的历史为突破口,以民族团结教育为纽带,解答人民群众期待的问题。建立舆情场,设置议题,主动宣传国际社会普遍关注的多民族地区的事务或者突发事件、群体性事件,及时准确地传递事实的真相,和境外反动舆情场展开国际舆论斗争,最大限度地挤压负面言论生存的空间。

(三)发挥新疆各类媒体传播社会主义核心价值观的主渠道作用。把社会主义核心价值观贯穿于主体宣传、热点引导和舆论监督中。建立社会主义核心价值观网上传播阵地,推动社会主义核心价值观占领网上舆论阵地。鼓励和引导新疆区域内文化企业创造更多的网络文化产品和文艺产品,充分运用微博、微信、微视频等形式,扩大社会主义核心价值观网上的宣传面和覆盖面,开展形式多样的网络文化活动,鼓励网民积极健康的网络行为。积极回应网民关切的话题,有效进行舆论引导。 天山网“最后一公里” 微信公众平台于2014年3月开通,内容包括新闻资讯、驻村日记、驻村秘笈、驻村集锦、驻村感怀、微故事、惠农政策、跟我学“双语”、你不知道的新疆等十余个栏目。所有文字、图片均来自下基层干部在微信平台上的投稿,生动、活泼、真实、感人,贴近百姓、反映实际,接地气、有生气,它正在发挥着凝聚各族群众向心力的纽带作用,无疑也成为传递网上正能量的一种有效方式。

(四)在网络媒体的信息传播内容上,追求社会公平正义、弘扬“依法治疆”观念。倡导积极健康的生活方式,使之成为新疆各族群众的价值认同;通过新疆塑造典型和舆论批评,引导人们形成正确的是非观念和理性判断,引导人们的价值选择,有效抵御境外反动舆情场有害信息的侵袭。

(五)抓好少数民族网站和少数民族文化的网络传播。首先,加大“民语”网站的建设力度,建设导向正确、内容丰富精彩、更新及时的“民语”网站,让合法、主流、健康的内容占据网络空间,最大限度地挤压非法、有害内容的存在空间 ,不给宗教极端思想和谣言传播以可乘之机。目前,“维吾尔语网站数量虽多,也多为综合类的,但内容单调、雷同,很难满足广大网民的精神、娱乐层面的需求,在一定程度上给了宗教极端思想传播的空间。”[6]应以“天山网”为依托,加大维吾尔、哈萨克等少数民族语种的网站建设,努力满足少数民族群众学习、娱乐的需求。 大力创办具有权威性、可靠性和影响力的民族文化网站。其次,把“新疆网络文化节”作为展示新疆经济社会发展成就、积极引导舆情的重要方式。再次,抓好国家重点出版项目和少数民族出版物工作,充分挖掘民族文化遗产和文化资源,规划、创作一批体现社会主义核心价值观要求、为群众喜闻乐见的文化作品,积极占领网络空间。使互联网、手机新媒体成为弘扬新疆少数民族节日和民族传统文化的重要平台。

参考文献:

[1]全国宣传思想工作会议在京召开[EB/OL].http://www.wenming.cn,2013-08-20.

[2]李学军:牢牢掌握意识形态工作主导权[EB/OL].http://news.ts.cn/content/2014-02/18/content_9321161.html,2014-02-18.

[3]人民网评:打通“两个舆论场”——善待网民和网络舆论[EB/OL].http://opinion.people.com.cn/GB/15119932.html,2011-07-11.

[4]褚亚玲.新媒体时代舆论格局下的少数民族地区传播策略[EB/OL].http://xwlt.northnews.cn/NewsTribune/ShowArticle.asp?ArticleID=1200,2013-09-01.

[5]龚学增.宗教问题概论[M].北京:人民出版社,2011.

[6]新疆公安机关:遏制宗教极端思想在网上传播蔓延[EB/OL].http://www.szhk.com,2013-10-8.

作者:王秀丽

少数民族语言网络舆情论文 篇3:

基于LDA的中国少数民族网络舆情监测系统的探究①

摘 要:随着民族地区信息化建设的不断推进,中国少数民族语言网络舆情研究也逐渐引起了大家的关注,文本分类和情感分析模块是舆情系统的重要组成部分。传统的文本分类方法主要通过统计字面上的词语重复次数,而对于文字背后的语义关联考虑甚少。该文重点介绍了一种基于LDA模型在少数民族语言(以彝文为例)网络舆情信息情感分析方面的应用,对文字隐含的主题进行建模,通过挖掘少数民族网页上的舆情信息所蕴含的主题,以及对这些主题进行情感分析,在事件全面爆发之前,采取应急措施。

关键词:主题模型 网络舆情系统 情感分析

LDA inquiry-based Chinese minority network public opinion monitoring system

GONG Pan WANG Jiamei YANG Xiaowei

(Yunnan Minzu University, Electrical and Information Engineering, Kunming,Yunnan,650500,China)

目前,支持少数民族语言文字的计算机软件的应用范围逐渐扩大,越来越多的少数民族人口开始接触、熟悉网络,使得互联网迅速成为我国少数民族地区人口表达自身意愿、共享民族文化、彼此交流信息的重要媒介。采用科学的理论方法,进行中国少数民族语言网络舆情信息的分析和研究,不仅是政府在现如今的大数据时代下实现科学、民主决策的基本需要,更是保证少数民族地区稳定、繁荣的重要条件。目前,云南境内影响力较大的少数民族官方网站比较少,信息及舆论导向能力相对比较薄弱。有些网站论坛甚至转载境外不实信息,加以报道,在一定范围内造成了极为恶劣的影响。民族语言新闻信息,特别是时政类信息的传播对国家安全存在极大的隐患。因此,做好网络舆情信息研究工作、正确领导社会舆论、加强网上舆论斗争是防止势力渗透,建设稳定、团结、和谐社会的迫切需要。

传统判断两个文本相似性的方法主要是通过统计的方法,查看这两个文本中共同出现的词语数,如TF-IDF等,但是这种方法并没有考虑到文字背后可能存在的语义关联,两个文本当中,共同出现的词语或许很少甚至没有,但这两个文本却是相似的。所以在进行文本相关性判断的时候,需要考虑到文本的语义,而主题模型则是语义挖掘的利器,LDA就是其中比较有效的一种模型。

以LDA(Latent Dirichlet Allocation)模型[1]为代表的主题模型是近年来文本挖掘领域的一个热门研究方向。该模型具有优秀的降维能力以及良好的扩展性,并且能够针对复杂系统进行建模。利用主题建模挖掘出的主题能够帮助人们进一步理解海量文本所隐藏的语义,从而完成文本分类、话题检测和关联判断等多方面的文本挖掘任务。彝文在少数民族语言当中具有典型性和代表性,该文以云南跨境民族语言—彝文为例,将LDA模型应用于彝文网络舆情信息情感分析系统当中,对于潜在的语义进行探索。

1 LDA模型研究

1.1 概率主題模型的提出

主题模型(Topic Modeling)成为近年来文本挖掘领域的热点之一,它能够发现文本与词语之间的潜在语义关系(即主题)——通过将文本看成是一组主题的混合分布,而主题又是词语的概率分布,从而将高维度的向量空间映射到低维度的空间。即“文本-词语”映射为“文本-主题”和“主题-词语”,从而有效地提高了文本信息处理的性能。

现在,计算机还不具备人脑的结构,对于自然语言的理解仍然存在一定的困难,所以需将无结构的自然语言文本转化为可以供计算机进行识别的特征文本。向量空间模型(VSM)是20世纪60年代提出的一种文本表示模型,它将文档表示成特征元素的集合,来表示自然语言,但其没有体现词语在文档中出现的频率,之后,基于词频统计的TF方法被提出。20世纪80年代,研究人员在TF的基础上进行改进,又提出TF-IDF(词频-逆文档频率)技术,该技术思想简单,容易理解,被广泛应用。但是,该技术无法捕捉文本内部与文本间的统计特征,并且不能解决同义词/多义词的问题,因此精确度不是很高。

于1990年,Deerwester等人提出潜在语义分析LSA(Latent Semantic Analysis)模型,用于挖掘文本与词语之间所隐含的潜在语义关联[2]。其理论基础是数学中的奇异值矩阵分解(SVD)技术。其优点在于,它能够对词-文档之间的关联关系进行降维,进而减少了存储规模,但是在计算时,迭代次数非常多,复杂度呈三次方急剧增长。

鉴于LSA存在的一些缺点,Hofmann等人于1999年提出了一种基于概率的潜在语义分析PLSA(Probabilistic Latent Semantic Analysis)模型。该模型通过引入概率统计的思想,避免了SVD的大量复杂度。但是随着文本和词的个数的增加,模型变得越来越庞大;EM算法需要进行反复迭代,因此计算量也很大。于是,Blei等人于2003年提出一种新的主题模型LDA(Latent Dirichlet Allocation),它是一个层次贝叶斯模型,将模型的参数也看作是随机变量,从而引入控制参数的参数,实现彻底的“概率化”。

1.2 相关工作

中国少数民族语言文字分类很多,彝文就是其中的一种,由于计算机目前还无法理解自然语言,所以需将无结构的自然语言文本转化为可供计算机识别的特征文本。而语料库是存储于计算机中,并可利用计算机进行智能分析的语言素材的总体,是语言文字信息处理工作的基础。因此,建设大型的彝文基础语料库,不仅为彝语语言文字规范和标准的制定提供可靠的数据,也为之后进行的文本分类和情感分析工作奠定了基础。在参考了汉语的既有分类语料库的基础上,结合已有的彝文语料,该文把彝文文本分类语料库分为七类,分别为色情、军事、化学医疗、信息科技、政治、宗教民俗。图1是其中的一部分。

1.3 模型建立

1.3.1 LDA模型

潜在狄里克雷分布(简称LDA)是文本生成模型中的一种,其基本思想是文本是由潜变量确定的主题随机混合而成的,而这些主题又可以表示为词语的分布。

给定一个文档集合,LDA将每个文档表示为一个主题集合,每个主题是一个多项式分布,用来捕获词之间的相关信息。如图2所示,包含词、主题和文档三层结构。其中θ是一个主题向量,向量的每一列表示每个主题在文档出现的概率,该向量为非负归一化向量;N表示要生成的文档的词语的个数,W表示生成的词语W。z表示所选择的主题,最外层的α和β是语料层次的参数,方框表示反复进行的过程,箭头表示采样工作,从图中可以看出,只需要采样一次就能够产生整个语料。

1.3.2 LDA生成文档

LDA方法使生成的文档可以包含多个主题,该模型需要首先选定一个主题向量θ,从而确定每个主题被选择的概率p(θ)。然后在生成每个词语的时候,从主题分布向量θ中选择一个主题z,表示给定θ时,主题z的概率分布,具体为θ的值。按主题z的单词概率分布再生成一个词语W,p(W|z)表示给定z时W的分布,可以看成一个k×v的矩阵,k为主题的个数,v为词语的个数,每行表示这个主题对应的单词的概率分布,即主题z所包含的各个词的概率,通过这个概率分布,按一定的概率生成每个词语。其图模型如图3所示。

通过对LDA生成模型的讨论,可以知道LDA模型主要是通过给定的输入彝文语料库中学习训练两个控制参数和β,确定了这两个控制参数就确定了模型,便可以用来生成文本。其中和β分别对应以下信息:

α:主题概率p(θ)需要一个向量参数,即Dirichlet分布参数,从而生成一个主题θ向量;

β:各个主题对应的词语概率分布矩阵p(W|z)。

从上图可知LDA的联合概率为:

(1)

1.3.3 参数估计

对文本的建模主要就是计算α和β两个参数。可以采用极大似然估计,找出一对α和β,使得似然函数值达到最大。可通过EM算法学习出α和β,在求解过程中,遇到后验概率p(θ,z|w)无法直接求解,需要找到一个似然函数下界来近似求解,每次E-step输入α和β,再计算似然函数,经过M-step使这个似然函数达到最大化,算出和β,不断迭代,直到其收敛。

2 主题模型在彝文文本情感分析中的应用

文本情感分析,又称意见挖掘(Opinion Mining),指对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程;属于计算语言学的范畴,涉及到机器学习[3]、数据挖掘、自然语言处理等多个研究领域。与客观性文本不同的是,主观色彩浓厚的信息往往蕴含着大众舆论对问题的看法,对政府部门具有十分重要的参考价值,例如:政府各部门需要全面掌握大众对其所管辖区域的新闻事件的思想动态,如果采用人工方式来收集和分析这些海量信息,显然成本高、效率低并且困难,通过利用计算机将非结构化的文本进行分类[4]和提取的文本情感分析技术(Text Sentiment Analysis)应運而生。通过挖掘网页所蕴含的主题,以及分析这些主题的情感偏好,来提高文本情感分析的性能。

从技术实现的角度,LDA及其扩展模型可以直接应用于用户评论文本挖掘中。基于此,有些研究人员提出从“词语-句子-段落-文档”角度进行多粒度划分的方法。从系统设计的角度,基于主题模型的文本情感分析系统主要包括以下部分:信息采集与预处理(如网页爬取、去噪处理、彝文分词、停用词处理等)、主题抽取、情感词抽取(彝文电子词典已经建立)、主题的情感分类或评分、主题情感摘要生成(方便用户直接了解主题)、系统评测等。

3 结语

尽管现阶段我国少数民族语言网络舆情研究系统并不多,但是从推进少数民族地区的民主管理和社会稳定的长远需求来看,进行少数民族语言网络舆情领域的理论研究,开发能够进行智能分析的网络舆情监测系统,对维护国家民族地区社会的繁荣和稳定具有非常重要的现实意义。该文将LDA主题模型应用到少数民族语言网络舆情信息情感分析当中,来对网络舆情信息进行深入分析,对政府部门做出贡献。

参考文献

[1] 翁伟,王厚峰.基于LDA的关键词抽取方法[C]//第五届全国青年计算语言学研讨会论文集,2010.

[2] 周博,岑荣伟,刘奕群,等.一种基于文档相似度的检索结果重排序方法[J].中文信息学报,2010,24(3):1849-1859.

[3] C.C.Chang,C.J.Lin.LIBSVM: a library for support vector machines[J].ACM Transactions on Intelligent Systems and Technology (TIST),2011,2(3):27.

[4] 奉国和.文本分类性能评价研究[J].情报杂志,2011,30(8):66-70.

[5] Wintersong.台湾大学NTUSD-简体中文情感极性词典[DB/OL].[2011-10-25].http://www.datatang.com/data/11837.

作者:弓盼 王嘉梅 杨小伟

上一篇:气象局协理员工作报告下一篇:上市公司股利政策分析论文