论文题目:面向交通广播文本的地理空间信息提取
摘要:随着信息技术的迅速发展,大量的涉及地理空间位置信息的文本数据飞速增加。面对日益增加的文本地理数据,采用传统的人工提取信息的方式耗时且落后,且在作业效率上远远不能满足要求。因此,快速、自动的文本信息提取方式变得尤为重要。交通广播文本是以自然语言形式描述的交通路况信息,其蕴含着丰富的地名、地址及方位信息等地理数据。本文选取北京市2014年交通广播文本为研究对象,为了提取出交通广播文本中的地理空间信息,采用中文文本信息提取的思路进行实验,并对提取出的信息进行可视化呈现。本文的研究内容主要分为四个部分。1.交通广播文本数据预处理。针对交通广播文本的特征,对交通广播文本的进行了文本去噪、中文分词、标注集的制定等。文本数据的预处理使得计算机对于后续的文本中地理空间信息的提取更加有效。2.交通广播文本分词。在分析了常规的分词方法后,发现常规分词方法并不能较好地实现交通广播文本的分词。针对交通广播文本分词面临的问题,提出了一种适合交通广播文本的分词方法。3.交通广播文本模式构建及识别。交通广播文本虽然表达随意自由,但是表述模式却相对固定。利用这一特征,本文构建了文本信息提取模式并进一步引入了模式识别模型,实现了非结构化形式的交通广播文本信息到结构化形式信息的有效转换,并提高了文本信息提取的速度。4.交通广播文本中地理信息可视化。本文将交通广播文本中提取到的地理空间信息,通过标签云、直方图、Arcgis点密度等可视化方式呈现出来,实现了文本中地理空间信息的可视化表达。
关键词:文本信息提取;中文分词;空间关系识别;模式匹配;文本可视化
学科专业:测绘科学与技术
致谢
摘要
Abstract
1 绪论
1.1 研究背景及研究意义
1.2 国内外研究现状
1.3 论文研究内容与技术路线
1.3.1 研究内容
1.3.2 技术路线
1.4 论文组织结构
2 交通广播文本信息提取关键方法
2.1 中文分词算法
2.2 文本空间方位关系识别
2.2.1 交通广播文本空间方位关系的表达
2.2.2 交通广播文本空间方位关系参考
2.2.3 交通广播文本空间方位关系的描述
2.3 文本中的模式匹配
2.3.1 文本模式
2.3.2 基于DTW算法的文本模式识别
2.4 本章小结
3 交通广播文本地理空间信息提取
3.1 交通广播文本特征分析
3.1.1 交通广播文本数据
3.1.2 交通广播文本特征词
3.1.3 半规则化的交通广播文本表达形式
3.2 文本的去噪
3.3 标注集的建立
3.4 分词
3.4.1 交通广播文本分词面临的问题
3.4.2 基于认知的复句分词算法
3.4.3 算法性能评测
3.5 模式构建
3.6 模式识别
3.7 程序实现
3.8 本章小结
4 面向交通广播文本的地理空间信息可视化
4.1 基于标签云的文本信息可视化方法
4.2 基于统计直方图的文本信息可视化方法
4.3 基于粗粒度坐标查询的文本信息可视化方法
4.4 本章小结
5 总结与展望
5.1 总结
5.2 下一步工作展望
参考文献
作者简历
推荐阅读:
初一下册地理复习提纲06-10
2024年中考地理总复习提纲06-13
八年级下册地理复习提纲粤教版提纲06-18
人教版高一地理必修一复习提纲06-26
家庭养老模式下的住宅空间设计的论文06-18
因果关系在餐饮空间设计中的应用论文06-10
基础地理信息数据06-10
测绘地理信息项目简介06-07
地理信息系统技术应用07-03
贸易地理论文05-25