专业技术企业安全管理论文提纲

2022-11-15 版权声明 我要投稿

论文题目:基于文本的企业安全隐患关联规则挖掘及预警方法

摘要:我国石油企业经历多年的安全管理存储了大量的安全管理文本数据,由于这些文本数据种类繁多,而且是非结构化数据,本文旨在找出隐藏在大量安全管理文本数据中企业的管理短板及安全隐患,降低企业风险,提升企业的安全管理水平。本文针对非结构化的文本数据,采用分词、词性标注等文本挖掘技术,结合关联规则算法,构建一种针对石油企业安全隐患文本数据的挖掘方法,找出安全隐患及漏洞,并编制了面向石油化工领域的文本挖掘软件。(1)本文将结巴分词和THULAC分词技术引入石油行业安全管理文本数据中,由于石油行业有很多专业名词,为了减少分词遗漏,继而采用了分词发现与专词合并,同时由于文本数据种类复杂,为了更好的对数据进行分析,对分词结果进行了标注,主要标注了设备设施、机构团体、人员岗位、规范标准等七类,保证了后续有针对性地进行分析,同时把安全管理文本数据按照标注类别进行了抽取,形成了结构化数据库。以两个企业安全管理文本数据为例,分别形成了25916条和10930条结构化数据库。(2)针对文本数据比较庞大,为了有效地挖掘文本数据的关联关系,建立了一种基于Apriori算法的文本挖掘的模型。结合分词技术,找出关键字,利用Apriori算法,调整合适的支持度和置信度,找出强关联规则,从而可以利用强关联规则,分析企业的安全管理现状,找出管理的缺陷和安全隐患,进而提升安全水平,降低风险,以两个企业为例,分别形成了93条和70条强关联规则。之后将关联规则以网络图的形式展现出来。根据生成的关联规则结合网络图进行分析,得到企业在安全管理方面存在的问题,并提出建议。(3)为了便于得到数据背后的知识,提高分析效率,本文利用Python语言、可视化工具Pyqt算法包开发了文本挖掘可视化软件。该软件基于本论文所运用的文本挖掘方法并加入可视化功能,同时采用了人机交互的操作方式,让使用者在文本挖掘的过程中可以实时进行调整,直观地得到安全隐患的关联关系。

关键词:文本挖掘;分词;关联规则;可视化软件

学科专业:安全工程(专业学位)

摘要

ABSTRACT

第1章 绪论

1.1 课题的来源

1.2 论文研究背景和意义

1.3 国内外研究现状及不足

1.3.1 国内外文本数据挖掘研究现状

1.3.2 国内外关联规则方法研究现状

1.3.3 国内外可视化技术研究现状

1.3.4 国内外研究不足

1.4 论文研究内容及技术路线图

1.4.1 论文研究内容

1.4.2 技术路线图

第2章 基于文本挖掘的安全隐患相关实体智能抽取方法研究

2.1 引言

2.2 文本数据挖掘介绍

2.3 基于数据挖掘的文本处理方法研究

2.3.1 中文分词技术

2.3.2 分词合并与专有名词发现

2.3.3 词性标注

2.3.4 结构化数据库构建

2.4 数据来源介绍

2.5 案例分析

2.5.1 A企业案例分析

2.5.2 B企业案例分析

2.6 本章小结

第3章 基于文本数据的关联规则挖掘及预警方法研究

3.1 引言

3.2 关联规则算法

3.2.1 关联规则相关概念简介

3.3 基于Apriori算法的安全管理文本数据挖掘

3.3.1 产生强关联规则

3.3.2 关联规则可视化

3.3.3 基于强关联规则的分析

3.3.4 基于关联结果的预警分析

3.4 案例分析

3.4.1 基于A企业的关联分析

3.4.2 基于B企业的关联分析

3.5 本章小结

第4章 隐患关联分析可视化软件设计与开发

4.1 引言

4.2 软件设计及模块功能介绍

4.2.1 文本数据导入模块

4.2.2 分词模块

4.2.3 词云展示模块

4.2.4 关联规则及可视化模块

4.3 本章小结

第5章 结论与展望

5.1 论文结论

5.2 展望

参考文献

附录A:分词、词性标注、数据库建立代码

附录B:关联分析代码

附录C:隐患关联分析软件可视化代码

附录D:关联规则

致谢

上一篇:成本意识加强成本管理论文提纲下一篇:混凝土裂缝防治管理论文提纲