恐怖袭击语料库的恐怖机构及诉求识别研究

随着全球恐怖袭击事件频发,恐怖袭击成为一个社会热点,而“一带一路”区域经济的发展以及其沿线各国复杂的政治格局和宗教信仰,该地区恐怖袭击情况尤为严重,也更加受到世界的关注。本文从恐怖组织及其动机的角度出发,对“一带一路”沿线的恐怖袭击情况进行分析,研究热点恐怖袭击组织和恐怖组织的发展;从动机的角度研究恐怖组织诉求。同时,利用CRF对恐怖组织名称进行交叉学习训练,训练出相应模型,使其能够自动新闻字段中的恐怖组织名称进行识别,此外还对模型的各项标引能力进行了测试对比。
目录
摘要 3
关键词 3
Abstract. 3
Key words 3
引言 3
一、文献综述 4
(一)恐怖袭击事件研究综述 4
(二)机构自动识别研究综述 4
(三)基于机器学习的事件抽取研究综述 5
二、基于语料库的恐怖机构及诉求统计与分析 5
(一)恐怖机构相关分析 5
1.20012015恐怖组织活动频次分析 5
2.20012015无恐怖机构宣称负责的恐怖袭击活动频次分析 6
3.典型恐怖机构活动频次和范围分析 7
4.20012015年活跃恐怖组织演变分析 10
(二)恐怖袭击诉求相关分析 11
1.恐怖组织动机分析 11
三、基于条件随机场的恐怖机构自动识别研究 12
(一)条件随机场定义 12
(二)CRF++工具包 12
(三)CRF自动识别实验 13
1.数据采集 13
2.数据清洗 13
3.特征的选取 13
4.语料库标注 13
5.基于机器学习算法的命名实体识别 13
6.效果评价 13
(四)CRF实验结论 14
四、结论 15
致谢 16
参考文献 17
图1 “一带一路”沿线恐怖袭击负责组织分布情况饼状图 5
图2“一带一路”沿线无组织宣称的恐怖袭击及恐怖袭击总数及其比例折线图 7
图3 20 *好棒文|www.hbsrm.com +Q: ¥351916072$ 
012015塔利班在“一带一路”沿线进行的恐怖袭击次数折线图 7
图4 20012015塔利班在“一带一路”沿线进行的恐怖袭击地点热力图 8
图5 20012015伊斯兰国在“一带一路”沿线进行的恐怖袭击次数折线图 9
图6 20012015伊斯兰国在“一带一路”沿线进行的恐怖袭击地点热力图 9
图7 20012015年伊斯兰国在“一带一路”沿线进行的恐怖袭击次数折线图 10
图8 20012015年索马里青年党在“一带一路”沿线进行的恐怖袭击地点热力图 10
表1 “一带一路”沿线恐怖进行袭击次数前20名的恐怖组织 6
表2 20012015年“一带一路”沿线热点恐怖组织活动频次表 11
表3 20012015“一带一路”沿线恐怖组织子组织活动频次表 11
表4 恐怖组织宣称的数量在20以上的典型动机 11
表5 实验110的各标引项的召回率、查准率和F值表 14
表6 实验110的各标引项的召回率、查准率和F值的平均值表 14
基于恐怖袭击语料库的恐怖机构及诉求识别研究
引言
引言:随着全球恐怖主义袭击事件频发,特别自“9.11事件”以来,公共安全问题逐渐进被社会公众所关注,恐怖袭击事件已经成为世界和平与人民安全的威胁之一,并成为世界关注的焦点。随着恐怖组织对平民造成袭击的灾难情况加剧,更加凸显出反恐任务的重要性。
恐怖袭击事件是由恐怖组织极端分子出于宗教或政治目的针对包括平民以及民用设施在内的制造的不符合国际人道主义的攻击方式。恐怖主义极端分子使用的袭击方式也从开始时的针对政府部队的袭击慢慢演化到针对平民的绑架、屠杀和自杀式爆炸袭击等行为。
全球恐怖主义数据库,简称GTD(Global Terrorism Database)是一个开源数据库,包括从1970到2015在世界各地的恐怖事件的信息,本文将从恐怖机构和恐怖机构的诉求的角度出发,对恐怖机构分布情况进行整理,对恐怖组织诉求进行分析,以更加全面的了解恐怖组织的活动分布、活动区域、活动时间、活动频次情况,从而更加行之有效的对恐怖袭击事件进行预防和处置。本文选取的数据仅包括“一带一路”沿线66国的恐怖袭击数据,仅能用来说明“一带一路”沿线的恐怖袭击情况,并不能代表全球的恐怖袭击现状。
一、 文献综述
(一)恐怖袭击事件研究综述
自从19世纪80年代以来,各方恐怖主义组织,包括民族分裂主义分子、宗教极端分子、国际恐怖主义分子等对整个世界的恐怖主义事件日益频发。特别是自“9.11事件”以来,全球恐怖袭击事件日益增加,凸显了反恐行动的迫在眉睫。
在对恐怖主义袭击事件的总体研究上,李国辉博士做了较为充分的研究,研究了恐怖袭击事件频率和死亡人数的分布情况,结果表明,频率和死亡人数服从幂律分布;此外还使用对应分析对不同死亡人数段和影响因素的对应关系进行了阐明,提出了基于因子分析的恐怖袭击风险评估模型,创建了风险分析指标体系[1]。朱君芳等人使用统计物理学的研究方法对恐怖袭击事件的研究状况进行了分析,包括恐怖主义事件所造成的伤亡情况以及恐怖袭击发生的时间间隔研究,此外还对恐怖袭击的爆发机制进行了模拟和解释,他的研究虽然建立了恐怖主义事件的数据库,但是数据库仅仅收集了事件的统计一些常规统计数据,而关于其背景、目的、诉求、恐怖组织之间的相关关系等还没有相关的详细数据[2]。龚伟志等针对传统算法在恐怖袭击风险预测的过程中,在建立预测模型时由于存在数据量较小、数据不稳定等问题,因此出现了预测精度较低的情况,但是最后还是首次采用了基于大数据分析的恐怖袭击事件预测研究方法,采用大数据分析中的模型方法,让机器对恐怖袭击历史数据进行深度学习,分析其中的演化规律,利用所获取的大数据模型进行未来的恐怖袭击预测。给出了基于大数据分析的精确度和效率都更高的恐怖袭击风险预测方法[3]。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/xxaq/555.html

好棒文