时间表达式识别的条件随机场模型性能判定研究
目录
摘要2
关键词2
Abstract2
Key words2
引言3
一、现阶段实体识别的基本情况3
(一)识别方法3
1基于规则的方法3
2基于统计的方法3
3.计与规则相结合的方法3
(二)三种模型的优缺点4
二、模型的构建4
(一)条件随机场4
(二)最大熵模型5
三、两个模型性能的比较5
(一)数据的选取6
(二)词位标注数量的去顶6
(三)及词性特征的选取以及特征模板的制定6
(四)基于时间表达式识别性能的判定7
1.衡量指标7
2.评测方法7
(五)基于条件随机场和最大熵模型时间表达式识别结果性能的对比8
四、条件随机场在不同语料规模上性能的判定9
五、对条件随机场模型的总结与思考11
(一)总结11
(二)思考与展望12
致谢12
参考文献12
图 1 模型构建流程4
图 2 线性链CRFs模型的拓扑结构5
图 3 评测图8
图 4 不同语料规模的对比11
表 1 时间表达式训练语料和测试语料标注样例6
表 2 基于条件随机场模型时间表达式识别性能比较8
表 3 基于最大熵模型时间表达式识别性能比较8
表 4 条件随机场和最大熵模型训练和测试耗时比较9
表 5 二十分之一规模语料上的条件随机场的性能9
表 6 九分之八的语料规模上的条件随机场性能10
表 7 全部语料规模上条件随机场性能
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/xxaq/1070.html