农业古籍断句标点研究
2中国农业古籍是我们华夏祖先的智慧结晶,对古籍的整理有助于我们更好的传承与研究中华文化遗产。古籍的断句标点是古籍研究的基础,然而传统的处理方法主要采用人工标识,费时费力。本研究通过探索并总结农业古籍断句、标点识别模式。首先观察以及参考相关文献归纳古代农业古籍汉语语言断句标点的一般规律,然后利用古籍在语言规律上的特点构建断句标点模式库,最后将断句标点模式转化为程序可以识别的正则表达式,并使用中文处理程序TextPro对古籍断句标点。经测试表明,该方法对古籍断句、标点具有一定的正确性和可行性。
目 录
Abstract 2
Key words 3
第1章 引言 3
1.1 选题背景和意义 3
1.1.1 选题背景 3
1.1.2 选题意义 3
1.2 古籍断句标点的概念和意义 3
1.2.1 古籍自动断句标点的意义 3
第2章 农业古籍断句标点研究与进展 4
2.1 断句标点概述 4
2.1.1 句读 4
2.1.2 标点 4
2.1.3 句读与标点的异同 4
2.2 古籍断句标点研究进展 5
第3章 农业古籍断句标点研究过程 5
3.1 构建断句标点模式库 5
3.1.1 古籍断句标点规律 5
3.2 断句标点模式 5
3.2.1 句法特征断句标点 6
3.2.2 重复字、词断句标点 7
3.2.3 利用时序断句标点 7
3.2.4 数词量词识别法 8
3.2.5 利用“之”断句标点 9
3.2.6 行文格式断句标点 9
3.2.7 禁用断句标点识别法 9
3.3 断句标点规则库 10
第4章 古籍自动断句标点设计、效果评价及结论 11
4.1 古籍自动断句标点设计流程 11
4.2 断句标点效果评价与结论 11
4.2.1 断句标点效果统计 11
4.2.2 结论及展望 11
致谢 12
参考文献 *好棒文|www.hbsrm.com +Q: @351916072@
12
农业古籍断句标点探究
信息管理与信息系统专业学生 林彬
指导教师 白振田
Sentence Segmentation and Punctuation for Ancient Books on Agriculture
Student majoring in Information Management and Information System Lin Bin
Tutor Bai Zhentian
Abstract: As great intellectual achievements created by ancient Chinese, the collation of ancient books on agriculture will help us to better inherit and study Chinese culture heritage. Sentence segmentation and punctuation are the basis for study of ancient books, however, the traditional approach using artificial identity, which is timeconsuming. This article probes into the issue of segmentation and punctuation for ancient books on agriculture, and summarizes certain pattern for it. It generalize the laws of sentence segmentation and punctuation of the old Chinese language of agriculture books by observing the ancient agriculture books and reference to the relative articles. Then the laws of old Chinese language are used to set up knowledge base.Last the terms in the knowledge base will be translated into regular expression, which could be recognized by computer, and use the Chinese information processing program TextPro to process the ancient books.In experiments, the methods of this punctuation models shows the feasible and potential.
Key words: Chinese information processing; ancient books; sentence segmentation; punctuation; pattern match
第1章 引言
1.1选题背景和意义
1.1.1 选题背景
从先秦散文、楚辞汉赋到魏晋文学、唐宋文学再到元曲、明清文学直至今日的现代文学。这些文学的价值不仅在于它们所传承的信息,也在于文学本身的艺术性。自1946年2月15日世界第一台通用电子数字计算机ENIAC宣告研制成功,人类的计算机技术发展历程在这一新的起点上,开始了长达近一个世纪的高速发展,直至今日全方位渗透我们生活的发展现状。计算机技术之所以能如此快速和侵略性的渗透社会的方方面面,是因为计算机技术具有明显的综合特性,它所运用的技术和手段与现代电子工程、应用物理、机械工程、现代通信技术、生物科学和数学等紧密结合,计算机技术已成为人类社会发展不可或缺的重要载体。中国传统文学作为华夏祖先的历史遗产,如何将计算机技术运用于我们中国传统文学整理当中是很具有研究意义和探索实践意义的!
1.1.2 选题意义
目 录
Abstract 2
Key words 3
第1章 引言 3
1.1 选题背景和意义 3
1.1.1 选题背景 3
1.1.2 选题意义 3
1.2 古籍断句标点的概念和意义 3
1.2.1 古籍自动断句标点的意义 3
第2章 农业古籍断句标点研究与进展 4
2.1 断句标点概述 4
2.1.1 句读 4
2.1.2 标点 4
2.1.3 句读与标点的异同 4
2.2 古籍断句标点研究进展 5
第3章 农业古籍断句标点研究过程 5
3.1 构建断句标点模式库 5
3.1.1 古籍断句标点规律 5
3.2 断句标点模式 5
3.2.1 句法特征断句标点 6
3.2.2 重复字、词断句标点 7
3.2.3 利用时序断句标点 7
3.2.4 数词量词识别法 8
3.2.5 利用“之”断句标点 9
3.2.6 行文格式断句标点 9
3.2.7 禁用断句标点识别法 9
3.3 断句标点规则库 10
第4章 古籍自动断句标点设计、效果评价及结论 11
4.1 古籍自动断句标点设计流程 11
4.2 断句标点效果评价与结论 11
4.2.1 断句标点效果统计 11
4.2.2 结论及展望 11
致谢 12
参考文献 *好棒文|www.hbsrm.com +Q: @351916072@
12
农业古籍断句标点探究
信息管理与信息系统专业学生 林彬
指导教师 白振田
Sentence Segmentation and Punctuation for Ancient Books on Agriculture
Student majoring in Information Management and Information System Lin Bin
Tutor Bai Zhentian
Abstract: As great intellectual achievements created by ancient Chinese, the collation of ancient books on agriculture will help us to better inherit and study Chinese culture heritage. Sentence segmentation and punctuation are the basis for study of ancient books, however, the traditional approach using artificial identity, which is timeconsuming. This article probes into the issue of segmentation and punctuation for ancient books on agriculture, and summarizes certain pattern for it. It generalize the laws of sentence segmentation and punctuation of the old Chinese language of agriculture books by observing the ancient agriculture books and reference to the relative articles. Then the laws of old Chinese language are used to set up knowledge base.Last the terms in the knowledge base will be translated into regular expression, which could be recognized by computer, and use the Chinese information processing program TextPro to process the ancient books.In experiments, the methods of this punctuation models shows the feasible and potential.
Key words: Chinese information processing; ancient books; sentence segmentation; punctuation; pattern match
第1章 引言
1.1选题背景和意义
1.1.1 选题背景
从先秦散文、楚辞汉赋到魏晋文学、唐宋文学再到元曲、明清文学直至今日的现代文学。这些文学的价值不仅在于它们所传承的信息,也在于文学本身的艺术性。自1946年2月15日世界第一台通用电子数字计算机ENIAC宣告研制成功,人类的计算机技术发展历程在这一新的起点上,开始了长达近一个世纪的高速发展,直至今日全方位渗透我们生活的发展现状。计算机技术之所以能如此快速和侵略性的渗透社会的方方面面,是因为计算机技术具有明显的综合特性,它所运用的技术和手段与现代电子工程、应用物理、机械工程、现代通信技术、生物科学和数学等紧密结合,计算机技术已成为人类社会发展不可或缺的重要载体。中国传统文学作为华夏祖先的历史遗产,如何将计算机技术运用于我们中国传统文学整理当中是很具有研究意义和探索实践意义的!
1.1.2 选题意义
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/jsjkxyjs/1997.html