摘要: 目的/意义 文章旨在探究将不同语义知识融入机器翻译模型能否增强机器翻译的效果以及何种语义知识的作用更为显著,以助力机器翻译研究与中华优秀传统文化的传承与传播。 方法/过程 研究选取了30万对精加工的《二十四史》“古代汉语-现代汉语”平行语料作为实验数据,基于神经机器翻译OpenNMT模型,通过三种不同的特征融合方法,将词边界知识、词性知识、实体知识和依存句法知识分别融入机器翻译模型的训练过程中。 结果/结论 不同语义知识与模型的融合对典籍翻译效果有不同的影响,词边界知识、词性知识、实体知识对机器翻译任务有一定的贡献且实体知识的贡献最大,依存句法知识无明显作用。
[V1] | 2024-05-27 17:10:43 | PSSXiv:202406.00114V1 | 下载全文 |
1. 数智时代背景下高校图书馆赋能新质生产力的作用机理、主要应用与实现路径 | 2024-09-19 |
2. 科普类微博信息质量评价指标体系构建与实证研究 | 2024-09-19 |
3. 新质生产力背景下信息资源管理专业学生数智素养评价指标体系构建研究 | 2024-09-18 |
4. 建设文献情报领域的数据标注基地 | 2024-09-18 |
5. 基于LDA模型的国文本的主题热点及策略分析 | 2024-09-18 |