摘要: [目的/意义]随着知识组织系统运作环境的变化,知识组织的重要性不断提升,为突破传统叙词表构建及应用困境,结合最新大语言模型技术探索叙词表构建新范式。[方法/过程]从叙词表自身特征及其构建思路入手,采用继续预训练、监督微调和强化学习的全流程微调结合本地知识库的方案对大语言模型进行微调训练,并基于“量子科技”和“理论力学”领域进行实证。[结果/结论]经过继续预训练、“多策略数据处理微调方案”和RLHF的微调方案表现更优。其中,对于“理论力学”领域的已有词表构建准确度高达89.06%,“量子科技”新兴领域词表构建准确度为63.02%。表明,本文方案可以实现已有词表的构建,且在新领域词表的构建中表现良好,具备一定可行性,为新领域叙词表构建提供参考。
[V1] | 2024-09-10 15:07:58 | PSSXiv:202409.00719V1 | 下载全文 |
1. 档案见证伟大祖国的认同历程与历史传承探析 | 2024-11-13 |
2. 智能社会中的档案数据规制论纲 | 2024-11-08 |
3. 雨花英烈近亲属口述档案在访谈式教学中的开发应用研究——以南京雨花台干部学院《感悟雨花魂 传承英烈志》互动访谈课程为例 | 2024-11-08 |
4. 以申报世界记忆为抓手扩大张謇与大生档案社会影响 | 2024-11-08 |
5. 新时代江苏档案资源开发工作的实践与创新 | 2024-11-08 |