哲学社会科学预印本平台

按提交时间

2024
1

按主题分类

情报学
1

按作者

江奕辉
1
陈锐
1

按机构

重庆大学法学院
1

当前资源共 1条

隐藏摘要

点击量

时间

1. PSSXiv:202411.00102
下载全文

作为生成式人工智能核心驱动力的训练数据的治理研究

分类：信息资源管理 >> 情报学提交时间： 2024-10-21 合作期刊: 《情报资料工作》

陈锐江奕辉

摘要：[目的/意义]当前研究对于生成式人工智能训练数据的治理问题关注较少。然而，训练数据的生命周期中存在着诸多不容忽视的风险，亟需有效的治理。[方法/过程]文章在论证了训练数据是生成式人工智能核心驱动力的基础上，使用数据生命周期的理论模型，全面归纳了训练数据生命周期中可能出现的风险样态。然后，从训练数据自身特性、生态性因素与生成式人工智能开发者操作性因素等角度分析了相关风险的成因。[结果/结论]数据本身的碎片化特性与偏见性是风险发生的起点；数据的生态失衡是风险发生的外部成因；同时，“黑箱”中的训练数据、偏差的数据标注与懈怠的数据脱敏则是风险发生的内在成因。由此，针对训练数据的特性，可以借助“可怜圆点”的框架，为其构建一个综合法律、市场、社群规范以及架构的风险治理方案。

点击量 68 下载量 25 评论 0

链接：

主办：中国人民大学承办：中国人民大学书报资料中心
邮箱: yuyin@ruc.edu.cn 电话:62516972 62515820
地址: 北京市海淀区中关村大街59号
版权所有©2024 中国人民大学

常见问题解答许可声明法律声明问题反馈

京公网安备11040102700185 京ICP备05066828号-47
（署）网出证（京）字第090号