• 人工智能训练数据真实性:概念体系构建及合规要求分析

    分类: 信息资源管理 >> 情报学 提交时间: 2024-10-12

    摘要:摘要:[目的/意义]AI训练数据真实性是当前国内外法规政策和标准中的关注焦点,研究其概念体系和合规要求有助于提升AI技术的质量、合法性、透明度和社会接受度等。[方法/过程]使用内容分析法对目标文献中的AI训练数据真实性相关内容进行分析和抽取,使用ISO 704:2022概念分析方法从抽取的条目中识别AI训练数据真实性相关概念关系和特征,以构建AI训练数据真实性概念体系,基于概念体系构建分析框架,进一步识别对应的合规要求。[结果/结论]与AI训练数据真实性相关的概念有AI训练数据客观性、AI训练数据可靠性、AI训练数据确实性、AI训练数据完整性。AI训练数据真实性合规要求包括具有合法来源、与基本事实相符、数据准确、没有受到不当操作和能反映人工智能系统的背景或预期用途5类。

  • 基于ISO 704:2022的AI数据多样性概念体系构建研究

    分类: 信息资源管理 >> 图书馆学 提交时间: 2024-10-12

    摘要:[目的/意义]AI数据多样性对于增强AI模型性能、减少偏见与歧视至关重要。然而,当前对AI数据多样性概念对象和特征的研究较少且缺乏系统性。本研究丰富了AI数据多样性的认知,对提升AI数据多样性质量,促进AI模型性能优化,促进系统性能与公平性提升具有理论意义和实践价值。[方法/过程]本研究采用ISO 704:2022概念构建的通用方法,通过系统梳理期刊论文、政策和标准中多样性的概念对象和特征,构建了一个较为全面的AI数据多样性概念体系。[结果/结论]AI数据多样性概念体系,其构成内容包括目标(性能优化与可持续性)、主体(公共利益相关者与AI系统相关者)、对象(人员、数据集/数据、AI系统/技术)、合规要求及关切点(法律行动多样性、技术伦理与社会影响考量)四类概念及概念关系。