《数字人文研究》(Digital Humanities Research)是创刊于2021年3月,由中国人民大学主办,中国人民大学信息资源管理学院、中国人民大学数字人文研究院承办的中国大陆首份数字人文领域专业期刊。以推动数字人文研究繁荣和学术创新为使命,日常设置“人文新知”“攻石以玉”“国际视野”“批判思维”“教育进展”等栏目,关注国内外数字人文领域最新理论发展、方法创新、应用成果及学术生态,囊括有思想、有温度、有活力、有新意的数字人文话语表达,为国内数字人文研究提供理论讨论和专题研究的高质量学术交流平台。以期刊为核心,目前已经建立起刊物、网站(http://dhr.ruc.edu.cn/)、微信公众号(“数字人文研究”)媒体矩阵,在国内数字人文学界具有广泛影响力。
DOI:10.12451/202405.00444
提交时间: 2024-05-07
摘要:研究旨在探索符合数字文化发展的知识组织方式和伦理规范,为数字文化领域生态的健康发展提供支持。文章在界定数字文化、知识组织和知识组织伦理概念的基础上探讨了三者间的关系。研究发现,知识组织作为联结数字文化与公众交流的关键要素和映射社会现实的透镜在文化的数字化转型中焕发生机,伦理则是评判与检验数字文化视野下知识组织公平的必要手段。数字文化视野下的知识组织伦理问题,包括文化资源选择偏见与访问限制、知识表征与表达中的隐含偏见、知识组织从业者的价值观与决策偏见、数字文化场景中用户的知识组织与共享偏见、人工智能技术引发的知识过滤和偏见。合理运用数字技术并推动跨文化视角的知识组织系统构建,对未来具有深远意义。
状态:已在期刊出版
DOI:10.12451/202405.00445
提交时间: 2024-05-07
摘要:日本线下演艺在新冠疫情期间遭受了巨大的冲击,同时也催生了一系列积极的数字化探索和变革。当前,日本剧场数字化探索主要有“个人云终端”“剧场×影院”和“虚拟剧场”三种类型,推动了“线上演艺”“混合上演”等突破传统剧场空间的新模式。日本数字演艺发展得益于文化政策支持与数字档案库的建设,致力于通过表演形式的创新以及充分利用沉浸式技术来提升观众的感官体验,并注重新世代观众的培养。日本剧场在数字化转型中以提升虚拟空间中的感官体验丰富性为核心,数字化演艺不再是现场表演的替代方案,而是成为一种全新的娱乐方式。
状态:已在期刊出版
关键词: 一战; 网络分析; 文本挖掘; 数据可视化; 语义标记;
DOI:10.12451/202405.00446
提交时间: 2024-05-07
摘要:数字人文视域下的文学研究通常呈现出两种倾向:一种是对大规模数据集进行宏观层面的“远读”,另一种则是对单部作品的语言特性进行微观分析。其中,“大数据”项目利用软件对数百万卷期刊的出版数据或文学语料所构成的大规模数据集进行可视化处理,进而揭示出学者们单凭自身的穷尽式阅读难以获知的各种历史模式。然而,这类方法无法深度阅读文学文本。与此同时,基于文本挖掘的微观分析也呈现出类似的优缺点。因此,本章旨在探索一种融合之道,即综合运用这两种方法解读1918年9月刊的《小评论》。
状态:已在期刊出版
关键词: 沉浸式叙事; 数字叙事; 档案开发; 数字人文; 视听联觉;
DOI:10.12451/202405.00447
提交时间: 2024-05-07
摘要:在档案资源开发过程中应用沉浸式数字叙事,可使档案记忆立体化、具象化,实现从物理空间向记忆空间的演变。研究对数字人文视域下的档案资源开发利用实践现状进行回顾,分析目前针对档案资源所进行的沉浸式数字叙事构建的局限,论证基于精细声音设计的沉浸式叙事路径在档案资源开发利用中的可行性。并以宋庆龄与中国福利会的相关档案为对象,探索了基于VR、模拟人声、数字人等多种数字技术、强调声音设计的沉浸式叙事方法。当中虚拟展厅与全景色、无损音效的结合,使档案资源从平面延伸到丰满的立体空间,从而验证了音乐和图像多模态交叉交融的可能性,针对文本所进行的视听联觉研究与构建的尝试,拓展了数字人文研究新领域。
状态:已在期刊出版
关键词: 机器学习; 翻译风格; 平行语料库; 《德伯家的苔丝》;
DOI:10.12451/202405.00448
提交时间: 2024-05-06
摘要:研究使用机器学习中的分类和聚类方法,基于自建平行语料库,考察哈代名作《德伯家的苔丝》中文三译本的翻译风格。从68个全部特征中筛选出15个显著特征,并结合实例进行量性融合的阐释和总结。结果表明,显著特征能够有效区分三译本风格差异,分类、聚类实验的平均准确率均达到97%左右,提示出各译本在词汇、句法、语篇上的不同风格特征和译者的个人偏好。研究在为既往质性研究提供数据支持和细粒度分析的同时,也提出了一些纠正性结论,如张谷若译本词汇密度更大、被字句比例极少、成语比例差别不大等,并为翻译风格和译者风格研究方法提供了一定改进和补充。
状态:已在期刊出版
关键词: 历史记忆; 共情; 认知功能; 抗日战争; 任务态功能磁共振;
DOI:10.12451/202405.00418
提交时间: 2024-05-06
摘要:记忆是历史学研究的核心,并因其主体差异,分为个体历史记忆、群体历史记忆、群体与群体之间的文化历史记忆,而大脑的“共情”功能会引发“感同身受”的情绪,得以连接起三种记忆。研究对不同学历、性别和历史知识水平的被试者开展实验,利用任务态功能磁共振成像技术,观察被试者观看战争图片时的大脑反应,揭示了高级认知功能网络、视觉信息处理网络及负性情绪脑区激活水平的变化。被试者在观看抗日战争图片组时,大脑中负责“共情”的核心区域与调控区域的激活水平显著增加,直接调动了大脑的“历史记忆”,突显出历史教育的重要性——加强群体间的文化性记忆的联系,从而强固国家认同感与爱国情怀。此外,不同性别与受教育程度的被试者,在大脑激活水平上也存在显著差异,受教育水平高的女性大脑呈现出的“共情”水平最为活跃,更能表现出“同仇敌忾”的态度。研究不仅展现了个体差异在感知历史事件中的重要性,也证明了历史记忆在维系社会共识与凝聚群体上的作用。
状态:已在期刊出版
关键词: 解释; 可解释性; 可阐释性; 可解释人工智能; 透明度;
DOI:10.12451/202405.00250
提交时间: 2024-05-06
摘要:随着研究人员和从业者寻求为其算法提供更多透明度,可解释人工智能(Explainable Artificial Intelligence)有一场新近的复苏。这项研究的大部分聚焦于向人类观察者明确地解释决策或行动。观察人类如何相互解释可以作为人工智能解释的一个有用起点,这应该没有争议。诚然,公正地说,大多数关于可解释人工智能的工作仅利用研究人员对什么构成“好”解释的直觉。哲学、心理学和认知科学领域存在大量关于人们如何定义、生成、选择、评估和呈现解释的有价值的研究,这些研究认为人们在解释过程中运用了某些认知偏见和社会期望。文章认为,可解释人工智能领域可以建立在这些现有研究的基础上,并回顾了研究这些主题的哲学、认知心理学/科学和社会心理学的相关论文,由此获取了一些重要的发现,并讨论了如何将这些发现融入可解释人工智能的相关工作中。
状态:已在期刊出版
DOI:10.12451/202405.00449
提交时间: 2024-05-06
摘要:由武汉大学信息管理学院与中国索引学会主办,武汉大学信息管理学院、武汉大学文化遗产智能计算实验室、武汉大学大数据研究院及武汉大学信息资源研究中心承办的第五届中国数字人文年会(CDH2023)于2023年12月9—10日在武汉光谷召开。年会以“数实共生:预见数字人文未来图景”为主题,下设十个专题分论坛,受到了国际国内高等院校和社会业界的广泛关注。文章对年会投稿论文、项目内容做了分类评述,对相关技术路径选择、呈现形式等情况进行了分析与总结,以期达到窥探现阶段中国数字人文研究焦点与进展,探讨中国数字人文研究面临挑战和应对方式,展望未来研究趋势的目的。
状态:已在期刊出版
关键词: 电影史; 视听档案库; 数字电影; 人工智能; 目标检索;
DOI:10.12451/202405.00477
提交时间: 2024-04-22
摘要:计算机工具为我们提供了观看电影的新方法,并为电影学者们创造了提出多样研究问题和展望新研究方法的机遇。文章着重关注电影史学者的研究如何能从尚未被广泛使用的人工智能的帮扶中获益,分享了利用人工智能“Snoop”在老电影语料库中进行的第一轮试验。Snoop由法国国家视听研究所(INA)和国家信息与自动化研究所(INRIA)共同开发。通过探索性的方式,Snoop使研究者能够检索老电影语料库中的共同主题。除了介绍实验中遇到的挑战和新发现外,文章亦旨在对实验进行整体评估并讨论新的研究方向。从研究史的角度而言,文章的另一目的在于评估人工智能系统是否能成为实施不同研究方法的有效工具——既能解决新的研究问题,又能重新审视旧有疑窦;且如果是,又将如何实现。
状态:已在期刊出版
DOI:10.12451/202405.00478
提交时间: 2024-04-22
摘要:欧洲和北美众多研究学者已对机器学习在光学字符识别中的应用进行了探索,许多项目也正在为此创建基准真值(ground truth, GT)数据。但对于非拉丁文本(non-Latin script)阅读材料来说,情况则有所不同。德国海德堡大学的“中国早期报刊在线数据库”(ECPO)项目于2021年开始研究如何基于中国报刊史料生成机器可读文本。ECPO采用多种机器学习方法(如卷积神经网络)开发了一个半自动流程来生成机器可读的全文文本,并选取民国时期娱乐小报《晶报》(1919—1940年)作为实验基础。文章聚焦于两方面:一是对基准真值编辑工作流程作详细阐述,包括组建编辑团队、组织工作流程、建立操作规范和确保质量控制;二是探讨制作基准真值时遇到的具体困难,包括字符编码问题、与Unicode相关的异体字符问题等。该研究项目创建了两个基准真值数据集,分别是文本型/结构化数据(全文基准真值,full-text GT)和版面分割数据(几何基准真值,geometry GT)。此外,文章还指出研究项目发现的问题及应对方案,期望提高机器学习效率,并为其他从事非拉丁文阅读材料研究的同仁提供借鉴。
状态:已在期刊出版