分类: 新闻传播学 >> 新闻学 提交时间: 2024-10-11 合作期刊: 《阅江学刊》
摘要:OpenAI发布的通用视觉大模型Sora以其强大的文生视频能力拥有了对当下世界进行描绘的话语权力,但其背后存在的大语言模型对世界表征的合法性问题以及带来的认知风险和社会性后果,需要将哲学和技术批判结合 起来进行反思与预防性研究。本文对多模态大语言模型技术进行分析,探究文生视频的技术本质和应用困境。同时,基于大语言模型的通用性,分析了其背后蕴藏的技术理性及对用户价值认知的重塑。研究表明,在从技术通用性到知识 公理性的过程中,人工智能技术出现了认识论上的悖论。基于深度学习的生成 式人工智能无法真正理解世界运作方式,只是处理信息单元和语义的逻辑关系,且现有的生成式大模型在反事实推理和合规性方面仍存在缺陷,还远未达到全 方位理解世界、表征世界的程度。因此,在虚实共生、人机融合成为新的时代命 题时,如何把握“虚”“实”之间的关系成为一个需要审视的维度。这不仅关系到 社会资源的投入,而且更关系到人类自身的重塑和对于世界的理解。
分类: 体育学 提交时间: 2024-11-13 合作期刊: 《首都体育学院学报》
摘要:构建健身运动知识图谱可以为人们科学运动提供直观便捷的指导,对推动健身研究领域的发展和促进人们身体健康具有重要意义。而如何全面获取科学健身运动的多模态知识,并进行系统的关联和集成以及形成多模态知识图谱,目前相关研究较少,且面临着诸多挑战。针对上述问题,利用自然语言处理、深度学习技术、视觉识别技术等,以人机结合的方式探索构建多模态科学健身运动知识图谱。具体步骤包括:1)数据选择和处理,确保知识图谱的基础数据可靠且全面;2)设计多模态知识体系,以整合文字、图像等多种信息形式;3)运用关键技术获取知识,特别是将运动视频转换为细粒度运动文本进行描述;4)构建可视化平台,使知识图谱更加直观和易于使用。通过系统地关联和集成多模态的健身知识,构建了一个包含丰富信息的健身运动知识图谱。该图谱系统不仅能够有效地将运动视频转换为详细的文本描述,还能可视化地直观展示图片、视频等信息,为用户提供易于理解和使用的科学运动指导。多模态科学健身运动知识图谱的构建,为其在健身方面的应用提供了重要参考。这表明,多模态知识的获取和集成是实现科学健身指导的重要途径,能够有效推动健身研究领域的发展以及促进人们的身体健康。
分类: 应用经济学 >> 金融学 提交时间: 2024-09-23 合作期刊: 《中国商论》
摘要:随着电子商务和数字经济的蓬勃发展,三方支付作为现代金融领域的重要一环,已逐渐渗透到人们日常生活的方方面面。本文概述了三方支付的概念、特点及其发展历程,进而分析了三方支付在多模态情境下的应用现状。文章以支付宝为例,深入探讨了其资金运营管理模式,特别是资金的运用,通过对余额宝资金运营模式的综合分析,提出了提高收益率和抗风险能力的可行性建议。研究表明,三方支付在资金运转及流通实现方面扮演着关键角色,其未来发展将受到技术创新、市场环境变化等多重因素的影响。
分类: 信息资源管理 >> 档案学 提交时间: 2024-01-17
摘要:数字叙事理论为红色馆藏资源开发提供了优化可能,有助于立体多维地呈现党史记忆和国家精神。采用文献研究和内容分析方法,在归纳红色馆藏资源多模态特征的同时,厘清数字叙事理论内涵,为红色馆藏资源开发提供指导基础。以数字叙事理论框架为分析依据,从叙事主体、叙事内容、叙事逻辑、叙事方式四个方面识别红色馆藏传统叙事的开发难点。面向红色馆藏开发需求,以方志敏红色人物馆藏资源为例,提出多模态红色馆藏资源的数字叙事开发策略,包括立足红色馆藏资源、开展多元主体叙事、呈现多维沉浸叙事、聚合红色知识表达。
分类: 信息资源管理 >> 情报学 提交时间: 2024-09-25 合作期刊: 《情报资料工作》
摘要:[目的/意义]在多模态信息资源日益丰富的背景下,跨模态信息组织方式对非遗信息资源序化存储与共享利用具有重要价值。文章提出一种基于图文数据的非遗跨模态知识图谱构建方法。[方法/过程]文章通过结合多模态信息抽取与知识图谱技术对非遗数字资源进行知识重组。首先,从非遗项目内容与模态维度设计非遗跨模态知识图谱模式层,为图文数据组织提供顶层设计;其次,分别讨论面向非遗领域的图像与文本资源的知识抽取方案,获取图文模态下的非遗知识,并验证知识抽取方法的有效性;最后,通过面向不同场景下的一系列跨模态知识链接方法抽取非遗图文实体间的跨模态关系。[结果/结论]以楚剧非遗项目为例,通过多数据源、多技术结合的方式构建楚剧跨模态知识图谱,验证了文章所提出构建方法的可行性,对非遗数字化建设具有一定参考价值。
分类: 信息资源管理 >> 档案学 提交时间: 2024-07-31 合作期刊: 《兰台世界》
摘要:针对档案信息利用成本高、利用率低、编研困难等问题,本研究实现了基于深度学习的档案多模态智能编纂方法。考虑到编纂知识的准确性和多样性,结合NLP及其图像处理技术将档案知识进行了关键信息抽取;为了保证生成内容与实际业务相符且较为规范,设计了档案业务主题模板及其编纂规则,并结合ChatGLM实现了档案主题内容智能编纂。
分类: 信息资源管理 >> 情报学 提交时间: 2024-04-10 合作期刊: 《情报资料工作》
摘要:目的/意义 互联网环境下,移动社交媒体中的图像文字等多模态用户生成内容(UGC)已成为影响用户决策的重要信息类型。关于其用户信息采纳的研究大多将图文等多模态内容割裂看待,导致UGC的多维特征,尤其是融合特征,对用户信息采纳的综合影响机制尚不清晰。 方法/过程 文章选取小红书这一代表性的经验分享型移动社交媒体作为研究对象,利用自然语言处理与机器视觉技术对信息分析方法进行改进,提出覆盖图文深层、浅层以及融合特征的多模态UGC多维特征测度方法,并进一步构建多维特征对用户信息采纳的影响机制计量模型。 结果/结论 研究发现,两种图文协调性特征对于用户信息采纳的影响力显著高于单独的图像或文字特征;图文浅层特征比深层特征的影响力更大;影响用户信息采纳的各关键特征之间存在调节作用;自然、物体和其他这三类场景中的具体影响机制存在异质性。研究对于促进移动社交媒体中高质量的UGC创作和有效的信息采纳具有重要参考价值。