阿卜杜拉国王科技大学(KAUST)首次通过大规模数据集展示了多种语言和文化中的情绪如何因视觉刺激而发生变化。
ArtELingo是一个多语言数据集,具有通过接触80,000种多种语言的视觉刺激(视觉艺术作品)构建的情感解释。它的当前版本已被数据集接受,其中包括针对英语、汉语和阿拉伯语的每种语言的420,000多个此类注释。还收集了来自拉丁美洲和拉丁美洲的1000多件艺术品的西班牙文小版本,以探索说同一种语言的两种不同文化在构建情感方面的差异。
ArtELingo论文在2022年自然语言处理经验方法会议(EMNLP)上发表。
ArtELingo是朝着创建能够很好地代表西方和非西方文化的多元文化数据集迈出的一步。这将特别有助于那些在研究文化和跨文化心理学时寻找数据的人。总的来说,这项研究有助于推动构建更多与人类兼容的人工智能,了解我们的情感和文化存在。
该项目由KAUST的YoussefMohamed、MohamedAbdelfattah、ShymaAlhuwaider、FeifanLi和MohamedElhoseiny(PI)以及来自圣母大学(XiangliangZhang)和KennethWardChurch(东北大学)的合作者开发。
作者感谢百度、北京时间对中文版数据集收集的支持,以及来自埃及(主要)和沙特阿拉伯的数十所大学收集阿拉伯语版本。
该作品发表在arXiv预印本服务器上。