多年来,Google翻译通过将性别无关的工作与特定性别相关联来显示性别偏见:医生为男性,护士为女性。在2018年,这家搜索巨头解决了该问题,为土耳其语等中性语言提供了两种性别的句子翻译。
昨天,Google的AI团队发布了一种更具可扩展性的新模型,这意味着它可以用于翻译其他语言的短语。这个新的推出为从英语到西班牙语以及从芬兰语,匈牙利语和波斯语到英语的针对性别的翻译提供了支持。
该公司在一篇博客文章中解释说,当它采用将土耳其语翻译成其他语言的旧方法时,发现最终结果有误。该团队表示,虽然使用一个神经机器翻译(NMT)系统无法显示特定性别的翻译查询的40%以上,作为两个翻译不只是性别有关的现象比较。
在较旧的方法中,系统在流程的第二步中生成了针对性别的翻译。系统会通过第一步生成翻译来转换在较新模型中进行的处理。第二步,AI使用一个新建的重写器,如果输入是性别,它会咳嗽出另一种翻译。
为了培训重写者,该团队首先使用了数百万个英语句子来创建基本模型。然后,研究人员对其进行了训练,使其从女性输入到男性输出,反之亦然。最后,将两个方向的结果合并以创建基于变压器的序列到序列单层模型。
Google还开发了一种减少偏见的模型来评估系统选择一种性别而不选择另一种性别时的偏见。该公司声称,新模型显示性别特定翻译的准确性为97%。