今年早些时候,谷歌推出了 AI Test Kitchen,这是一款 Android 应用程序,可让用户与其最先进的 AI 聊天机器人之一 LaMDA 2 交谈。今天,该公司正在开放注册以进行早期访问。你可以在这里注册,谷歌表示很快就会让人们下载应用程序并开始聊天。(虽然它现在仅限于美国用户。)
有趣的是,考虑到 Meta 在本月早些时候采取了几乎相同的举措,将其最新最好的 AI 聊天机器人 BlenderBot 3 开放给公众使用。当然,人们很快发现他们可以让 BlenderBot 说出令人毛骨悚然或不真实的话(甚至批评 bot 的名义老板马克扎克伯格),但这就是发布这些演示的全部意义所在。
人工智能研究人员表示,在野外测试聊天机器人仍然很有帮助
正如 Facebook AI Research (FAIR) 的研究工程经理 Mary Williamson 在本月初告诉我的那样,许多公司不喜欢在野外测试他们的聊天机器人,因为他们所说的话会对公司造成损害,因为与微软的 Tay。但对于许多研究人员来说,改进这些相同的机器人的最佳方法是将它们投入公共领域,在那里喋喋不休的民众将进行压力测试并以任何公正的工程师梦寐以求的方式操纵它们。
“从广义上讲,对机器人说无益的事情缺乏容忍是不幸的,”威廉姆森说。“而我们正在努力做的是非常负责任地发布它并推动研究向前发展。”
在这方面比较 Google 和 Meta 很有趣,因为 Meta 对与 BlenderBot 交互的限制肯定更少。另一方面,谷歌将与 LaMDA 2 的对话限制为几种基本模式。正如我在公告中所写:
该应用程序具有三种模式:“想象一下”、“谈论它”和“列出它”,每种模式都旨在测试系统功能的不同方面。“Imagine It”让用户说出一个真实或虚构的地方,LaMDA 会随后描述(测试是 LaMDA 是否能匹配你的描述);“谈论它”提供了一个对话提示(如“与网球谈论狗”),目的是测试人工智能是否停留在主题上;而“列出它”要求用户命名任何任务或主题,目的是查看 LaMDA 是否可以将其分解为有用的要点(因此,如果您说“我想种菜园”,响应可能包括子- 诸如“你想种什么?”和“水与护理”之类的话题)。
这意味着虚拟舌头令人尴尬的失误的可能性肯定会降低。但是,我敢打赌,不会完全消除。