微软新的Z-code模型使用“专家混合”方法,旨在使翻译和其他微软AI服务性能更好,运行效率更高。
官方于3月22日宣布,微软正在使用一组称为Z-code的AI模型更新其翻译器和其他AzureAI服务。这些更新将提高机器翻译的质量,并帮助这些服务支持的不仅仅是最常见的翻译可用训练数据较少的语言。
新的Z-code模型使用稀疏的“专家混合”方法,微软高管称这种方法运行效率更高,因为它只需要模型的一部分来完成任务。根据微软的说法,结果是:在保持计算量不变的同时,模型参数的数量大幅增加。
微软最近部署了Z-code模型,以改进其各种AzureAI服务中常见的语言理解任务,例如名称实体识别、文本摘要、自定义文本分类和关键短语提取。但今天的发展标志着“一家公司首次公开展示它可以使用这种新型专家混合模型来为机器翻译产品提供动力。”
Z-code是微软更大的XYZ-code项目的一部分,该项目旨在结合文本、视觉、音频和多种语言的模型,以创建更强大的集成AI系统,可以更好地说、听、看和理解。Z-code模型属于MicrosoftAIatScale和Turing计划,这些计划旨在开发使用大量文本数据进行预训练的大型模型,并且可以直接集成到Microsoft和客户开发的产品中。
官方表示,为了将这些模型投入生产,微软正在使用NVIDIAGPU及其Triton推理服务器来高效地部署和扩展它们。
说到NVIDIA,微软今天宣布它正在与NVIDIA合作,将其机密计算能力引入NVIDIAGPU。
Azure首席技术官兼技术研究员MarkRussinovich在3月22日的博客文章中解释了其重要性:
“对于机密GPU,数据在通过PCIe总线在CPU和GPU之间传输时会被加密,密钥在NVIDIA的设备驱动程序之间安全交换和GPU。数据被解密的唯一位置是在GPU包内的硬件保护、隔离环境中,数据可以在其中进行处理以生成模型或推理结果。与其他Azure机密计算解决方案非常相似,机密GPU支持基于加密证明在制造过程中由NVIDIA提供的唯一GPU身份。使用远程证明,组织可以独立验证其数据仅在真正且正确配置的机密GPU中处理。“