保护隐私的协作机器学习
训练机器学习模型以有效执行图像分类等任务涉及向模型展示数千、数百万甚至数十亿的示例图像。当隐私是一个问题时,例如医学图像,收集如此庞大的数据集尤其具有挑战性。麻省理工学院和诞生于麻省理工学院的初创公司DynamoFL的研究人员现在已经针对这个问题采取了一种流行的解决方案,即联邦学习,并使其更快、更准确。
联合学习是一种用于训练机器学习模型的协作方法,该模型可将敏感的用户数据保密。成百上千的用户在自己的设备上使用自己的数据训练自己的模型。然后,用户将他们的模型传输到中央服务器,中央服务器将它们结合起来,提出一个更好的模型,然后发回给所有用户。
例如,位于世界各地的医院可以使用这种方法来训练机器学习模型,以识别医学图像中的脑肿瘤,同时保证患者数据在本地服务器上的安全。
但是联邦学习有一些缺点。将大型机器学习模型传入和传出中央服务器需要移动大量数据,这具有很高的通信成本,尤其是因为模型必须来回发送数十次甚至数百次。此外,每个用户都收集自己的数据,因此这些数据不一定遵循相同的统计模式,这会影响组合模型的性能。并且该组合模型是通过取平均值得出的——它不是针对每个用户进行个性化的。
研究人员开发了一种技术,可以同时解决联邦学习的这三个问题。他们的方法提高了组合机器学习模型的准确性,同时显着减小了其大小,从而加快了用户与中央服务器之间的通信。它还确保每个用户收到一个更适合其环境的个性化模型,从而提高性能。
与其他技术相比,研究人员能够将模型大小减少近一个数量级,这导致个人用户的通信成本降低了四到六倍。他们的技术还能够将模型的整体准确性提高约10%。
“很多论文都解决了联邦学习的一个问题,但挑战在于将所有这些放在一起。仅关注个性化或通信效率的算法并不能提供足够好的解决方案。我们希望确保我们能够针对所有内容进行优化,因此这种技术实际上可以在现实世界中使用,”VaikkunthMugunthan博士说。'22,介绍该技术的论文的主要作者。
Mugunthan与他的顾问、资深作者、计算机科学与人工智能实验室(CSAIL)的首席研究科学家LalanaKagal共同撰写了这篇论文。这项工作将在欧洲计算机视觉会议上发表。
将模型切割成合适的尺寸
研究人员开发的名为FedLTN的系统依赖于机器学习中的一个概念,即彩票假说。这个假设表明,在非常大的神经网络模型中,存在可以实现相同性能的更小的子网络。找到其中一个子网类似于找到中奖彩票。(LTN代表“彩票网络”。)
松散地基于人脑的神经网络是机器学习模型,它学习使用互连的节点或神经元层来解决问题。
找到一个中奖彩票网络比简单的刮刮更复杂。研究人员必须使用一种称为迭代修剪的过程。如果模型的准确度高于设定的阈值,它们会移除节点和它们之间的连接(就像从灌木上修剪树枝一样),然后测试更精简的神经网络以查看准确度是否保持在阈值之上。
其他方法已将这种剪枝技术用于联合学习,以创建更小的机器学习模型,这些模型可以更有效地转移。但是,虽然这些方法可能会加快速度,但模型性能会受到影响。
Mugunthan和Kagal应用了一些新技术来加速修剪过程,同时使新的、更小的模型对每个用户更加准确和个性化。
他们通过避免将修剪后的神经网络的其余部分“倒回”到其原始值的步骤来加速修剪。Mugunthan解释说,他们还在修剪模型之前对其进行了训练,这使其更准确,因此可以更快地修剪它。
为了使每个模型对用户的环境更加个性化,他们小心翼翼地不剪掉网络中捕获有关该用户特定数据的重要统计信息的层。此外,当模型全部组合在一起时,它们利用了存储在中央服务器中的信息,因此每一轮通信都不是从头开始的。
他们还开发了一种技术,以减少使用资源受限设备(如慢速网络上的智能手机)的用户的通信次数。这些用户使用已经由其他用户子集优化的更精简的模型开始联邦学习过程。
通过彩票网络赢得大奖
当他们在模拟中对FedLTN进行测试时,它带来了更好的性能并全面降低了通信成本。在一个实验中,传统的联合学习方法生成了一个大小为45MB的模型,而他们的技术生成了一个具有相同精度的模型,只有5MB。在另一项测试中,最先进的技术需要用户和服务器之间12,000兆字节的通信来训练一个模型,而FedLTN只需要4,500兆字节。
使用FedLTN,表现最差的客户仍然看到超过10%的性能提升。Mugunthan补充说,总体模型准确性比最先进的个性化算法高出近10%。
现在他们已经开发并微调了FedLTN,Mugunthan正在努力将该技术整合到他最近创立的联邦学习初创公司DynamoFL中。
展望未来,他希望继续改进这种方法。例如,研究人员已经证明使用带有标签的数据集取得了成功,但更大的挑战是将相同的技术应用于未标记的数据,他说。
Mugunthan希望这项工作能够激发其他研究人员重新思考他们如何处理联合学习。
“这项工作显示了从整体方面考虑这些问题的重要性,而不仅仅是必须改进的个别指标。有时,改进一个指标实际上会导致其他指标的降级。相反,我们应该关注如何我们可以一起改进一堆东西,如果要在现实世界中部署它,这非常重要,”他说。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
宝子们,杭州 房子装修完成啦!这次要给大家分享几家设计超赞的装修公司哦。它们各具特色,从空间规划到风格...浏览全文>>
-
欲筑室者,先治其基。在上海,装修房子对于每个业主而言,都是极为关键的一步,然而,如何挑选一家值得信赖的...浏览全文>>
-
2025年以来,联通支付严格贯彻落实国家战略部署,以数字和科技为驱动,做好金融五篇大文章,履行支付为民社会...浏览全文>>
-
良工巧匠,方能筑就华居;精雕细琢,方可打造美家。当我们谈论装修公司时,选择一家靠谱可靠的公司是至关重要...浏览全文>>
-
在当今社会,随着城市化进程的高速推进,建筑垃圾的产生量与日俱增。据权威数据显示,我国每年建筑垃圾产生量超 ...浏览全文>>
-
家人们,在上海要装修,选对公司那可太重要了!古语有云:"安得广厦千万间,大庇天下寒士俱欢颜。"一个温馨的...浏览全文>>
-
近年来,新能源汽车市场发展迅猛,各大品牌纷纷推出各具特色的车型以满足消费者多样化的需求。作为国内新能源...浏览全文>>
-
近年来,随着汽车市场的不断变化和消费者需求的升级,安徽滁州地区的宝来2025新款车型在市场上引起了广泛关注...浏览全文>>
-
随着汽车市场的不断变化,滁州地区的消费者对高尔夫车型的关注度持续上升。作为大众品牌旗下的经典车型,高尔...浏览全文>>
-
在2023年,大众探影以其时尚的设计和出色的性能赢得了众多消费者的青睐。作为一款小型SUV,探影凭借其紧凑的车...浏览全文>>
- 安徽滁州途安L新车报价2022款,最低售价16.68万起,入手正当时
- 小鹏G7试驾,新手必知的详细步骤
- 别克GL8预约试驾,4S店的贴心服务与流程
- 安徽阜阳ID.4 CROZZ落地价全解,买车必看的省钱秘籍
- 淮北探岳多少钱 2025款落地价,最低售价17.69万起现在该入手吗?
- 安徽淮南大众CC新款价格2025款多少钱能落地?
- 淮北长安启源C798价格,最低售价12.98万起现在该入手吗?
- 安徽淮南途锐价格,各配置车型售价全解析
- 蒙迪欧试驾预约,4S店体验全攻略
- 沃尔沃XC40试驾需要注意什么
- 滁州ID.4 X新车报价2025款,各车型售价大公开,性价比爆棚
- 试驾思域,快速操作,轻松体验驾驶乐趣
- 试驾长安CS35PLUS,一键搞定,开启豪华驾驶之旅
- 天津滨海ID.6 X落地价限时特惠,最低售价25.9888万起,错过不再有
- 天津滨海凌渡多少钱?看完这篇购车攻略再做决定
- 安徽池州长安猎手K50落地价,买车前的全方位指南
- 山东济南ID.6 CROZZ 2024新款价格,最低售价19.59万起,现车充足
- 试驾海狮05EV,新手必知的详细步骤
- 生活家PHEV多少钱 2025款落地价走势,近一个月最低售价63.98万起,性价比凸显
- 奇瑞风云A9试驾,新手必知的详细步骤