微软致力于负责任地推进人工智能的发展,使每个人和组织都能取得更大的成就。在过去的几个月里,我们谈到了我们的Azure基础设施、Azure认知服务和Azure机器学习的进步,以使Azure更好地支持我们所有客户的AI需求,无论其规模如何。同时,我们还与世界上一些领先的研究机构密切合作,使他们能够建立伟大的人工智能。
今天,我们很高兴地宣布,我们与Meta的合作正在扩大。Meta公司已经选择Azure作为战略云提供商,帮助加速人工智能的研究和开发。
作为这种深入关系的一部分,Meta公司将扩大对Azure超级计算能力的使用,以加速其Meta人工智能小组的人工智能研究和开发。Meta公司将利用由5400个GPU组成的专用Azure集群,使用Azure中最新的虚拟机(VM)系列(NDm A100 v4系列,采用英伟达A100 Tensor Core 80GB GPU),用于其部分大规模AI研究工作负载。2021年,Meta公司在体验了Azure令人印象深刻的性能和规模之后,开始使用微软Azure虚拟机(NVIDIA A100 80GB GPU)进行一些大规模的AI研究。与其他公共云产品相比,虚拟机之间的GPU-to-GPU带宽是四倍,Azure平台能够实现更快的分布式人工智能训练。例如,Meta利用这一点来训练他们最近的OPT-175B语言模型。Azure上的NDm A100 v4虚拟机系列还为客户提供了灵活性,可以自动和动态地配置任何规模的集群,从几个GPU到几千个,并能够在实验期间暂停和恢复。现在,Meta AI团队正在扩大使用范围,将更多前沿的机器学习训练工作负载带到Azure,以帮助进一步推进他们领先的AI研究。
此外,Meta和微软将合作扩大PyTorch在Azure上的应用,并加速开发者从实验到生产的过程。Azure为PyTorch用户提供了一个全面的自上而下的堆栈,拥有一流的硬件(NDv4s和Infiniband)。在未来几个月,微软将建立新的PyTorch开发加速器,以促进在Azure上快速实施基于PyTorch的解决方案。微软还将继续为PyTorch提供企业级支持,使客户和合作伙伴能够在云和边缘的生产中部署PyTorch模型。
Meta公司人工智能副总裁Jerome Pesenti表示:”我们很高兴能深化与Azure的合作,以惠及全球更多开发者的方式推进Meta的人工智能研究、创新和开源工作。”有了Azure的计算能力和每个虚拟机1.6TB/s的互连带宽,我们能够加快我们不断增长的训练需求,以更好地适应更大和更创新的AI模型。此外,我们很高兴与微软合作,将我们的经验扩展到他们的客户,在他们从研究到生产的旅程中使用PyTorch。”
通过扩展Azure的超级计算能力,为全球领先的研究机构训练大型人工智能模型,并通过扩大开源合作和实验的工具和资源,我们可以帮助为开发人员和更广泛的技术社区释放新的机会,并进一步推动我们的使命,以增强世界各地的每个人和组织。
原文链接:https://www.cnblogs.com/taylorshi/p/16315383.html
原创文章,作者:优速盾-小U,如若转载,请注明出处:https://www.cdnb.net/bbs/archives/8151