英特尔在Vision 2024大会上,宣布推出Intel Gaudi 3 AI加速器,与前代产品相比,Gaudi 3为BF16提供4倍AI运算能力、1.5倍内存带宽以及2倍网络带宽,可扩展大规模系统,将有助大型语言模型(LLM)和多模态模型的AI训练和推理,大幅提升性能和生产力。
Intel Gaudi 2 AI加速器是市场上唯一通过MLPerf基准测试的LLM解决方案,性能和效率皆通过验证。英特尔通过开源社交媒体软件和符合业界标准的以太网络,为客户提供可灵活扩展系统的新选择。
英特尔执行副总裁暨数据中心与AI解决方案宏观经济理Justin Hotard表示:“AI市场瞬息万变,但产品间仍存在巨大差距。不论是来自客户还是更广泛市场的反馈,皆反映对更多选择的渴望。企业须权衡可用性、可扩展性、性能、成本和能源效率等因素。Intel Gaudi 3作为生成式AI的新选择,凭借性价比、系统可扩展性和时间成本优势的完美结合脱颖而出。”
金融、制造和医疗保健等关键领域的企业,目前正快速提升AI的普及化,并积极将生成式AI计划从试验阶段转为全面实施。为了应对转型、推动创新并完成营收增长目标,企业需要开放、符合成本效益且更节能的解决方案和产品,以符合投资报酬率(ROI)和运营效率需求。
Intel Gaudi 3加速器将满足这些需求,并通过开放社交媒体软件和开放标准的以太网络,协助企业灵活扩展AI系统和应用。
定制化基础架构如何提升生成式AI性能和效率:Intel Gaudi 3加速器专为高效的大规模AI运算打造,采用相较前一代产品更先进的5纳米制程。其设计允许同时启动所有引擎以提升速度,包括矩阵乘法引擎(MME)、张量处理器核心(TPC) 和网络适配器(NIC),进而实现更高速、高效的深度学习运算和规模扩展。Gaudi 3加速器的主要特点包括:
Intel Gaudi 3加速器将为领先生成式AI模型的训练和推理,带来显著的性能提升。与Nvidia H100相比,Gaudi 3加速器的平均性能预期将为:
Intel Gaudi 3加速器将于2024年第二季,向OEM提供通用基板和开放加速器模型(Open accelerator module, OAM)的业界标准配置。包含戴尔科技、慧与科技(HPE)、联想和美超微等知名OEM,都将采用Gaudi 3。Intel Gaudi 3加速器预计于2024年第三季全面上市,Intel Gaudi 3 PCIe附加卡预计于2024年第四季上市。
英特尔打破使用限制,为企业生成式AI市场提供新选择
Intel Gaudi 3加速器也将支持多个高成本效益LLM基础架构,协助训练和推理,并为包括NAVER在内的组织提供性价比优势和选择。
开发者从今日起即可访问Intel Developer Cloud上以Intel Gaudi 2为基础的实例,以学习、创建原型、测试和执行应用程序与工作负载。
Intel Gaudi 3加速器的发展将为英特尔下一代针对AI和高性能计算的GPU Falcon Shores奠下基石。Falcon Shores将集成Intel Gaudi和Intel Xe的知识产权(IP),以及创建在Intel oneAPI规范的单一GPU可程序化界面。
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/230443.html