Meta推出Llama 3大模型在集成近25000块英伟达H100计算集群上训练

TechWeb2024-04-19 12:11:38 74

[TechWeb]4月19日消息，据外媒报道，Meta公司在当地时间周四推出了他们最新一代大语言模型Llama3的早期版本，并宣布推出基于这一模型打造的人工智能助手MetaAI。

从外媒的报道来看，同前一代大模型Llama2一样，Meta新一代的Llama3大模型，也注重供用户免费使用，目前已有两种不同参数版本的Llama3可供用户使用，分别为80亿参数和700亿参数，均已可在Meta官网下载。

对于Llama3大语言模型，Meta公司CEO马克?扎克伯格在接受采访时透露，他们在训练700亿参数的模型时，使用了15Ttokens的数据，在训练过程中模型从未达到饱和状态，也就是从未在能力提升过程中遇到瓶颈，Meta最终也解决了训练过程中遇到的问题，并转向训练其他的模型。

正如外媒在报道中所提到的一样，Meta目前推出的还只是Llama3的早期版本，他们还在训练更强大的模型。外媒在报道中就提到，Meta已宣布他们目前正在训练有4000亿参数的Llama3模型，部分专家认为他们的这一模型，在MMLU、GPQA、HumanEval、MATH等方面的表现，将与OpenAI的GPT-4Turbo,Anthropic的Claude3Opus和谷歌的GeminiUltra相当。

作为全球人工智能领域重要参与者的英伟达，在Meta训练的Llama3上也发挥了关键作用，提供了大量的GPU。

在Meta宣布推出Llama3之后不久，英伟达就在官网上披露，Meta的工程师是在集成了24,576块H100GPU的计算集群上训练的Llama3，这些GPU通过英伟达的Quantum-2InfiniBand网络连接。在英伟达的支持下，Meta也为他们的旗舰模型调整了网络、软件和模型架构。（海蓝）

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益，请与本站联系，我们将及时更正、删除、谢谢。
https://www.414w.com/read/283516.html

随机主题

品牌出海“搭便车”：看似捷径实则弯路决胜局终极绝杀，希金斯再现巅峰时刻，翻袋助力单局逆转万代南梦宫预测《艾尔登法环》DLC销量将会非常高看不到武磊vs孙兴慜? 媒体人: 孙兴慜恐无法参加与中国队的比赛三分射手胜过高中锋! 火箭3号签摘控卫? 内线拥挤, 摘后卫补短板西安举办2024年国际生物多样性日主题宣传活动第一视角试驾视频 2023款捷尼赛思 G90 1/5 万吨大驱率编队赴南海训练！它的兵力构成和课目设置有何讲究？中场进攻底线分点能力都有提升继续加油美股收评: 三大指数集体下跌, 太阳能、通讯设备板块走高, 金属、采矿、油气股跌幅居前男网红“请假几天”引热议, 网友问何时关闭打赏? 已经影响下一代内地封杀的女星, 被岛国拍出来了吞噬星空大改, 界中界血腥混战, 罗峰抱大腿, 雾大人杀疯了为什么很多人讨厌国漫的超前点播, 但又希望快点出, 原因有两个 Faker喜提2个新皮肤! 姿态4连胜被终结, 小微笑怒喷MLXG: 没脑子乐道L60开启预售, 起售价为21.99万元 35万以上豪华车, 合资+纯电, TA就是销量冠军, 一口气攀登67名从八十年代倒卖国债中我们能学到什么三个女学生相约抗日, 两人半途而废, 一人成为开国大将夫人求新、求变的《梦幻西游》追求的是有血有肉的角色!有人认为职业年金是私分国有资产的由头, 你认为这种说法靠谱吗?

最新回复(0)

Meta推出Llama 3大模型 在集成近25000块英伟达H100计算集群上训练

Meta推出Llama 3大模型在集成近25000块英伟达H100计算集群上训练