波波算法笔记

Bob Peng

Meta发布llama31405B开源模型王座一夜易主基准测试力压GPT4o

2025-04-01
Meta发布llama31405B开源模型王座一夜易主基准测试力压GPT4o

Llama 3.1模型提前泄露,基准测试出人意料

就在昨天Meta即将发布的llama3.1系列模型被提前泄露,基准测试和磁力链已经传得满天飞了。

测试结果出人意料,尤其是405B与70B.评测结果力压同类竞品。

这里要注意几个点:

  1. llama 3.1 405B只是一个base模型。并没有进行过微调。就效果很好了

  2. 就参数量来说,llama3.1只是405B,而gpt-4o肯定是大于1800B的。

  3. llama3.1 405B可以达到大约750tokens/s

观望

如果评测结果真实,那meta进步是巨大的。降低了企业级别大语言模型的微调门槛。可以想象如果算力支持,会有越来越多的公司可以私有化部署一个405B的模型,其能力不亚于GPT-4o。

但是评测数据集是公开的,存在一定偏见,而且不排除有拿评测数据用作预训练数据的可能。所以还有待观望。

相关链接

Llama 3.1 已推出 🔥 尽情享受吧!