Bob Peng

Meta发布llama31405B开源模型王座一夜易主基准测试力压GPT4o

AI笔记

0

2025-04-01

Meta发布llama31405B开源模型王座一夜易主基准测试力压GPT4o

Llama 3.1模型提前泄露，基准测试出人意料

就在昨天Meta即将发布的llama3.1系列模型被提前泄露，基准测试和磁力链已经传得满天飞了。

测试结果出人意料，尤其是405B与70B.评测结果力压同类竞品。

这里要注意几个点：

llama 3.1 405B只是一个base模型。并没有进行过微调。就效果很好了
就参数量来说，llama3.1只是405B，而gpt-4o肯定是大于1800B的。
llama3.1 405B可以达到大约750tokens/s

观望

如果评测结果真实，那meta进步是巨大的。降低了企业级别大语言模型的微调门槛。可以想象如果算力支持，会有越来越多的公司可以私有化部署一个405B的模型，其能力不亚于GPT-4o。

但是评测数据集是公开的，存在一定偏见，而且不排除有拿评测数据用作预训练数据的可能。所以还有待观望。

相关链接

Llama 3.1 已推出 🔥 尽情享受吧！

• 了解一切 https://hf.co/blog/llama31
• 型号 https://hf.co/meta-llama
• 社区量化分析师 https://hf.co/hugging-quants
• 如何使用它 https://github.com/huggingface/huggingface-llama-recipes
• 尝试模型 https://hf.co/chat/models/meta-llama/Meta-Llama-3.1-405B-Instruct-FP8

0
0

quot走出去见世面quot是年轻人最值得做的事

OpenAI最新发布的o3模型未来码农或将不复存在