推广 热搜： 边框产量方形 pc材料工序投资税收分类 2022 低周疲劳冬季

Meta发布Llama 3.3开源模型：700亿参数媲美4050亿，支持7种语言

日期：2024-12-08 来源：网络整理作者：二手钢材网浏览：135 评论：0

核心提示：架构整合了分组查询注意力（GQA），在推理期间提高了可扩展性和性能。用简单的话来总结，Llama用百亿参数规模达到了千亿参数的性能，同时必然带来了成本的大幅降低。有媒体报道称，某些情况下，低参数模型的GPU内存需求甚至可以低至4GB。

《AI未来指南北》客座作者肖静

“12天科技直播嘉年华”第二天，北京时间12月7日凌晨1点，meta发布了最新开源模型Llama 3.3。 meta 生成人工智能副总裁 Ahmad Al-Dahle 表示

Al-Dahle 在 X 上发布了一张图表，显示 Llama 3.3 70B 在多个行业基准测试中优于 1.5 Pro、 GPT-4o 和亚马逊新发布的 Nova Pro。

Llama 3.3支持除英语之外的7种语言：法语、德语、印地语、意大利语、葡萄牙语、西班牙语和泰语。该模型还引入了多项增强功能，包括更长的 128k 令牌上下文窗口（与 GPT-4o 相比，大约 400 页文本），使其适合长格式内容生成和其他高级用例。该架构结合了分组查询注意 (GQA)，以提高推理过程中的可扩展性和性能。

简单来说，Llama用百亿参数实现千亿参数的性能，必然会带来成本的大幅降低。

可以节省多少成本？

GPU显存需求方面，根据博客的数据，Llama 3.1-405B需要243GB到的GPU显存，而Llama 2-70B需要42-168GB的GPU显存。

有媒体报道称，在某些情况下，低参数机型的GPU显存要求甚至可以低至4GB。这意味着，如果部署 Llama 3.3，用户预计可以节省高达 24 倍的内存，从而有可能减少标准 80GB H100 GPU 的 GPU 负载。每个 H100 GPU 的成本约为 25,000 美元，这可能意味着高达 600,000 美元的前期 GPU 成本节省，这还不包括持续的电力成本节省。

现在，Llama 3.3可以通过meta、Face等平台下载。开源许可证是 Llama 3.3 社区许可证。这是一份非排他性、免版税的协议，允许用户合法使用、复制、分发和修改 Llama 3.3 模型。及其输出，支持模型输出的重用，例如合成数据生成和模型蒸馏，但对于每月活跃用户超过 7 亿的大型组织，需要来自 meta 的商业许可证，而不是使用社区许可证。

参考：

标签： 开源模型 700亿参数 7种语言 GPU内存商业许可

打赏

更多>同类资讯

0 条相关评论

• Infinity自回归文生图模型超越Stable Diffusion	• OpenAI与Google DeepMind发布新视频生成模型，
• Meta发布70亿参数Llama 3.3 AI模型，性能媲美40	• 开源大模型王座易主，Reflection 70B 全面超越
• 明星 AI 创企 Runway 竟悄咪咪删库跑路，开源模	• 阿里云通义千问发布最强开源模型 Qwen2-72B，中
• Meta 推出最强开源模型 Llama 3.1 405B，可与 G

• 滤芯PD/PDP130+2901300106阿托拉斯滤	• 滤芯PD130+2901200405滤芯DD25+阿托拉斯滤
• 不锈钢过滤器不锈钢压缩空气过滤器	• 304L不锈钢过滤器 316L不锈钢过滤器
• 真空除菌过滤器食品级过滤器	• 304不锈钢过滤器 316L不锈钢过滤器
• JDG800给料机配件无极调速器摆线减速机	• GLD800/7.5给料机锰钢甲带柔性甲带片穿条
• 真空除菌过滤器食品级过滤器	• 304不锈钢过滤器 316L不锈钢过滤器

Meta发布Llama 3.3开源模型：700亿参数媲美4050亿，支持7种语言

推荐资讯

推荐图文资讯

一艘一万吨的货船一般造价是多少钱？(组图)

英特尔与高通口水战：高通处理器能否挑战英

钢板重量怎么算？钢板理论重量计算公式是什

日照钢铁收购营口中板，中国制造业更是雄居

联发科 Helio G81-Ultra 处理器性能分析：4

有哪些钢材会被用来制造剑呢？这些钢材的优

资讯点击排行

热门标签

推荐视频

最新加入公司