欢迎新会员 发表于 2025-3-12 22:29:04

又出来一个大模型 minimax ... 最近速度好快啊

<i class="pstatus"> 本帖最后由 欢迎新会员 于 2025-3-12 22:30 编辑 </i><br />
<br />
MiniMax-01开源:新架构开启Agent时代<br />
<br />
https://minimaxi.com/news/minimax-01-%E7%B3%BB%E5%88%97<br />
<br />
在 MiniMax-01系列模型中,我们做了大胆创新:首次大规模实现线性注意力机制,传统 Transformer架构不再是唯一的选择。这个模型的参数量高达4560亿,其中单次激活459亿。模型综合性能比肩海外顶尖模型,同时能够高效处理全球最长400万token的上下文,是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。<br />
<br />
基于业界主流的文本和多模态理解测评结果如下图所示,我们在大多数任务上追平了海外公认最先进的两个模型,GPT-4o-1120以及Claude-3.5-Sonnet-1022。在长文任务上,我们对比了之前长文最好的模型 Google的Gemini。如图(c)所示,随着输入长度变长,MiniMax-Text-01 是性能衰减最慢的模型,显著优于Google Gemini。<br />
<br />

欢迎新会员 发表于 2025-3-12 22:33:37

嗯,还开源了,虽然我看不懂<br />
<br />
https://github.com/MiniMax-AI

hkbbdx 发表于 2025-3-12 22:40:11

试了一下,发现还可以

laox 发表于 2025-3-12 22:42:27

哪家公司的?

欢迎新会员 发表于 2025-3-12 22:50:06

<div class="quote"><blockquote><font size="2"><a href="https://hostloc.com/forum.php?mod=redirect&goto=findpost&pid=16277674&ptid=1395533" target="_blank"><font color="#999999">laox 发表于 2025-3-12 22:42</font></a></font><br />
哪家公司的?</blockquote></div><br />
稀宇极智科技(MiniMax) <br />
https://www.thepaper.cn/newsDetail_forward_29692389

zhujisou 发表于 2025-3-12 22:42:00

大模型四小龙 很早的玩家了
页: [1]
查看完整版本: 又出来一个大模型 minimax ... 最近速度好快啊