全球主机交流论坛备用站

 找回密码
 立即注册

QQ登录

只需一步,快速开始

全球云38元起免备案V2EX搬瓦工VPS
SEO查询超级PING网站测速
Virmach特价鸡乌云漏洞吾爱破解
查看: 101|回复: 3

在1.25欧的机器上部署蒸馏的deepseek到底多弱智

[复制链接]

16

主题

60

回帖

230

积分

中级会员

Rank: 3Rank: 3

积分
230
发表于 2025-2-12 14:40:24 | 显示全部楼层 |阅读模式
20230417
含部署指北 原文:https://zhujisou.com/1278.html

1.5b参数是头两张没有标注的图
7b、8b的也没好到哪去 哈哈哈
个人认为,7b、8b的模型 在加上向量数据库后,可以对接微信或者QQ机器人,回答一些简答的客户问题,或者伪装在线客服,反正纯CPU推理速度也就在1token/s左右,挺像是人工客服打字慢慢回来着。

如果正儿八经的需要生产力的臂助,可以考虑在scnet、autodl部署32b、70b的版本,或者使用目前成本相对较低、api可用性强于deepseek官方的硅基流动(这家也提供了很多公益的小模型api免费用)




MJJ,你的签名掉了~~~
回复

使用道具 举报

15

主题

293

回帖

887

积分

高级会员

Rank: 4

积分
887
发表于 2025-2-12 14:41:12 | 显示全部楼层
这不是蒸馏deepseek,这是蒸馏大便。
MJJ,你的签名掉了~~~
回复 支持 反对

使用道具 举报

16

主题

60

回帖

230

积分

中级会员

Rank: 3Rank: 3

积分
230
 楼主| 发表于 2025-2-12 14:43:08 | 显示全部楼层
大爷 发表于 2025-2-12 14:41
这不是蒸馏deepseek,这是蒸馏大便。

说真的 本身对1.5b的小参数模型没有抱期望,但是它思考出 兔子2条腿 2个头是真爆笑了
MJJ,你的签名掉了~~~
回复 支持 反对

使用道具 举报

3

主题

191

回帖

595

积分

高级会员

Rank: 4

积分
595
发表于 2025-2-12 14:41:00 | 显示全部楼层
deepseek的模型32B起步才能算正常点,更低的模型连字数统计都完成不了,每次让他写1000字文章只给输出四五百字。
MJJ,你的签名掉了~~~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

展开

QQ|Archiver|手机版|小黑屋|全球主机交流论坛备用站

GMT+8, 2025-4-30 21:09 , Processed in 0.044041 second(s), 26 queries , Gzip On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表