主机论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 63|回复: 3

在1.25欧的机器上部署蒸馏的deepseek到底多弱智

[复制链接]

12

主题

48

回帖

190

积分

注册会员

Rank: 2

积分
190
发表于 2025-2-12 14:40:24 | 显示全部楼层 |阅读模式
含部署指北 原文:https://zhujisou.com/1278.html

1.5b参数是头两张没有标注的图
7b、8b的也没好到哪去 哈哈哈
个人认为,7b、8b的模型 在加上向量数据库后,可以对接微信或者QQ机器人,回答一些简答的客户问题,或者伪装在线客服,反正纯CPU推理速度也就在1token/s左右,挺像是人工客服打字慢慢回来着。

如果正儿八经的需要生产力的臂助,可以考虑在scnet、autodl部署32b、70b的版本,或者使用目前成本相对较低、api可用性强于deepseek官方的硅基流动(这家也提供了很多公益的小模型api免费用)




回复

使用道具 举报

11

主题

219

回帖

655

积分

高级会员

Rank: 4

积分
655
发表于 2025-2-12 14:41:12 | 显示全部楼层
这不是蒸馏deepseek,这是蒸馏大便。
回复

使用道具 举报

12

主题

48

回帖

190

积分

注册会员

Rank: 2

积分
190
 楼主| 发表于 2025-2-12 14:43:08 | 显示全部楼层
大爷 发表于 2025-2-12 14:41
这不是蒸馏deepseek,这是蒸馏大便。

说真的 本身对1.5b的小参数模型没有抱期望,但是它思考出 兔子2条腿 2个头是真爆笑了
回复

使用道具 举报

3

主题

152

回帖

473

积分

中级会员

Rank: 3Rank: 3

积分
473
发表于 2025-2-12 14:41:00 | 显示全部楼层
deepseek的模型32B起步才能算正常点,更低的模型连字数统计都完成不了,每次让他写1000字文章只给输出四五百字。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|主机论坛

GMT+8, 2025-2-27 05:39 , Processed in 0.066692 second(s), 18 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表