为什么Qwen模型总给我一种又土又low的感觉?
来源:
编辑:
时间:2025-06-23 11:15:18

本来用下来对Qwen3印象不太好,但30B A3B这个惊呆了,台式机265k用cpu跑都有30多的速度,得益于Moe架构,每次只激活3b参数,压力很低,可用度非常高。
虽然经常吐槽qwen模型思考链又臭又长来刷分,但也是对比deepseek 671b版来说的,但只看开源小模型,32b模型它家之前qwq 包括这次的qwen3 32b和30b没啥好挑的了。
。
-
{dede:pagebreak/}


网友评论:
{dede:include file='ajaxfeedback.htm' /}
栏目分类

最新文章

热门文章
- 浏览器解析Html一般是边下载边渲染么?如果是边下载边渲染的话,Html又使用GZIP格式传输,如何能够做到没有完全下载就可以渲染的呢?
- 《诡秘之主》动画已经播出,感觉怎么样?符不符合大家的期待?
- 什么是Android逆向?如何学习安卓逆向?
- 如何评价电影《碟中谍8:最后清算》?
- 公司规定所有接口都用 post 请求,这是为什么?
- 只有我觉得.doc文件比.docx文件便捷吗?
- 最近突发奇想,想做以NAS为主的家用媒体中心。下面是我做的一个草图,各位大神看看可行吗?
- 你觉得《捞女游戏》会因为不可抗力而被下架吗?
- Node.js 性能为什么这么差?
- 求大神解答,为什么大家都不喜欢用docker?
