为什么Qwen模型总给我一种又土又low的感觉?
来源:
编辑:
时间:2025-06-23 04:55:14

本来用下来对Qwen3印象不太好,但30B A3B这个惊呆了,台式机265k用cpu跑都有30多的速度,得益于Moe架构,每次只激活3b参数,压力很低,可用度非常高。
虽然经常吐槽qwen模型思考链又臭又长来刷分,但也是对比deepseek 671b版来说的,但只看开源小模型,32b模型它家之前qwq 包括这次的qwen3 32b和30b没啥好挑的了。
。
-
{dede:pagebreak/}


网友评论:
{dede:include file='ajaxfeedback.htm' /}
栏目分类

最新文章

热门文章
- 微软宣布 5 月 28 日开始下架「Microsoft 远程桌面」应用,背后原因有哪些?
- 20届设计系,我的设计水平很差吗,找不到合适的工作?
- 为什么现在知乎有一种j***a运行速度很慢,很吃***的论调?
- J***a,一个单据领导让把主数据存mysql,详情存mongodb中,如何保证数据一致性比较简单?
- 为何中文互联网相对英文互联网的内容质量较低?
- 上海首例认定提供爬虫程序抓取公开数据构成提供侵入计算机信息系统程序罪案,该案件有哪些细节值得关注?
- 足球运动员的身材会不会像篮球运动员一样朝着巨型化的方向发展?
- MySQL 面试中常见的问题有哪些?
- 未来20年什么是优质资产?
- 家庭网络,是否有必要做多个网段并隔离?
