Qwen3真香,通义App满血接入,一手实测在此
日期:2025-05-04 16:52:36 / 人气:11
一、Qwen3的发布与热度
开源大模型Qwen3预告一出便引发关注,深夜正式上线并登顶全球最强开源模型后,瞬间引爆全网热议。其纸面参数十分亮眼:8款混合推理模型全部开源,参数量从0.6B到235B全面覆盖;32B模型性能超越OpenAI o1、DeepSeek R1,在编程基准测评中超过Gemini 2.5 Pro;支持思考和非思考模式,支持119种语言和方言、加强对MCP支持等。网友认为这是“又一个DeepSeek时刻”,通义App和网页版也第一时间满血上线Qwen3并有专属智能体体验。

二、通义App中Qwen3的实测情况
(一)代码生成
空间内弹小球测试
提示词要求用p5.js脚本、25个粒子、圆柱形容器实现空间内弹小球。旗舰版Qwen3模型用时1分钟生成一百多行代码,运行后发现虽无明显错误,但缺少3D空间感。
与Grok 3模型对比,Grok 3的空间感更强。让Qwen3自己对比两段代码后,它进行了全方位分析并给出改进意见,新版本运行结果符合要求,其第一版2D效果是考虑兼容性简化成俯视图。
设计提醒喝水电脑端App
在“极简模式”下,Qwen3生成的App有模有样且能真实点击交互,具备工程能力的人可在此基础上实现更复杂效果。
(二)逻辑推理
经典逻辑陷阱题
农夫带狼、羊和菜过河问题,在关闭联网模式下,Qwen3经过推理给出正确方案,即带羊过河,返回;带狼过河,带回羊;带白菜过河,返回;带羊过河,共7次移动确保安全过河,其思维方式与人类相似,通过推翻方案找出可行路径。
专业数学题
普特南数学竞赛题目,Qwen3思考时间较长,最终用时5分38秒给出正确答案,国外网友测试中Grok 3约8分钟找到解决方案,Qwen3略胜一筹。
(三)多语言能力
Qwen3支持119种语言和方言,被网友戏称“AI届多邻国”。让它翻译莎士比亚《哈姆雷特》经典选段,它能参考优秀译本并避免侵权,最终结果与朱生豪经典译本相比,有独特的“AI味儿”。
(四)其他玩法
赛博闺蜜功能:可帮忙选择更适合发朋友圈的游客照。
购物比价功能:能分析出3000元预算内值得入手的平板,用表格列出各品牌核心参数并按不同需求推荐。
写歌功能:尝试创作五一版·大张伟嗨歌,歌词有相应风格。
三、通义App改版及网友实测情况
通义App自上个月页面改版后,整体设计更简洁,交互更完善。更多网友也进行了试玩,如进行类似“空间内弹小球”的页面设计,用阿拉伯语、法语和印地语解释爱因斯坦相对论,开发小游戏等。
四、Qwen3引发的思考与开源格局变化
Qwen3引发热议,背后体现国产大模型开源影响力有超越Llama之势,从reddit LocalLLaMA等开发者板块话题可见一斑。以Qwen为例,2024年11月底开源推理模型QwQ;2025年春节档连发Qwen2.5百万上下文版本、视觉理解模型Qwen2.5 - VL和超大规模MoE模型Qwen - 2.5 Max;2025年3月QwQ - 32B以1/10成本比肩DeepSeek - R1,多模态方面万相Wan持续开源迭代,这仅是短短5个月内的进展,加上Apache 2.0协议更开放和商用友好,开发者转向Qwen系列自然在情理之中。普通用户可在通义App感知满血模型能力,也可期待开源带来更多衍生应用可能性。
作者:天富娱乐
新闻资讯 News
- 国产PC游戏的春天:腾讯押注下...05-08
- 2025全球顶尖教育科技公司榜单:...05-08
- 斯凯奇被3G资本溢价30%收购,汉...05-08
- 山坳上的地产|中信城开佳兆业资...05-08