8月2日报道,刚刚,知名ai大模型评测chatbot arena放榜!
阿里qwen3-235b-a22b-instruct-2507位列大语言模型总榜第三,月之暗面kimi-k2-0711-preview、深度求索deepseek-r1-0528并列为总榜第五,以开源之姿超越claude 4、gpt-4.1等顶尖闭源模型。
多模态大模型中,字节图像生成模型seedream-3位列文生图榜第五,字节图像编辑模型seededit-3.0、字节开源统一多模态基础模型bagel、阶跃星辰开源图像编辑模型step1x-edit分别位列图像编辑榜第五、第七、第八。
在7月30日公布的chatbot arena编程榜单中,深度求索deepseek-r1-0528、阿里qwen3-coder并列第一,月之暗面kimi-k2-instruct位列第七。
其中,阿里qwen3-235b-a22b-instruct-2507、阿里qwen3-coder、月之暗面kimi k2均是在7月最新发布的开源模型。
赶在7月收尾、8月开头,中国ai大模型依旧在紧锣密鼓地上新,字节跳动、阶跃星辰、阿里、月之暗面近两天接连公布模型新动作。
周四晚,字节跳动seed团队发布发布实验性扩散语言模型seed diffusion preview,阶跃星辰开源基础大模型step3。周五,阿里开源“甜品级”编程模型qwen3-coder-30b-a3b-instruct,月之暗面发布kimi-k2的高速版kimi-k2-turbo-preview。
hugging face还在周五发布了中国ai社区7月重点,回溯这一个月来令人眼花缭乱的开源浪潮,包括:
✨ 另一个“deepseek时刻”——kimi k2
✨ qwen完全矩阵化- instruct / thinking / coder模型跨越30b – 480b参数规模
✨ 多模态浪潮:
glm-4.1v-thinking: image text > text
intern-s1: image text > text
wan 2.2 – text image > video
skywork-r1v3: image text > text
skywork-unipic: text > image / image > text
tar-7b: any-to-any
ming-lite-omni-1.5: any-to-any
step3: image text > text
hunyuanworld-1: image > 3d
thinksound: video > audio
neta-lumina: text > image
✨ 轻量级、可部署的模型
smallthinker runs on 1gb ram
✨ agentic编程成为主流
qwen3-coder: fully spec’d tool calling
glm-4.5: browser agents, ide assistant
qwen3 webdev demo: text-to-frontend code
✨特定领域和实用的模型/工具/数据集
science one s1: scientific model
agentar deepfinance: finance dataset
objectclear: interactive vision tool
qwen3 mt demo: machine translation tool
其中回顾的7月31个亮眼开源模型、1个框架、1个数据集,来自16家企业、高校或研究机构:阿里(9个)、月之暗面(2个)、智谱(2个)、阶跃星辰(1个)、字节跳动(2个)、昆仑万维(2个)、智源研究院(1个)、中国电信人工智能研究院(1个)、蚂蚁集团(4个)、快手(1个)、捏ta(1个)、磐石(3个)、上海交通大学(1个)、腾讯(1个)、上海人工智能实验室(1个)、复旦大学(1个)。
1、阿里(9个):编程模型qwen3-coder-30b-a3b-instruct、qwen3-coder-480b-a35b-instruct,深度思考模型qwen3-30b-a3b-thinking-2507、qwen3-235b-a22b-thinking-2507,基础模型qwen3-235b-a22b-instruct-2507、qwen3-30b-a3b-instruct-2507,cot音频模型thinksound,统一视频生成模型wan2.2-ti2v-5b,文生视频模型wan2.2-t2v-a14b。
2、月之暗面(2个):moe基础模型kimi-k2-base,与numina团队联合研发的数学定理证明模型kimina-prover-72b。
3、智谱(2个):多模态大模型glm-4.1v-9b-thinking,基础模型glm-4.5。
4、阶跃星辰(1个):基础模型step3。
5、字节跳动(2个):智能体模型tar-7b,多语言翻译模型seed-x-instruct-7b。
6、昆仑万维(2个):多模态推理大模型skywork-r1v3-38b,多模态统一模型skywork-unipic-1.5b。
7、智源研究院(1个):文生配音视频框架mtvcraft。
8、中国电信人工智能研究院(1个):ai-flow-ruyi-7b-preview0704。
9、蚂蚁集团(4个):多模态推理模型m2-reasoning,多模态大模型
ming-lite-omni-1.5,金融训练数据集agentar-deepfinance-100k,交互式深度推理模型kag-thinker-en-ch-7b-instruct。
10、快手(1个):自适应思考模型kat-v1-40b。
11、捏ta(1个):动漫风格图像生成模型neta-lumina。
12、磐石(3个):科学基础大模型s1-base-671b、s1-base-8b、s1-base-32b。
13、上海交通大学(1个):端侧原生大模型smallthinker-4ba0.6b-instruct。
14、腾讯(1个):3d世界生成模型hunyuanworld-1。
15、上海人工智能实验室(1个):科学多模态大模型intern-s1。
16、复旦大学(1个):语音生成模型moss-ttsd-v0.5。
前两天hugging face趋势榜前十直接被华人团队包揽。如今最新榜单中,华人团队占据前十中的8席,其中智谱占2席、腾讯占1席、阿里占4席、ai大神李沐的美国创业公司bosonai占1席。
从最新的hugging face趋势榜top100,我们梳理出其中的中国ai开源团队名单,主要有14家企业及独立研究机构,分别是智谱、腾讯、阿里、上海人工智能实验室、月之暗面、阶跃星辰、捏ta、昆仑万维、小红书、字节跳动、蚂蚁集团、深度求索deepseek、快手、智源研究院,还有上海交通大学(smallthinker)、复旦大学(与阶跃星辰合作omnisvg)、香港城市大学(pusav1)等高校。
智象未来(hidream)、美团(meigen)、群核科技(spatiallm)、百度(ernie)、稀宇科技(minimax)、磐石(scienceone)、面壁智能(minicpm)等企业的模型虽在最新趋势榜100名开外,但也是中国开源ai生态的重要力量。
加起来,积极拥抱ai开源的中国企业,超过20家。
尤其是阿里,是无人争锋的头号“卷王”,卷得频率直接断层,在7月先后开源了音频模型thinksound、多模态推理模型humanomniv2、编程模型qwen3-coder(480b-a35b-instruct)、推理模型qwen3-235b-a22b-thinking-2507、qwen3-30b-a3b-thinking-2507、基础模型qwen3-235b-a22b-instruct-2507(非思考版)、电影级视频模型wan2.2、编程模型qwen3-coder-flash(30b-a3b-instruct),并将新模型背后的gspo新算法公开。
以下是位列最新hugging face趋势榜top100中的中国企业、独立研究机构及上榜模型:
1、智谱(7个):glm-4.5、glm-4.5-air、glm-4.5-fp8、glm-4.5-base、glm-4.5-air-fp8、glm-4.1v-9b-thinking、glm-4.5-air-base。
2、腾讯(3个):hunyuanworld-1、hunyuan3d-2.1、x-omni-en。
3、阿里(18个):qwen3-30b-a3b-instruct-2507、qwen3-coder-480b-a35b-instruct、qwen3-coder-30b-a3b-instruct、qwen3-235b-a22b-thinking-2507、wan2.2-ti2v-5b、wan2.2-t2v-a14b、qwen3-30b-a3b-thinking-2507、wan2.2-i2v-a14b、qwen3-235b-a22b-instruct-2507、wan2.2-ti2v-5b-diffusers、owen3-30b-a3b-instruct-2507-fp8、wan2.2-t2v-a14b-diffusers、wan2.2-i2v-a14b-diffusers、qwen3-coder-480b-a35b-instruct-fp8、qwen3-0.6b、qwen3-235b-a22b-thinking-2507-fp8、qwen3-30b-a3b、qwen3-8b。
4、上海人工智能实验室(2个):intern-s1、intern-s1-fp8。
5、月之暗面(1个):kimi-k2-instruct。
6、阶跃星辰(2个):step3、omnisvg(与复旦大学合作)。
7、捏ta(1个):neta-lumina。
8、昆仑万维(1个):skywork-unipic-1.5b。
9、小红书(1个):dots.ocr。
10、字节跳动(1个):seed-x-ppo-7b。
11、蚂蚁集团(1个):ming-lite-omni-1.5。
12、深度求索deepseek(2个):deepseek-r1、deepseek-r1-0528-qwen3-8b。
13、快手(1个):kat-v1-40b。
14、智源研究院(1个):bge-m3。
上榜的还有一些知名个人开发者,比如kijai,虽然无法确定国籍,但从其密集选用国产模型的动作来看,大概率是华人。
unsloth、comfy-org、bullerwins、quantstack、phr00t、英伟达等海外团队位列趋势榜前100的模型,不少用阿里qwen3、阿里wan2.2、智谱glm-4.1v等模型作为底模进行微调、蒸馏或量化。
最新hugging face趋势榜top100:
在展现受欢迎程度的“most likes”榜中,最后一次更新停留在今年3月份的旧版deepseek-r1依旧稳居第一。
不过,最受欢迎榜top10中,其他9席都是海外开源项目。期待中国开源模型继续追赶,取得更多的突破性进展。