国际知名大模型评测 Chatbot Arena 放榜,Qwen3-235B-A22B-Instruct-2507 斩获 1433分,超越顶尖闭源模型 Grok4、Claude4、GPT4.1,千问3位列总榜「全球第三」。
Chatbot Arena采用盲测评价机制,是AI大模型领域最具影响力的榜单之一。此次千问3的1433分,是全球开源大模型和中国大模型的历史最高分。同时,千问3还在5个关键能力子项中摘得「全球第一」,包括数学(math)、代码(coding)、复杂提示(hard prompts)、长文本检索(longer query)和指令遵循(instruction following)。
青海配资开户提示:文章来自网络,不代表本站观点。