腾讯发布自研混元T1正式版:吐字速度最快可达80tokens/s

新重庆-重庆日报精选

2025-03-22 21:00

3月22日下午消息,腾讯宣布推出自研深度思考模型混元T1正式版,目前已上线腾讯云官网,并即将在腾讯元宝灰度上线。

该模型以腾讯于 2 月底发布的新一代快思考模型混元Turbo S为基座打造,是一款能秒回、吐字快、擅长超长文处理的强推理模型,性能保持业界领先。

通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元T1正式版进一步提升了推理能力。与此前已上线腾讯元宝的混元T1-preview模型相比,综合效果明显提升。

在体现推理模型基础能力的常见benchmark上,如大语言模型评估增强数据集MMLU-PRO中,混元T1取得87.2分,仅次于o1。在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到业界领先推理模型的水平。

此外,T1还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。

混元T1正式版沿用了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型。

这一架构有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache的内存占用,从而显著降低了训练和推理成本,让混元T1实现首字秒出,吐字速度达到最快80 tokens/s。

目前,混元T1正式版已在腾讯云官网上线,输入价格为每百万tokens 1元,输出价格为每百万tokens 4元。(罗宁)

来源: 新浪科技  
编辑: 彭光瑞   主编:王萃      审核: 王成
版权声明:

凡注明来源重庆日报的作品,版权均属重庆日报所有,未经授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:重庆日报网”。违反上述声明者,本网将追究其相关法律责任。

除来源署名为重庆日报稿件外,其他所转载内容之原创性、真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考并自行核实。

相关新闻
网站首页| 重报集团| 关于我们| 广告业务| 投稿信箱

Copyright © 2000-2022 CQNEWS Corporation, All Rights Reserved.

重庆日报版权所有 未经书面授权 不得复制或建立镜像

地址:重庆市渝北区同茂大道416号 邮编:401120 广告招商:023-63907707 传真:023-63907104 举报电话:023-63823333   违法和不良信息举报中心热线:12377

互联网新闻信息服务许可证编号50120180001 互联网出版许可证号:(署)网出证(渝)字002号  渝ICP备17015920号

渝公网安备 50011202500747号