3月21日,腾讯宣布推出自研深度思考模型 混元T1 正式版,并同步在腾讯云官网上线。
该模型以腾讯于3月初发布的 混元Turbo S 为基座打造,是一款能秒回、吐字快、擅长超长文处理的强推理模型。
通过大规模强化学习并结合专项优化,混元T1正式版进一步提升了推理能力。与此前已上线腾讯元宝的 混元T1-preview 模型相比,综合效果明显提升。
混元T1正式版沿用了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型。
这一架构有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache(一种大模型推理性能优化技术)的内存占用,从而显著降低了训练和推理成本,让混元T1实现首字秒出,吐字速度最快可达80tokens/s(Token意为处理文本的最小单元)。
目前,混元T1已在腾讯云官网上线,输入价格为1元/每百万tokens,输出价格为4元/百万tokens 。
如需转载请与《每日经济新闻》报社联系。
未经《每日经济新闻》报社授权,严禁转载或镜像,违者必究。
读者热线:4008890008
特别提醒:如果我们使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系我们要求撤下您的作品。
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。