3月21日,腾讯晓谕推出自研深度想考模子“混元T1”郑再版,并同步在官网上线。
该模子以腾讯于3月初发布的“混元Turbo S”为基座打造,是一款能秒回、吐字快、擅长超长文科罚的强推理模子。
通过大界限强化学习并连合专项优化,混元T1郑再版进一步晋升了推理才智。与此前已上线腾讯元宝的“混元T1-preview”模子比较,详细后果显然晋升。
混元T1郑再版沿用了混元Turbo S的立异架构,剿袭Hybrid-Mamba-Transformer会通款式。这是工业界初次将夹杂Mamba架构无损欺诈于超大型推理模子。
这一架构灵验缩短了传统Transformer结构的策划复杂度,玩ag百家乐技巧减少了KV-Cache(一种大模子推感性能优化本事)的内存占用,从而权贵缩短了测验和推理资本,让混元T1完了首字秒出,吐字速率最快可达80tokens/s(Token意为科罚文本的最小单位)。
现在,混元T1已在腾讯云官网上线,输入价钱为1元/每百万tokens,输出价钱为4元/百万tokens 。