新京報貝殼財經訊(記者韋英姿)3月21日晚間,騰訊正式推出深度思考模型混元T1正式版。此前元寶已上線T1預覽版。騰訊混元團隊在發布會上透露,近期有推進一款中小規模模型的開源計劃,性能預期能夠接近新建模型,在部署和推理成本上有所下降。

混元T1正式版沿用了混元Turbo S的創新架構,采用Hybrid-Mamba-Transformer融合模式。據騰訊混元團隊介紹,這一架構降低了傳統Transformer結構的計算復雜度,減少了KV-Cache的內存占用,從而降低了訓練和推理成本。現場資料顯示,混元T1吐字速度達60至80token/s。

混元T1支持API使用,輸入價格為1元/百萬tokens,輸出價格為4元/百萬tokens。輸入價格與行業差距不大,但輸出價格為DeepSeek-R1標準時段的1/4。

目前,DeepSeek-R1標準時段(即:北京時間8時30分至0時30分)API使用定價為:在輸入價格方面,緩存命中為1元/百萬tokens,緩存未命中為4元/百萬tokens;輸出價格為16元/百萬tokens。非標準時段(即:北京時間0時30分至8時30分),DeepSeek-R1在輸入價格方面,緩存命中為0.25元/百萬tokens,緩存未命中為1元/百萬tokens;輸出價格為4元/百萬tokens。


此外,文心大模型X1的API使用定價為輸入0.002元/千tokens,輸出0.008元/千tokens。


編輯 王真真

校對 趙琳