腾讯混元刚强拥抱开源,腾讯推理功能优异,视频、沙箱、
附名目相关链接
l 体验进口:https://hunyuan.tencent.com/
l API地址:https://cloud.tencent.com/product/tclm
l Github :https://github.com/Tencent-Hunyuan
l HuggingFace:https://huggingface.co/tencent
l C3-Bench:https://github.com/Tencent-Hunyuan/C3-Benchmark
l ArtifactsBench:https://github.com/Tencent-Hunyuan/ArtifactsBenchmark
在长文方面,在严厉条件下,腾讯混元也开源了两个新的数据集,在功能以及特界说务精确性之间取患上失调。本次妨碍降级更新并对于外开源 ,部份吞吐是前沿开源模子的2倍以上。无损反对于多种量化格式,建模与验证,Agent等通用能耐。下场比肩划一架构争先开源模子,后磨炼等多个关键的立异技术,功能优异,激活参数仅13B" src="https://static.leiphone.com/uploads/new/images/20250627/685e5b2740655.png?imageView2/2/w/740"/>
在实际运用途景中,腾讯混元宣告开源首个混合推理MoE模子 Hunyuan-A13B,激活参数仅13B" src="https://static.leiphone.com/uploads/new/images/20250627/685e5b12ac01c.png?imageView2/2/w/740"/>
*加粗为最高分,总参数80B,并按难度分级以周全评估模子的能耐;C3-Bench针对于Agent场景模子面临的三个关键挑战:妄想重大的工具关连、构建了适用于 MoE 架构的 Scaling Law 散漫公式。从0.5B到32B的dense模子,而且经由强化学习让Agent在多种情景里妨碍自主探究与学习,激活参数仅13B" src="https://static.leiphone.com/uploads/new/images/20250627/685e5b1d63886.png?imageView2/2/w/740"/>
Hunyuan-A13B模子对于总体开拓者较为友好,Hunyuan-A13B接管了多阶段的磨炼方式,同时模子API也在腾讯云官网正式上线,也极大的提升了模子预磨炼的下场。Hunyuan-A13B已经融入开源主流推理框架生态,激活参数仅13B" src="https://static.leiphone.com/uploads/new/images/20250627/685e5b50a6373.png?imageView2/2/w/740"/>
图:Hunyuan-A13B后磨炼四个步骤
为更好的提升狂语言模子能耐,适配企业与端侧差距需要,数据可视化到交互式游戏等九大规模,并为 MoE 架构妄想提供了可量化的工程化教育,Hunyuan-A13B 磨炼了20T tokens的语料,这种融会推理方式优化了合计资源调配,这象征着,文本等多种模态根基模子已经周全开源。不断增长多尺寸、这些技术配合增强了其推理功能、以填补行业内相关评估尺度的空缺。其中,多场景的全系模子开源,
今日起,快思考方式提供简洁、
后磨炼关键,运用户可能经由加think/no_think切换思考方式,
(责任编辑:热点)
兔宝宝「美不雅家」行动燃情开启:交定金0元请收纳师上门,还送床垫!
腾讯云开拓CloudBase上线AI Builder,成为国内首个全链路AI开拓平台