「天工大模型4.0」o1版和4o版正式上线天工APP和网页,免费使用
(原标题:「天工大模型4.0」o1版和4o版正式上线天工APP和网页,免费使用)
2025年1月6日,昆仑万维正式将「天工大模型4.0」o1版和4o版同步上线,并全量登陆天工网页和APP,人人免费可用。
图片来源于网络,如有侵权,请联系删除
作为国内第一款中文逻辑推理能力的o1模型(Skywork o1),不仅包含上线即开源的模型,还有两款性能更强的专用版本。经过全方位的技术栈升级和模型优化,由昆仑万维自研的Skywork o1系列能熟练处理各种推理挑战,包括数学、代码、逻辑、常识、伦理决策等问题。
图片来源于网络,如有侵权,请联系删除
「天工大模型4.0」4o版(Skywork 4o)是由昆仑万维自研的多模态模型,其赋能的实时语音对话助手Skyo,则是一个具备情感表达能力、快速响应能力、多语言流畅切换的智能语音对话工具。
当前,这两款模型已正式登陆昆仑万维旗下天工web与APP,全面向用户开放。
天工AI官方地址:https://www.tiangong.cn/ (进入后可直接体验o1版)
01.
Skywork o1为用户带来更极致的推理能力,正式上线天工web
相较于之前的版本,正式上线的Skywork o1进行了重磅升级,体现在以下三个方面:PRM优化,基于Q*算法的推理系统优化,创新性提出Step-DAPO算法,力争解决训练效果不稳定、计算资源开销过大等问题。
全面升级且正式上线的Skywork o1 Lite / Skywork o1 Preview大幅提升了数学、代码和逻辑推理能力。我们对其进行标准数学基准测试(包括GSM8k、MATH、OlympiadBench、AIME-24以及AMC-23),以及在HumanEval、MBPP、LiveCodeBench及BigCodeBench这四项代码基准测试上评估了Skywork o1的代码能力。
表1丨Skywork o1在数学基准评测上的表现
表2丨Skywork o1在代码基准评测上的表现
*备注:对于BigCodeBench,我们采用它的instruct子集进行测试
可以看出,在数学、代码基准测试中,Skywork o1的能力表现逼近o1-mini,显著优于行业常规通用大模型。
02.
Skywork 4o赋能的Skyo,已全面登陆天工APP
图丨天工APP中Skyo入口与界面(来源:昆仑万维)
为了达成“像和真人一样说话聊天”的效果,Skyo 坚持采用更先进的创新路线,通过多模态 LLM 端到端建模,来解决这个难题。
图丨Skyo所采用的语音对话框架(来源:昆仑万维)
Skyo 的上线是昆仑万维在智能语音交互技术方向,从“操纵机器”迈向“和真人交流”的重要一步。
03.
坚定迈向AGI时代
过去两年,昆仑万维已完成“算力基础设施―大模型算法―AI应用”全产业链布局,并构建起由AI大模型、AI搜索、AI游戏、AI音乐、AI 社交、AI短剧组成的多元AI业务矩阵。我们坚信,所有在模型与产品上进化的每一小步,都是迈向实现通用人工智能的一大步。昆仑万维仍会坚持以技术为底座,以产品为先锋,给用户带来更好的使用体验,为推动人工智能技术的发展和应用做出贡献,立志成为一家小而大美的国际化人工智能企业。
本文来源:财经报道网
推荐阅读:
5分钟,挤爆服务器!起价2.5万,苹果新品被抢空!已有代购加价至7万
李鸣涛:直播电商是实体经济非常重要的一部分,推动实体经济发展
版权声明
本文仅代表作者观点,不代表xx立场。
本文系作者授权xx发表,未经许可,不得转载。