首页 > 技术 > AI/人工智能

最强ai模型发布 | Ai明眸

人阅读 2023-11-08 08:00:00

【最强ai模型发布 | Ai明眸】lot物联网小编为你整理了的相关内容,希望能为你解答。

本报记者 曲忠芳 李正豪 北京报道

国产企业在AI大模型赛道加速奔跑。继百度、360之后,4月10日,商汤科技(0020.HK)正式推出了“日日新SenseNova”大模型体系,与此同时,商汤的通用人工智能(AGI)“全家桶”应用——涵盖AI文生图创作“秒画”、高效聊天助手“商量”、2D/3D数字人生成等也集中亮相。

商汤科技董事长兼CEO徐立表示,在AI大模型时代,数据、算法和算力这三要素也在经历新的演变,大模型参数量将以指数级的速率提升,而数据量随着多模态的引入也将大规模增长,因此就必然会导致对算力需求的剧增。“我们以AI大装置SenseCore打造AGI时代的基础设施,并基于此将大模型体系命名为‘日日新SenseNova’,寓意‘苟日新、日日新、又日新’,希望在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI的更多可能。”

《中国经营报》记者注意到,就在商汤大模型推出的同一天,昆仑万维(300418.SH)公告披露,该公司与奇点智源合作自研的双千亿级大语言模型“天工3.5”将于4月17日开启邀请测试。阿里云官方宣布,将于4月11日举行的2023阿里云峰会上推出“通义千问”大模型,并已于4月7日开放了企业邀请测试。此外,搜狗创始人、前CEO王小川也在4月10日宣布成立“百川智能”,开启AI大模型领域创业。毫无疑问,本月里或者未来几个月里,众多国产AI大模型将密集面市。

商汤上线“AGI全家桶”

记者打开商汤“日日新SenseNova”官网观察到,无论是“日日新”这一品牌,还是“秒画”“格物”“明眸”“琼宇”“如影”等应用名称,显然都参考借鉴了中国传统文化精华,具有非常明显的中国文化特色,而这一特点在其他企业中也体现出来,如百度“文心一言”、阿里云“通义千问”、昆仑万维“天工”、华为“盘古”大模型等。当然,这也并不难理解,除了品牌名的锤炼塑造逻辑之外,目前已面市的几款国产AI大模型重点训练及考虑的以中文文本理解为主。

从日日新SenseNova官网打开“商量”页面,可以看到聊天助手“商量”、中文医疗语言模型“商量·大医”、“商量·AI代码助手”三款应用。商汤展示了“商量”在多轮对话和超长文本理解能力方面的表现,它是一款千亿级参数的自然语言处理模型,在使用大量数据训练的同时充分考虑了中文语境,能更好地理解和处理中文文本。不同于“商量”,“如影”则是AI数字人视频生成平台,仅需一段5分钟的真人视频素材,即可生成出数字人分身。需要注意的是,目前日日新SenseNova平台的这些应用尚未向公众开放,还处于邀请测试阶段。

商汤科技联合创始人、首席科学家王晓刚指出,AGI催生了新的研究范式——基于一个强大的多模态基模型,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。AGI将实现从“数据飞轮”到“智慧飞轮”的演进,最终迈向人机共智。“商汤已建立了全栈的大模型研发体系,已在多个行业场景中落地,场景的多样性,任务的复杂度,数据的丰富度均充分展示了我们大模型的能力和未来潜力。我们将持续推动基础设施建设,期待和合作伙伴一起投入到AGI的时代大潮中。”

当前,业界训练大模型对大算力的需求非常旺盛,并且真正好用的基础设施十分稀缺。商汤花费五年建设了AI大装置,大装置上总共有2.7万块的GPU芯片卡,可以输出5.0 exaFLOPS的总算力,可支持最多20个千亿参数量大模型同时训练。基于大装置的能力,商汤目前已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。

驱动MaaS新模式

与商汤科技类似,向大模型、AIGC(AI生成内容)、大算力等AI赛道布局押注已成为国产企业的普遍性动作,一场国产AI大模型的混战时期正在开启。据记者不完全统计,目前已经加入或即将加入“大模型”混战的力量众多,既有清华大学、中国科学院等学界力量,又有华为、百度、阿里、讯飞等一众科技企业,还有以美团联合创始人王慧文、王小川等为代表的知名创业团队。

值得注意的是,在通用人工智能模型的比拼中,“模型即服务”(Model-as-a-Service,简称MaaS)的商业模式也日益成为发展趋势。

商汤方面表示,基于AI大装置SenseCore和“日日新SenseNova”大模型体系,商汤面向行业伙伴提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多种MaaS(模型即服务)服务,例如,基于预训练大模型的自动化数据标注可实现相较于人工数据标注近百倍的效率提升;模型推理部署服务可将大模型推理效率提高100%以上,降低用模型提供服务的成本。

国泰君安证券最新研报中指出,基础大模型日趋成熟,MaaS 已成产业趋势。近年来,基础模型(即“预训练模型”)的研究从技术层面逐渐趋向于大一统,自然语言处理、计算机视觉、语音处理、多模态等不同人工智能领域的基础模型从技术上都依赖三个方面:一是 Transformer开源架构成为不同领域和问题的通用神经网络架构和建模方式,二是生成式预训练成为最重要的自监督学习方法和训练目标,三是数据和模型参数的规模化进一步释放基础模型的潜力。技术和模型的统一将使得 AI 大模型逐步标准化、规模化,基于标准化的大模型,有助于为大范围产业化提供基础和可能,从而实现 MaaS 生态。进一步借助云部署和云端协作,AI 将有可能成为像水电一样的“新基建” 赋能各行各业,并进一步催生颠覆性的应用场景和商业模式。

(编辑:吴清 校对:翟军)

以上内容为【最强ai模型发布 | Ai明眸】的相关内容,更多相关内容关注lot物联网。

LOT物联网

iot产品 iot技术 iot应用 iot工程

Powered By LOT物联网  闽ICP备2024036174号-1

联系邮箱:support1012@126.com