美团开源LongCat-Flash:战略指向何处?
实用性是追求目的,但实用的前提是什么?9月1日,美团正式对外发布并开源了自研大模型LongCat-Flash-Chat。这是美团首次将大模型作为完整产品开放给行业与开发者。模型采用业界流行的MoE(Mixture-of-Experts)架构,总参数规模高达5600亿(560B),但每次推理仅激活186亿-313亿参数,平均约270亿,平均激活率仅4.8%。尽管激活率如此之低,但据美团官方称,“在...
网页链接实用性是追求目的,但实用的前提是什么?9月1日,美团正式对外发布并开源了自研大模型LongCat-Flash-Chat。这是美团首次将大模型作为完整产品开放给行业与开发者。模型采用业界流行的MoE(Mixture-of-Experts)架构,总参数规模高达5600亿(560B),但每次推理仅激活186亿-313亿参数,平均约270亿,平均激活率仅4.8%。尽管激活率如此之低,但据美团官方称,“在...
网页链接