大模型“独角兽”亟须差异化应对价格冲击
效率成为行业关键词
日前,杭州深度求索人工智能基础技术研究有限公司(DeepSeek)推出的新一代大模型DeepSeek-V3,因其训练成本之低引发行业热议。从其正式发布的技术报告来看,包括预训练、上下文长度外推和后训练在内,DeepSeek-V3完整训练只需2.788M H800 GPU小时。假设H800 GPU的租金为每GPU小时2美元,其总训练成本仅为557万美元。不过,Deepseek也透露,上述成本不包括与架构、算法或数据相关的先前研究以及精简实验的成本。
美国人工智能公司Anthropic的CEO达里奥·阿莫迪曾透露,GPT-4o这样的模型训练成本约为1亿美元,这意味着DeepSeek的成本只有GPT-4o的1/20。
训练成本降低的同时,DeepSeek-V3却保持了高性能。根据其公告,DeepSeek-V3多项评测成绩均表现优秀,性能与世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
为什么DeepSeek-V3能够实现低成本、高性能?“包括模型架构、基础设施优化、数据优化在内,DeepSeek-V3从端到端都进行了工程优化,叠加后呈现出很好的效果。”Gartner研究总监闫斌介绍说,大模型进入公众视野时间尚短,只有两年多时间。期间,行业模型训练相对粗放,通过尽量多收集数据,建设更大的数据中心,以获得更好的训练结果,行业也用“Scaling Law”总结这一过程。
“DeepSeek-V3证明,通过更好的工程化能力,我们可以通过相对较少的算力资源、较小的模型,也可以达到不错的训练效果。”闫斌认为,“目前行业在数据和算法方面仍有优化空间,低成本的训练和高效推理应用或将是下一阶段大模型发展的方向之一。”
值得关注的是,伯克利大学NovaSky团队也刚刚发布了Sky-T1-32B-Preview开源模型,在常见的推理和编码基准测试中,与OpenAI的o1-preview“平分秋色”。据称,其训练成本不到450美元,展示了以经济高效的方式复制高水平推理能力的可能性。
NovaSky团队能够以如此低成本进行模型训练,其关键之处包括使用了数据筛选机制,如通过QwQ-32B-Preview生成初始数据,通过GPT-4o-mini重写数据格式等。此外,NovaSky团队选择了Qwen2.5-32B-Instruct作为基础模型进行训练。行业人士评价称,“这个项目证明,高水平AI研发不需要天价预算。”
瑞银证券中国软件分析师张维璇说:“效率是2025年大模型行业的关键词之一。除了少数公司有能力、有愿景用万卡,乃至十万卡继续追求顶级大模型,大多数公司未来要降本增效。事实上,优化注意力机制、采用MOE架构、降低模型激活的参数量等,都已经是很主流的降本方式。我们相信这会带来AI门槛的降低,以及技术的普及化,不仅体现在应用侧,还有研发侧。”
大模型创业公司将直面降价冲击
伴随着训练成本的降低,DeepSeek-V3的API价格目前为每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元。同时,DeepSeek提供了45天优惠价格体验期,在2025年2月8日之前,所有用户使用DeepSeek-V3 API的价格分别下降了80%(输入命中)、50%(输入未命中)、75%(输出)。
事实上,2024年上半年中国大模型价格竞争的发起者正是DeepSeek。2024年5月,DeepSeek率先宣布降价,其发布的第二代MoE大模型DeepSeek-V2定为0.001元/千tokens的输入价格与0.002元/千tokens的输出价格。随后,智谱AI、火山引擎、阿里云、百度、科大讯飞、腾讯云等国内主要大模型厂商迅速跟进。
可以看到,2024年年底,除了DeepSeek-V3新版本的推出以及API价格调整,国内大模型其他厂商也在降价。2024年12月31日,阿里云宣布2024年度第三轮大模型降价,通义千问视觉理解模型全线降价超80%,其中,Qwen-VL-Plus直降81%;更高性能的Qwen-VL-Max降幅高达85%。此前,在12月18日举办的火山引擎Force大会上,字节推出的豆包视觉理解模型也宣布进行降价。
“大模型的不断降价,无疑有利于吸引更多企业使用新的技术,为大模型创业公司提供了更大的市场。同时,这也对大模型创业公司构成了挑战。‘独角兽’仅仅做到提升大模型能力还不够,还要不断优化算法,快速降低模型的推理成本。只有真正做到为用户提供更有性价比的大模型服务,才能赢得市场份额。”MiniMax副总裁刘华说。
经过一年多来的行业竞争,中国人工智能大模型的行业格局不断清晰,主要玩家从“百模大战”时代不断收敛。MiniMax与智谱AI、百川智能、月之暗面、阶跃星辰、零一万物6家行业“独角兽”企业估值均超10亿美元,被行业称为国内“大模型六小虎”;再加上关注度较高的幻方和面壁智能,以及互联网大厂中的字节、阿里、百度和腾讯,行业主要玩家缩减到十来家。
API接口调用付费是大模型企业B端重要商业化实现路径之一。不过,ToB业务中,由于互联网大厂可以将AI功能绑定算力和云服务业务,二者叠加商业推广效率更高。因此,在“价格战”中,大厂因为业务复合、资金雄厚,也更有优势。面对价格竞争,创业公司只能化压力为动力,从加快迭代模型、不断优化算法中寻找解法。
“如果要拼低价和资源,创业公司肯定不如大厂。下一步,大模型创业公司可以聚焦在提供个性化服务,比如提供情感类大模型的API接口。”行业人士对记者表示。
“独角兽”还需差异化发展
无疑,大模型训练成本、推理成本的下降,将进一步加快行业场景应用落地。事实上,寻找更合适的大规模落地场景、更好的商业闭环模式,已经成为大模型企业下一阶段发展的当务之急。
在接受采访时,多位行业人士提到,上述“大模型六小虎”开始出现分化,已有独角兽企业出现“掉队”势头,“这也说明,大模型行业发展遇到了瓶颈。”
“从全球来看,大模型企业都面临一定的融资压力。大模型出现之初,大家对它的预期很高,后面又经历了预期的回调。与此同步,行业融资热度稍降。当然这也符合一项新技术的发展曲线。单纯通过讲故事已经很难找到投资人。”闫斌表示。
从B端应用来看,Gartner的一份最新调研结果显示,截至2024年6月,只有8%的中国企业将生成式人工智能部署在生产环境中。对此,闫斌解释称,目前大模型在中国企业生产场景中小规模落地已出现,但大规模企业落地仍然较为少见。“如果把最终落地应用比作一场考试,那么大模型能力、数据、工程化、产品设计将是几门关键课程。根据我们观察,国内很多大模型能力已经不错,目前落地短板更聚焦在其他几个方面。”
再来看C端的落地情况。根据AI产品榜数据,目前用户量排名靠前的应用分别为抖音的豆包、MiniMax的Talkie AI、月之暗面的Kimi智能助手、百度的文小言,全球2024年12月的月活分别为7117万、2977万、1669万、1347万,在全球主要C端产品榜单中,分别位列第2位、第4位、第15位、第20位。
与创业“独角兽”相比,“大厂”在C端应用推广上,展示出了流量和资本方面的巨大优势。字节2024年5月才推出AI对话助手“豆包”,凭借投流买量后来居上,成为过去半年增长最快的移动应用。“一些创业公司此前通过投流买量的方式迅速扩大了用户量。但随着‘大厂’下场,这种做法就显得不那么划算了。”有行业人士对记者表示。
“目前国内大模型企业的C端产品存在‘同质化’的问题,很多企业都推出了AI对话助手类产品,功能大同小异。但是,大模型技术在不断迭代。各家企业需要基于大模型能力的提升趋势,去探索新的AI产品形态,去满足客户尚未被满足的需要。尤其是创业公司,更是要把资源聚焦于技术和产品的创新,而不是通过投流买量进入变成‘红海’的赛道。”刘华说。
标签:
精彩推送
- 大模型“独角兽”亟须差异化应对价格冲击
- 880万架 算力产业量质齐升
- 知识产权领域2024交出“高分答卷”
- 中外团队“听”到遥远太空合声波
- 2024年制造业产品质量合格率为93.93%
- “文化+科技”助推假日经济持续繁荣
- 星空有约|人类首次!“天关”卫星探测到宇宙早期爆发的软X射线信号
- ST中润重生:招远国资的赋能与蜕变
- ST中润2024年业绩分析:全年营业收入两位数增长,净利润亏损收窄
- 中国工商银行牡丹卡中心携手中国银联以“真金白银真实惠”点燃春节惠民消费心动力
- 积极稳妥推进碳达峰碳中和——联通支付荣获第十四届公益节2024年度ESG典范企业奖
- MW八点档丨MCD不一样的分销
- 美提出要评估中美第一阶段贸易协议执行情况 商务部回应
- 截至2024年12月底,我国电动汽车充电设施总数达到1281.8万台
- 美方称或于2月1日开始对中国征收10%关税 商务部回应
- 商务部回应美国希望拥有50%TikTok股份
- 看好中国前景加大投入!外资企业深度融入中国市场
- 广铁抢运1300万吨电煤保障春节用电
- 迎接首个“非遗版”春节,好内容带动文创年货热销
- 外资通过QFII、沪深股通共持A股约3万亿元
- (经济观察)引导中长期资金更好入市 中国绘制“施工图”
- 2024年成都国际班列冷链班列同比大幅增长
- 2024年上海跨境人民币结算量实现历史性增长 收支总额近30万亿元
- 贺州海关助力贺州扩大供港澳蔬菜出口
- (新春走基层)中国水上最高输电铁塔将立于狮子洋
- (经济观察)重庆发挥产业优势 加速培育先进制造业集群
- 2024年四川银行业保险业运行平稳 四项指标均居西部第一
- 中国经济信心说丨稳中有进!中国经济高质量发展成色十足
- 2024年上海涉外收支总额49523.88亿美元 同比增长33.1%
- 密尔克卫荣获AEO(authorized economic operator)高级认证
- 法海风控北京总部完成全新升级
- 稳健夯实 高质发展 | 2025年度经营表彰大会暨新春年会圆满结束!
- 密尔克卫荣获杜邦2024年度Valued Partnership Award奖项
- 三菱重工SAFG新风送风机:大风量净化,让每一次呼吸都充满底气
- 1月20日起!手机等数码产品购新补贴将陆续实施
- 德国“空中出租车先驱”折翼
- 5G-A与量子产业2025将按下“加速键”
- Meta计划淘汰5%“未达预期”员工
- 电动自行车安全实用都不能少
- 2024年度中国科学院杰出科技成就奖颁发
- 中国科学院颁发2024年度杰出科技成就奖
- 中信金控举办第三届“中信财富杯”实战案例大赛
- 央行释放多重稳汇率信号 政策“工具箱”储备足
- 一张保单守护全家人 “人保全家福家庭保险产品组合”推出
- 银联国际与马来西亚国民储蓄银行达成数字化发卡合作
- 货币信贷总量稳结构优 融资成本稳中有降——从数据看2024年金融支持实体成色
- 国家外汇管理局:2024年非银行部门涉外收支规模创新高
- 银联国际化进程稳步推进 服务国家高水平对外开放
- 从中小学到福利院 蚂蚁投教基地首创“教实融”多层次投教模式
- 首批券商财报出炉 自营业务扛大旗
- 中小银行压降自营理财缩影:规模趋零、人员转岗与客户不舍
- 哈银消金以普惠金融服务助力假期经济
- 哈银消费金融2024资本提升,赋能普惠金融新生态
- 智盈:以科技赋能,助力投资者稳健前行
- 环球金融特别推荐中国艺坛大家黎明
- 创盛亚洲投资集团温文浩董事长荣膺品牌强国经济论坛·金融服务行业创新先锋人物
- 中国艺坛名家——薛济权作品展示
- 数势科技—中原银行智能指标平台建设项目入选《沙丘社区大模型先锋案例Top50》
- 国家外汇局:截至2024年12月末,我国外汇储备规模为32024亿美元
- 上海杨浦区创新模式加速数字赋能 大中小企业共赢
- 焦点访谈丨冰雪经济等成为新蓝海 如何打开消费新空间?
- 截至2024年11月底 全国港口集装箱铁水联运量同比增长约15%
- 商务部:初步认定原产于印度的进口氯氰菊酯存在倾销
- 赋能工业变革,机器人有哪些“大魔力”?
- (乡村行·看振兴)江西彭泽:工厂化养殖助力彭泽鲫增产增收
- 上海:推进“1+N+X”绿色金融组织体系建设
- 中国最大滩涂光储电站在山东莱州投产
- 中国国家发改委:开展市场准入壁垒清理整治行动
- 第六届工业互联网大赛收官
- 海南推出农机券政策 财政补贴助力农业机械化
- 河南进境邮件实现“一站式”办理
- 2024年前11个月支持科技创新和制造业减税近2.3万亿元
- 浙江:2027年山区海岛县减至20个以下
- 鲁大师2024牛角尖颁奖盛典圆满落幕
- 2024年重庆中车在墨西哥推进多个轨道交通项目
- 国家发改委:将结合实际对《指引》的内容进行调整完善和动态更新
- 构建全国统一大市场 国家发改委详解“五统一、一破除”
- 刹住“狂飙”的电动自行车
- 什么是商业保险年金?如何挑选?解答来了
- 慧荣SM2268XT2主控芯片引领SSD市场新潮流
- 以数智物流赋能制造业升级,跨越速运为何收获企业青睐
- 外资金融机构看好中国经济前景,智盈助力投资者理性决策
- 华宇生物医药牵头制定食材净化清洗设备国家标准
- 《恋与深空》开启多国文旅联动,全球告白见证周年热恋
- 平安健康荣膺2024年度阳光行业标杆企业奖项,加速医养结合服务创新步伐
- 河南黄河酒业:大黄河美酒
- 数势科技智能分析AI Agent 何以在市场中脱颖而出?
- 法海风控涉诉风险量化报告迎来重大更新
- 浙商期货:强化金融帮扶力度 助力美丽乡村建设
- 数势科技指标平台,让金融企业业务决策和分析效率提升70%
- 打破肌肤“皱”语,润致格格针帮你摆脱颈部年龄,守护美丽弧线
- 作业可以熔断,家长的焦虑该如何熔断?
- 上海多措并举培养课后育人“主力军” 为学生营造个性发展时空
- 2025年研考工作准备就绪 教育部提醒广大考生诚信考试
- 中国—东盟“中文+职业教育”联盟在广西南宁成立
- 纸顺笔利,皆有好运!@考研人 这份“注意帖”必看→
- 课间15分钟,如何推广开?有哪些难点堵点?
- 4所新高校公示!其中3所有点不一样
- 聚焦钱学森现代科学技术体系研究应用 专家学者研讨交流建言献策
- 益盟软件——打造个性化证券理财投顾服务