降价97%背后, 大模型公司的心机和焦虑

虎嗅APP2024-06-14 19:30:09 44

国内大模型公司，也没有错过今年的618。

“降价97%！”“免费！”过去一个月，各大国产大模型厂商喊出了不要钱的架势，降价之狠，让外行惊叹。

谁也没想到，这场价格大战是由一家本不在牌桌上的公司掀起的。

5月6日，知名私募机构幻方量化创立的大模型公司“深度求索”（英文名：DeepSeek），发布了第二代MoE模型DeepSeek-V2。模型迭代的同时，其API调用价格直接降至每百万tokens输入1元、输出2元。

仅为GPT4-Turbo百分之一的定价，让这家公司在AI界迅速崭露头角，也让一众互联网大厂和大模型独角兽坐不住了。

不出半个月，智谱AI、字节跳动、阿里云、百度、腾讯云、科大讯飞等头部玩家纷纷加入降价行列，你追我赶地大举下调了模型价格。

这番场景，让人不禁回忆起ofo和摩拜的“单车之争”、滴滴与快的的“合并之战”。短短两年间，大模型这场不见硝烟的战争，似乎也步入了最简单粗暴的阶段。

然而，这场声势浩大的降价潮，究竟是单纯的成本让利，还是一场精心策划的营销之战？为何一众大厂迅速响应，大部分初创公司却持观望态度？大模型客户们真的能从这波降价中获益吗？参与降价的企业，真正的目的是什么？

真降价还是假噱头？

截至发稿，公开宣布参与本次价格战的公司共有7家，其中包括字节、腾讯、阿里、百度四家互联网大厂，大模型创业公司“智谱AI”、老牌AI上市公司“科大讯飞”，以及这次价格战的发起者“DeepSeek”。

镜相工作室研究发现，这波来势汹汹的价格大战，不像宣传中那么简单直降，而是一场精心计算的策略游戏。

首先，降价最狠的基本都是入门级的基础模型，而那些最高配的模型其实并不打折。

每家大模型公司，都有一个“模型家族”，里面有性能不一的通用模型，也有擅长某些场景的专用模型。比如OpenAI旗下的GPT-3.5和GPT-4，以及文生视频模型Sora。

以百度为例，百度宣布降价的两款大模型，分别是适合在特定场景作为基座模型进行精调的轻量级模型ERNIESpeed，和参数更小、适合搭载在低算力卡上的ERNIELite。而最新发布的超大规模模型ERNIE4.0系列并未降价。

最先坐不住的智谱AI，第一次宣布降价的也是其最基础的模型GLM-3Turbo，最先进的GLM-4并未搬上价格战的牌桌。直到6月5日第二次降价，才将GLM-4系列中的图生文模型GLM-4V加入降价行列，但最常用的对话版模型依然没有降价。

巧的是，部分公司降价的，也只是输入部分的tokens使用量，输出部分的价格不仅没降价，还在各家打出的降价广告语中被悄悄隐藏了。

在API调用中，推理费用的具体定价，分成“输入”和“输出”两部分。输入指的是，用户向大模型提出的问题，输出则是大模型给出的答案。

例如腾讯的混元-Pro大模型，虽然输入价格大幅下降了70%，但输出价格并未优惠，依旧保持原价。同样，阿里云的Qwen-Max模型输入价格下调了67%，输出费用也维持不变，没有折扣。

在各家的宣传里，有不少是拿自己降价的模型与别家最贵的模型作对比，才有了动辄“比行业水平便宜90%”的降价幅度，让外界以为下了血本让利客户。实际上，模型之间性能不同、使用场景不同，有的降价是真有用，有的更多只是一个营销噱头。

其次，同一个模型不同的交付模式，也对应着不同的价格。根据使用场景、部署方式和用户需求，大模型的交付模式通常会分为基础服务、进阶服务和高阶服务。

基础服务指的是，用户直接调用平台已经预设好的API，来使用模型的功能。而进阶服务意味着，用户可以把模型部署到自己的服务器或云平台上，然后根据使用场景对模型进行微调，可以理解为定制产品，在特定任务上的性能和准确性会更高。

当用户觉得，大模型的响应速度不够快时，可以选择高阶服务，不再需要和其他人抢计算资源，用户可以独占所有计算资源，来确保调用频率和响应时长满足业务诉求。

目前各家企业大幅降价的焦点，更多集中在基础服务，即直接调用预置模型进行推理。如果初级服务无法满足需求，就需要更高级的模型微调和部署服务，这部分其实并未降价。

以阿里云参与降价的通义千问主力大模型Qwen-Long为例，降价只针对基础服务。对于寻求更高级服务的用户来说，需要转向其他模型产品，因为Qwen-Long模型本身不支持微调和自定义部署。

而百度宣布的两款免费模型，仅限于初级的平台预置服务阶段。一旦用户需要模型部署或进一步的精调服务，免费优惠便不再适用。

以百度的ERNIESpeed模型为例，虽然基础服务免费，但一旦用户升级至进阶服务，费用即提高到0.005元/千tokens。若用户选择更高级的服务，价格则进一步增至0.008元/千tokens。随着服务级别的提升，费用也会相应增加。

一分钱一分货，想要得到更高级的服务，用户就需要花费更多的钱。进阶服务和高阶服务，一般依照消耗的计算资源来计费，即实际训练过程中使用的计算资源和训练时长。

以智谱AI的ChatGLM-130B模型的私有化部署为例，企业用户一年需要支付高达3960万元的费用。这一价格显然只有具备一定规模和财力的大型企业客户才能承担。

因此，这一波降价，只能说降低了企业用户使用大模型的门槛，利好一些个人开发者和小创业公司，真要大规模使用大模型，依旧省不下太多钱。

为什么创业公司不参与价格战？

与火药味十足的大厂相比，资金有限的初创公司显得更为冷静。

除了智谱AI之外，包括百川智能、月之暗面、零一万物在内的几家头部大模型初创公司并未加入降价行列。MiniMax虽然宣布了价格调整，但仅针对其语音模型进行了调整，文本大模型的价格则保持不变。

创业公司是否跟风降价，主要得看几个条件：一要看商业模式，有没有必要跟；二要看技术能力，能不能跟得动；三要看生态，能不能跟下去。

商业模式决定收入来源，大模型企业主要有两种盈利途径：一是面向企业客户（B端），销售API服务或定制化大模型；二是直接面向消费者（C端），提供终端产品。

出售API，是大模型公司常见的赚钱方式。企业训练出自己的模型后，通过API将其功能提供给开发者或企业。这样，开发者无需从头开始训练模型，只需输入自己的数据进行微调，便能迅速开发出定制化的应用程序。因此，降价主要受益的是开发者和企业客户，对普通消费者没有直接影响。

以C端市场为主战场的创业公司，就没有必要卷入这场价格竞争。

一位头部VC机构的投资人也认为，智谱AI面向的主要是企业客户，因此它调整价格以适应市场是符合逻辑的。相较而言，其他几家AI创业公司专注于C端市场，它们的盈利并不完全依赖API销售，自然没必要趟这个浑水。

但对于那些靠卖API活着的创业公司，就难以保持从前的从容了。面对大厂的搅局和收入的减少，这些公司的市场空间逐渐缩小，必须开始寻找新的商业模式。

百川智能在发布新模型Baichuan4时，也同步推出了AI助手。这也意味着，百川正在寻求销售API之外新的盈利模式，以应对大模型低价战。

猎豹移动董事长兼CEO傅盛也表示，这次大降价基本宣告了大模型创业公司必须寻找新的商业模式。降得最凶的都是有云服务的大公司，通过大模型来获取云客户，“羊毛出在猪身上，降得起”，而大模型创业公司没有这样的生态，必须另寻商业模式。

2024北京智源大会上，几位头部大模型初创公司创始人同台论道。摄影：赵一帆

技术的差距，也是一些创业公司打不出低价牌的重要原因。算法的不断优化，使得大模型的训练和推理效率得到提升，这直接导致了成本的大幅下降。

从算法逻辑来看，传统Transformer架构的大模型运作起来，就像一个不论任务大小，总是启动所有机器的工厂，这种无差别的运作方式容易导致资源的浪费。

而打响价格战的深度求索，采用了更聪明MoE算法架构。在这种模式下，工厂可以实现资源的精准分配，只需特定的机器，其他机器保持待命状态就好。更加智能的分工，优化了成本和效率，这也是它能够提供更低价格产品的关键。

零一万物的CEO李开复对大模型成本下降持肯定态度。他在接受采访时表示：“未来整个行业的推理成本每年降低10倍是可以期待的，而且也应该是必然发生的。”

头部云厂商的中层管理者田梦怡更谨慎看待这个问题。她告诉我们，“在过去两年，大厂在模型训练和推理的提效上，每年降低到之前的1/10是正常的，但未来空间可能也没多大了。”

此外，大厂凭借长期积累所构建的生态，也是创业公司难以快速复制的竞争优势。参战的云厂商，客户众多，商业模式多元，有能力同时响应不同的需求，通过提高资源利用率，进一步压缩了成本。

田梦怡解释道：“大厂可以超卖，可以自用和售卖结合，这是庞大业务规模带来的腾挪空间，也是其挣钱的重要来源，小厂没有这种条件和人才。”

以阿里云为例，为了提高资源利用率，其研发出了“动态资源超卖”的技术。简单来说，就像一个智能监控系统，可以实时查看服务器资源的使用情况，在不影响服务质量的情况下，将同一资源分配给更多用户。不仅极大降低了单位成本，也为其提供了更大的降价空间。

大厂完备的供应链体系和配套服务，也成为创业公司难以跟随的障碍。

大模型从接入到部署，具有一定技术门槛，不是每个企业客户都具有这些能力。大厂通过提供模型服务和开发工具，助力企业更快地部署和开发。同时，企业还能利用大厂平台发布新应用，借助其用户基础来增加曝光和流量。

综合看，大模型降价，大厂更有实力，也更有动力。对创业公司来说，性价比却不高。

大模型降价，到底图什么？

在大模型的世界里，时间仿佛被压缩。仅仅花了一年时间，大模型厂商们就从技术竞争迅速过渡到了比价大战。

多家云厂商负责人公开表示，降价是希望吸引更多开发者，加速AI应用的爆发。但事实果真如此么？他们又为何选择这一时间点降价？降价究竟有没有用，又能持续多久？

ToC流量难增长、ToB业务难挣钱，成为点燃价格战的导火索。

随着时间推移，业界开始意识到，仅靠一个交互式聊天窗口是无法持续吸引用户的。傅盛的说法，也印证了这一事实。他表示：“现在各个大模型App基本都是免费的，本质上应该是各个大模型App用户量涨不动了，包括OpenAl。”

而大模型在B端的应用场景又太少，在日常工作生活里，其实很少能感受到大模型能力的落地。

一位火山引擎内部人士向我们透露，国内大模型卖API的ToB收入，现在非常少，相比训练侧的投入可以说是杯水车薪。

因此，降低定价其实是一种营销策略，目的是让更多开发者先把大模型用起来。比如，要用100亿tokens打磨一个业务场景，以前要花100多万，起码得立项审批到副总，还有很大概率会失败。现在8000块钱就能做，小组长就能批。

这样做的好处是，可以快速地吸引到开发者，应用多了，需求也就多了，他们才愿意为后续的服务付费。

从短期角度来看，降价策略可能会导致赔本。然而，官方口径的背后，打包出售整套云服务、提振公有云业务才是降价背后的长期目标。

上述投资人和田梦怡都认为，价格战的玩家都是在用降价来换市场空间。用大模型客户撬动公有云业务虽然是未来，但是要先保证自己在餐桌旁，否则就在餐桌上了。

对于客户来讲，打折的大模型固然诱人，但模型性能仍是决定购买的关键。

Max是一家AI教育创业团队的联合创始人，该团队致力于构建学习能力分析模型，从而提供更加个性化、数据驱动的教育服务。在谈及团队的选购标准时，他表示，会先看模型能不能完成场景任务，然后才会横向对比价格、稳定性，最终选出一个性价比最高的产品。

但API作为开发过程中的一项大额开支，降价确实能帮助开发者以更低成本构建应用。“降价的吸引力确实很大，它给很多过去难以达成盈利的项目带来了机会。”Max坦言。

Max的团队在API价格调整后，也享受到了实实在在的好处。在价格调整之前，他们每月调用GPT的成本在一万元左右。但随着价格的降低，他们转而使用了智谱的GLM和DeepSeek的服务。即便他们的调用量有所增加，整体成本却下降了30%。

目前来看，价格的下降暂时还没有刹车的迹象。上述投资人判断，不管是从技术还是从市场看，降价都是可持续的，并且不好说“底”在哪里。

正如滴滴和快的通过合并结束了烧钱的补贴战，美团也以其创新和激进的市场策略在团购大战中崭露头角。大模型行业的价格战可能会一直持续下去，直到某个突破性的杀手级应用或场景出现，才能宣告结束。

在这一决定性的时刻到来之前，不断转动的车轮下，将有无数企业被市场淘汰。

（文中受访者均为化名）

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益，请与本站联系，我们将及时更正、删除、谢谢。
https://www.414w.com/read/728658.html

随机主题

M4版iPadPro｜苹果发布会上没有说的细节热议西决G1! 詹皇呼吁联盟出新规东欧大笑庆祝+欧文揭秘爆发真因山西: 科学预防“干热风” 确保小麦丰产丰收指尖血祭神秘女孩引领你进入血腥世界老牌工业镇走出“小巨人”, “小五金之乡”全球掘“金”|高质量发展调研行一加12直降1200, 骁龙8Gen3专业影像旗舰大跳水, 618必选生涯第4冠, 36岁韩德君退役? 谁注意郭艾伦喊话, 大韩举动感人全无人化Robotaxi，居然有这种骚操作？DNF: 新副本传奇页游风, 记录室钥匙千万留好! 每周7次奖励拉满 1962年投资1000万美元，真实装备与军人协助拍摄，被封为二战电影封神之作！「王阳明」——文成贤圣王阳明，千载光辉照后人#致每一个热爱生活的你章盟主: 5.22 光伏, 全面爆涨!家族荣耀之继承者：降智豪门家族没有社媒的小因扎吉通过妻子账号告别张康阳: 谢谢你炎炎夏日24款奔驰GLC300升级原厂通风座椅香氛负离子哪款故障少? 五菱缤果、海鸥、欧拉好猫、海豚, 10万内选谁好?全球最大私营医械制造商, 裁员关厂波波维奇是不是被高估的主教练? 邓肯退役后马刺队就一事无成了最懂MPV, 也最懂消费者的全新GL8陆尊PHEV 印度美女远嫁中国, 弟弟前来中国祝贺, 直言: 中国人真是尖酸刻薄 5年2.45亿, 多赚4100万! 联盟两大新星, 带队闯进分区决赛

最新回复(0)