这两天Twitter上大家在传TheInformation报道的StabilityAI打算把自己卖了的消息。从2022年8月推出StableDiffusion以来,不到两年的时间,沦落到出售公司的程度。甚至据很多业内人士分析,StabilityAI真的放到市场上,可能卖不出多少钱。
进入2024年,StabilityAI风波不断。3月21日,开发StableDiffusion的几名核心研究人员离职。过了没有两天,StabilityAI的CEOEmadMostaque宣布离任,并退出董事会。又过了没到一个月,4月19日,StabilityAI又宣布裁员20人,约占全体员工的10%。
StabilityAI到底挖了多大的坑?根据TheInformation的说法,StabilityAI私下表示2023年的营收只有800万美金左右,这个数字比之前网传的1100万美金还低了不少。而根据彭博社在2023年10月的报道,StabilityAI一个月就要在员工工资和云计算等领域支出800万美金,其他不算,公司利润率怒达-1100%。
而2024年第一季度,StabilityAI收入不到500万美元,貌似赚得多了点,但亏损超过3000万美元,利润率稍微好看了些,也就是-600%。
公司经营结果一塌糊涂,还欠了不少外债,据传StabilityAI欠云计算供应商和其他公司1亿美元。相比之下,隔壁Midjourney只有十几名员工,就能拿下3亿美金左右的年营收。
如此糟糕的财务状况,几乎所有生图类产品都会用其底层模型的StabilityAI,到底问题出在哪?
开源+API的商业模式陷阱
经过一番资料的搜索,对于这个问题,笔者主要总结出了两个方面的原因,一是公司的管理出现了问题,二是StabilityAI的商业模式一直没有跑通。
StableDiffusion其实并不是StabilityAI开发的产品,这款模型最初是由项目负责人RobinRombach攻读博士学位的慕尼黑大学和另一个AI视频创企runway共同开发的开源模型项目LatentDiffusion。
而StabilityAI最初只是为项目提供了计算资源,才取得了冠名权。而2022年,StabilityAI说服了负责人RobinRombach和其他核心成员加入公司,这才“名正言顺”地获得了StableDiffusion的所有权。
虽然获得了所有权,但是StabilityAI的管理却一地鸡毛。有离职员工透露,CEOMostaque几乎不懂研究,也不会为研发团队制定计划、分配资源,加上他个人的学历、经历造假、欺骗投资人、欠薪等丑闻,造成StabilityAI管理混乱,负面新闻缠身。如果说管理层混乱是一个例外,StabilityAI选择的商业化路径在为很多做开源模型、API收费的企业敲响警钟。
众所周知,StableDiffusion是一款开源模型,所有人都可以免费下载和修改模型。
而StabilityAI本身则是靠API、企业服务、AI相关的咨询来赚钱。这个开源商业化模式,模仿的是Linux的提供商RedHat,即靠开源打出知名度,再靠API和企业定制产品在B端赚钱。StableDiffusion在推出伊始就上线了API。
目前来看,市面上绝大多数的生图产品,使用的都是SD和它的衍生模型,受众远比Midjourney和DALL-E等闭源模型要大很多,而为什么StableDiffusion被那么多创企采用,官方做API却不赚钱呢?
第一个原因其实是模型本身的设计,由于SD从一开始就是开源模型,所以在设计时就比闭源模型参数更少,更轻量,以满足离线部署的需求,因此,SD原模型的生图效果其实是不如闭源模型的。
但是SD作为开源模型,本身设计上,留下了很大的“可调整空间”,例如对SD模型进行微调可以得到Checkpoint,可以优化某种特定风格的生图质量,进一步还能在Checkpoint的基础上对cross-attentionlayer进行调整形成LoRa模型,来添加特定对象或实现人物、风格一致的效果。这些都给了用户和开发者按需求/场景,实现更佳效果的可能。而在实际落地中,绝大多数开发者都会对SD模型进行重新训练,来适应电商、广告、或者漫画脸等场景。
而直接调用API,单纯做套壳产品,其实竞争力不大,无法满足多数厂商的业务落地需求。
第二个原因是成本问题。
其实单看API费用的话,除了最新推出的SD3比较昂贵之外,SDXL和SD1.6等已开源的模型的API可以说比OpenAI便宜不少了,与腾讯混元的文生图API价格相当。
但是如上所述,很多厂商为了落地,会选择自行部署。而SDXL和SD1.6都是完全开源模型,任何用户都可以自行下载和部署这两款模型。甚至,一些云厂商也会将SD这种完全开源的模型做成即插即用的插件放在自己的解决方案里。
根据网络上的分享,使用腾讯云部署SD1.5的话,平均单张图片花费0.1~0.01元人民币,合1美金能生成70~710张图片;而上面提到的AWS的云服务,1美金大约可生成240张图片。而如果选用更便宜的云服务提供商的话,这个价格能做到更低。
那我们把云部署的费用更新到表格中,就会变成下面这样:
这么一比,虽然SD在API价格对比层面,费用确实不高,但和其他一些方式比没有成本优势。
谷歌搜索“SDAPI”结果(上),第三方API的价格(下)
最后,依然是因为完全开源,在StableDiffusion出来不久,就已经各路有三方API出现了,目前在谷歌搜索“StableDiffusionAPI”第一条是官网,第二条就是一个第三方API的网站,甚至这个网站提供无限次使用API的服务,价格为147美金/月。
SD使用的CreativeMLOpenRAIL-Mlicense协议关于“分发模型”的条款,注:SD使用的协议是专为AI开源产品设计,而类似DeepSeek等国内出海产品会使用针对一般开源软件的MIT协议,两者商业化条款的规定基本相同,前者在道德等层面上会做了更多的规定,促使人们安全地使用AI。
对于其他企业使用开源模型做三方API的法律问题,我咨询了法律专业人士。他表示能否提供第三方API服务需要参考产品协议中列示的商用条款,如果违反条款,原开发者就有权进行索赔。而StableDiffusion所使用的协议,完全允许向第三方分发模型,包括销售付费API,这让SD官方的API无形中又多了无数竞争对手。
目前,很多国内大模型都在走开源+API的路径,但是在开源的基础上,都会拥有能力更强的闭源模型,或干脆将开源闭源分成两个系列(比如Google的Gemini和Gemma),为自己的API保留一些差异,在开源和商业化方面找到平衡。
看下来,StablityAI陷入“疯狂烧钱,但营收不利”的局面,其实就是没有在开源的同时推出能够区别于开源模型的差异化产品,在价格上也无法与自行部署模型来竞争。在价格更低、部署也并不麻烦的情况下,B端用户们自然会更倾向自行部署大模型、甚至直接使用部署了开源模型的云服务,而不是调用API,StablityAI自己的模型开源把自己的商业化路径堵死了。
从开源转向闭源,StablityAI的自救能成功吗?
这样的商业化困境,造成StablityAI一直要靠融资维持,早在去年11月份,就有消息爆出,投资者对公司业绩不满而要求CEO辞职的新闻。
为此,StabilityAI开始密集进行商业化尝试,涵盖API、限制自行部署模型商用、ToC订阅付费等多种模式。
去年12月底StablityAI针对自行部署模型用户,变更了政策,简单说就是不商用还可以免费用,但如果商用,就要买会员了。
这个政策变更覆盖的模型有SDXLTurbo、视频生成模型SVD等(未来还会有SD3)。与之前坚持的不限制商用的开源协议不同,StablityAI想通过限制“自部署”模型的商用权限获得收入。
而且SD3宣布了很久,一直没上线模型,只提供了API调用,StablityAI似乎有转向闭源的趋势。
4月17日,StablityAI宣布SD3和SD3Turbo可以通过调用API中访问模型,而且在X帖文中还提到,为了实践开源的承诺,未来将在StablityAI会员的权益中添加这两款模型,但绝口不提完全开源的事情。
StableArtisan订阅价格
除了收模型的会员费,在5月9日,StablityAI又宣布开始做C端生意了,推出基于Discord的AI图像工具StableArtisan。
用户可以在Discord中输入提示词,用SD3、StableVideo和StableImageCore等最新模型进行生图、修图、生成视频等操作。商业化方面,StableArtisan采取订阅制,用户可以根据生图数量的需求按月或年付费。“Discord平台+4档订阅付费”,这几乎已经是照抄Midjourney的模式了,只不过订阅价格略便宜一些。
但问题是,面对各路生图模型的竞争,StablityAI还能收到C端用户的钱吗?
要想探究这个问题,我们首先要看,StablityAI的模型能力是否有优势,这个答案是“似乎没有”。我们以最新推出的SD3为例,虽然StablityAI在论文中表示经过测试,SD3比市面上所有模型都要强。
但是根据国内媒体进行的测评,在细节质量、语义理解和审美三个点的评分上,SD3基本都低于MidjourneyV6,虽然这个测评带有不小的主观性,但是综合笔者看到的其他测评结果,至少可以得出结论,SD3并没有碾压Midjourney、DALL-E的实力,不同模型在不同的维度上各有优劣。
而且,与API有同样的问题,StableArtisan也不能像市面上的其他生图产品那样调节更多的参数或使用Lora,可控性上可能还不如那些使用了开源SD模型的产品。
此外,目前StableArtisan只支持在Discord聊天框里输入Prompt,但是笔者看下来,几乎没有对用户的指引,用户虽然可以二次创作其他人生成的图片,但只能像“原始版Midjourney”那样,在Discord中一页一页的翻找。更不要说,像很多生图产品那样有让用户点标签生成提示词,或者像SeaArt一键做同款等方便用户操作的设计了。
此外,笔者浏览了一下Discord中其他用户的生图记录,绝大多数用户都是在使用文生图工具,使用线稿生图或去背景/对象等其他功能的用户并不太多,而且这个去背景的效果,似乎也不怎么好。
Discord邀请页面显示的在线人数
从人气来看,StableDiffusionDiscord的在线人数只有Midjourney一个零头。而目前,Midjourney网站端的生图功能已经向生图超过100张的用户开放了,其他生图产品基本都在网站端使用了。而StableDiffusion才刚刚走上Midjourney等产品一年半前走的路。
写在最后
作为一个AI时代的明星,StableDiffusion和StablityAI已经写下浓墨重彩的一笔,但是不到2年的时间,就沦落到出售公司的程度,也令人唏嘘不已。未来开源AI这条路能否走出“疯狂烧钱,却不挣钱”的死路,找到可行的商业模型,可能还要未来的AI创企们给出答案了。
参考文献:
1.StableDiffusion|SD腾讯云3步部署,全程五分钟,附价格费用清单
2.StabilityAIFacingCashCrunch,DiscussesSale
3.曾经爆红的AI独角兽,走到了树倒猢狲散的边缘
4.疯狂烧钱、管理混乱,StableDiffusion背后企业濒临倒闭
5.HowdoesStabilityAImakemoney?StabilityAIbusinessmodelanalysis