潮水退去,才知道谁在裸泳。
3个月前,全球最大AI开源社区HuggingFace的首席执行官对2024年的AI行业做了6条预测,其一是:
某个当红的AI公司会破产,或者以极低的价格被收购。
不知道当时他的心里有没有具体的人选,但开年没多久,现实真的如剧本一样上演。
技术团队集体出走,当红AI独角兽的垮掉
谈到文生图模型,跳不过三个产品:DALL-E、Midjourney以及StableDiffusion。
DALL-E内置于GPT-4,召唤方便。Midjourney因为创业团队只有11人而成了传奇,画风更加艺术。
StableDiffusion出名更多是因为产品本身,开源、自由、免费,背后的公司StabilityAI反而名不见经传。
最近,StabilityAI又陷入了麻烦:StableDiffusion的开发者之一RobinRombach从公司辞职。
强调“又”是因为,一年来,这家公司的技术团队动荡不断,首席技术官换人,首席信息官、工程副总裁、产品副总裁、研发副总裁、研究主管、大语言模型负责人等陆续离职。
2022年8月,Stability向公众发布了StableDiffusion,日活很快达到1000万。当年10月,Stability完成约1亿美元的融资,估值达到10亿美元,加入“独角兽”的行列。
不过1年多,Stability怎么就从神坛跌落?
离职原因并未对外公布,福布斯认为,人才外流无非一个原因:公司已经入不敷出了,又赚不到钱和融不到资。
闭源的DALL-E和Midjourney用订阅模式赚钱很好理解,StableDiffusion作为开源项目,供所有人免费下载和使用,但一样可以做大做强。
就像开源界的楷模红帽公司,基于免费的开源操作系统Linux,以订阅模式向B端出售优质的企业级软件服务,并于2019年被IBM以340亿美元收购。
Stability的盈利方式则主要分为两种:文生图Web应用DreamStudio的API访问,以及面向企业的AI咨询和模型服务。
2023年12月,Stability为商业用户推出了每月20美元起的付费套餐。个人和研究需要的非商用,依然是免费的。
然而,身处生成式AI的寒武纪大爆发,如同参与大逃杀,个人能力、人脉资源和场外因素缺一不可。
Stability不像Meta、Google一样根基深厚,也不像OpenAI有微软投喂算力和资金,而是和亚马逊的云计算部门按行业规矩签了合同,拿4000多个英伟达芯片训练模型。
AI模型训练烧钱,业务铺得不够大,虎视眈眈的竞争对手又在抢夺市场份额。去年10月,Stability从英特尔拿到5000万美元补血,但再多的钱也经不起一直亏损。
彭博社报道,Stability在2023年10月的训练和工资支出约800万美元,同年8月的软件和服务收入却只有120万美元。
福布斯从另一个角度说明了Stability的困难,打工人应该更能共情。公司不仅涉嫌拖欠员工工资、欠商业伙伴的钱,甚至因为不按时给钱逼得亚马逊威胁断掉GPU权限,但Stability否认了此事。
AI图片的版权争议,让本不富裕的初创公司雪上加霜。图库GettyImages以及艺术家们主张,Stability窃取了艺术品和图库照片来训练其模型,诉讼仍在进行中。
巧合的是,Stability和竞争对手Midjourney的关系,也在最近掉入了冰点。
3月初,Midjourney拉黑了Stability的所有员工,因为调查到疑似Stability员工的两个付费账户试图窃取数据,导致服务器长时间中断。
Stability的CEO在X回应,这只是一个员工的个人行为,再次证明,高端的商战,往往采用最朴素的方式。
做实事的人,讲故事的人
StableDiffusion和Stability之间的关系,并不像ChatGPT和OpenAI那样纯粹。
StableDiffusion源于一个学术项目,前身是LatentDiffusion模型,由慕尼黑的路德维希-马克西米利安大学、纽约的AI公司Runway主导研究。
Runway就是文生视频赛道的那个Runway,原来命运的齿轮早已开始转动,科技行业也是个熟人圈子。
图片来自:arxiv
项目的研究论文发布7个月后,2022年6月,Stability以金主的身份加入,为其提供了计算资源,Stability自己的生成式AI团队也参与了研究。
这次辞职的RobinRombach,是慕尼黑研究团队的领导和论文一作,后来被Stability纳入麾下。论文署名紧随其后的两位慕尼黑同僚,疑似也随其离开。
Stability今年2月发布了StableDiffusion3,3月发布了新的3D视频模型SV3D,这些技术人员,颇有站好最后一波岗再卷铺盖走人的感觉。
过去的一年,Stability可谓勤勉,升级StableDiffusion,并开发新模型:文生图模型SDXL、大语言模型StableLM、音频生成模型StableAudio、视频生成模型StableVideo,代码生成模型StableCode、3D对象生成模型StableZero123......
但竞争对手们也没闲着,被GPT-4、Gemini、Claude几座大山压着,StableLM几乎没有什么水花。Meta也开源了Llama2,更是和Stability直接竞争。
如今,草创时期的多名核心人才出走,虽然不至于人去楼空,但军心势必会被动摇,类似的例子近在眼前。
最近,初创公司InflectionAI联合创始人MustafaSuleyman接了微软的Offer,领导微软面向消费者的AI业务,他同时也是Google旗下DeepMind的联合创始人。
Inflection最主要的产品是聊天机器人Pi。和同行比较,Pi的情商尤其突出,更有同理心,更加关心你,喜欢加emoji疑似患了聊天讨好症,和它聊天的时候,会不自觉放松下来。
一同加入微软的,还有Inflection联合创始人兼首席科学家KarénSimonyan,以及部分Inflection工程师和研究人员。
OpenAI宫斗期间,纳德拉招揽SamAltman和几百名誓死追随的员工,从而无痛收购OpenAI的计划落空了。莞莞类卿,如今他的愿望在Inflection身上代偿。
这次微软把Inflection高管团队打包带走,将其模型集成到微软的云计算业务Azure,花的钱远低于估值,虽然不是收购,本质接近收购,Inflection和Pi名存实亡。
不难看出,当AI行业卷生卷死,人才仍然是关键。只要有人的地方就有恩怨,有恩怨就会有江湖,科技行业也不免俗,内斗不止,商战不休。
人才出走,这剧情Google再熟悉不过。同时,Stability的高层管理风格也和多次翻车的Google一样,受到了质疑。
Stability首席执行官EmadMostaque的上份职业是对冲基金经理,大部分时间在搞石油交易,虽然拥有计算机科学学位,但之前从未创办或入职科技公司,还有说大话和抢功劳的毛病,自上而下影响着企业文化。
一些现任和前任员工爆料,Mostaque经常言过其实。他在融资时将亚马逊称为“战略合作伙伴”,其实两者只是普通的甲乙方。他说Stability正在为数十家客户构建定制AI模型,但被问到具体的名字时,只透露了一家印度控股公司和一个非洲国家。
更加过分的是,明明公司已经资金困难,Mostaque和他曾经担任公关主管的妻子,与公司财务之间的关系还不清不楚。
2023年7月,前Google研究员DavidHa在担任Stability研究主管8个月后辞职,他接受媒体采访时说,尽管入局得早,推动了AI行业的发展,但Stability仍然需要找到自己的护城河保持竞争力,似乎话里有话。
多位人才出走之后,Stability自己的技术能力如何,确实是个等待解答的问题。
宣布融资的新闻稿里,Stability不知有意还是无意,模糊了StableDiffusion研究人员的存在,只说StableDiffusion是一款功能强大、免费且开源的文本到图像生成器,自己是这款产品背后的公司。
话留一半也是事实,但在论文留名的教授Bj?rnOmmer对此很是不满:“在科学研究中,如果你从某个地方拿走了一些东西,你应该归功于某人、引用某人。”
目前担任Stability首席研究员的,是从GoogleBrain跳槽的VarunJhampani,他能够被留住多久,恐怕只有他自己知道。
贩卖想象的阶段结束,见血的洗牌期到来
StableDiffusion的免费开源对于AI社区意义非凡。
它的许可证十分宽松,只要求道德、合法地使用模型,允许商业和非商业用途,让任何人可以自由地创作、开发产品甚至推出自己的项目。
比如AI生成图片的角色稳定性问题,Midjourney给出了CharacterReference的方案,开源社区则为StableDiffusion推出了附加组件IPAdapter。
同时,开源模型也更容易成为Deepfake的武器,用来生成暴力和色情内容。更有甚者,一些基于StableDiffusion的初创公司不标注许可证和技术来源,套个壳就以崭新的面貌出道骗钱了。
开源的倡导者们往往认为,当人们无需付费访问模型时,AI的开发效果会更好,并且模型的训练方式更加透明。
但开发模型的公司们未必这么觉得,因为担心“竞争和安全问题”,OpenAI从GPT-4开始不再分享研究成果,取而代之的是技术报告。
从商业的角度,OpenAI的决定可以理解。开源的两面性,以及开源和闭源的冲突,也如同当下AI竞争的缩影。
2023年,生成式AI的发展如烈火烹油、鲜花着锦,巨头和初创竞相发布模型和商业化的产品,但一派欣欣向荣的景象不仅孕育着成功,也包容着谎言、危害、浑水摸鱼和夸大其词。一时风光无限的陪跑者,小心翼翼地等待泡沫破裂的瞬间。
身为前基金经理的Mostaque,其实对水温的变化非常敏锐,很早就嗅到了AI行业竞争的加剧,曾经警告员工:“2023年你们都会死去。”
市场已经有太多的选择,一时的估值只是镜花水月。如何自力更生站稳脚跟,是AI公司们接下来的课题。
Inflection去年6月才融了13亿美元,但接到微软的橄榄枝,高管和骨干说走就走,也是因为看不到未来。
接受彭博社采访时,MustafaSuleyman谈到,Pi的每日用户数量已达到100万,然而还没有找到有效的商业模式。
Pi虽然态度友好、招人喜欢,但面向消费者的纯聊天机器人撑不起那么高的估值,不如转头去做企业定制服务和被巨头委以重任。
虽然Inflection承诺,Pi的服务“不会立即变化”,但也有人觉得,它的死亡不过早晚的事。同样,开发模型的大佬出走,用户们不免担心,尚在邀请测试的StableDiffusion3,还能不能开源。
回应RobinRombach的离职消息时,Stability发言人感谢他的付出,祝福他有美好的未来,同时强调了公司的发展重心:将技术商业化。
说到AI的商业化,家家有本难念的经。今年2月,亚马逊云计算服务CEOAndyJassy在和分析师的电话会议里谈到,生成式AI的收入“仍然相对较小”。
但他补充道,亚马逊的几乎所有消费者业务都已经或将拥有生成式AI产品,预计未来几年带来数百亿美元的收入。
微软不想被称为“OpenAI的IT部门”让投资者不满,所以一边开发内部的AI项目,一边琵琶别抱,到处挖人,向OpenAI的竞争对手MistralAI投资。
这一方面,OpenAI也很有发言权,2015年刚成立时是非营利组织,以最有可能造福全人类的方式开发AGI,2019年转变为有限利润(limitedprofit)公司,拉微软入伙投资,原因其实很简单:AI实在太烧钱了。
OpenAI去年的年化收入超过16亿美元,赚钱主要靠三板斧:会员订阅、对开发者的API接口调用收费、与微软产品的收入分成。
马斯克多次批评OpenAI的“堕落”,称其成了一家由微软控制的闭源、追求利润最大化的公司,SamAltman不痛不痒,表示想念以前的那个马斯克。
2024年是生成式AI的第二年,热点从聊天机器人、文生图转变到文生视频、机器人具身智能。
参赛选手们的情绪也变得更加紧张,如果还没有脱离融资的供血,还没有找到商业化的落地场景,或许无需很久,就能看到很多所谓的明星公司倒闭。
AI发展的初期,市场的乐观情绪高涨,会容忍贩卖梦想、粗糙的体验和对未来的想象。
但人工智能的价值必须在实践中体现出来,游说投资者的热情应当转化为消费者愿意买单的产品,技术的诗歌还是要写在互联网的大地而非虚空。
福布斯2024年10大AI预言之一是:Stability将会倒闭。它或许说对了,问题是,接下来还会有多少Stability。