一、底层大模型创业:数学天才的时代
真理总是掌握在少数人手里。而且,历史也是由少数人书写的。AGI大模型创业也是如此。
这轮AI创业看起来很奇怪:
明星公司都是底层基础模型,应用层公司大多昙花一现,所以投资人也不敢投。
只要卡够钱够,卷人数好像用处不太大:Mistral~20人团队照样完爆无数大厂。
从另一个角度,找PMF(ProductMarketFit)非常难:
即使看到了一个可能的机会,创业公司自己也没能力做出来;
要么等到开源模型的能力更新,机会马上变成红海;
要么是ChatGPT更新,瞬间机会就被碾压没了。
归根结底,是因为大多数AI公司都不拥有底层技术:拿到的开源模型也只是黑箱,自己并不知道怎么能真正做得更好,只能在现有模型上随机调优原地打转……
我们越来越发现:AGI大模型的底层技术,只掌握在少数天才的手里。而且,天才的重要性要大于人数和组织能力。
大模型公司中研究的领军人物通常都拥有计算机/数学/物理博士学位,且深耕学术研究多年。而且我们都知道,计算机/物理/经济学……一切需要计算的学科中,最牛的人往往是数学最好的。比如前OpenAI灵魂人物IlyaSutskever在本科阶段主修数学,Anthropic的CEODarioAmodei从本科到博士都主修物理(数学也很重要)……
所以说,盛产数学天才的地方,才是AGI创业的真正沃土。
所以今天要特别聊聊法国。
国人对法国的概念主要停留在艺术文化和奢饰品,但了解过Concours(法国高考)的朋友都知道,法国社会对于数学的重视程度一点不亚于海淀;数学和哲学作为Concours必考题目,才是这个国家精英眼中真正的明珠。教育基础也孕育了社会文化:除了吐槽法国政府之外,哲学-数学-历史-文学-艺术都是巴黎酒吧咖啡馆的重要下酒菜;而且,这类问题也是法国各类商业-政治沙龙的无形门槛。
回到法国数学教育本身:重理论轻计算——基本都是证明题。以个人为参照,本来以为北大物理系的数学应该不算太差,但到了法国一样被虐得很惨。才发觉,原来我本科学的叫“算术”,不叫“数学”……所以说,海淀可以量产“做题家”,但真正的“数学家”却出在法国。
但不得不说,数学天才们在法国挣得太少了。所以我们看到无数法国数学牛人去美国做算法/数据/IT,也知道很多在伦敦的量化交易公司的官方语言是法语……这些人的回流,正是当下法国AI生态的主力。
“数学理论的分支与关系”,亨利-庞加莱研究院InstitutHenriPoincaré
二、法国:数学家的摇篮
法国的数学研究历史底蕴深厚。中学数学到高等数学的课本中反复出现,虐我千百遍的名字原来那么多法国人!
从解析几何创始人笛卡尔(Descarte),到“数论先锋”费马(Fermat),从在微积分、复变函数和微分方程中大量冠名的柯西(Cauchy),到随处可见的傅里叶(Fourier)级数和傅里叶变换,乃至21岁决斗而亡的“群论之父”天才伽罗华(Galois),以及“最后一位数学全才”庞加莱(Poincaré),力学、天文学中有大量存在感的拉普拉斯(Laplace)、拉格朗日(Lagrange)……
17到19世纪的数学可谓群星闪耀,这与这一阶段法国统治者们(路易十四1654-1715在位,路易十五1715-1774在位,拿破仑1804-1815在位)热爱数学(都有专职数学老师)、大力投资数学、并从全欧洲挖角数学人才是密不可分的。
20世纪以来,法国数学仍是世界一流。素有数学界“诺贝尔奖”之称的菲尔茨奖,每四年一次,仅颁发给2至4名未满40岁作出突出贡献的数学家。而从1936年至今的69名获奖者中,法国(13人)几乎和美国(15名)并驾齐驱,并超过俄罗斯+苏联(9名)。要知道法国人口只有6700万,而美国有3.3亿。
有如此多大师坐镇的法国,如今仍是数学学习和研究者的向往之地。巴黎-萨克雷大学(UniversitéParis-Saclay,包含巴黎综合理工écolePolytechnique)数次摘得数学专业世界排行榜第一,还有索邦大学(SorbonneUniversity,包含巴黎六大),巴黎文理研究大学(Paris-PSL,包含巴黎高师ENS)、亨利-庞加莱研究所(InstitutHenriPoincaré)等享誉世界的学校和研究机构。
三、AI届的法国大佬们
如今的AI领域,无论是学术界还是科技公司,都活跃着这些有扎实数学基础的法国人才,以下仅列出部分知名大佬:
四、Mistral:欧洲顶级大模型
美国以外最引人注目的大模型创业公司之一,无疑是法国的MistralAI。当前重要AI创业公司估值如下:
OpenAI=800亿美元(2024年2月)
Anthropic=184亿美元(2024年3月)
MistralAI=65亿美元(2024年6月)
月之暗面、Minimax、智谱=25亿-30亿美元
Mistral系列是当前仅次于Llama3系列的,最重要的开源模型。提供Mistral7B,Mixtral8x7B,Mixtral8x22B三个选择。
从Mistral7B(2023年9月27日)发布,到Llama3(2024年4月10日)发布之间6.5个月里,Mistral系列一直被认为是开源模型的首选。而且,与Llama系列相比,Mistral使用宽松的ApacheLicense2.0;而且实测下来MoE架构的推理性价比真的很香。让我们期待Mistral下一代开源模型的发布。
在支持开源的同时,Mistral也在24年2月发布了闭源大模型MistalLarge和对标Chatgpt的产品"LeChat"(翻译="猫")。MistralLarge在发布时是当时最接近GPT4的产品(2024年3月末被Anthropic的Claude3系列超越)。
Mistral的开局如其名“冬日北风”一样发展迅速。23年4月三个创始人才在巴黎的咖啡馆确定“法国人也要有自己的ChatGPT”的愿景,6月就锁定1.13亿美元的种子轮融资。3个月后,不到20人的小团队,仅使用几百张A100做训练,快速发布开源模型Mistral7B。
快速出成果的背后是人才。CEOArthurMensch曾参与Deepmind的Chinchilla等知名项目,包括CTOGuillaumeLample在内的很多团队成员都来自原MetaAI巴黎的Llama团队。(这里要感谢Meta的YannLecun在巴黎的投入:Llama背后有很多法国人。)
Mistral背后的资本是法国本土+美国的混合。带着“成为欧洲AI领导者”的愿景,Mistral的1.13亿美元的种子轮就吸引了不少法国投资者,包括德高JCDecauxHolding,XavierNie(法国电信运营商Free创始人),RodolpheSaadé(航运公司CMACGM的CEO),MotierVentures(老佛爷百货所有者Moulin-Houzé家族办公室)等法国亿万富翁和家族办公室。在此后的A轮和B轮融资中,CMACGM,Bpifrance(法国国家队),法国巴黎银行BNPParibas也加入融资。当然,美国的风投机构(GeneralCatalyst,a16z,LightspeedVenture)和大厂们(英伟达,三星,IBM,Salesforce)也在投资者之列。
Mistral的意义是深远的。
首先,欧洲有了顶级大模型。于是,欧洲手里多了一张牌,可以在站队压力可控时做出独立选择,保持一定的外交独立性。
第二,Mistral的号召力盘活了法国的AI生态。围绕Mistral和HuggingFace,法国当前的AI创业生态非常繁荣,这样可以进一步聚集AI人才,也给投资人信心,走入良性循环。
五、不止Mistral,法国的AI“隐形冠军”们
1.HuggingFace:模型平台
Github是代码的平台,HuggingFace(HF)是模型的平台,也是AI开源在全球扛大旗的。HF最大的想象空间,是成为“模型调用模型”的平台与规则制定者。于是,HF在23年5月发布TransformerAgent1.0,并在24年5月升级到2.0,做的就是这件事。官方宣称基于Llama3-70B-Instruct在GAIALeaderboard测试中,比基于GPT4的Agent有更好表现。
HuggingFace其实是一家“法国-美国”公司。
HuggingFace在2016年由三位法国人ClémentDelangue,JulienChaumond和ThomasWolf在巴黎创立。公司初始想法是“面向青少年的AI驱动的聊天机器人”,当时在法国难以获得风投,于是搬到纽约以获得第一轮融资。
2019年,在Google发布BERT模型后,公司逐渐将聊天平台转化为开发者社区,并逐步形成了全网最大的自然语言处理开源模型数据库,获得Google、Amazon、Nvidia、Salesforce等多个巨头的战略投资。
目前HuggingFace约180名员工中三分之二在欧洲,其中70人位于巴黎。
HuggingFace的重要性在于,它本身就是生态。它正在成为一个创业工厂,从中已经产生了AdaptiveML(详情见下),Contextual和Arcee等AI初创公司。
2.H.ai:Mistral之外第二家底层模型公司
如果说,Mistral是Meta系,H.ai就是Deepmind-Google系。
创始团队:法国人CharlesKantos聚集了四位来自Deepmind的强化学习、博弈论和多智能体领域的专家,其中LaurentSifre和JulienPerolat是法国人。
产品定位:开发“能动性”或“以行动为导向”的AI模型,这些模型能够推理、规划和协作解决问题,超越当前的语言模型;围绕行业的企业提供这些AIAgent,以推动生产力和人机协作。
融资:种子轮融资2.2亿美元(2024年5月),分别来自:
VC:Accel、Bpifrance(法国国家队)、Creandum、ElaiaPartners等;
家办:EricSchmidt(前GoogleCEO和主席)、XavierNiel(法国电信运营商Free创始人)、BernardArnault(LVMH董事长)等;
大厂:亚马逊、三星和UiPath的战略投资。
3.AdaptiveML:LLM企业个性化部署
创始时间:2023年,总部位于纽约,但在巴黎有一个强大的技术团队。
创始团队:5位法国人JulienLaunay,DanielHesslow,BaptistePannier,AlessandroCappelli和AxelMarmet共同创立,他们都曾一起在开源的FalconLLM项目上工作,并且三个人此后在HuggingFace工作。
产品定位:帮助企业将大型语言模型(LLMs)适应于他们的特定用例,并根据用户互动不断改进模型。
融资:种子轮2000万美元。
4.Dust:AI助手
创始时间:2023年。
创始团队:2位法国人,GabrielHubert和前OpenAI员工StanislasPolu。
产品定位:用来自Notion、Slack、GoogleDrive等的内部数据,使用带有检索增强生成(RAG)的LLM来为公司客户构建一个内部AI助手平台;在OpenAI、Cohere和AI21等公司的现有LLM之上构建应用程序。
融资:4500万美元+
5.Giskard:AI系统的安全
创始时间:2021年。
创始团队:2位法国人包括前Dataiku员工AlexCombessie和Jean-MarieJohn-Mathews,以及AndreyAvtomonov。
产品定位:开发一个开源AI测试框架,作为“市场上最好的大语言模型杀毒软件”,来保护AI系统安全。
融资:450万欧元。
6.Photoroom:电商图片生产
创始时间:2019年。
创始团队:2位法国工程师背景的创始人,MatthieuRouif和EliotAndres。
产品定位:基于AI的图片编辑软件,让用户无需经过大量训练就能创造出令人印象深刻的图像;开发了自己的自定义基础模型“PhotoroomID”。
融资:6400万美元。
7.Owkin:药物发现&临床优化
创始时间:2016年。
团队:法国临床研究医生ThomasClozel和生物学领域的人工智能先驱GillesWainri。
产品定位:开发用于药物发现、临床试验优化和人工智能诊断的技术;主要产品MSIntuitCRC-一款在欧盟获得批准的人工智能诊断工具,用于预先筛选结直肠癌患者的生物标志。
融资:3亿美元(其中1.8亿美元来自赛诺菲)。
除了最新的AI创业公司之外,更久一些法国人的科技创业故事是创立数据/SaaS/AI公司,获得美国风投,然后在美国上市。
8.Snowflake:云原生数字平台
2012年在美国加州,由两个法国人BenoitDageville和ThierryCruanes,与MarcinZukowski共同创立。
2020年上市,当前估值约550亿美元。
2023财年总收入为26.2亿美元,截至2024年1月,Snowflake在全球拥有7004名员工,并在福布斯全球2000强榜单中拥有691家世界最大上市公司的客户。
9.Datadog:用于云应用的监控和分析平台
2010年在纽约,由两位法国人OlivierPomel和AlexisLê-Qu?c共同创立。
2019年在纳斯达克上市,当前估值约370亿美元。
2023年收入超过20亿美元,拥有超过5200名员工,为全球27300名客户提供服务。
10.Dataiku:人工智能和数据科学公司
2013年在纽约,四位法国人FlorianDouetteau,ClémentStenac,ThomasCabrol和MarcBatty共同创立。
2022年8月E轮融资中筹集了4亿美元,公司估值达46亿美元。
2023年营收约2.3亿美元,拥有约1400名员工和600多个全球客户。
六、挑战与机遇
最后,法国AI究竟有多强?有超过中国吗?
我觉得答案还是明确的:AI第一强国是美国,第二是中国。因为无论是从总AI论文数量还是研究者数量,中国都比法国要高出一个数量级。我们也看到假以时日,国产模型们也一步步逼近GPT4的水平。但问题是,我们的这些大脑是否用在了真正技术前进的方向,还是用在了完成内部KPI的雕花上?以及在这个天才创业的时代,个别天才是有可能改变历史命运的。
法国AI行业的瓶颈,一个是人才数量,另一个是半导体工业。
人才瓶颈目前主要由东欧和北非在补,但如何培养出更多的AI人才正在给法国当前的教育体系提出巨大挑战。以及,法国的高级AI算法人才的工资明显低于美国和中国:这一方面对于创业公司是成本优势,但另一方面也造成了国家层面的人才外流。
芯片相关的半导体工业的短板更加难补。目前芯片工业体系主要在美国和东亚,消费电子在中国更是有巨大优势。欧洲可能需要再造一个“空中客车计划”,才有可能在AI浪潮中立住根基。
最后,欧洲作为AI第三极有着更多与中国合作的空间。法国-欧洲的AI发展有着众多痛点缺陷,如果我们有能力提供一部分价值,那么机遇也自然会向我们招手。