专访澜舟科技周明: 我不追求AGI, 我追求ROI

科技甲子光年2024-03-26 14:53:10  80

大模型创业,可不可以小而美?

作者|赵健

GPT-4发布一年后,做“中国版的OpenAI”,已经成为头部大模型创业公司不成文的主流叙事。

这套叙事逻辑中的AI公司往往以AGI作为愿景,在Scaling Law的指引下追求千亿乃至万亿参数的大模型,并以此撬动AI时代的to C生态。这些公司也吸引了绝大多数的投资、人才与聚光灯。

但也有大模型公司尝试“四两拨千斤”,提出一套“反OpenAI”的叙事。澜舟科技就是其中的代表。

澜舟科技创始人兼CEO周明告诉「甲子光年」:“澜舟科技不追求AGI,也不追求超越GPT-4,而是把大模型如何更好地服务客户放在首位,并且计算好ROI。”

在今天追赶OpenAI的氛围下,澜舟科技似乎成为了少数派。

成立于2021年6月的澜舟科技是中国最早做大模型创业的公司之一。那时候,大模型在AI圈都是一个冷门词汇。

澜舟科技创始人兼CEO周明是世界自然语言处理(NLP)领域的领军人物,曾任国际计算语言学学会(ACL)主席、微软亚洲研究院副院长、中国计算机学会副理事长。今年年初,周明当选“2023年度ACL Fellow”,这是NLP领域的最高荣誉。

2020年底,在见证了OpenAI发布的GPT-3惊人的“智力”后,周明判断一个属于AI的大时代要来了。他选择从工作了21年的微软辞职,毅然踏上AI创业之旅。半年之后,在创新工场的塔尖孵化下,澜舟科技正式成立。

凭借周明博士的资深履历,去年硅谷科技媒体The Information也将其领军的澜舟科技评为五家“最有可能成为中国OpenAI的公司”之一。

但澜舟科技并没有对外界讲述一个打造中国版OpenAI的故事,而是选择小而美的“小参数大模型(SLLM,Small LLM)”路线。澜舟科技本周刚刚发布的澜舟孟子GPT大模型,最高参数只有400亿。

澜舟科技并没有着眼于开启AI时代新的互联网革命的to C市场,而是选择了更加非标准化的to B市场。周明坦言,在中国做to B很难,但不得不做难而正确的事。

因为要做to B,大模型成本与客户预期必须找到平衡。如果超出客户预期,一味追求大参数并没有意义。为此,周明还提出了“周明曲线”,将最佳的模型参数范围定在了100亿到1000亿之间。

去年,在调研了102家企业之后,澜舟科技找到了“周明曲线”的最佳临界值——400亿。周明认为,400亿大模型能很好地兼顾技术领先性与低成本的需求。

周明认为,大模型有两大流派,一是好奇心驱动的技术信仰派,最终目标是追赶OpenAI,实现AGI;二是以大模型落地与商业化为首要目标的市场信仰派,技术是否领先并不那么重要。

科学家出身的周明也认同Scaling Law,但在落地的时候,并不会一味追求它。因此,周明将澜舟科技定位为技术与应用双轮驱动的“融合派”。

周明判断2024年是大模型落地元年。在他看来,大模型落地过程中,“互联网的七字法则仍然适用:专注、极致、口碑和快,还要再加上成本,形成大模型落地九字法则”。

周明认为,作为创业公司,找到商业模式最重要,而不是一定要追求做出最牛的技术。周明坦言,放眼市场,可能只有他说这一点说得比较多了。

人人都想做OpenAI,但澜舟科技主动选择了“小而美”。这套大模型路线能否成立?

对此,「甲子光年」专访澜舟科技创始人兼CEO周明,来揭秘澜舟科技过去一年大模型的落地探索与背后的思考。

1.谈派别:技术与商业之间的融合派

甲子光年:去年被问到为什么中国没有做出ChatGPT,你回答“贫穷限制了想象力”。现在ChatGPT发布一年多,新的技术与产品层出不穷,澜舟科技的想象力有没有变大?

周明:我们去年也比较冷静。去年大模型一出来,我就知道大模型还会出现改良,但突飞猛进会比较难。因为从2017年到去年,也就冒出一个GPT。从去年到现在,虽然有一些改良,但都不是革命性的,Transformer、Multi-head attention(多头注意力机制)架构没有发生变化。

最大的变化是数据,数据量与质量提升,模型层次增加,围绕Scaling Law做工作。我去年也预感到,Scaling Law应该follow,数据更大、模型更大、算力更大,性能就会更好,我们也遵循了。

但我们也考虑了落地。落地的时候不能无限追Scaling Law,因为要考虑成本问题。在to B场景,大模型到底需要多大?我将其总结为“周明曲线”。

我们调研了102家企业后发现,400亿模型就足够了。对于工业界来讲,它能解决80%的应用产品环境。虽然我也可以不计成本把它变成千亿、万亿模型,水平当然会更高,但ROI就小了。既然做公司,那就要算ROI。

甲子光年:你在技术上信仰Scaling Law,但在商业上会更克制?

周明:主要考虑公司的运营成本。大型模型有两种流派——第一种是纯粹的技术派,由好奇心驱动,不计成本。模型参数接近人脑神经元个数,数据更大、算力更大,一点点逼近AGI,再把多模态加进去。这种通常由科学院或者比较有实力的大公司进行。

第二种是实用派,他们使用现有的模型,如开源模型,来解决实际问题,注重实用性和落地性。

甲子光年:澜舟科技是哪一派?

周明:澜舟科技是两者结合派,技术加应用双轮驱动。我们既了解大模型的技术发展趋势,也知道如何在适当的时机应用大模型,并能够利用大型模型的优势来弥补其短期的不足,而不是盲目地使用。当我们在实际应用场景中得到反馈时,这些信息可以帮助我们在下一代模型训练中做得更好。

例如,大型模型的可解释性比较弱,而原先是没有人讨论RAG(Retrieval-Augmented Generation)的,许多本地数据和用户数据无法被纳入模型中。这些都是那些真正从事过模型落地工作的人才会有的深刻体会。

我不排除要去做Scaling Law,但我不会永远做下去。我觉得自己算是理论与实践结合比较准的,但也不能说别人不结合。

甲子光年:目前市场上的公司,技术派、落地派、融合派,哪个更多?

周明:大家关注比较多的肯定是第一类,融资比较多的公司,他们给人的印象是追求大模型的前瞻性能力,或者说追赶OpenAI,解决人类的AGI问题。但更多的人是第二类,只是很少有人关注,有数以千万的人基于开源模型做很多有趣的应用。

把大模型跟实际应用巧妙结合起来,大概国内说的比较多的人就是我了。因为我做过大模型,也做过应用。前者需要持续投入,还可以再投十年,但只要你停下脚步,三个月之内就会从王者跌落神坛,马上有人超越你。

作为一个初创公司,在投资力度有限的情况下,是要非常谨慎的。但如果天天做应用,而不知道未来技术发展轨迹的话,可能会失去一些前进的动力。所以,两者都需要去关注。

2.谈愿景:我们不把AGI当做愿景

甲子光年:现在一些大模型公司把AGI当做公司愿景。澜舟科技的愿景是什么?

周明:我们不把AGI当愿景,这是我的性格使然。我个人认为AGI是人类长远的目标,过去人工智能有多少次起伏?每次有点起来的时候,都说AGI越来越近了,比如当年机器翻译刚刚做出点成果,马上有人说,人类不再需要翻译,搞得大家挺恐慌。每次只要科技有点进步,就有人说“人类工作被消灭了”“人类要寻找新的生存空间了”“硅基智能与碳基智能谁更厉害?”等等诸如此类的问题,但每次事情都没有那么大。

甲子光年:是因为“狼来了”的故事听太多了吗?

周明:我的岁数稍微大一点,见过几个人工智能的冬天。但人工智能每次进步,确实离AGI更近了。第一,要乐观看待技术进步,市场离AGI越来越近,就会产生巨大的机会;第二,要冷静一点,我们离真正解决AGI的问题还有很长的路要走,包括杨立昆、张钹院士他们都有这种观点,我也赞同。现在的语言模型、“世界模拟器”Sora,都是用数据驱动的方式向AGI更近了一步,很多人工智能的原理,包括人类智能的原理,还不是很清楚,需要进一步研究。

甲子光年:如果说AGI还是一个长期愿景的话,那澜舟的短期目标是追赶GPT-4吗?

周明:我们也不把什么GPT-4当做目标,我就是站在客户和公益的角度。比如我要做to B,那to B要解决哪些场景?哪些是大模型解决得很好的,哪些是解决不好的?解决不好的如果不是核心场景,我就先容忍;如果是必须跨越的一步,我就着力去解决。做来做去,我这个模型有的地方比GPT-4厉害,有的地方远远不如,但是客户所期待的。我是走这种从实际中倒逼模型发展的路线

甲子光年:总结一下,澜舟科技的目标是什么?

周明:用AI解决千行百业中遇到的一些核心问题,不是零碎的问题。有些问题正好是GPT-4的研发方向,有一些是GPT-4根本没有考虑到的问题,就需要我们加入并提出解决方案。我是以解决问题出发,不会说问题都不看,GPT做啥我就做啥。国内的投资人也好,创业者也好,有的是这么做的(follow GPT),那也没错,也能教育受众。但是我在微软经历过这些事情,我不会被表面的现象所迷惑。

甲子光年:解决这些行业核心问题的本质是什么,降本增效?

周明:一个是解决降本增效,这是已有问题;还有一个是创造一个前所未有的增量市场,原先没有这样的技术,大家觉得这件事没法做。但现在有了这样的技术,我们带着这种技术了解客户需求,创造出所谓的大模型原生应用。这是革命性的变化。再次强调,要想带来大模型与大模型原生应用,技术与用户场景两个必须都懂。

3.谈融资:不担心估值比同行低

甲子光年:去年大模型火了之后,你最开始做to B的想法有动摇过吗?融资、投入可不可以更激进一点?

周明:从我的本心来说没有动摇。融资上不同的公司会有不同的表述。有的人明明不信任OpenAI,但他就宣称自己是中国的OpenAI。我们一直坚持说理论与实践结合,坚持to B为主,to C为辅,我认为这比较符合中国目前的国情,但不排除有人追赶OpenAI,也是一个非常重要的努力;或者有人就拿开源模型做应用,也有意义。创业各有千秋,取决于你自己的判断

甲子光年:去年The Information也评价澜舟科技是5家“最有可能成为中国OpenAI的公司”之一。

周明:受宠若惊。我们做的也没那么好,其他上榜的也不一定能走多远,大家属于刚刚开始。

甲子光年:如果澜舟科技融资了很多钱,现在会做出不一样的决策吗?比如会不会做Sora那样的视频模型?

周明:我会有轻重一些。比如大模型的一些短板,我会尽早布局,而不一定等OpenAI做出来我们再做。但投资额度小的话,会更多地先了解别人,会用就行。看你的投资额度,每个公司都应该有自己的判断。

初创型的公司肯定是有聚焦的。我们只聚焦在语言理解,而多模态涉及的则相对较少,多模态领域原来做视频和图像的涉及会比较多。我们就是做语言模型,以及提升语言模型能力的Long context(长文本)、RAG等技术。我们的“一横N纵”的“N纵”,就是各种语言模型的能力,包括信息抽取、信息检索、翻译、问答、写作等。

甲子光年:从融资的角度来说,澜舟科技不在第一梯队,还没到独角兽的级别。你怎么看待这件事?

周明:首先恭喜融资比较多的大模型公司,他们做了不错的努力。我们这边因为讲究大模型的落地,融资的需求会从实际出发。另外,我本人的创业理念就是不喜欢去套热钱,融资的节奏和力度要跟公司现在的发展和未来一两年的发展匹配,否则会背上一个很大的包袱。

融资多和少是需要理性判断的,如果未来做大需要快速复制,就需要很大的投资。每个人有不同的判断,切忌盲目抬高估值。

甲子光年:你担心在投资人心中,澜舟科技的想象空间更小吗?

周明:的确会这样,但我正是有意而为之。我们不是随波逐流的,而是以终为始,坚持客户与市场的需求。

甲子光年:现在的融资节奏符合你的预期吗?

周明:我们的融资节奏很清晰。去年年初融资了一个亿左右,对于我们这样的团队,足以支撑我们几年的发展。我们自己又有落地项目,还有一些收入。我希望我们的造血能力能够发展起来。我们融资时刻都是开放的,讲究的是小步快跑,不讲究非要融多少多少钱。

我们融资的目的很清晰,就是支撑一些新的业务发展,比如我们的商业化元年,要组建商业化团队,需要资本来支撑一些事。我们有一些新的技术,比如客户对大模型的期待,比如可解释性、大模型的评测,从分析到生成的能力,RAG如何做的更好等,这需要投入一些研发资源。

甲子光年:融资更多才会有资源来投入一些最前沿技术的研发。

周明:世界上最头部的科研问题,应该由创业公司来做?还是应该由科学院或学校来做?我对此有不同意见。我认为,创业公司最重要的事情,是把商业模式做出来,而不是发明一个最牛的技术。从历史上看,施乐发明了很多东西,没一个能落地的,但微软把那些技术很好地用来起才成就了微软。

所以我觉得以终为始,从客户和社会需求角度,把现有东西能够最好地巧妙用起来,不排除你可以去收购或合作,也不排除自己成立一些研究部门,但一开始不要轻易地把所有压力都压在核心技术开发,才成立一个伟大的公司,这可能有难度。

甲子光年:OpenAI也是创业公司,它在引领这一轮AI浪潮。

周明:现在这一轮AI竞争还没有结束,未来是什么样也不好说。未来我觉得一个有资源、有场景和应用、商业模式清晰、把大模型跟自己的业务结合的非常好的公司,最后赢得可能性会更高。OpenAI是因为跟微软结合,等于微软弥补了很大的短板。

甲子光年:现在很多AI人才会奔着瞄向AGI的大模型公司,澜舟科技在人才方面,会不会相对缺乏吸引力?

周明:人才也各种各样。有想做AGI的,有想解决问题的。如果你是想做AGI的,想推数学公式,那我们肯定不是这个方向,也不是我的初衷。我在微软亚洲研究院担任副院长的时候是这样的,但现在做AI to B的创业,我们更想吸引那种拿最新的技术来解决人类问题的人才,而不是说非要发明新的技术。

4.谈落地:今年才是大模型落地元年

甲子光年:你一开始创业为什么想做to B,而不是to C?

周明:第一是我对中国的理解。中国过去几十年企业的智能化水平相对来说比较薄弱,之前国家号召大家去做大数据平台、数字化等方向,但智能化的水平在各行各业都还比较薄弱。我认为站在国家的方向上看,to B会比较有机会。

第二,在经过20多年互联网高速发展后的今天,大模型to C的机会我认为很少。To C在没有大模型的时候都有王者了,有了大模型,这些公司不会掉以轻心,把大模型拿过来就到位了。

现在的问题是,你有没有本事创造新的to C问题,但to C在国家跟国家、民族跟民族各地都相似,非常难创造出一个别人没想到你想到的新的to C场景,有很多的用户基础非常重要。再加上中国to C的付费意愿都比较低,未来大厂对你会有碾压的可能性。假设你费了很大的劲做了一个to C应用,大厂也不会闲着,它有技术、有能力、有资金,很快就免费把它做出来。

至少对我来讲,to C的创业机会是很小的。To B既然符合国家长期战略,大厂做的难度也比较大,因此创业团队会更有机会。基于这些考虑,我选择了这个领域。

甲子光年:To C是不是更适合年轻的创业者?

周明:To C永远都是年轻人而不是老年人的。年轻人有敏锐的视角观察,也有自己的体验,更有可能创造出新的to C场景。

甲子光年:但在中国做to B,实际上也不好做,SaaS行业就是一个典型的案例。

周明:中国长期看to B是有道理的,短期很难。中国to B各个公司对自己的数据要求比较严格,所有都不喜欢走API或者SaaS。To B也需要打单,需要去交付,这些成本都相对比较高,周期也比较长。

但我对to B长期是看好的,你可能第一个单子或前几个单子是很辛苦,但是你一旦通过打单,你提升了自己的服务能力和标准化水平,那后面的单子就能更加高效得来实施了,形成规模化,提供标准的产品和服务。但前提是你自己要走出来。

我坚信没有一件容易的事情。现在在中国创业,你只能去选择那种难而正确的事情。

甲子光年:去年澜舟科技做出一个判断,“to B行业的价值会在2024年上半年体现”。为什么不是2023年?

周明:去年大模型刚出来,央国企大厂都在观望。假设有开源了,他们自己去试一试到底有没有用,哪些地方会有用,心里清楚之后沉淀一下,在内部形成一个共识,要不要往大模型方向走?

经过一年时间的尝试我们判断是够了,央国企在2024年应该会下场。下场就是要拨出一部分预算来做一些行动。你看投资委报告、政府工作报告,都在鼓励央国企大厂考虑人工智能+的问题了。诸如此类的信息告诉我们,2024年应该是大模型落地的元年。

当然元年不代表爆发年,只是代表大家开始行动了,开始做预算了,开始跟你接触了。什么时候爆发?怎么也要花两三年的工作培育这个市场,包括有些技术更加完善、交付的过程更加标准。

甲子光年:最近跟客户接触最直观的感受是什么?

周明:去年的客户找我们主要是做咨询,但没有诚意要成单。今年找我们确实业务有需求,他的同行,或者上级单位已经做了某些大模型的应用,现在来找我们是有诚意的。但也不是一窝蜂的来,金融客户比较多,其他行业相对少。

甲子光年:业务咨询是付费的吗?

周明:我们做咨询都是免费。一是我们觉得咨询就是建立客户认知,也赢得客户;第二客户也是这么认为,他认为你是这个领域的公司,我们不懂跟你了解,也许日后会形成合作伙伴。

5.谈客户:如何建立标杆客户

甲子光年:澜舟科技曾表示,“大模型落地商业化,标杆客户是关键”。澜舟科技是如何树立标杆客户的?

周明:比如传神语联,曾经是中国和亚洲最大的人工智能翻译网络公司,原来是靠人工翻译,后来在我们的预训练模型,以及现在的大模型基础上做翻译系统,几乎达到人类翻译的水平。现在再把订单发给具体的翻译工作人员的时候,先通过模型翻译,人再检查一遍,这样就能大幅度提升效率。这是在翻译领域的一个标杆客户。此外还有华为、中金,提升他们翻译的能力。还有投研领域的同花顺,用孟子大模型来改进他的投研系统的能力。

甲子光年:当时的合作是如何达成的?当时也会遇到成本、信任度的问题。

周明:当然感谢人家对我们的信任,更重要的是人家看到我们的技术,虽然我们是一家初创公司,但技术一开始就是讲究应用怎么做,不去讲那些高大上的概念,我们做的比较实际,把水平提升到一定程度,能在业务场景用起来。

甲子光年:怎么看待大模型成本过高的问题?

周明:去年5月份之前卖一个大模型,能卖上千万,但对于很多客户来说这是不可接受的。客户对于大模型的期待成本接近于零,你跟客户讲你训练大模型花了多少成本是没有意义的,客户不接受成本定价。客户能接受的是,你这个大模型能提供什么样的功能,至于背后的大模型技术,对客户是无感的,还是要把产品、用户体验做好。

首先,模型本身的成本要降下来;第二,要从模型走向产品,而不是去兜售模型本身;第三要考虑用户的接受度,与其最后一公里业务场景相Match。这三件事我认为很多大模型团队都没有做。

甲子光年:跟这样的B端大客户,主要就是聊这三件事吗?

周明:对,这些都不是在追赶OpenAI时能够体会到的。我们既要仰望星空,把技术做到一定水平;又要脚踏实地,把客户很好地对接,才能真正解决问题。现在有的人走向了极端,就觉得有高举高打的技术,觉得客户拿去用就好使,这在中国肯定很难。它可以吸引一段时间的投资,但要落地总要走这样一种方式。

甲子光年:如果一家千亿模型的公司来做to B,跟澜舟相比会不会更有优势?

周明:优势很清楚,因为他能做千亿模型,技术、品牌都是不错的。但劣势是,他这些人愿不愿意躬身入局,把所有客户的事情了解特别清楚?因为这件事的ROI对他来说并不高。因为ROI不高,他有可能基于各种理由不去做,从而也就失去了一些跟客户对接的机会。这件事儿本身没有对错,就是企业基因决定的。

甲子光年:开源的Llama2有700亿参数,客户为什么不直接用开源模型?

周明:如果客户是一个小应用,自己用开源做一做就够了。但要是大的应用,还是喜欢找一些专业的公司合作,他会觉得专业公司能把一些核心问题做出来,并有一定的前瞻性。而且他也希望这样的公司未来持续给他维护。

甲子光年:什么是小的应用?什么是大的应用?

周明:比如小的文本分类、小的信息抽取,用户找不找你都没有什么意义,钱很少,而且他也不想花那个钱;大的应用,比如搜索翻译,文档理解等,用户自己很难做好,这种订单也相对比较大,我们也愿意多做,也是我们发力的方向。

甲子光年:如果做to B,数据飞轮如何形成?因为to B的客户更倾向于私有化部署,数据留在客户侧,这样模型层与用户层就无法“握手”。

周明:在中国做to B,数据飞轮某种意义上是无解的,也就不要去追求它。你能做的就是两件事,一是大模型的预训练数据足够广泛,二是做RAG,把这两件事做好,在to B行业就能解决问题了。做to C要有数据飞轮,但to B很难。

甲子光年:谷歌近期发布的Gemini 1.5 Pro,有100万token上下文。有人说上下文足够长之后,RAG不存在了,你认同吗?

周明:思路不一样。RAG的出现是因为很多用户不想把数据训在模型里,既有保密问题,又想保持灵活度(RAG可以灵活地更换数据)。谷歌的思路是允许用户上传一个长文本来替代RAG,从技术上来说是有可能的,但实际上真有这么大的必要吗?

我觉得RAG更灵活,而且还要考虑成本。谷歌也好,其他大模型也好,从input token到output token,上传这么大的文本是要算钱的。在云上部署的时候可能会省略掉一些本地部署的成本,但是还要考虑用户是否愿意把自己特别敏感的数据放在云上,并形成它的长文本的一部分。至少在中国,很多用户是会担心的。

甲子光年:RAG就是做本地部署吗?

周明:RAG是在本地部署,在本地把模型与用户数据连接;谷歌等于在云上,需要用户上传PDF文档,就不需要做RAG了。这两个也不能说是替代关系,等于用户多了一个选择。

6.谈金融:是普遍场景,但不一定赚钱

甲子光年:澜舟科技为什么聚焦在金融领域?

周明:金融对于国民经济非常重要,它还有一些客观的优势:一是金融数据比其他领域多;二是金融领域历来对人工智能比较热情,从CV阶段,到现在大模型的落地;三是金融领域预算比较充实。金融公司都有自己很大的团队,就是要解决它的刚需问题。

金融领域是大模型落地的一个普遍场景,但是不是最有利润的场景?不好说,因为金融大模型的利润比较单薄,成单时间比较久,预算可能做一年半年,交付在做一年半年。从商业的角度来说,大家要谨慎。

我们更多把金融当成一个打磨标杆的过程,这个过程会形成标准化的应用,在其他领域落地。

甲子光年:以金融行业模型为例,是直接通过预训练来做,还是在一个通用模型上加金融行业数据做微调?

周明:取决于你对数据的掌握。假设你的金融数据足够强,那就在通用模型基础上加金融数据做continue train,当预训练,把金融模型做出来;假如你的金融数据没有那么多,再加上你的通用模型很不错了,那就在通用模型基础上加点SFT。这个取决于你手里有多大的资源。

甲子光年:哪一种方式效果更好?

周明:不好说。站在用户场景上来讲,如果场景单一的话,SFT肯定就很简单,甚至连SFT都不用,context learning 就可以;但如果场景足够大、数据量足够大,预训练数据不用就可惜的话,还是应该训一个行业模型。背后还是成本问题。

甲子光年:你更倾向于做哪一类客户?从头预训练做行业模型,可复制性大不大?

周明:首先站在公司收益角度,哪个收益大,就更应该做哪个。个别单子订单很大,但用户用途很窄,这不一定是公司的首选。有些用户用途很广,但客户没什么钱,我们也不想从他这非要挣多少钱,只是想做一个场景实验形成一个案例。这个还是case by case。

7.谈商业模式:如何避免项目制陷阱

甲子光年:做to B的一个核心问题,包括以前的AI四小龙也遇到类似问题,就是如何避免做成项目制,因为很难规模化复制,利润很低甚至亏损。澜舟科技如何做的?

周明:首先要承认这件事的难度,我们能做的就是标准化的程度。澜舟科技发布的“一横N纵”产品体系,就是从用户的需求中提炼出最精华的、占据80%场景的需求。那么剩下20%的需求,标准化程度低或者难度太大,我们就不去碰。

这样能做到标准化。第一个客户可能要打磨做技术储备,但以后形成标准化之后,后面越来越多的客户只需要上传数据或者跟我们配合做本地部署,就能马上看到效果.

我们希望通过大模型时代提高成单和交付的效率。如果这个效率解决了,to B还是很有机会的。

甲子光年:一横N纵的具体产品体系是怎样的?

周明:一横首先有两个标准的通用大模型,一个13B,一个40B,有三个垂直模型——金融大模型、编程大模型,以及其他行业的垂直模型;N纵是一些具体场景的能力,包括文档理解、文档问答、文档写作、机器翻译、会议分析、文档检索等能力。

此外,横是可以替换的。比如我们现在用的金融大模型,突然有一天我们要做体育领域,我们自己没有这个模型,但合作伙伴有,我能马上把合作伙伴的模型接入进来。

(本周的发布会上澜舟科技宣布与零一万物达成合作,零一万物即将在近期发布千亿级别的基础大模型,可以作为澜舟科技“一横”的合作伙伴。两家公司都是创新工场塔尖孵化的公司)

甲子光年:一横N纵的产品思路是怎么形成的?

周明:最早是去年形成的。去年我们在考虑大模型落地时总是遇到一种困惑,就是每次跟客户讲,你看我们这大模型有很多技术,你想做投研、想做翻译都能做,通过聊天的方式写出来就能解决。

客户却觉得这太费劲了,他说面对你的孟子大模型,第一,我不知道它有啥能力,也不知道怎么去试;第二,我心里只需要你做一件事,可是你给我整出这么多选择。你就告诉我这是个翻译系统、这是个搜索系统,别告诉我这是一个大模型技术好不好?

我一下受到启发。大模型不是用户的中台,用户不太关心也不想了解大模型。其次,Chat不是用户的常态,它是教育受众的一种手段,而用户的场景都是很具体的业务模式。于是,我把业务底层用的核心技术一个一个找出来,分一下类就发现,N纵的技术几乎支持了80%的业务场景。

一横是给自己看的,等我把这个技术一个个做好了,跟客户讲起来也容易。你要做搜索,我们有搜索;你要做翻译,我们有翻译。而不是你要做搜索,我给你个大模型去玩玩,这是一个用客户语言跟客户对齐的方式,内部研发人员也对齐了。这样也提高了我们跟用户谈单、订单与交付的效率。

甲子光年:这件事具体是什么时候开始做的?

周明:我是去年底彻底想明白了,有了一横N纵的概念。现在很多人在吹捧什么交互式、Chat的方式,我们更多地是走向技术、走向产品,而不是底层的核心模型。

甲子光年:这次发布的是孟子GPT大模型,但实际上孟子大模型也保留了BERT、T5等路线。为什么是这种选择?

周明:都是按照客户需求,从落地角度也不存在GPT就能大一统。比如说,用一个BERT的小模型就能解决的小需求,为什么非要搞一个大模型?站在用户的角度,用户需要什么模型我就提供什么模型。

甲子光年:即使是做to B,行业也有不同的做法。比如智谱AI就自己不做行业模型,只专注在通用模型,最后一公里交给合作伙伴。而澜舟科技是自己做行业模型,为什么会这样?

周明:我们是兼容的,也有合作伙伴拿我们的模型去改造,对接客户需求。但我觉得在合作伙伴成功之前,自己要成功。你的模型水平到底多高,能不能用起来?所以我们是先走示范工程、标杆客户,重要的场景先自己做一遍,做完了再去告诉合作伙伴,遇到这种情况这么做,遇到那种情况那么做,使得整个过程非常流畅。

甲子光年:现在还在示范工程阶段吗?

周明:现在做示范工程做的比较努力,合作伙伴也在寻找,这个过程中也有合作伙伴,但是没有铺开。现在市场上还没有多少模型能做到这一点,主要是模型水平不够。有很多地方合作伙伴既要懂模型,还要懂场景,对合作伙伴也很难。

大家现在对大模型有一点误区,觉得大模型现在的水平啥都好使。你要真去做to B的话,真是干啥都不好使。

甲子光年:干啥都不好使?

周明:差距很大,我们做技术的人有时候不愿意说太多,技术没有到吹成神话的地步。这时候要对接用户场景怎么办?运用之妙,存乎一心,巧妙地把大模型的长处用起来,大模型的短处克服掉,才能解决场景问题。太理想主义,至少还不是今天,至少还需要一定的时间。

甲子光年:这个时间还要多久?达到比较理想的、好用的状态。

周明:要有一个top down和bottom up的过程。我们做大模型的人要让用户一点点接受,用户再反馈给我们,对大模型做相应的修正,甚至加一些中间层,使得大模型能够过渡到一种理想的状态,这正是我们提出L1、L2、L3、L4(孟子通用大模型、行业大模型、场景任务大模型、AI Agent)的分级,从大模型一点点到行业、客户场景与产品。从top down走到bottom up,走两三个来回,大模型就算走通了,现在还没有。

甲子光年:现在走完一个来回了吗?

周明:我们大模型团队在往下走,用户在往上走,中间“握手”的部分,还差点意思。

甲子光年:澜舟科技的商业化进展如何?

周明:我们团队是把今年当做商业化的元年,我们也组建了相应的营销、售前队伍。去年一些业务员会去拿单,但不是为了挣钱。今年我认为大家还是要抱着谨慎乐观的态度,因为市场刚起来,客户认知建设还没有做很好,所以需要创业团队有点耐心去了解客户需求,走通商业化的全路径。

甲子光年:有设定目标数字吗?

周明:今年我们希望能走通所有环节,在金融领域做深做透。我们并没有挣多少钱的严格的目标,还需要更多地了解市场需求。

甲子光年:澜舟科技最终要做成一家什么样的公司?

周明:目标是建立一家更有效率的、盈利的智能生产力公司。

(封面图来自澜舟科技)

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/33476.html
0
最新回复(0)