专访澜舟科技周明: 我不追求AGI, 我追求ROI

科技甲子光年2024-03-26 14:53:10 80

大模型创业，可不可以小而美？

作者｜赵健

GPT-4发布一年后，做“中国版的OpenAI”，已经成为头部大模型创业公司不成文的主流叙事。

这套叙事逻辑中的AI公司往往以AGI作为愿景，在Scaling Law的指引下追求千亿乃至万亿参数的大模型，并以此撬动AI时代的to C生态。这些公司也吸引了绝大多数的投资、人才与聚光灯。

但也有大模型公司尝试“四两拨千斤”，提出一套“反OpenAI”的叙事。澜舟科技就是其中的代表。

澜舟科技创始人兼CEO周明告诉「甲子光年」：“澜舟科技不追求AGI，也不追求超越GPT-4，而是把大模型如何更好地服务客户放在首位，并且计算好ROI。”

在今天追赶OpenAI的氛围下，澜舟科技似乎成为了少数派。

成立于2021年6月的澜舟科技是中国最早做大模型创业的公司之一。那时候，大模型在AI圈都是一个冷门词汇。

澜舟科技创始人兼CEO周明是世界自然语言处理（NLP）领域的领军人物，曾任国际计算语言学学会（ACL）主席、微软亚洲研究院副院长、中国计算机学会副理事长。今年年初，周明当选“2023年度ACL Fellow”，这是NLP领域的最高荣誉。

2020年底，在见证了OpenAI发布的GPT-3惊人的“智力”后，周明判断一个属于AI的大时代要来了。他选择从工作了21年的微软辞职，毅然踏上AI创业之旅。半年之后，在创新工场的塔尖孵化下，澜舟科技正式成立。

凭借周明博士的资深履历，去年硅谷科技媒体The Information也将其领军的澜舟科技评为五家“最有可能成为中国OpenAI的公司”之一。

但澜舟科技并没有对外界讲述一个打造中国版OpenAI的故事，而是选择小而美的“小参数大模型（SLLM，Small LLM）”路线。澜舟科技本周刚刚发布的澜舟孟子GPT大模型，最高参数只有400亿。

澜舟科技并没有着眼于开启AI时代新的互联网革命的to C市场，而是选择了更加非标准化的to B市场。周明坦言，在中国做to B很难，但不得不做难而正确的事。

因为要做to B，大模型成本与客户预期必须找到平衡。如果超出客户预期，一味追求大参数并没有意义。为此，周明还提出了“周明曲线”，将最佳的模型参数范围定在了100亿到1000亿之间。

去年，在调研了102家企业之后，澜舟科技找到了“周明曲线”的最佳临界值——400亿。周明认为，400亿大模型能很好地兼顾技术领先性与低成本的需求。

周明认为，大模型有两大流派，一是好奇心驱动的技术信仰派，最终目标是追赶OpenAI，实现AGI；二是以大模型落地与商业化为首要目标的市场信仰派，技术是否领先并不那么重要。

科学家出身的周明也认同Scaling Law，但在落地的时候，并不会一味追求它。因此，周明将澜舟科技定位为技术与应用双轮驱动的“融合派”。

周明判断2024年是大模型落地元年。在他看来，大模型落地过程中，“互联网的七字法则仍然适用：专注、极致、口碑和快，还要再加上成本，形成大模型落地九字法则”。

周明认为，作为创业公司，找到商业模式最重要，而不是一定要追求做出最牛的技术。周明坦言，放眼市场，可能只有他说这一点说得比较多了。

人人都想做OpenAI，但澜舟科技主动选择了“小而美”。这套大模型路线能否成立？

对此，「甲子光年」专访澜舟科技创始人兼CEO周明，来揭秘澜舟科技过去一年大模型的落地探索与背后的思考。

1.谈派别：技术与商业之间的融合派

甲子光年：去年被问到为什么中国没有做出ChatGPT，你回答“贫穷限制了想象力”。现在ChatGPT发布一年多，新的技术与产品层出不穷，澜舟科技的想象力有没有变大？

周明：我们去年也比较冷静。去年大模型一出来，我就知道大模型还会出现改良，但突飞猛进会比较难。因为从2017年到去年，也就冒出一个GPT。从去年到现在，虽然有一些改良，但都不是革命性的，Transformer、Multi-head attention（多头注意力机制）架构没有发生变化。

最大的变化是数据，数据量与质量提升，模型层次增加，围绕Scaling Law做工作。我去年也预感到，Scaling Law应该follow，数据更大、模型更大、算力更大，性能就会更好，我们也遵循了。

但我们也考虑了落地。落地的时候不能无限追Scaling Law，因为要考虑成本问题。在to B场景，大模型到底需要多大？我将其总结为“周明曲线”。

我们调研了102家企业后发现，400亿模型就足够了。对于工业界来讲，它能解决80%的应用产品环境。虽然我也可以不计成本把它变成千亿、万亿模型，水平当然会更高，但ROI就小了。既然做公司，那就要算ROI。

甲子光年：你在技术上信仰Scaling Law，但在商业上会更克制？

周明：主要考虑公司的运营成本。大型模型有两种流派——第一种是纯粹的技术派，由好奇心驱动，不计成本。模型参数接近人脑神经元个数，数据更大、算力更大，一点点逼近AGI，再把多模态加进去。这种通常由科学院或者比较有实力的大公司进行。

第二种是实用派，他们使用现有的模型，如开源模型，来解决实际问题，注重实用性和落地性。

甲子光年：澜舟科技是哪一派？

周明：澜舟科技是两者结合派，技术加应用双轮驱动。我们既了解大模型的技术发展趋势，也知道如何在适当的时机应用大模型，并能够利用大型模型的优势来弥补其短期的不足，而不是盲目地使用。当我们在实际应用场景中得到反馈时，这些信息可以帮助我们在下一代模型训练中做得更好。

例如，大型模型的可解释性比较弱，而原先是没有人讨论RAG（Retrieval-Augmented Generation）的，许多本地数据和用户数据无法被纳入模型中。这些都是那些真正从事过模型落地工作的人才会有的深刻体会。

我不排除要去做Scaling Law，但我不会永远做下去。我觉得自己算是理论与实践结合比较准的，但也不能说别人不结合。

甲子光年：目前市场上的公司，技术派、落地派、融合派，哪个更多？

周明：大家关注比较多的肯定是第一类，融资比较多的公司，他们给人的印象是追求大模型的前瞻性能力，或者说追赶OpenAI，解决人类的AGI问题。但更多的人是第二类，只是很少有人关注，有数以千万的人基于开源模型做很多有趣的应用。

把大模型跟实际应用巧妙结合起来，大概国内说的比较多的人就是我了。因为我做过大模型，也做过应用。前者需要持续投入，还可以再投十年，但只要你停下脚步，三个月之内就会从王者跌落神坛，马上有人超越你。

作为一个初创公司，在投资力度有限的情况下，是要非常谨慎的。但如果天天做应用，而不知道未来技术发展轨迹的话，可能会失去一些前进的动力。所以，两者都需要去关注。

2.谈愿景：我们不把AGI当做愿景

甲子光年：现在一些大模型公司把AGI当做公司愿景。澜舟科技的愿景是什么？

周明：我们不把AGI当愿景，这是我的性格使然。我个人认为AGI是人类长远的目标，过去人工智能有多少次起伏？每次有点起来的时候，都说AGI越来越近了，比如当年机器翻译刚刚做出点成果，马上有人说，人类不再需要翻译，搞得大家挺恐慌。每次只要科技有点进步，就有人说“人类工作被消灭了”“人类要寻找新的生存空间了”“硅基智能与碳基智能谁更厉害？”等等诸如此类的问题，但每次事情都没有那么大。

甲子光年：是因为“狼来了”的故事听太多了吗？

周明：我的岁数稍微大一点，见过几个人工智能的冬天。但人工智能每次进步，确实离AGI更近了。第一，要乐观看待技术进步，市场离AGI越来越近，就会产生巨大的机会；第二，要冷静一点，我们离真正解决AGI的问题还有很长的路要走，包括杨立昆、张钹院士他们都有这种观点，我也赞同。现在的语言模型、“世界模拟器”Sora，都是用数据驱动的方式向AGI更近了一步，很多人工智能的原理，包括人类智能的原理，还不是很清楚，需要进一步研究。

甲子光年：如果说AGI还是一个长期愿景的话，那澜舟的短期目标是追赶GPT-4吗？

周明：我们也不把什么GPT-4当做目标，我就是站在客户和公益的角度。比如我要做to B，那to B要解决哪些场景？哪些是大模型解决得很好的，哪些是解决不好的？解决不好的如果不是核心场景，我就先容忍；如果是必须跨越的一步，我就着力去解决。做来做去，我这个模型有的地方比GPT-4厉害，有的地方远远不如，但是客户所期待的。我是走这种从实际中倒逼模型发展的路线。

甲子光年：总结一下，澜舟科技的目标是什么？

周明：用AI解决千行百业中遇到的一些核心问题，不是零碎的问题。有些问题正好是GPT-4的研发方向，有一些是GPT-4根本没有考虑到的问题，就需要我们加入并提出解决方案。我是以解决问题出发，不会说问题都不看，GPT做啥我就做啥。国内的投资人也好，创业者也好，有的是这么做的（follow GPT），那也没错，也能教育受众。但是我在微软经历过这些事情，我不会被表面的现象所迷惑。

甲子光年：解决这些行业核心问题的本质是什么，降本增效？

周明：一个是解决降本增效，这是已有问题；还有一个是创造一个前所未有的增量市场，原先没有这样的技术，大家觉得这件事没法做。但现在有了这样的技术，我们带着这种技术了解客户需求，创造出所谓的大模型原生应用。这是革命性的变化。再次强调，要想带来大模型与大模型原生应用，技术与用户场景两个必须都懂。

3.谈融资：不担心估值比同行低

甲子光年：去年大模型火了之后，你最开始做to B的想法有动摇过吗？融资、投入可不可以更激进一点？

周明：从我的本心来说没有动摇。融资上不同的公司会有不同的表述。有的人明明不信任OpenAI，但他就宣称自己是中国的OpenAI。我们一直坚持说理论与实践结合，坚持to B为主，to C为辅，我认为这比较符合中国目前的国情，但不排除有人追赶OpenAI，也是一个非常重要的努力；或者有人就拿开源模型做应用，也有意义。创业各有千秋，取决于你自己的判断。

甲子光年：去年The Information也评价澜舟科技是5家“最有可能成为中国OpenAI的公司”之一。

周明：受宠若惊。我们做的也没那么好，其他上榜的也不一定能走多远，大家属于刚刚开始。

甲子光年：如果澜舟科技融资了很多钱，现在会做出不一样的决策吗？比如会不会做Sora那样的视频模型？

周明：我会有轻重一些。比如大模型的一些短板，我会尽早布局，而不一定等OpenAI做出来我们再做。但投资额度小的话，会更多地先了解别人，会用就行。看你的投资额度，每个公司都应该有自己的判断。

初创型的公司肯定是有聚焦的。我们只聚焦在语言理解，而多模态涉及的则相对较少，多模态领域原来做视频和图像的涉及会比较多。我们就是做语言模型，以及提升语言模型能力的Long context（长文本）、RAG等技术。我们的“一横N纵”的“N纵”，就是各种语言模型的能力，包括信息抽取、信息检索、翻译、问答、写作等。

甲子光年：从融资的角度来说，澜舟科技不在第一梯队，还没到独角兽的级别。你怎么看待这件事？

周明：首先恭喜融资比较多的大模型公司，他们做了不错的努力。我们这边因为讲究大模型的落地，融资的需求会从实际出发。另外，我本人的创业理念就是不喜欢去套热钱，融资的节奏和力度要跟公司现在的发展和未来一两年的发展匹配，否则会背上一个很大的包袱。

融资多和少是需要理性判断的，如果未来做大需要快速复制，就需要很大的投资。每个人有不同的判断，切忌盲目抬高估值。

甲子光年：你担心在投资人心中，澜舟科技的想象空间更小吗？

周明：的确会这样，但我正是有意而为之。我们不是随波逐流的，而是以终为始，坚持客户与市场的需求。

甲子光年：现在的融资节奏符合你的预期吗？

周明：我们的融资节奏很清晰。去年年初融资了一个亿左右，对于我们这样的团队，足以支撑我们几年的发展。我们自己又有落地项目，还有一些收入。我希望我们的造血能力能够发展起来。我们融资时刻都是开放的，讲究的是小步快跑，不讲究非要融多少多少钱。

我们融资的目的很清晰，就是支撑一些新的业务发展，比如我们的商业化元年，要组建商业化团队，需要资本来支撑一些事。我们有一些新的技术，比如客户对大模型的期待，比如可解释性、大模型的评测，从分析到生成的能力，RAG如何做的更好等，这需要投入一些研发资源。

甲子光年：融资更多才会有资源来投入一些最前沿技术的研发。

周明：世界上最头部的科研问题，应该由创业公司来做？还是应该由科学院或学校来做？我对此有不同意见。我认为，创业公司最重要的事情，是把商业模式做出来，而不是发明一个最牛的技术。从历史上看，施乐发明了很多东西，没一个能落地的，但微软把那些技术很好地用来起才成就了微软。

所以我觉得以终为始，从客户和社会需求角度，把现有东西能够最好地巧妙用起来，不排除你可以去收购或合作，也不排除自己成立一些研究部门，但一开始不要轻易地把所有压力都压在核心技术开发，才成立一个伟大的公司，这可能有难度。

甲子光年：OpenAI也是创业公司，它在引领这一轮AI浪潮。

周明：现在这一轮AI竞争还没有结束，未来是什么样也不好说。未来我觉得一个有资源、有场景和应用、商业模式清晰、把大模型跟自己的业务结合的非常好的公司，最后赢得可能性会更高。OpenAI是因为跟微软结合，等于微软弥补了很大的短板。

甲子光年：现在很多AI人才会奔着瞄向AGI的大模型公司，澜舟科技在人才方面，会不会相对缺乏吸引力？

周明：人才也各种各样。有想做AGI的，有想解决问题的。如果你是想做AGI的，想推数学公式，那我们肯定不是这个方向，也不是我的初衷。我在微软亚洲研究院担任副院长的时候是这样的，但现在做AI to B的创业，我们更想吸引那种拿最新的技术来解决人类问题的人才，而不是说非要发明新的技术。

4.谈落地：今年才是大模型落地元年

甲子光年：你一开始创业为什么想做to B，而不是to C？

周明：第一是我对中国的理解。中国过去几十年企业的智能化水平相对来说比较薄弱，之前国家号召大家去做大数据平台、数字化等方向，但智能化的水平在各行各业都还比较薄弱。我认为站在国家的方向上看，to B会比较有机会。

第二，在经过20多年互联网高速发展后的今天，大模型to C的机会我认为很少。To C在没有大模型的时候都有王者了，有了大模型，这些公司不会掉以轻心，把大模型拿过来就到位了。

现在的问题是，你有没有本事创造新的to C问题，但to C在国家跟国家、民族跟民族各地都相似，非常难创造出一个别人没想到你想到的新的to C场景，有很多的用户基础非常重要。再加上中国to C的付费意愿都比较低，未来大厂对你会有碾压的可能性。假设你费了很大的劲做了一个to C应用，大厂也不会闲着，它有技术、有能力、有资金，很快就免费把它做出来。

至少对我来讲，to C的创业机会是很小的。To B既然符合国家长期战略，大厂做的难度也比较大，因此创业团队会更有机会。基于这些考虑，我选择了这个领域。

甲子光年：To C是不是更适合年轻的创业者？

周明：To C永远都是年轻人而不是老年人的。年轻人有敏锐的视角观察，也有自己的体验，更有可能创造出新的to C场景。

甲子光年：但在中国做to B，实际上也不好做，SaaS行业就是一个典型的案例。

周明：中国长期看to B是有道理的，短期很难。中国to B各个公司对自己的数据要求比较严格，所有都不喜欢走API或者SaaS。To B也需要打单，需要去交付，这些成本都相对比较高，周期也比较长。

但我对to B长期是看好的，你可能第一个单子或前几个单子是很辛苦，但是你一旦通过打单，你提升了自己的服务能力和标准化水平，那后面的单子就能更加高效得来实施了，形成规模化，提供标准的产品和服务。但前提是你自己要走出来。

我坚信没有一件容易的事情。现在在中国创业，你只能去选择那种难而正确的事情。

甲子光年：去年澜舟科技做出一个判断，“to B行业的价值会在2024年上半年体现”。为什么不是2023年？

周明：去年大模型刚出来，央国企大厂都在观望。假设有开源了，他们自己去试一试到底有没有用，哪些地方会有用，心里清楚之后沉淀一下，在内部形成一个共识，要不要往大模型方向走？

经过一年时间的尝试我们判断是够了，央国企在2024年应该会下场。下场就是要拨出一部分预算来做一些行动。你看投资委报告、政府工作报告，都在鼓励央国企大厂考虑人工智能+的问题了。诸如此类的信息告诉我们，2024年应该是大模型落地的元年。

当然元年不代表爆发年，只是代表大家开始行动了，开始做预算了，开始跟你接触了。什么时候爆发？怎么也要花两三年的工作培育这个市场，包括有些技术更加完善、交付的过程更加标准。

甲子光年：最近跟客户接触最直观的感受是什么？

周明：去年的客户找我们主要是做咨询，但没有诚意要成单。今年找我们确实业务有需求，他的同行，或者上级单位已经做了某些大模型的应用，现在来找我们是有诚意的。但也不是一窝蜂的来，金融客户比较多，其他行业相对少。

甲子光年：业务咨询是付费的吗？

周明：我们做咨询都是免费。一是我们觉得咨询就是建立客户认知，也赢得客户；第二客户也是这么认为，他认为你是这个领域的公司，我们不懂跟你了解，也许日后会形成合作伙伴。

5.谈客户：如何建立标杆客户

甲子光年：澜舟科技曾表示，“大模型落地商业化，标杆客户是关键”。澜舟科技是如何树立标杆客户的？

周明：比如传神语联，曾经是中国和亚洲最大的人工智能翻译网络公司，原来是靠人工翻译，后来在我们的预训练模型，以及现在的大模型基础上做翻译系统，几乎达到人类翻译的水平。现在再把订单发给具体的翻译工作人员的时候，先通过模型翻译，人再检查一遍，这样就能大幅度提升效率。这是在翻译领域的一个标杆客户。此外还有华为、中金，提升他们翻译的能力。还有投研领域的同花顺，用孟子大模型来改进他的投研系统的能力。

甲子光年：当时的合作是如何达成的？当时也会遇到成本、信任度的问题。

周明：当然感谢人家对我们的信任，更重要的是人家看到我们的技术，虽然我们是一家初创公司，但技术一开始就是讲究应用怎么做，不去讲那些高大上的概念，我们做的比较实际，把水平提升到一定程度，能在业务场景用起来。

甲子光年：怎么看待大模型成本过高的问题？

周明：去年5月份之前卖一个大模型，能卖上千万，但对于很多客户来说这是不可接受的。客户对于大模型的期待成本接近于零，你跟客户讲你训练大模型花了多少成本是没有意义的，客户不接受成本定价。客户能接受的是，你这个大模型能提供什么样的功能，至于背后的大模型技术，对客户是无感的，还是要把产品、用户体验做好。

首先，模型本身的成本要降下来；第二，要从模型走向产品，而不是去兜售模型本身；第三要考虑用户的接受度，与其最后一公里业务场景相Match。这三件事我认为很多大模型团队都没有做。

甲子光年：跟这样的B端大客户，主要就是聊这三件事吗？

周明：对，这些都不是在追赶OpenAI时能够体会到的。我们既要仰望星空，把技术做到一定水平；又要脚踏实地，把客户很好地对接，才能真正解决问题。现在有的人走向了极端，就觉得有高举高打的技术，觉得客户拿去用就好使，这在中国肯定很难。它可以吸引一段时间的投资，但要落地总要走这样一种方式。

甲子光年：如果一家千亿模型的公司来做to B，跟澜舟相比会不会更有优势？

周明：优势很清楚，因为他能做千亿模型，技术、品牌都是不错的。但劣势是，他这些人愿不愿意躬身入局，把所有客户的事情了解特别清楚？因为这件事的ROI对他来说并不高。因为ROI不高，他有可能基于各种理由不去做，从而也就失去了一些跟客户对接的机会。这件事儿本身没有对错，就是企业基因决定的。

甲子光年：开源的Llama2有700亿参数，客户为什么不直接用开源模型？

周明：如果客户是一个小应用，自己用开源做一做就够了。但要是大的应用，还是喜欢找一些专业的公司合作，他会觉得专业公司能把一些核心问题做出来，并有一定的前瞻性。而且他也希望这样的公司未来持续给他维护。

甲子光年：什么是小的应用？什么是大的应用？

周明：比如小的文本分类、小的信息抽取，用户找不找你都没有什么意义，钱很少，而且他也不想花那个钱；大的应用，比如搜索翻译，文档理解等，用户自己很难做好，这种订单也相对比较大，我们也愿意多做，也是我们发力的方向。

甲子光年：如果做to B，数据飞轮如何形成？因为to B的客户更倾向于私有化部署，数据留在客户侧，这样模型层与用户层就无法“握手”。

周明：在中国做to B，数据飞轮某种意义上是无解的，也就不要去追求它。你能做的就是两件事，一是大模型的预训练数据足够广泛，二是做RAG，把这两件事做好，在to B行业就能解决问题了。做to C要有数据飞轮，但to B很难。

甲子光年：谷歌近期发布的Gemini 1.5 Pro，有100万token上下文。有人说上下文足够长之后，RAG不存在了，你认同吗？

周明：思路不一样。RAG的出现是因为很多用户不想把数据训在模型里，既有保密问题，又想保持灵活度（RAG可以灵活地更换数据）。谷歌的思路是允许用户上传一个长文本来替代RAG，从技术上来说是有可能的，但实际上真有这么大的必要吗？

我觉得RAG更灵活，而且还要考虑成本。谷歌也好，其他大模型也好，从input token到output token，上传这么大的文本是要算钱的。在云上部署的时候可能会省略掉一些本地部署的成本，但是还要考虑用户是否愿意把自己特别敏感的数据放在云上，并形成它的长文本的一部分。至少在中国，很多用户是会担心的。

甲子光年：RAG就是做本地部署吗？

周明：RAG是在本地部署，在本地把模型与用户数据连接；谷歌等于在云上，需要用户上传PDF文档，就不需要做RAG了。这两个也不能说是替代关系，等于用户多了一个选择。

6.谈金融：是普遍场景，但不一定赚钱

甲子光年：澜舟科技为什么聚焦在金融领域？

周明：金融对于国民经济非常重要，它还有一些客观的优势：一是金融数据比其他领域多；二是金融领域历来对人工智能比较热情，从CV阶段，到现在大模型的落地；三是金融领域预算比较充实。金融公司都有自己很大的团队，就是要解决它的刚需问题。

金融领域是大模型落地的一个普遍场景，但是不是最有利润的场景？不好说，因为金融大模型的利润比较单薄，成单时间比较久，预算可能做一年半年，交付在做一年半年。从商业的角度来说，大家要谨慎。

我们更多把金融当成一个打磨标杆的过程，这个过程会形成标准化的应用，在其他领域落地。

甲子光年：以金融行业模型为例，是直接通过预训练来做，还是在一个通用模型上加金融行业数据做微调？

周明：取决于你对数据的掌握。假设你的金融数据足够强，那就在通用模型基础上加金融数据做continue train，当预训练，把金融模型做出来；假如你的金融数据没有那么多，再加上你的通用模型很不错了，那就在通用模型基础上加点SFT。这个取决于你手里有多大的资源。

甲子光年：哪一种方式效果更好？

周明：不好说。站在用户场景上来讲，如果场景单一的话，SFT肯定就很简单，甚至连SFT都不用，context learning 就可以；但如果场景足够大、数据量足够大，预训练数据不用就可惜的话，还是应该训一个行业模型。背后还是成本问题。

甲子光年：你更倾向于做哪一类客户？从头预训练做行业模型，可复制性大不大？

周明：首先站在公司收益角度，哪个收益大，就更应该做哪个。个别单子订单很大，但用户用途很窄，这不一定是公司的首选。有些用户用途很广，但客户没什么钱，我们也不想从他这非要挣多少钱，只是想做一个场景实验形成一个案例。这个还是case by case。

7.谈商业模式：如何避免项目制陷阱

甲子光年：做to B的一个核心问题，包括以前的AI四小龙也遇到类似问题，就是如何避免做成项目制，因为很难规模化复制，利润很低甚至亏损。澜舟科技如何做的？

周明：首先要承认这件事的难度，我们能做的就是标准化的程度。澜舟科技发布的“一横N纵”产品体系，就是从用户的需求中提炼出最精华的、占据80%场景的需求。那么剩下20%的需求，标准化程度低或者难度太大，我们就不去碰。

这样能做到标准化。第一个客户可能要打磨做技术储备，但以后形成标准化之后，后面越来越多的客户只需要上传数据或者跟我们配合做本地部署，就能马上看到效果.

我们希望通过大模型时代提高成单和交付的效率。如果这个效率解决了，to B还是很有机会的。

甲子光年：一横N纵的具体产品体系是怎样的？

周明：一横首先有两个标准的通用大模型，一个13B，一个40B，有三个垂直模型——金融大模型、编程大模型，以及其他行业的垂直模型；N纵是一些具体场景的能力，包括文档理解、文档问答、文档写作、机器翻译、会议分析、文档检索等能力。

此外，横是可以替换的。比如我们现在用的金融大模型，突然有一天我们要做体育领域，我们自己没有这个模型，但合作伙伴有，我能马上把合作伙伴的模型接入进来。

（本周的发布会上澜舟科技宣布与零一万物达成合作，零一万物即将在近期发布千亿级别的基础大模型，可以作为澜舟科技“一横”的合作伙伴。两家公司都是创新工场塔尖孵化的公司）

甲子光年：一横N纵的产品思路是怎么形成的？

周明：最早是去年形成的。去年我们在考虑大模型落地时总是遇到一种困惑，就是每次跟客户讲，你看我们这大模型有很多技术，你想做投研、想做翻译都能做，通过聊天的方式写出来就能解决。

客户却觉得这太费劲了，他说面对你的孟子大模型，第一，我不知道它有啥能力，也不知道怎么去试；第二，我心里只需要你做一件事，可是你给我整出这么多选择。你就告诉我这是个翻译系统、这是个搜索系统，别告诉我这是一个大模型技术好不好？

我一下受到启发。大模型不是用户的中台，用户不太关心也不想了解大模型。其次，Chat不是用户的常态，它是教育受众的一种手段，而用户的场景都是很具体的业务模式。于是，我把业务底层用的核心技术一个一个找出来，分一下类就发现，N纵的技术几乎支持了80%的业务场景。

一横是给自己看的，等我把这个技术一个个做好了，跟客户讲起来也容易。你要做搜索，我们有搜索；你要做翻译，我们有翻译。而不是你要做搜索，我给你个大模型去玩玩，这是一个用客户语言跟客户对齐的方式，内部研发人员也对齐了。这样也提高了我们跟用户谈单、订单与交付的效率。

甲子光年：这件事具体是什么时候开始做的？

周明：我是去年底彻底想明白了，有了一横N纵的概念。现在很多人在吹捧什么交互式、Chat的方式，我们更多地是走向技术、走向产品，而不是底层的核心模型。

甲子光年：这次发布的是孟子GPT大模型，但实际上孟子大模型也保留了BERT、T5等路线。为什么是这种选择？

周明：都是按照客户需求，从落地角度也不存在GPT就能大一统。比如说，用一个BERT的小模型就能解决的小需求，为什么非要搞一个大模型？站在用户的角度，用户需要什么模型我就提供什么模型。

甲子光年：即使是做to B，行业也有不同的做法。比如智谱AI就自己不做行业模型，只专注在通用模型，最后一公里交给合作伙伴。而澜舟科技是自己做行业模型，为什么会这样？

周明：我们是兼容的，也有合作伙伴拿我们的模型去改造，对接客户需求。但我觉得在合作伙伴成功之前，自己要成功。你的模型水平到底多高，能不能用起来？所以我们是先走示范工程、标杆客户，重要的场景先自己做一遍，做完了再去告诉合作伙伴，遇到这种情况这么做，遇到那种情况那么做，使得整个过程非常流畅。

甲子光年：现在还在示范工程阶段吗？

周明：现在做示范工程做的比较努力，合作伙伴也在寻找，这个过程中也有合作伙伴，但是没有铺开。现在市场上还没有多少模型能做到这一点，主要是模型水平不够。有很多地方合作伙伴既要懂模型，还要懂场景，对合作伙伴也很难。

大家现在对大模型有一点误区，觉得大模型现在的水平啥都好使。你要真去做to B的话，真是干啥都不好使。

甲子光年：干啥都不好使？

周明：差距很大，我们做技术的人有时候不愿意说太多，技术没有到吹成神话的地步。这时候要对接用户场景怎么办？运用之妙，存乎一心，巧妙地把大模型的长处用起来，大模型的短处克服掉，才能解决场景问题。太理想主义，至少还不是今天，至少还需要一定的时间。

甲子光年：这个时间还要多久？达到比较理想的、好用的状态。

周明：要有一个top down和bottom up的过程。我们做大模型的人要让用户一点点接受，用户再反馈给我们，对大模型做相应的修正，甚至加一些中间层，使得大模型能够过渡到一种理想的状态，这正是我们提出L1、L2、L3、L4（孟子通用大模型、行业大模型、场景任务大模型、AI Agent）的分级，从大模型一点点到行业、客户场景与产品。从top down走到bottom up，走两三个来回，大模型就算走通了，现在还没有。

甲子光年：现在走完一个来回了吗？

周明：我们大模型团队在往下走，用户在往上走，中间“握手”的部分，还差点意思。

甲子光年：澜舟科技的商业化进展如何？

周明：我们团队是把今年当做商业化的元年，我们也组建了相应的营销、售前队伍。去年一些业务员会去拿单，但不是为了挣钱。今年我认为大家还是要抱着谨慎乐观的态度，因为市场刚起来，客户认知建设还没有做很好，所以需要创业团队有点耐心去了解客户需求，走通商业化的全路径。

甲子光年：有设定目标数字吗？

周明：今年我们希望能走通所有环节，在金融领域做深做透。我们并没有挣多少钱的严格的目标，还需要更多地了解市场需求。

甲子光年：澜舟科技最终要做成一家什么样的公司？

周明：目标是建立一家更有效率的、盈利的智能生产力公司。

（封面图来自澜舟科技）

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益，请与本站联系，我们将及时更正、删除、谢谢。
https://www.414w.com/read/33476.html

随机主题

不到10万的方盒子混动油耗低还有电四驱 BJ30上市导购口碑公认的三款手机, 入手仅千元价位陈仓之战背景板, 传说中的无敌神刀王双【三国志战略版】恒生科技指数日内跌超2%新年创业加盟哪家强? 社区生鲜连锁品牌钱大妈有话说!DNF手游疲劳值用完, 除了站街还有7种游戏玩法: PVP、深渊、试炼一不小心中国又领先了, 2023年, 中国电力需求增长6.9%成都: 6月起将对骑车看手机行为进行处罚 15年攻关实现全人工繁殖探秘“水中大熊猫”川陕哲罗鲑王朝大旗手中擎，天也辽来地也宁！南海交锋, 外军4打2, 解放军战机遭火控雷达锁定, 现场惊心动魄第十一代索纳塔, 简直是个五边形战士!《闯关东》: 看懂朱传武对朱家的报复, 才知鲜儿被他利用得有多狠韩国央行维持利率在3.5%不变一口价6.99万起，标配1.5T+双大屏+独悬，探店2024款瑞虎7 董军会见南非海军司令 17.2%! 大规模设备更新释放经济增长后劲好评如潮的3部韩国电影, 你若一部都没看过, 真的太可惜了欧阳夏丹采访尴尬记: 离职后现身山西小馆, 遭遇冷漠回应森林北深夜发文澄清恋情, 汪峰离婚背后真相究竟如何?极星CEO: 不再依赖沃尔沃和吉利! 两款新车将用“自家”技术

最新回复(0)