大模型狂飙半年，“群模乱舞”谁能胜出

发布时间: 2023-07-03 22:25:28

毫无疑问，当前的科技圈已进入“大模型”时代。含“模”量大到什么程度？但凡科技企业，基本都在做“大模型”。

“从去年12月ChatGPT（Chat Generative Pre-trained Transformer）引爆科技圈之后，几乎所有行业玩家都想抓住这根救命稻草。因为做成了就意味着抓住未来几十年的趋势。”行业创业者夏先生对壹DU财经说道：“ChatGPT是生成式AI，是大模型的落地场景之一。理论上讲，这条路的走通，加速了大模型在短期内的爆发。”

的确，ChatGPT的爆发，让更多人看到了语言模型的魅力。微软、谷歌、百度、阿里等

国内外科技巨头快速响应，相继推出自家的AI聊天机器人，试图以To C作为切入口，抢占市场。

风口在哪里，资金和人才就在哪里。随后，先是厂商陆续宣布推出大模型，如百度的文心大模型、阿里的通义大模型、腾讯的行业大模型，后有科技圈曾经的风云人物也开始陆续入场，李开复、王小川、周伯文、王慧文等。出行、认知、办公等一些垂直领域的大模型也相继推出。

半年时间，国内呈现出“群模乱舞”盛况。而在经历喧嚣后，大模型或许是时候回归现实了。

玩家们开始意识到，最初的热闹仅仅是热闹，他们最终的战场在B端市场。此时，多家有着人工智能积累和云计算大厂登台，相继推出了AI大模型服务。

行业老炮和新手创业者的对决，也就此开始了。

热情高涨，玩家们跑步入场

进入2023年，大模型技术让科技圈沸腾起来。看到ChatGPT爆发后，不少大厂抓紧时间推出相应产品，新老创业者们着急招兵买马，生怕慢一步就错过了这难得的风口。一级市场关于大模型的投融资热度也在攀升，不少FA开始疯狂补课。

一时间，整个行业热闹非常。

在OpenAI发布GPT4大模型后，第一个采取行动的是百度，在3月16日用“Demo演示”的形式正式发布文心一言。同样在3月，已经沉寂许多的周鸿祎推出大模型产品，甚至连名字都没来得及取。

在此之后，科技巨头、创业公司和高校研究院们展开了一场关于“大模型”的竞速赛。整个4月，都成了“大模型的发布月”，华为、商汤、阿里都在4月份亮出了自己的大模型产品。

到了5月，讯飞推出了自己的星火大模型，并公布了大模型在自己优势领域的诸多应用场景。

创业者们也在火速入场。原美团联合创始人王惠文（目前已退出）、创新工场CEO李开复、前京东AI掌门人周伯文、前阿里技术副总裁贾扬清等开始招兵买马。前搜狗CEO王小川的百川智能拿到5000万美元融资后，甚至扬言：“今年年底做到国内最好的”。

“这波创业热潮有点2000年左右的互联网创业潮的意思。”一位业内人士说道：“似乎每个创业者都想在这个时代找到第二春。”

总体来看，今年上半年，大模型几乎成为所有科技企业的必选项。对于普通人而言，大模型或许是件很遥远的事。毕竟不是每次科技浪潮都能成功靠岸，如元宇宙、XR等行业。

但事实上，大模型的应用更多在B端市场。那么，在行业烈火烹油过后，摆在这些玩家眼前的，理应是他们对市场更多的理性思考。比如市场是否真的需要大模型？大模型真正走向成熟，需要越过哪些重要关卡？能否真正意义上实现商业化。

“军备赛”开打

大模型军备赛的冲锋号吹响后，整个行业开始“卷”起来。更多玩家已经将视线移至应用层面。因为行业“退烧”后，最终考验的还是玩家们的“硬实力”。

此时，一些在人工智能、云计算上有积累的玩家则占据的先发优势。尤其是模型的参数量。

就目前市场上发布的AI模型来看，虽然大家都自称为“大模型“，但参数量实质是大模型和小模型的界定因素之一。

此前，百度集团副总裁侯震宇在接受媒体采访时曾表示，2022年，10亿参数的模型就叫大模型。但到了眼下，千亿参数以上才会出现“智能涌现”，才会形成泛化能力，才能在各个场景下具备通用能力。

何为“智能涌现”？简单地讲，当模型规模、算力水平超过某个参数阈值后，AI效果将不再是随机概率事件。比如初期语言大模型出现“图不对文”“答非所问”等现象。

并且在通用领域，参数量越大，智能通常涌现的可能性就越大，AI准确率就越高。在垂直领域则更容易获得精确的效果。

今年5月，科技部下属的中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》统计，截至5月28日，国内10亿级参数规模以上基础大模型至少已发布79个。

但可以看到，10亿级参数这个量级，很可能不是真正的“分界线”。因为现实的情况是，一些未能达到千亿规模的模型，很难在当前市场的竞争具有竞争力。不过，也不排除一些在垂直领域深耕的玩家，最终能跑出来。

“大模型需要算力、算法和数据积累，绝对不是玩概念的事情，最终还是要市场买单。”夏先生认为，目前来看诸如百度、腾讯、阿里无论是在资源还是积累上，都有一定的优势，“他们在云市场深耕，并在自己擅长的领域积累多年，无论技术层面还是行业积累上，实质已经完成了抢跑，未来就看这些头部玩家如何落地。”

而在投入层面，这会是一个天文数字。

以百度为例。据透露，过去10年，百度在AI方向的投入已超过1000亿元。但大模型不是投一笔钱、做一个模型那么简单，它需要有算力、有数据、有经验丰富的AI工程师在好的研发平台上长期积累。

而创业公司如果直接去做基础大模型，除了上述投入之外，还需要能够把模型、算力管理好的AI开发平台。

这意味着，创业公司不论是自建开发平台，还是采购外包平台，其投入都不会是小数目。并且，大模型不是预训练出来就好，更需要后续持续敏捷迭代。从这一点看，创业公司所受的限制明显要高于大公司。

但大厂很难留住强算法人才的弊端也比较突出，因为大模型投入是一件长期主义的事，必定会面临与既有业务之间的冲突。这一点，从大厂出走的大模型创业者的经历，就说明了一点。长期主义对创业公司同样重要，无论是创始人的背景背书，还是资源合作，抑或是客户的拓展，都需要长期积淀。

行业竞赛即将鸣枪

人工智能专家侯世达的学生梅拉妮·米歇尔《AI 3.0时代》一书中提到，研究人工智能与赛道中的创业者们都熟悉了一种模式——先是“人工智能的春天”，紧接着是过度的承诺和媒体炒作，接下来便是“人工智能的寒冬”。并且，他认为这一模式将以五到十年为周期不断上演。

具体到2023年上半年的大模型赛道，显然其正处于第二个阶段——行业很火，市场很热。这一周期往往是最短的，也通常意味着如此去泡沫化后，赛道竞争即将正式开始。

大模型比拼的不仅仅是技术，还应该将重点放在大模型应用、产业生态中去评估。

目前，市场上大模型的玩家主要分三类。

一是聚焦基础层，主要对标OpenAI，发挥基础设施的作用。

第二类是锚定中间层，不需要像OpenAI一样花大钱做底层，只需要掌握通用化能力，就可以通过开源大模型做精调，让模型具备差异化能力，最终可以形成垂直类模型。

第三类是调用大模型API的企业，专注开发大模型具体场景的应用，如Jasper。

相对而言，前两类又是大模型的“基础设施”，因为有极高的门槛，对技术、资金以及资源有严格的准入壁垒，往往是大公司布局的主要方向。

目前来看，百度、阿里和华为在大模型的构建上，不约而同地采用了“模型+工具平台+生态”的三层共建模式。腾讯云则更专注于应用层而，6月19日公布的腾讯云MaaS服务解决方案即覆盖了金融、文旅、政务、教育等10个行业、超50个解决方案。

虽然巨头们参与竞争的姿势不同，但目标实质上只有一个，那就是打通应用层。在百度创始人李彦宏看来，应用层最具想象空间。

商汤科技联合创始人杨帆认为，AI 基础设施本质上还是算力、数据、基础算法，包括算法相关的工具，本质上还是三位一体的东西。最后谁能把这三者的整合能力提供的好，提供更低成本、更低门槛的能力是决定整个竞争最重要的点。

人工智能行业就是这么神奇，每每一波风吹起，总会让人误以为这个行业还大有可为。

大语言模型就是典型的例子。在山姆·奥特曼和他的Open AI没有出名前，不单单是国内，整个人工智能圈也仅仅把它当作是一种新型工具，投资人开始变得谨慎起来，以至于他们中的一些人跑去看起了新消费，原因很简单，相较于复杂的科技，消费品类要更好懂一些。

后来的故事大家都知道了，Open AI与微软的联姻，给原本冰冷的人工智能行业强行续上了火种，热度蔓延到国内，圈内外的讨论度空前高涨。

尤其在今年上半年，继百度发布文心一言后，各类新老公司层出不穷，除了隔三差五能听到某某公司发布了自己的大模型，最喜闻乐见的，每天都有新的群聊诞生，其中有卖教程的、有假借AI之名兜售私董会的，当然也有一些正儿八经聊大模型的现状与未来的。

最吊诡的是，过去人工智能圈负有一定名气的AI四小龙，这次居然不是顶流。

拿商汤科技来说，继今年4月发布了“日日新大模型”体系后，它还密集推出了其他的大模型，和Open AI继续补强LLM不同，商汤这次似乎很着急向外界证明自己。

但事与愿违，自2022年以来，商汤已经多次遭到大股东减持，其中就包括软银集团和阿里巴巴，前者累计减持了4次，套现金额超3.26亿港元，后者减持3次，有业内人士认为，大股东减持，对于当前营收规模下降、且尚未盈利的商汤而言，无异于向市场发出了不看好的信号。

这也是本篇文章想聊清楚的点：大模型风口究竟能否给商汤们带来新生？

人工智能的窘境，大模型改变不了

关于阿里减持商汤这件事，外界认为主要有两点原因：一方面是出于商汤在AI方面的投入短期还看不到回报；另一方面，则是阿里自身也在进行各业务线的调整，所以亟需切割旁支的投资项目。

但这些理由仍显得有些牵强，因为从价值投资的角度来看，被减持只能说明一个问题：大概率不是别人眼中的优质资产了。

我们还是以商汤科技这家公司为例，这家公司从创业那天起，就是含着金钥匙的。如果给它贴上一个标签，毫无疑问就是科学家亲自下场，商汤的联合创始人汤晓鸥是香港中文大学教授，被外界认为是全球人脸识别技术的开拓者和探路者。

据新眸不完全统计，成立4年的商汤融资额已经超过17亿美元，是当时全球融资额最大、估值最高的人工智能独角兽公司。但好景不长，自从商汤2021年底上市后，其市值就一路下挫，现在商汤市值徘徊在700亿港元左右。

那么问题来了，一度风头无两的商汤为何IPO后就变了味呢？

关于这个问题，知乎上有个高赞回答：“AI四小龙最大的问题，不是没有清晰的业务，而是初期发展路线不清晰，导致业务不连贯，先前的技术未能形成有效沉淀，不能很好地助力新近提出的主营战略。换句话说，AI四小龙现在才找到清晰的发展方向，沉没成本没有转化为养分，大部分都白白浪费掉了。”

这段评论发表于两年前，但即便现在来看，依然不过时。

翻译成大家都能听懂的话，就是AI遇冷，资本不再迷恋AI神话。既然之前用了几十亿、投资了近十轮都没能让它捧向更大的市场，那么现在即便你有了新战略、发布了新产品，在市场眼里，还是要打上一些折扣的。

从另外一个角度看，这其实是人工智能这些年一直不温不火的主要原因。

单从商业视角来看，如果一项技术没能找到合适的落地场景，那么这项技术大概率只能是孤芳自赏。过去很长一段时间里，包括商汤在内的一众明星科技公司们，过度迷恋技术信仰，忽略了场景落地，表现在业务上，就是他们的触手很长，无论是C端，还是B端和G端，只要有合适的活，它都会去做。

这像极了十几年前的软件公司，也是四小龙们的难言之隐，毕竟在理想和现实之间，为了能把AI故事继续讲下去，这些传统软件公司就能做的活，他们大概率还是会继续干下去的。

商汤问题是典型的AI行业问题

关于AI含金量这件事，业界主要有三个判断因子：研发投入、营收规模及增速、主营业务净利率，但人们往往只注意前面两个，而忽略了最关键的最后一项。

因为关于前两者，几乎每家做软件的公司都能做到还不错，关键是，很多外包、集成商卡脖子的点，就是没法形成规模效应和技术壁垒，这里有一个技术误区，很多人误以为技术壁垒代表着企业拥有专利数的多少，但最实际的衡量指标应该是，这项能应用于社会场景的技术，是否缺它不可。

在这方面，Open AI就是一个典型的例子。时至今日，相比于已经推出的大模型，业界更关心的，其实是它究竟是怎么构建模型的，以及如何进行模型训练的。

这也是国内一些人工智能公司最缺乏的竞争力。

换句话说，商汤们的问题不仅仅是商汤本身的问题，更是一个行业性的难题。

这也解释了为什么人工智能很难形成绝对壁垒。根据IT橘子数据，截至2020年，30%的成长型AI企业尚未获投，这些未获投企业很多没有找到细分的价值板块，产品差异化竞争优势也不明显，甚至存在着严重的同质化竞争现象。

那么问题来了，大模型究竟能不能解决当下人工智能的困境呢？

答案是否定的，本质上来讲，现在多数的大模型并不能称得上是真正的AGI。有业内人士告诉《新眸》，“衡量大模型成功与否的标准，并不只是有多少参数，而是它究竟能解决什么样的场景难题，而且这个场景问题，用AI解决成本更低、安全性更高。”

按照这个逻辑来看，现在的大模型还远不能撑起一个主营业务，反倒加剧了AI的黑盒化，本来大家对于人工智能已经很费解了，现在陡然推出的各种新方案，它的可靠性和商业价值就更加值得商榷。

AI现状也大致如此，近些年爆火又沉寂的中台们就是典型。就国内玩家而言，你会发现在活得好的基本都是卡位垂直领域的，比如AI语音领域的科大讯飞、智能BI领域的帆软等，但目前也未跑出一个类似于微软或者Snowflake式的巨头。

似是而非的风口，正让局面愈加混乱

大模型爆火后，很多人都认为这将是一个超级风口。

但事实却是，隔壁的Open AI已经和微软密切合作，试图把AI能力融入原有的微软产品体系中，旗下的Azure云计算业务、office 365，甚至是搜索业务Bing，都进行了大升级。

但国内的人工智能环境却有所差异。

基本上包括阿里、腾讯在内的巨头们更愿意研发自己的大模型，而不是和其他厂商合作，这是由国内互联网发展路径决定的。中国是个超级市场，无论是典型的人工智能公司，还是有一定研发能力的互联网企业，他们更愿意关起门来自己做，至于生态，大多还是停留在销售视角和口头上。

在这种情况下，往往会加剧行业的内卷程度，以至于出现了一个怪象，大模型越来越火，而人工智能公司的定位反倒越来越模糊。这也是另外一个需要深思的问题，按照凯恩斯的经济学逻辑，国内人工智能遇冷的关键在于，供给远超过真实需求，而想要培育这个市场，仍需要时间沉淀和多方努力。

按照这个逻辑来看，我们确实应该让AI降降温，重回理性的轨道上了。

结语

AI大模型是人工智能迈向通用智能的里程碑式技术，因为其可为各行各业的智能化升级提供强劲的生产力工具。在千行百业数字化转型升级的当下，大模型的重要意义不言而喻。也因此，在当下，谁能率先在赛道里抢到更多筹码，就非常关键了。可以预料，未来，抛开“基础设施”层面的较量外，真正的战场大概率是各行各业的切实落地上。