撰文|史圣园
【资料图】
编辑|翟文婷
互联网公司对大模型探索的脚步还在继续。
6月19日,腾讯姗姗来迟,交出大模型作业。不过跟百度、阿里通用大模型不同,腾讯云发布的是行业大模型。至此,BAT 全部入局。
先是百度抢跑,阿里紧随其后。5月,马化腾在股东大会上表现得云淡风轻,「我们也一样在埋头研发,但是并不急于早早做完,把半成品拿出来展示。」
话虽如此,此次腾讯云的行业大模型,很难被看作一个饱满的「完成品」。行业发展特性使然,大模型跟产业结合还处于比较早期的阶段。
腾讯云推出行业大模型还有一个特殊背景。
云服务行业风云突变,增长放缓的当下,MaaS(模型即服务)成为保卫市场的最佳选择,也是不得不做出的必需反应。
放眼国际,也是如此。微软谷歌自不必说,另一位云计算选手亚马逊,在4月份发布了泰坦大模型、AI大模型服务Amazon Bedrock,一定程度上也是借机提振云服务增长士气。
正如李彦宏此前的论断,「过去,云计算主要卖算力,看速度、看存储,今天,客户购买云服务,是要看框架好不好、模型好不好。」
问题是,这个设想是否完整落地,尚未可知。
相比通用大模型,行业大模型与产业的结合更为紧密,至少技术不是悬浮在空中,多了几分解决具体问题的可能性。
但我们不能将此理解为,行业模型的实现难度更低,更容易出成果。
一、行业模型的魔力和阻力
相比通用大模型,行业大模型的优势显而易见,这也是巨头和资本市场把目光投向此处的原因。
腾讯云与智慧产业事业群 CEO 汤道生说,「目前通用大模型一般都是基于广泛的公开文献与网络信息来训练的,网上的信息可能有错误、有谣言、有偏见,许多专业知识与行业数据积累不足,导致模型的行业针对性与精准度不够,数据『噪音』过大。」
而理想情况下,行业模型的数据更聚焦、训练和推理成本更低。毕竟,每一次提问,大模型就如同参加一个闭卷考试。复习的东西越多,在记忆里搜寻的时间就越多,也更容易出错。
汤道生的话没错。但没有好的通用模型,行业模型也无从谈起。
而且落地一个真正可用、能严肃解决问题的行业大模型,也许并不比开发通用大模型简单。
数据的噪音,会带来模型的幻觉(hallucination),也就是大模型难以避免事实性错误。然而,模型的幻觉和智力如同一体两面。
模型的智力涌现需要较大的参数。一位AI公司的技术合伙人表示,目前,没有500-600万亿参数规模,模型就很难达到较好的智能水平。虽然学界也在研究如何用更小的模型达到更理想的效果,但这需要时间。
大模型智力涌现的参数规模
100万亿参数的通义千问,距离GPT级别的C端商用尚且存在距离;如果行业模型真的仅仅基于规模更小的行业数据来训练,在B端的应用,效果大概率不会理想。
想要严肃应用在行业中,还是要在表现良好的基础模型上再用行业数据进行训练。
以Bloomberg的金融行业模型为例,它的底层依然是GPT。BloombergGPT的训练数据量约为5300亿词,其中金融行业公开数据占54.2%,另一半则是通用模型基础数据,Bloomberg自己的数据仅占 0.7%。
腾讯云智能负责人吴运声表示,腾讯云的10个行业大模型里,参数规模从数十亿到数百亿不等。
另一个难点在于高质量行业数据的获取。
首先是可利用的公共数据较少。复旦大学的一项研究显示,各地方所发布的数据中86.25%的数据为静态数据,更新频率以年为单位,甚至更久。国家信息中心的公开资料显示,只有8.5%的地方平台连续两年发布了新的数据集。
此外,很多公共数据以文件附件的形式公布,存在数据质量不高、机读性差等现象。
而企业的私有数据,管理者更是希望牢牢握在自己手中。核心数据,是企业竞争力的一部分,当然不肯轻易示人。数据上云都需要很大决心,更不会轻易拿去给科技公司训练模型。
而私有部署和训练一个可用模型的成本高昂,一般企业很难承担。除此之外,企业还需承担模型微调的成本、每一次运行的成本。
二、MaaS,云计算厂商的救命稻草?
目前看来,行业大模型的难度并不比通用大模型轻松多少,为什么却成为巨头趋之若鹜的所在?甚至鼓励企业基于云服务打造专属模型,已经成为云计算厂商的必争之地。
一个不能忽略的背景是,国内云服务经过十年狂奔,市场增速放缓,导致行业从寻找增量变为存量拼杀。
IDC公有云市场报告显示,2022年下半年,IaaS+PaaS 市场增速明显放缓,与一年前相比,增速下滑了23.9%。一直排名第二的腾讯云没能保住这个珍贵的位子。企业对公有云的投入放缓、互联网公司等传统云客户自身的增长也不及预期。
与此同时,云计算厂商的价格战愈演愈烈。毕竟,IaaS 服务同质化严重,价格是影响客户购买决策的重要因素。
4月,阿里打响了第一枪,开启了「阿里云史上最大规模降价」,覆盖了存储、网络、数据库、视频云等几乎全部核心产品,其中存储产品最高降幅可达 50%。一个月后,腾讯云快速跟进,大幅下调报价,部分产品线降价幅度超过40%。
阿里和腾讯纷纷将降价包装为「技术红利的回馈」。事实是,除了使用价格战作为撬动市场的利器,很难找到新的突破点。
MaaS 的出现,让云计算厂商们看到了希望和新的可能性。
腾讯云 MaaS,就是基于TI平台打造的「行业精选模型商店」,面向的领域包括金融、文旅、政务、传媒等十大行业,提供50余个解决方案。
「虽然大家对通用大模型期待很高,但它不一定是满足行业场景需求的最优解。」腾讯云与智慧产业事业群CEO汤道生说。腾讯云想要更「务实」,帮助企业用户用自己的数据,更快生成能够严肃应用于业务场景的专属模型。
投资者们也持有相同的看法。从朱啸虎和傅盛的隔空辩论中,我们不难看到投资者的共识——场景优先,数据为王,行业大模型才是真正的机会所在。
某种程度上,巨头「以价换量」,更像是提前锁定未来 MaaS 客户的策略,要将算力、框架、模型、应用统一兜售给企业。
三、离应用有多远
行业模型要想将云计算重新拉回快增长轨道,还有相当的距离。最典型的问题是,落地应用。
「企业所需要的是在实际场景中真正解决了某个问题,而不是在100个场景中解决了70%-80%的问题。」汤道生说。
正如前文所述,大模型的幻觉问题,知识截断问题,以及训练数据量大所带来的灾难性遗忘,是目前很难攻克的技术难题。使用行业数据精调,能在一定程度上减少大模型的犯错概率,但绝不可能「彻底避免」。
大模型的能力,还需要通过产品设计加以限制,以及人类专家的二次把关,才能保证相对可靠的落地应用。
腾讯自身的企业级应用,包括腾讯会议、企点智能客服,以及AI代码助手三款SaaS产品,率先应用了行业大模型。
腾讯会议 AI 助手可以智能生成会议的纪要,用户可以依据「章节」「发言人」「话题」快速定位到相关内容。通过企点智能客服,用户可以使用自然语言进行查询,直接得到数据分析。AI代码助手则可以在沟通、编码、排错、评审、调优5个环节提供高效的编程辅助。
目前,除了腾讯会议的智能录制功能已经小规模开放给企业用户试点,其他两款产品暂未开放体验渠道。
我们只能从 PPT 里窥见一二,推测一下实际效果。以智能客服为例,它的知识构建方式包括向量数据库、企业级LLM两种。这是一个务实的解决方案。
向量数据库(Embedding),其实是大模型之外的基础设施。
技术上,它将企业各种形式的私有数据(包括文件、音频等等)进行预处理,先转化为文本,再切分为一个个文本块,存储在向量数据库中。
根据提问,系统会在数据库中检索最相关的文本块,然后和用户的问题一起整合为提示词(Prompt),再给到大模型生成答案。尽量在提示词中给到准确的信息,就可以尽可能控制大模型的幻觉问题。
市面上已经有类似的产品,比如德国独立开发者发布的ChatPDF,用开源模型处理用户的文档页面,再调用 GPT 3.5 的API,从而让用户可以直接与之对话。它仅仅针对于单个文档,检索的量级和难度要小很多,可效果也是差强人意:用来娱乐还可以,用来办公有点难。
新莓daybreak试用 ChatPDF 发现,即使是对于单个文档、且对接了目前效果最好的 GPT,它的回答仍然不够稳定。尤其是跟数值相关的问题,经常会出现错误;同一个问题问两次,回答的内容也不尽相同。
可以想见,如果想要处理更庞大的企业数据库、且基于自研的大模型,在实际落地中需要突破的技术难点还有很多:如何低成本地高精度标注数据、如何提高检索向量数据库的相关度、如何溯源、如何动态更新知识库等等……每一步,都像是在泥地里的跋涉。正如汤道生所言,「大模型只是开端」。
发布会上,腾讯提及了与文旅、金融、政务、教育、传媒五大行业合作探索的应用案例。
关于效果,腾讯讲的也较为克制,似乎有意在对用户进行「预期管理」:AI 仍然是助手的角色,与专业人员配合,可以提升任务完成率、信息录入准确率提、提升媒资检索能力等等。
会后采访中,吴运声也表示,大模型跟产业结合还处于比较早期的阶段。
行业大模型,壁垒在于数据获取、模型调优,以及下游应用场景。毋庸置疑,腾讯手握丰富的应用场景,这是他们的优势。
如果吸引更多用户在合理预期下「先用起来」,从而获取更多行业数据、形成细分领域的数据飞轮,那么模型也会在实际应用中不断完善自己。