百模大战，不拼单项拼平台

文章转载来源：数智前线
原文来源：数智前线
作者：徐鑫
图片来源：由无界 AI生成
产业智能化转型走进深水区，企业对AI能力的需求点在起变化。
越来越多大型企业的视野已不局限在单一智能应用上。在电力、金融等行业，大型企业正围绕着AI能力的生产、运用和管理全流程，对厂商的AI学习平台及平台性生产力工具提出需求，从而解决人才稀缺、数据稀缺、管理困难、资源复用率低等一系列痛点。
大模型热潮到来后，平台的比拼重点转移到了大模型开发和应用之上，厂商们积极将此前的AI平台解决方案和大模型结合。 在平台大比拼中，一些企业的优势已经凸显出来。国际分析机构Forrester近日发布报告显示，中国人工智能/机器学习平台竞争中，百度智能云表现亮眼，参与评选的AI平台在数据、推理、应用等6个大类，15个细项获得了最高分，位居领导者象限。
AI平台，正帮助企业快速构建符合业务需求的人工智能模型及应用，有效监控和优化模型效果。
一百个场景要建一百个模型的境况已经成为历史。
01 深度用AI，老炮们的困扰
产业正在进入深度用AI应用阶段，AI已不再遥不可及。不过也有越来越多企业发现，随着应用深入，这些企业智能化领域里的资深用户们正在遭遇新的困扰。
以能源行业为例，大型电力企业已经将AI模型用于电路巡检等多个场景。通常情况下，这类企业的相关需求，多由不同部门或分公司独立采购。随着AI应用变多，模型数量也在积累。管理大量模型，并让大量的零散模型能稳定、高效运行，正成为一项挑战。
许多大型企业都存在类似问题。一位资深人士告诉数智前线，他亲眼见过企业里A部门放5个人做A算法，B部门搞B小分队也放几个人做算法，这导致很难从公司层级进行统一的监控优化更新维护，同时企业内整体的AI资源复用率很低。
金融行业应用AI也走在前列，一些企业或机构早已将AI技术应用于信用卡发放资格审批和欺诈识别等多个环节，实现AI风控和精准营销。但金融行业对安全和合规的强调也在延伸到AI的应用过程。比如，银行内的技术团队非常重视合规因素，新建一个模型时，建设的委托和批准角色是谁，数据读取的审批由谁经手，数据撰写、模型生产、训练、落地和上线也都有层层流程保障。这类需求明显不是传统的智能应用建设。
一位云厂商资深行业解决方案人士告诉数智前线，一些大型央国企明确提出希望构建企业的智能中枢，培育自身的AI能力，这样企业里的数字化部门就能针对新场景，自己研发算法做全新应用。
业界也观察到这一趋势。百度智能云AI平台高级架构师靳伟告诉数智前线，这反映出，AI应用迈向深水区，企业的智能化转型的系统性日益凸显。企业不但要有愿景目标规划，也需要有很强的推进协调和监督机制，并且要有完备的工具，确保顺利推进实施。AI平台就是企业智能化转型的生产力工具。
行业上下已经意识到这一平台产品的重要性。日前，国际分析机构Forrester发布《The Forrester WaveTM：中国市场人工智能/机器学习平台厂商评测，Q42023》报告指出，中国的企业决策者们正进一步优先考虑采用AI技术，推动生产率提升和业务创新。过程中，企业需要人工智能平台产品，从而在各自的业务环境中支持复杂用例。
新的趋势对机器学习平台厂商的能力也提出了要求。Forrester认为，领先的平台既要能提供跨数据管理、模型培训和人工智能应用程序构建的综合工具；也要贴合产业场景，帮助一些缺乏AI人才和数据科学家的企业基于自身业务需求来获得AI能力；另外，还能通过工具、技术和实践帮助企业可以规模化开发部署模型。
Forrester对中国14家主流机器学习平台厂商从产品能力、战略布局、市场表现3大维度，进行了25项细分标准的评估。数据显示，目前百度智能云获评该报告的领导者阵营，在数据、训练、预测推理、应用等9项细分评分均获第一。
靳伟介绍，百度在AI平台的产品能力领先经历了长期的积累和打磨。AI平台的初衷是希望打造一款生产力软件，让不同类型的企业用户能够多快好省地建设AI应用，同时做到平台上算法多、工具多、运行快、效果好，帮助客户节省服务器和人力。
目前能源、金融行业的一些大型企业里已经在深度使用。基于AI平台，企业不仅可以快速构建符合业务需求的人工智能模型及应用，还能有效监控和优化模型效果。此外，管理和协调数据、算力、人员、流程等资源时也更便捷、高效。
例如，电力行业，百度智能云AI平台正帮助大型集团解决业务痛点。一方面，模型和数据能在不同子公司分享，避免重复造轮子。同时一些已有的安全生产相关模型使用这款产品，可由国网直接统一分发到省网或市网，能高效利用AI资源，质量一致。另外，AI平台还能助力企业创新，比如研发出的电力调度新算法，用上了百度的强化学习框架，可实现不用大量专家的人工经验调参数，AI自动完成调度参数校准。
金融行业里，百度智能云的AI平台解决方案也帮助许多金融机构构建了大的模型风险管理模块，保障AI应用到金融场景里流程合规和可信安全。
02 大模型时代，如何量体裁衣
今年以来，大模型和生成式AI浪潮推动了产业界进一步深度应用AI，机器学习平台也在迎来新的发展机会。
资深人士介绍，大语言模型到来后，机器学习平台的变化体现在三个层面。最典型的一个变化在操作界面上，NLP之前复杂的操作界面变简单了，企业应用语言类AI的门槛在降低。同时，模型的自动化能力提升，数据处理、模型选择、自动报告生成等任务都可以自动化完成。另外，AI原生的创新应用空间也随之打开。
在这一背景下，许多企业已经把大模型当作了一道必答题，各平台厂商也摩拳擦掌，加足马力，推出各类产品和平台来加速大模型技术的应用落地。以百度为例，今年3月推出了百度智能云千帆大模型平台，将大模型开发和应用的关键能力与AI平台深度整合，打造大模型服务的“超级工厂”。
为方便企业轻松使用和开发大模型应用，目前百度千帆上既提供包括百度自研的文心大模型和第三方大模型，还提供了各种AI开发工具和整套开发环境，助力各行业的生成式AI产业落地。
具体而言，百度将产业界对大模型的需求总结为五种类型，无论是只有算力需求的客户，还是希望直接调用大模型API或基于现有大模型做二次开发的企业，以及想要基于大模型去开发AI原生应用或者直接使用已开发好应用的公司，百度千帆平台都能提供有针对性的服务。
对只有算力需求的企业，百度千帆平台可提供极具高效和性价比的异构算力服务。靳伟透露，要做到这一点，百度智能云AI平台的技术团队花几年时间做了大量Dirty Work。例如兼容国内外主流AI芯片，需要从框架层、核心算法及网络、芯片型号、操作系统四个层级做适配。“PyTorch写的和TensorFlow写的不一样，操作系统用Windows、Linux或者单片机，要做的工作也有差别。四层组合做了四万种适配，才能保证各种模型顺利运转。”靳伟说。
想直接调用大模型API的用户关心模型能力的丰富性，目前千帆大模型平台既接入了文心大模型4.0，还纳管了44个第三方的国内外主流大模型，数量上是国内平台里最多。
有些企业希望对现有大模型进行二次开发，这需要丰富的工具链和大量的数据集支持。千帆平台目前有覆盖大模型再训练、微调、评估和部署等全生命周期的完善工具链和大量高质量数据集，能针对场景快速优化模型效果，进一步提升企业的大模型用户体验。
大模型对数据标注环节带来新变化，许多标注任务可通过模型完成。目前千帆平台支持业务数据回流和高度自动化的数据标注。比如目标检测场景里，千帆直接提供预训练能力，通过点按纽标注少部分，剩下的让模型学习人类标注风格自动标注，可为企业节省70%～90%的人力。
也有许多企业想基于大模型来开发AI原生应用。本月中旬，百度智能云发布“千帆AI原生应用开发工作台”，其中包含大模型应用开发的常见应用组件、应用框架两层服务，正是针对开发AI原生应用需求。
以应用组件为例，千帆平台包含了多种类型的能力，如问答、思维链等大语言模型组件和文生图、语音识别等多模态组件以及向量数据库、对象存储等传统云服务能力等。
而应用框架能将组件有机串联起来，完成特定场景的完整任务。千帆平台已经提供市面上常用的检索增强生成（RAG）、智能体（Agent）等框架服务，先锋企业如三一重工已经应用这些框架，快速开发自己的知识问答应用。
Prompt工程是大模型出现之后诞生的新领域。这与大模型的特性有关，稍微改变一下指令，它的输出或行为会发生巨大变化。目前，各家厂商都在强调Prompt工程工具。百度千帆平台也提供了覆盖对话、编程、电商、医疗、游戏、翻译、演讲等十余个场景，共226个模版。据介绍，这是国内主流平台里数量最多的Prompt模板库。开发者和企业还能使用平台提供的各类自动化及批量工具，高效完成prompt环节。
靳伟认为，过去几个月里百度智能云千帆大模型平台夯实了基础，为百模大战，助力企业规模化应用AI做好了准备。
03 AI平台，下一站拼什么？
AI并不只是大企业专属。目前机器学习平台厂商们都重视对大型企业、中小型客户和开发者市场的全面覆盖，百度智能云的AI平台解决方案也有针对性地服务不同群体。
靳伟告诉数智前线，百度AI平台解决方案是多个产品的总称，包含了全功能AI开发平台BML、零门槛AI开发平台EasyDL及百度智能云千帆大模型平台等产品。针对不同领域或不同客户偏好，AI平台都有对应的产品适配。例如，数据处理能力被打包成EasyData产品，零代码建模能力也被抽出来做了EasyDL产品，能帮助用户实现用高性能预训练模型完成零代码建模，而大模型的能力则由百度智能云千帆平台承载。
在公有云上，客户类型以偏中小的企业居多，AI平台的模块被重新打散组合，以全功能AI开发平台BML和EasyDL产品为主要代表来适应需求。针对大型客户的私有化部署需求，各类产品又会被打包成超大产品去完成交付。
此次Forrester报告显示，百度智能云AI平台的产品能力在数据处理、模型训练、预测推理、应用、架构等五大领域都表现优异。
靳伟介绍了不同领域里的独特能力优势。以数据领域的特征工程为例，靳伟介绍，百度AI平台集成了非常优异的特征库管理能力，能力上达到了专业级水平。可以提供特征的增删改查，特征生产、共享、版本管理、数据验证等功能，支持批示流式不同形式的数据用于预测服务，还能保证模型训练时用的特征和最终预测时候的特征一致。“如果训练的时候特征分布上，比如男人占50%，女人50%，而预测的时候男人占60%、女人40%，那你不可能指望这个模型特别准”，靳伟说，这对模型的准确性非常关键。
又比如模型训练领域，百度AI平台可支持包含图像、视频、文本、语音以及结构化数据等多种数据类型的建模和训练。在建模方式上，为愿意写代码的人提供了NoteBook工具支持，不喜欢写代码的人能拖拉拽甚至点一下集成式一站式按纽就能建模。针对大量的场景比如图像分类，单标签多标签，物体检测等CV场景，都由飞桨算法团队基于Paddle算子进行了深度优化，性能和效果表现会更优异。
产品性能上的独特优势点，离不开长期的技术投入和对新技术趋势的关注。百度AI平台研发团队介绍，他们非常关注新的技术趋势，比如三年前业界就在探讨模型可解释性问题，不知道模型怎么做决策的，就会影响模型在安全合规要求比较高的场景里使用。一般而言，深度学习模型参数量上比传统的机器学习模型大很多，黑盒问题会更加严重。
经过长期的准备，百度AI平台团队最终攻克了常规机器学习领域下的模型可解释性算法，集成了五个常见的机器学习的原理白盒化，同时还攻克了部分深度学习可解释性问题。“弄清模型在什么场合下做出决策，是数据引发还是算法引发，都可以归因，这些成果推动了AI平台相关产品在金融决策等特殊行业场景里的应用。”靳伟介绍。
当下业界把大模型的发展范式分五层，大模型本身、prompt工程、Chain工具链和行动链、Agency与Multiagency。百度智能云千帆平台此前主要的工作重心在第一、二层走得非常扎实，后面三层包括工具链、Agent和Multiagency能力也处于重点建设阶段。靳伟介绍，千帆大模型平台将持续完善升级，让大模型自主发挥主观能动性，具备解决复杂问题的能力。同时，未来不排除有出海计划。
总体而言，企业智能化建设下，企业应用AI深度升级，AI平台领域的竞争也日趋激烈。要在这一领域持续保持领先，迎接合规性和技术复杂度变化等带来的长期挑战，厂商们还需要技术投入。靳伟认为，厂商需要坚持技术创新、在客户满意度、安全性、合规性上提升来适应这个不断变化的市场。
百模大战，不拼单项拼平台

Другие публикации автора

Последние новости