客户案例

案例应用——某大型保健品公司 | 引入MatrixOne Intelligence构建销售Copilot的统一GenAI数据平台

作者:MatrixOrigin发布于

客户背景与挑战

客户是世界知名的保健品零售品牌。为加速企业的智能化转型,启动了AI工厂项目,计划为包括营销、客服、财务在内的多个业务职能构建一系列AI助手应用。然而,这一宏大的AI战略在数据层面遇到了核心挑战。企业所需的关键知识,如产品资料、业务政策、市场报告等,以PDF、HTML、结构化数据等多种形态,分散于CMS、S3、数据库等多个异构的IT系统中。
如果每一个Copilot应用都独立地对这些分散的数据源进行连接、接入和加工,将会形成一个极其复杂且混乱的“多对多”烟囱式集成架构。这种模式不仅会导致大量的重复开发工作,造成数据处理口径和质量标准不一,更会使得整个系统的运维成本高昂,无法支持企业级AI应用战略的快速、敏捷和规模化落地。因此,亟需一个统一的数据工程平台来解决这一瓶颈。

解决方案:构建统一AI数据工程基座

为应对挑战并为 AI工厂建立稳固的数据基座,客户选择引入MatrixOne Intelligence,构建统一的AI数据工程平台,从根本上解决数据分散和处理流程复杂的问题 。该平台的核心目标,是将所有AI应用所需的数据准备工作,通过一个标准化的、自动化的中央平台来完成,实现“一次处理、全域共享”。 具体实施路径如下:

  1. 统一数据接入:平台通过内置的连接器(Connector)模块,从客户现有的S3、CMS、Dataphin等多个业务系统中,自动、周期性地接入PDF文档、HTML内容及各类结构化数据 。
  2. 自动化多模态数据处理流水线:接入的原始数据进入由MatrixPipeline驱动的可视化工作流 。在该流水线中,平台利用集成的多种AI模型,对数据进行深度加工,包括: a. 智能解析与切分:利用layout-doc-yolo等版式分析模型和Paddle-OCR等OCR引擎,精准解析文档结构,并将长文本智能切分为适合RAG的片段 。 b. 向量化(Embedding):调用BAAI/bge-m3等业界领先的向量模型,将处理后的数据转化为高质量的向量,以便进行语义检索 。
  3. 构建统一的向量知识库:所有经过处理、增强和向量化的AI-Ready数据,最终被统一存储在MatrixOne数据库中 。MatrixOne作为核心的向量数据库,为上层所有的AI应用提供了一个统一、高性能、高可用的知识入口。 2.png

实施效果

在销售Copilot的实际落地中,一线营销人员通过语音、图片等多模态交互方式,向助手提出诸如“针对糖尿病患者的高蛋白营养方案如何搭配”等复杂需求。此时,统一数据平台瞬间联动:从MatrixOne向量库中精准检索产品成分表、临床营养学研究报告、客户历史健康档案等跨领域知识,再通过RAG增强生成技术整合为个性化方案。通过部署MatrixOne Intelligence作为统一的数据工程平台,客户成功地为其AI工厂战略奠定了坚实的数据底座,取得了显著成效:

  • 简化技术架构,提升开发效率:平台成功解耦了底层复杂的数据工程与上层的AI应用开发,彻底避免了“多对多”的集成困境。AI应用开发者无需再关心数据的获取与处理,只需从统一的平台调用AI-Ready数据即可,新应用的平均数据准备时间缩短了80%。
  • 保障数据质量与口径统一:标准化的中央数据处理流程,确保了所有AI应用使用的数据在来源、清洗、加工和向量化等环节的口径完全一致,极大地提升了“销售 Copilot”等RAG应用在进行业务问答时,答案的准确性、一致性和可信度 。
  • 加速企业级AI应用落地:该数据工程平台已成功支撑了“AI合同审核”、“销售copilot”“AI大健康助手”等多个核心Copilot应用的上线 。其中,“合同审核智能体”更是将单次审核时间从16天大幅缩短至1分钟,充分验证了该架构的先进性和商业价值 。

长期规划

当前统一数据平台已接入20+系统,但客户正计划进一步扩大其边界。据内部路线图披露,2025年将逐步整合供应链传感器数据、科研农场物联网信息流等实时信号,并通过动态向量化技术使平台具备预测性分析能力。这一演进不仅延续“一次处理、全域共享”的核心逻辑,更在智能化深度上实现从被动响应到主动决策的关键跨越,为AI工厂的下一阶段目标——构建企业级智能体网络(Agent Network)奠定基础。