数字世界正在向AI原生世界加速演进,然而面对未来百万倍的算力需求和数据规模增长,现有的互联网基础设施面临严峻的挑战。数据与算力作为AI的核心驱动因素,均发生了深刻的变化。传统的数据平台面向AI时代,需要从结构化处理转向多模态处理,而将数据技术和AI技术进行深度融合是其中的核心关键;同时面向AI的算力基础设施也需要从Scaling-up架构向Scaling-out架构转变,新一代智算网络在这一转变中扮演至关重要的角色。
10月24日,在这个属于程序员的节日,由中关村超互联新基建产业创新联盟、数字人民币研究院联合主办,世纪互联承办的“超互联(苏州)总部节点发布会”将在苏州举办。本文将带您提前揭秘矩阵起源及世纪互联在多模态AI数据智能平台与超互联智算平台的紧密合作。
AI大模型时代的多模态数据处理需求强烈
多模态数据,指的是各种类型和格式的异构形态数据,包括行业常说的结构化数据、半结构化数据及非结构化数据。
根据 IDC 的预测,到 2025 年,全球数据量将达到 175ZB,其中大部分为非结构化数据。传统来说,由于结构化数据相对价值密度较高,主流数据处理技术主要围绕结构化数据展开。而非结构化数据,受限于过高的处理成本和技术门槛,同时价值密度较低,因此往往会在企业中形成数据沼泽,即用户或是无法访问这样的数据,或是无法从数据中获取任何价值。但AI大模型的出现完全改变了这一现状,几乎所有的企业都深刻看到了大模型对于知识的理解和生成的高效能力。而AI大模型则是由海量文本、图像、音视频等非多模态数据训练而来,这样的使用范式使得企业对于多模态数据的重视前所未有的提高。
但是多模态数据处理并不是一件容易的事情,大量企业内部产生的多模态数据是碎片化的,缺乏有效的管理方案和治理能力,处于混乱生长的阶段。用户无法访问、感知、搜索,更加无法深入确定其中的价值和应用方式,这样的现状带来的后果就是企业难以真正将AI大模型落地到实际业务中去。
矩阵起源多模态数智平台解决方案
为了应对多模态数据处理的挑战,矩阵起源公司已推出完整的端到端多模态AI数据智能解决方案,可帮助企业一站式将异构多模态数据进行统一纳管、解析、治理、查询及搜索,使用户可以将多模态数据的数据沼泽变成具有真正财富的数据森林。
该平台共分为四个重要模块:
-
MatrixDC是一个高性能异构算网调度平台,负责底层对于GPU算力资源、网络资源、存储资源的管理,同时基于Kubernetes提供容器服务。该模块作为整体IaaS基座,为数据层及AI层提供弹性、高速的基础资源服务。
-
MatrixOne是一个超融合数据管理平台,负责整体数据接入、解析、存储及元数据管理,其以云原生存算分离架构为基础,具备面向结构化关系型数据、日志数据、JSON数据、文档数据、图片及音视频数据进行接入及调用AI算法进行解析的能力,同时可以融合OLTP、OLAP、时序、向量、搜索等多种数据负载,实现多模态AI数据处理的超融合一体化。
-
MatrixGenesis是一个AI模型底座及智能体开发平台,负责托管及调优各类大小AI模型,服务于多模态数据pipeline中各类多模态数据解析、文本语义理解及内容生成等任务,同时可以基于MatrixOne的能力构建知识库及RAG/Agent智能体应用。
-
MatrixSearch是一个面向多模态数据的统一搜索引擎,它将语义、关键词及结构化三种搜索技术进行了融合,同时利用大模型的能力进行进一步的搜索重排,以返回用户最精确的搜索答案。
该方案已经在传媒、电商、制造、零售等多个领域广泛落地,帮助数十家中大型企业进行多模态数据的管理、搜索及价值挖掘。
难以绕过的IT基础设施缺陷
在实际落地交付多模态AI原生数据智能平台的过程中,我们发现在真实企业场景中,IT基础设施的瓶颈大大限制了数据价值的发挥。其中,最重要的就是缺乏高速高效的可信数据空间来连接公共数据和私域数据,以及企业内部不同位置、不同应用的数据。
-
多模态数据天然会具有碎片化和异构化的特征。由于企业业务系统及IT设施的异构化,多模态数据天然会诞生于不同的数据源头,企业希望建立统一的数据平台往往需要会涉及到大量的数据搬迁。
-
多模态数据的解析和应用需要用到大量的大小AI模型,这里需要一定的GPU算力资源。对于某些垂直领域来说,还涉及到对GPU算力消耗更大的模型训练和精调。绝大部分的企业并不具备相关的算力资源及投资能力。
-
多模态数据,如文档、图片、音视频等,由于企业对其内容没有建立完整的感知,因此对于将其访问权限限于私域范围内。但是大量应用实际上需要公域数据及私域数据的互联互通,甚至行业上下游私域数据的相互交换。
从根本上说,企业数据应用需求、数据安全隐私保护、算力资源供给能力、IT投资能力在当前的IT基础设施环境下存在较大的矛盾,这个矛盾在可见的将来,随着AI应用的大规模落地会愈演愈烈。企业很难保证以安全、可靠和高效的方式来处理私域数据,同时还能与公域数据及其它私域数据进行联合计算。
世纪互联的可信数据空间解决方案
根据世纪互联的探索实践,AI大规模落地的关键在于打造“超互联AI原生计算架构”。多模态AI数据处理及大模型AI落地的IT架构需要以分布式及云边端的形式设计,传统意义上的数据中心内、城域、广域以层级形式互联,无法实现跨地域、低时延、高带宽且安全可信的网络架构,导致超海量数据的处理基本上只能停留在数据中心内部。而在新一代多模态数据处理架构中,我们需要重新设计一套全新的可信网络架构去链接异构异地异属的算力、数据及模型。这一架构将改变过去以算力为中心将数据进行汇聚,成为以数据为中心、以点对点的可信网络进行跨地域连接的方式进行重构,形成完善的安全、可靠、高速的可信数据空间。
面对这个挑战,世纪互联联合苏州移动在苏州推出了超互联分布式算网大脑,建设全球首个AI原生的城域智算网,实现AI原生基础设施的三个首创。
-
第一,首创AI原生超级互联(Ultra Cross Connects,简称UCC)城市计算总线架构,全光网络实现100G直达办公桌面、40G直达AI原住民家庭及5G切片模式下的智能手机;
-
第二,首创枢纽型/Hub、辐射型/Spoke、边缘型/Edge 三个形态的AIDC同城同时接入UCC城市计算总线;
-
第三,首创“IP”+“地址”双网络架构设计。有别于传统互联网中基于域名(DNS)和IP寻址模式,网络底层协议引入区块链技术,每个超互联终端都具备其独立的公私钥地址,来实现寻址和终端校验,实现UCC城市计算总线内所有连接的“可信、可管、可控”的新一代安全原生架构,提供与传统互联网B2B、B2C、C2C不同的新一代数字基础设施。
在数据保护和应用方面,基于非对称密钥加密和超级互联UCC,首次提出非App层、分布式密钥保护的企业训练数据和模型文件存储基础应用。每个数据切片记录都经拥有者的公钥加密,数据内容存储在接入UCC城市计算总线的多种形态的AIDC上,因此用户可随时获取数据和模型的文件分片,使用私钥解密,呈现并管理企业的训练和推理数据。结合城市分布式算力平台无所不在的计算能力,启动大模型API服务,构建全流程隐私保护、即开即用、存算一体的AI原生基础设施。
在模型服务和使用方面,基于RDMA和RoCE 增强的超高速网络和数据智能管理分发系统,将帮助大模型企业充分利用城市总线上的算力资源来进行模型的精调甚至训练。还可以在模型训练工厂(枢纽型/Hub AIDC)和模型使用者(边缘型/Edge AIDC)之间,建立安全可信高效的模型分发和企业私有数据/用户隐私数据的专用网络。
在这样的新一代超互联智算网络的架构下,无论是在云侧、边侧还是端侧,地域及距离的限制将被彻底打破。点对点东西向的互联架构、上百倍的网络带宽、新一代软件定义的全流程数据加密及隐私保护技术,将打造一个全新的网络信息空间(CyberNext)和一个真正实用的可信数据空间,将帮助各行各业全面释放数据价值,拥抱AI原生世界。