爱游戏-瞄准五大方向持续攻关,构建AI网络底座

[导读]假如企业具有数据中间,需要存眷的是人工智能(AI)手艺可能很快就会摆设到数据中间。不管AI系统是一个聊天机械人,仍是横跨多个系统的主动化流程,亦或是对年夜型数据集的有用阐发,这项新手艺都有望加快和改良很多企业的营业模式。但是,AI的概念也可能会使人发生猜疑和曲解。是德科技的这篇文章旨在切磋有关AI收集若何工作和该手艺面对的怪异挑战等五个方面的根基问题。 假如企业具有数据中间,需要存眷的是人工智能(AI)手艺可能很快就会摆设到数据中间。不管AI系统是一个聊天机械人,仍是横跨多个系统的主动化流程,亦或是对年夜型数据集的有用阐发,这项新手艺都有望加快和改良很多企业的营业模式。但是,AI的概念也可能会使人发生猜疑和曲解。是德科技的这篇文章旨在切磋有关AI收集若何工作和该手艺面对的怪异挑战等五个方面的根基问题。 GPU相当在AI计较机的“年夜脑” 简单来讲,AI计较机的年夜脑就是图形处置器(GPU)。曩昔,人们可能传闻过中心处置器(CPU)是计较机的年夜脑。GPU 的优势在在,它是一个善于进行数学计较的 CPU。当建立AI计较机或深度进修模子时,需要对其进行 “练习”,这就要求对可能包括数十亿个参数的数学矩阵方程进行求解。进行此种数学运算的最快方式是让多组 GPU 在不异的工作负载上运行,即使如斯,练习AI模子也可能需要数周乃至数月的时候。AI模子建立后,会被迁徙到前端计较机系统,用户可以向模子发问,这就是所谓的推理。 AI计较机集浩繁GPU在一身 用在处置AI工作负载的最好架构是在一个机架中集成一组GPU, 并将其毗连到机架顶部的互换机中。还可以有更多的 GPU 集成机架,依照收集条理布局毗连所有 GPU。跟着所要解决的问题的复杂性增添,对 GPU 的需求也就越年夜,有些将要摆设的解决方案可能会包括数千个 GPU 集群。这不难让人联想到数据中间里一排又一排密密层层的办事器机架,这类场景很是常见。 AI集群是一个小型收集 在构建AI集群时,有需要将更多GPU毗连起来,如许它们才能协同工作。而GPU之间的毗连可以经由过程建立微型计较机收集的体例来实现,让GPU与GPU之间可以或许相互发送和领受数据。 图1:AI集群 图1展现了一个AI集群,此中最下方的圆圈代表了GPU在履行使命时的工作流程。将很多GPU毗连到了机架顶部(ToR)的互换机。ToR 互换机还毗连到了上图顶部的主干收集中利用的互换机,这张图充实描画了需要集成浩繁GPU时所采取的清楚收集条理布局。 AI摆设的瓶颈在在收集 客岁秋季,在OCP(开放计较项目)全球峰会上,预会者重点会商了新一代AI根本举措措施。此中,来自迈威尔科技的Loi Nguyen充实论述了由此呈现的一个要害问题:收集已成为新的瓶颈。 GPU在解决数学问题或处置工作负载方面很是有用。这些系统完成使命的最快方式是让所有 GPU并行计较、协同工作来处置不异的工作负载。要做到这一点,GPU需要获得它们行将处置的信息,而且它们彼此之间可以相互进行通讯。假如此中一个GPU没有获得它所需的信息,或需要更长的时候来输出成果,那末所有其他GPU都必需期待,直到可以或许一致协作来完成使命。 从手艺角度来说,拥堵的收集酿成的数据包延迟或数据包丢掉可能会致使系统需要频频从头传输数据包,并显著耽误完成使命所需的时候。这意味着,可能会有价值数百万或数万万美元的 GPU闲置,从而影响终究的成果,固然也可能会影响但愿经由过程操纵AI手艺取得商机的企业的上市时候。 测试是成功运行AI收集的要害 为了高效运行AI集群,用户需要确保GPU获得充实操纵,如许才能较早地完成进修模子的练习,并将其投入利用,实现投资回报最年夜化。这就需要对AI集群(图2)的机能进行测试和基准测试。但是,这其实不是一件垂手可得的事儿,由于GPU和收集架构之间有着千丝万缕的联系和诸多设置,它们需要在架构上实现互补,以知足处置工作负载的需要。 图2:AI数据中间测试平台和若何测试AI数据中间集群 这给AI收集带来了诸多挑战: 斟酌到本钱、装备的可用性、谙练的收集 AI 工程师的时候、空间、功率和热量等身分的限制,很难在尝试室中复刻完全的工作收集。 在工作系统上履行测试会下降工作系统可用的处置能力。 因为工作负载的类型和数据集的范围巨细和规模可能年夜不不异,是以所要研究的问题也会难以重现。 深切洞察GPU之间的集体通讯也颇具挑战性。 应对上述挑战的方式之一是,起首在尝试室情况中对所提出的设置的一个子集履行测试,以便对JCT、全部AI集群所能到达的带宽等要害参数进行基准测试,同时将这些参数与Fabric容量操纵率和内存缓冲区耗损环境进行比力。这类基准测试有助在找到GPU/工作负载的散布与收集设计/设置之间的均衡点。当计较架构和收集工程师对成果比力满足时,他们就可以够将这些设置利用到履行使命的工作系统中而且权衡新的成果是不是抱负。 为了充实释放AI的潜能,需要优化AI收集的装备和根本架构。企业的研究尝试室和学术机构致力在对构建和运行高效AI收集所触及的各个层面进行阐发,以解决在年夜型收集上履行使命所面对的挑江南体育战。特别是在当前行业最好实践正不竭产生转变的环境下,情势更是如斯。只有采取这类可以频频验证、高度协作的方式,业界才能实现可反复的测试,并矫捷地测验考试各类“假定 ”场景,这是优化AI收集的根本。 作者:是德科技产物营销司理 Linas Dauksa

欲知详情,请下载word文档 下载文档

北京2024年8月27日 /美通社/ -- 在8月23日举行的2024年长三角生态绿色一体化成长示范区结合招商会上,软通动力信息手艺(团体)股分有限公司(以下简称 软通动力 )与长三角投资(上海)有限...

要害字: BSP 信息手艺

上海2024年8月26日 /美通社/ -- 本日,高端全合成润滑油品牌美孚1号联袂品牌体验官周冠宇,开启全新路程,助力泛博车主经由过程驾驶去摸索更广漠的世界。在全新发布的品牌视频中,周冠宇和分歧布景的消费者表达了对驾驶的酷爱...

要害字: BSP 汽车制造

上一篇:爱游戏-为恒智能2024年生态伙伴大会(浙江站)圆满举行 下一篇:爱游戏-TCL电子(01070.HK)2024年上半年经调整归母净利润同比大增近1.5倍