当前位置:首页 > 揭开面纱 > AI小大模子不再依靠英伟达GPU?苹果掀秘自研小大模子

AI小大模子不再依靠英伟达GPU?苹果掀秘自研小大模子

2025-09-03 09:46:51 [内幕曝光] 来源:

电子收烧友网报道(文/梁浩斌)过去多少年中收做的模不秘自AI算力需供,英伟达GPU成为了最小大的再依赢家,不论是靠英自动驾驶借是AI小大模子,好比特斯推、伟达小鹏、果掀OpenAI、大模字节跳动等厂商皆正在争相抢购英伟达GPU产物,模不秘自患上到短缺的再依算力构建自己的合计中间,用于实习不开操做的靠英AI模子。

AI规模众星捧月也哺育了英伟达市值曾经突破三万亿好圆,伟达并少久登顶齐球第一的果掀位置。不中苹果却反其讲而止之,大模正在7月尾苹果公司拆脱的模不秘自夷易近圆论文隐现,苹果自研小大模子AFM眼前,再依残缺出有英伟达GPU的靠英影子。

苹果小大模籽实习,抉择了google芯片

正在苹果远期拆脱的一篇足艺论文中,详细介绍了苹果正在端侧战处事器侧的小大模子。正在小大模子预实习的阶段,苹果底子模子是正在AXLearn框架上妨碍实习的,据苹果介绍,AXLearn框架是苹果公司正在2023年宣告的开源名目,那个框架竖坐正在JAX战XLA的底子上,许诺模子正在种种硬件战云仄台上妨碍下效战可扩大性实习,收罗TPU战云端战当天的GPU。

苹果回支了数据并止、张量并止、序列并止战残缺分片数据并止(FSDP)的组开去沿多个维度扩大实习,如数据规模、模子规模战序列少度。

其中,苹果的AFM处事器端小大模子是苹果规模最小大的讲话模子,该模子正在8192个TPUv4芯片上妨碍了预实习,那些芯片被竖坐成8*1024个芯片散群,经由历程数据中间汇散DCN)毗邻。预实习有三个阶段,起尾操做 6.3 万亿个Tokens匹里劈头,接着操做 1 万亿个Tokens继绝实习,最后操做 1000 亿个Tokens妨碍笔直文少度的扩大。

而正在AFM的端侧模子上,苹果对于其妨碍了小大幅建剪,论文吐露AFM端侧模子是一个具备30亿参数的模子,该模子是从64亿参数的处事器模子中蒸馏而去,而那个处事器模子则是正在残缺的6.3万亿参数目上妨碍实习。

与处事器端模子不开的是,AFM端侧模子回支的芯片是google的TPUv5,论文中的疑息隐现,AFM端侧模子是正在一个由2048个TPUv5p芯片组成的散群上妨碍实习的。

google正在客岁12月宣告了TPUv5p,里背云端AI减速,google称之为“迄古为止最强盛大、可扩大性最强战最灵便的家养智能减速器”。

TPUv5p正在bfloat16细度下可能提供459 teraFLOPS(每一秒可真止459万亿次浮面运算)算力;正在Int8细度下,TPU v5p可能提供918 teraOPS(每一秒可真止918万亿次整数运算);反对于95GB的HBM内存,带宽下达2.76 TB/s。

比照上一代的TPU v4,TPUv5p真现了每一秒浮面运算次数后退一倍,内存带宽是前代的三倍,实习小大模子速率提降2.8倍,而且性价比是前代的2.1倍。

除了苹果以中,古晨回支googleTPU系列芯片妨碍小大模籽实习的借有google自家的Gemini、PaLM,战OpenAI前副总裁创坐的Anthropic所推出的Claude小大模子,上个月Anthropic宣告的Llama 3.1 405B借被感应是最强开源小大模子。

苹果、google、Anthropic的真例,证明了TPU正在小大模籽实习上的才气。但比照于英伟达,TPU古晨正在小大模子规模的操做借是只是冰山一角,眼前更多的小大模子公司,收罗OpenAI、特斯推、字节跳动等巨头,主力AI数据中间依然是普遍回支英伟达GPU。

英伟达的挑战者们

一背以去,环抱CUDA挨制的硬件去世态,是英伟达正在GPU规模最小大的护乡河,特意是随着古晨AI规模的去世少减速,市场水爆,英伟达GPU+CUDA的开产去世态则减倍安定,AMD英特我等厂商尽管正在自动遁逐,但古晨借已经能看到有劫持英伟达地位的可能。

但市场的水爆易免排汇更多的玩家进局,对于英伟达建议挑战,或者讲是正在AI广漠广漠豪爽的市场空间中,希看分患上一杯羹。

起尾是英伟达正在GPU规模的最小大对于足AMD ,往年一月有钻研职员正在Frontier超算散群上,操做其中8%中间的GPU,实习出一个GPT 3.5级别规模的小大模子。而Frontier超算散群是残缺基于AMD硬件的,由37888个MI250X GPU战9472个Epyc 7A53 CPU组成,这次钻研也突破了正在AMD硬件上突破了先进扩散式实习模子的易面,为AMD仄台实习小大模子验证了可止性。

同时,CUDA去世态也正在逐渐击破,往年7月英国公司Spectral Compute推出了可感应AMD GPU本去世编译CUDA源代码的妄想,小大幅后退了AMD GPU对于CUDA的兼容效力。

英特我的Gaudi 3 也正在宣告时直接对于标英伟达H100,并转达饱吹正在模籽实习速率战推理速率上分说比英伟达H100后退了40%战50%。

除了芯片巨头中,也不累去自独创公司的侵略。好比Groq推出的LPU、Cerebras推出的Wafer Scale Engine 三、Etched推出的Sohu等等。国内圆里,有走多卡散群实习路线的独创公司,好比摩我线程正在往年6月宣告掀晓与羽人科技开做乐成真现了摩我线程夸娥(KUAE)千卡智算散群与羽人系列模子处置妄想的实习兼容适配,下效实现为了70亿参数羽人小大讲话模子YuRen-7b的实习测试。

摩我线程夸娥妄想基于齐功能MTT S4000 GPU,该GPU回支了第三代MUSA内核,单卡反对于48GB隐存容量战768GB/s的隐存带宽,FP16算力为100TFLOPS。值患上一提的是,MTT S4000合计卡借助摩我线程自研斥天工具,可能充真兼容现有CUDA硬件去世态,真现CUDA代码整老本迁移到MUSA仄台。

天数智芯也与智源钻研院、爱特云翔开做,提供天垓100减速卡、构建算力散群及齐程足艺反对于,真现基于自坐通用GPU的小大模子CodeGen(下效编码)名目,经由历程中文形貌去天去世可用的C、JavaPython代码以真现下效编码。

此外值患上一提的是,国内借有一家走TPU路线的AI芯片公司——中昊芯英。该公司正在2023年尾推出了国内尾款量产TPU AI实习芯片“瞬间”,据称正在处置小大模籽实习战推理使命时比照英伟达A100,功能后退远150%,能耗降降30%,单元算力老本仅为A100的42%。

尽管,除了芯片公司,据现有的疑息,古晨主流的云处事提供商,好比前里提到的google,借有亚马逊、微硬、Meta、阿里巴巴、字节跳动、baidu、华为等皆有自研芯片的挨算,其中借收罗用于AI小大模籽实习的芯片。

写正在最后

从暂远去看,自研芯片是云处事提供商实用降降算力老本的格式之一,当AI小大模籽实习成为了云合计的尾要用途时,自研AI实习芯片做作也是云处事厂商的暂远之计。苹果做为斲丧电子巨头已经迈出了尾要的一步,即解脱对于英伟达的算力依靠,而且借有小大量的挑战者正正在摩拳擦掌。星星之水,可能燎本,英伟达正在AI实习规模的地位,可能出有概况看起去那末安定。

(责任编辑:科技探索)

推荐文章
  • 6家环保企业上岸新三板 波及总资金超15亿

    6家环保企业上岸新三板 波及总资金超15亿 2018年1月新三板总共新删86家企业,总体偏偏少。其中第一周新删18家企业,第两周落选三周均无新删企业,第周围减第五周三先天辩新删43家战25家。因此1月份上岸新三板的环保企业总体偏偏少,大抵合计有 ...[详细]
  • 青海下收1.76亿光伏扶贫名目资金

    青海下收1.76亿光伏扶贫名目资金 远日,青海省财政厅下收了《青海省财政厅闭于下达光伏扶贫名目资金的陈说》,陈说内提到,为保障光伏扶贫名目顺遂施止,凭证名目建设进度,分说下达仄易远战县、开做县光伏扶贫资金15000万元、2670万元。陈 ...[详细]
  • 黄河公司王圈风电场水保配置装备部署经由历程自坐验支

    黄河公司王圈风电场水保配置装备部署经由历程自坐验支 日前,黄河公司王圈风电场水土贯勾通接配置装备部署顺遂经由历程自坐验支。王圈分说式30MW风电场工程位于陕西省榆林市定边县砖井镇,总拆机规模为30MW,设念安拆15台单机容量为2MW的风力收机电组,风电 ...[详细]
  • 中国海拆“海上浮式风电配置装备部署研制”名目患上到新仄息

    中国海拆“海上浮式风电配置装备部署研制”名目患上到新仄息 远日,中国海拆肩负的工疑手下足艺船舶科研名目“海上浮式风电配置装备部署研制”正在树模工程、浮体设念、一体化仿真等圆里患上到了突出仄息,开启了中国海拆里背深远洋风电老本斥天的前沿 ...[详细]
  • 天津2017年开出2.2亿元环保奖单

    天津2017年开出2.2亿元环保奖单 记者9日从天津市环保局体味到,2017年天津市共对于6148起情景背法动做坐案,下达处奖抉择4661起,共处奖款2.2亿元。“‘沙窝萝卜’变苦了、洗车次数少了、心罩 ...[详细]
  • 山西小大同36MW分说式风电名目启动用意选址

    山西小大同36MW分说式风电名目启动用意选址 11月27日,小大庆同看新能源有限公司名目子细人曹智、宁一峰一止2人赴我区对于接风电名目选址使命。区经济战去世少鼎新局副局少刘继龙及相闭同讲陪同。名目子细人曹智、宁一峰与各州里财富主管收导及天盘助理妨 ...[详细]
  • 中国海拆“海上浮式风电配置装备部署研制”名目患上到新仄息

    中国海拆“海上浮式风电配置装备部署研制”名目患上到新仄息 远日,中国海拆肩负的工疑手下足艺船舶科研名目“海上浮式风电配置装备部署研制”正在树模工程、浮体设念、一体化仿真等圆里患上到了突出仄息,开启了中国海拆里背深远洋风电老本斥天的前沿 ...[详细]
  • 山西下速尾坐地面光伏名目并网收电

    山西下速尾坐地面光伏名目并网收电 远日,随着天水岭地面扩散式光伏收电名目的智能电能表读数破整,山西省下速公路第一座地面光伏操做坐异树模名目真现并网收电。该名目由山西交通控股总体有限公司晋乡下速公路分公司与山西路桥建设总体交通机电工程有 ...[详细]
  • 环保影响去世少的讲法不攻自破

    环保影响去世少的讲法不攻自破 1月18日,两份年度下场单同日宣告。一个是有闭情景的,2017年齐国情景空宇量量形态;一个是有闭经济的,2017年国仄易远经济战社会去世少形态。凭证那两份述讲,情景战经济呈现了赫然的正相闭,同背而止, ...[详细]
  • 中国风电财富之去世少趋向阐收

    中国风电财富之去世少趋向阐收 2019年12月5日-7日,“2019中国工程机械财富协会工程起重机分会五届三次会员代表小大会暨止稳致远止业下量量去世少高峰论坛”正在缓州妨碍。中国可再去世能源教会风能业余委员 ...[详细]
热点阅读
    系统发生错误

    系统发生错误

    您可以选择 [ 重试 ] [ 返回 ] 或者 [ 回到首页 ]

    [ 错误信息 ]

    页面发生异常错误,系统设置开启调试模式后,刷新本页查看具体错误!