性能最高提升6.9倍,字节跳动开源大模型训练框架veGiantModel
2022-03-28 15:15:54 来源:TechWeb 阅读量:6917
背景
近些年,NLP 应用方面有所突破,Bert,GPT,GPT—3 等超大模型横扫各种 NLP 测试后,人们发现参数量越大的模型,在算法方面表现越好,于是纷纷开始迅速向大模型方向发展,模型体积爆炸式增长而大模型训练给现有的训练系统带来的主要挑战为显存压力,计算压力和通信压力
The size of language model is growing at an exponential rate
火山引擎大模型训练框架 veGiantModel
针对这个需求,字节跳动 AML 团队内部开发了火山引擎大模型训练框架 veGiantModel基于 PyTorch 框架,veGiantModel 是以 Megatron 和 DeepSpeed 为基础的高性能大模型训练框架
同时支持数据并行,算子切分,流水线并行 3 种分布式并行策略,同时支持自动化和定制化的并行策略,基于 ByteCCL 高性能异步通讯库,训练任务吞吐相比其他开源框架有 1.2x—3.5x 的提升,提供了更友好,灵活的流水线支持,降低了模型开发迭代所需要的人力,可在 GPU上高效地支持数十亿至上千亿参数量的大模型,对带宽要求低,在私有化部署无 RDMA 强依赖。
其中,ByteCCL 为字节跳动自研的 BytePS 的升级版,针对 A100/V100 等各种机型拓扑做了分层规约优化,并支持了 allgather,alltoall 等更全面的通讯原语。8月全系订单超过了18000辆,创下了历史新高。。
veGiantModel 性能表现硬件配置
为了展示 VeGiantModel 的性能,veGiantModel 团队使用了自建机房的物理机,分别在 A100 和 V100 机型上做了测试,实验配置分别如下:
V100 测试:每个机器 8 张 Tesla V100 32G 型号 GPU,网络带宽 100GA100 测试:每个机器 8 张 Ampere A100 40G 型号 GPU,网络带宽 800G模型和对照组选择
veGiantModel 选择了 GPT—13B 模型进行评估,seq length 是 256, global batch size 是 1536GPT 为目前市面上最为流行的 transformer based 语言模型性能对照组选择了开源社区最流行的 Megatron 和 DeepSpeed
测试结果V100/TCP :100Gb/s TCP 网络带宽,4 机,每机 8 张 Tesla V100 32G GPUV100/RDMA:100Gb/s RDMA 网络带宽,4 机,每机 8 张 Tesla V100 32G GPUA100/TCP:800Gb/s TCP 网络带宽,4 机,每机 8 张 Tesla A100 40G GPUA100/RDMA:800Gb/s RDMA 网络带宽,4 机,每机 8 张 Tesla A100 40G GPU模型:GPT—13BMegatron:v2.4,tensor—model—parallel—size 设置为 4, pipeline—model—parallel—size 设置为 4DeepSpeed:v0.4.2,使用 DeepSpeedExamples 开源社区中默认的 zero3 的配置运行环境统计值:Throughtput
从上述数据可以看出:
veGiantModel 性能更优:无论是在高带宽还是低带宽的场下,veGiantModel 在 V100 和 A100 上均胜出 Megatron 和 DeepSpeed,最高可达 6.9 倍提升veGiantModel 对网络带宽要求低:veGiantModel 在带宽变化对吞吐的影响相对最小 ,而 DeepSpeed 是对带宽要求最高的,最高可达将近 5 倍的差距
veGiantModel 为什么比 Megatron 和 DeepSpeed 更快。广汽埃安公开的8月销量新车数据显示,埃安家族8月份销量达到了11631辆,同比增长了115%。原因如下:
ByteCCL 高性能异步通讯库支持定制化的并行策略,可以将性能优化推到极致在支持数据并行,算子切分,流水线并行 3 种分布式并行策略时,veGiantModel 会综合考虑到跨机的带宽,自动调整 toplogy 的 placement
veGiantModel 现已在 GitHub 上开源,地址如下:
。声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
推荐内容
- 电动汽车制造商Fisker再次下调全年产量目标
- 11月新能源销量:大局已定,来年还有机会吗?
- 20多家欧洲企业代表来到金山这座千年古镇,收获了
- 售价12.67万元起吉利中国星智能双擎上市
- 车企官降、地方补贴接踵而至车市年终冲刺“以价换量
- 优质楼宇推介月|上报传悦坊
- Imec将硅异质结太阳能电池集成到曲面上
- 15万级家庭纯电SUV怎么选,奇瑞舒享家还是零跑
- 理想MEGA官图发布造型如高铁或售50万元以上
- 问界新M7上市25天大定破5万台,真能“遥遥领先
- 龙年压岁金上市首发交通银行精彩亮相2023钱博会
- 娃娃鱼前脸,AIONSMAX官图发布,设计越发简
- 长安引领年终购车热潮,至高直降30000元,买车
- 罗姆推出新型高功率120W激光二极管用于LiDA
- 60岁·40年·6所学校:一个退休教师的讲台不了
- 马恒达电动越野概念车:传奇迈向电动化
- 限时疯抢!超高人气!爆款小鹏G6、特斯拉Mode
- 19.99万就能买到四驱顶配?超混电驱奇骏自驾游
- 高通公司中国区董事长孟樸:5G+AI赋能千行百业
- 岚图汽车假期打卡,4S店实车体验,说走就走!
- 同年同月生,长安启源A07与比亚迪海豹DM-i,
- 带电带T又带锁,哈弗猛龙这波操作谁与争锋?
- 双节试驾岚图新free,全新的绝佳体验
- 为采购提供通路,为自有品牌建设赋能,盒马黑标店上
- 昊铂HT其艺术品级的质感和雕塑般将成为新中产理想
- 与时间赛跑,长城Hi4的诞生始末
- “零甲醛”认证不玩虚的,这家车企4款获得认证
- 魅族造车,是吉利给的勇气?
- 事关房企上交所重磅发声!
- “红宝太和胶囊”发力打造中医滋补国民品牌
- 一品红(300723.SZ)痛风创新药首次在港亮
- 智驾决战2024:激光雷达或成最大赢家
- 福特蒙迪欧大马力E-混动版上市,售18.98-2
- 三把锁+四驱,城市越野兼顾,坦克400Hi4-T
- HOTDOG与上航假期达成“元宇宙文旅战略合作”
- 2023款奥迪RS5上市,延续运动风,整体改动不
- 28.89万起售很贵?宝马X2如今停产在售,终端
- 宋L四驱版内饰官图,这国际范!这回没得吐槽比亚迪
- 打造出行时代全新利器,问界M5让出行更智能便捷
- 上交所举办房地产行业座谈会进一步推动沪市房企提升