色视频www在线播放国产成人 _亚洲第一激情av_在线播放豆国产99亚洲_国产亚洲精品福利_午夜伦全在线观看_这里只有精品丝袜_欧美少妇精品_欧美成人午夜电影_成人在线免费观看黄色_欧美日韩亚洲综合一区二区三区_欧美高清xxxxxkkkkk_久久精品国产99久久6

昆侖萬維開源2千億稀疏大模型天工MoE,全球首創(chuàng)能用4090推理

速途網(wǎng)6月3日消息(報道:李楠)今日,昆侖萬維宣布開源 2 千億稀疏大模型 Skywork-MoE , 性能強勁, 同時推理成本更低。Skywork-MoE 基于之前昆侖萬維開源的 Skywork-13B 模型中間 checkpoint 擴展而來,是首個完整將 MoE Upcycling 技術應用并落地的開源千億 MoE大模型,也是首個支持用單臺 4090 服務器推理的開源千億 MoE大模型。

開源地址:

Skywork-MoE 的模型權重、技術報告完全開源,免費商用,無需申請:

? 模型權重下載:

https://huggingface.co/Skywork/Skywork-MoE-base

https://huggingface.co/Skywork/Skywork-MoE-Base-FP8

? 模型開源倉庫:https://github.com/SkyworkAI/Skywork-MoE

? 模型技術報告:https://github.com/SkyworkAI/Skywork-MoE/blob/main/skywork-moe-tech-report.pdf

? 模型推理代碼:(支持 8×4090 服務器上 8 bit 量化加載推理) https://github.com/SkyworkAI/vllm

模型架構:

本次開源的 Skywork-MoE 模型隸屬于天工 3.0 的研發(fā)模型系列,是其中的中檔大小模型(Skywork-MoE-Medium),模型的總參數(shù)量為 146B,激活參數(shù)量 22B,共有 16 個 Expert,每個 Expert 大小為 13B,每次激活其中的 2 個 Expert。

天工 3.0 還訓練了 75B (Skywork-MoE-Small) 和 400B (Skywork-MoE-Large)兩檔 MoE 模型,并不在此次開源之列。

模型能力:

我們基于目前各大主流模型評測榜單評測了 Skywork-MoE,在相同的激活參數(shù)量 20B(推理計算量)下,Skywork-MoE 能力在行業(yè)前列,接近 70B 的 Dense 模型。使得模型的推理成本有近 3 倍的下降。同時 Skywork-MoE 的總參數(shù)大小比 DeepSeekV2 的總參數(shù)大小要小 1/3,用更小的參數(shù)規(guī)模做到了相近的能力。

技術創(chuàng)新:

為了解決 MoE 模型訓練困難,泛化性能差的問題,相較于 Mixtral-MoE, Skywork-MoE 設計了兩種訓練優(yōu)化算法:

1. Gating Logits 歸一化操作

我們在 Gating Layer 的 token 分發(fā)邏輯處新增了一個 normalization 操作,使得 Gating Layer 的參數(shù)學習更加趨向于被選中的 top-2 experts,增加 MoE 模型對于 top-2 的置信度:

2. 自適應的 Aux Loss

有別于傳統(tǒng)的固定系數(shù)(固定超參)的 aux loss, 我們在 MoE 訓練的不同階段讓模型自適應的選擇合適的 aux loss 超參系數(shù),從而讓 Drop Token Rate 保持在合適的區(qū)間內,既能做到 expert 分發(fā)的平衡,又能讓 expert 學習具備差異化,從而提升模型整體的性能和泛化水平。在 MoE 訓練的前期,由于參數(shù)學習不到位,導致 Drop Token Rate 太高(token 分布差異太大),此時需要較大的 aux loss 幫助 token load balance;在 MoE 訓練的后期,我們希望 Expert 之間仍保證一定的區(qū)分度,避免 Gating 傾向為隨機分發(fā) Token,因此需要較低的 aux loss 降低糾偏。

訓練 Infra

如何對 MoE 模型高效的進行大規(guī)模分布式訓練是一個有難度的挑戰(zhàn),目前社區(qū)還沒有一個最佳實踐。Skywork-MoE 提出了兩個重要的并行優(yōu)化設計,從而在千卡集群上實現(xiàn)了 MFU 38% 的訓練吞吐,其中 MFU 以 22B 的激活參數(shù)計算理論計算量。

1. Expert Data Parallel

區(qū)別于 Megatron-LM 社區(qū)已有的 EP(Expert Parallel)和 ETP(Expert Tensor Parallel)設計,我們提出了一種稱之為 Expert Data Parallel 的并行設計方案,這種并行方案可以在 Expert 數(shù)量較小時仍能高效的切分模型,對 Expert 引入的 all2all 通信也可以最大程度的優(yōu)化和掩蓋。相較于 EP 對 GPU 數(shù)量的限制和 ETP 在千卡集群上的低效, EDP 可以較好的解決大規(guī)模分布式訓練 MoE 的并行痛點,同時 EDP 的設計簡單、魯棒、易擴展,可以較快的實現(xiàn)和驗證。

一個最簡單的 EDP 的例子,兩卡情況下 TP = 2, EP = 2, 其中 Attention 部分采用 Tensor Parallel , Expert 部分采用 Expert Parallel

2. 非均勻切分流水并行

由于 first stage 的 Embedding 計算和 last stage 的 Loss 計算,以及 Pipeline Buffer 的存在, 流水并行下均勻切分 Layer 時的各 stage 計算負載和顯存負載均有較明顯的不均衡情況。我們提出了非均勻的流水并行切分和重計算 Layer 分配方式,使得總體的計算/顯存負載更均衡,約有 10% 左右的端到端訓練吞吐提升。

比較均勻切分和非均勻切分下的流水并行氣泡:對于一個 24 層 Layer 的 LLM, (a) 是均勻切分成 4 個 stage,每個 stage  的 layer 數(shù)量是:[6, 6, 6, 6].(b) 是經(jīng)過優(yōu)化后的非均勻切分方式,切成 5 個 stage, 每個 stage 的 layer 數(shù)量是:[5, 5, 5, 5, 4] , 在中間流水打滿的階段,非均勻切分的氣泡更低。

MoE Know-how

此外,Skywork-MoE 還通過一系列基于 Scaling Laws 的實驗,探究哪些約束會影響 Upcycling 和 From Scratch 訓練 MoE 模型的好壞。

一個可以遵循的經(jīng)驗規(guī)則是:如果訓練 MoE 模型的 FLOPs 是訓練 Dense 模型的 2 倍以上,那么選擇 from Scratch 訓練 MoE 會更好,否則的話,選擇 Upcycling 訓練 MoE 可以明顯減少訓練成本。

4090 推理

Skywork-MoE 是目前能在 8×4090 服務器上推理的最大的開源 MoE 模型。8×4090 服務器一共有 192GB 的 GPU 顯存,在 FP8 量化下(weight 占用 146GB),使用我們首創(chuàng)的非均勻 Tensor Parallel 并行推理方式,Skywork-MoE 可以在合適的 batch size 內達到 2200 tokens/s 的吞吐。天工團隊完整開源了相關的推理框架代碼和安裝環(huán)境,詳情參見:https://github.com/SkyworkAI/Skywork-MoE

結語

我們希望本次開源的 Skywork-MoE 模型、技術報告和相關的實驗結果可以給開源社區(qū)貢獻更多的 MoE 訓練經(jīng)驗和 Know-how,包括模型結構、超參選擇、訓練技巧、訓練推理加速等各方面, 探索用更低的訓練推理成本訓更大更強的模型,在通往 AGI 的道路上貢獻一點力量。

(0)
上一篇 2024年6月3日 19:27
下一篇 2024年6月4日 06:46
久久精品国产久精国产| 五月天欧美精品| 97人人做人人人难人人做| 999福利在线视频| 亚洲丝袜精品丝袜在线| 国产精品推荐精品| 伊人久久综合影院| 夜夜爽av福利精品导航| 国产一区香蕉久久| 成人看的视频| 午夜精品蜜臀一区二区三区免费| 国产福利视频在线观看| 国产精品亚洲午夜一区二区三区| 97精品国产aⅴ7777| 99国产精品免费网站| 欧美精品在线观看91| 日韩国产91| 国产亚洲精品激情久久| 亚洲欧洲高清| 日韩av网址在线| 久久夜夜久久| 亚州av乱码久久精品蜜桃| 欧美激情久久久久| 欧美亚洲综合视频| 中文字幕少妇一区二区三区| 国精产品一区一区三区四川| 精品黑人一区二区三区久久| 一级二级三级欧美| 尤物视频一区二区| 91九色视频在线| 一区二区在线免费播放| 亚洲美女福利视频网站| 污视频网站在线免费| 欧美色精品在线视频| 成人短视频app| 亚洲片国产一区一级在线观看| 女同另类激情重口| 国产精品播放| 成人va在线观看| 成人性生交大片免费看视频r| 精品国产91乱高清在线观看| 国模精品一区二区| 日韩一区二区av| 51漫画成人app入口| 午夜剧场成人观在线视频免费观看| 国产精品白浆| 国产精品日韩欧美一区二区| 亚洲情侣在线| 国产精品丝袜视频| 国产欧美日韩视频在线观看| 黄网站在线免费看| 性亚洲最疯狂xxxx高清| 香蕉成人久久| 美臀av在线| 欧美v日韩v国产v| 久久电影网站中文字幕| 天堂av在线电影| 99久久久久国产精品免费| 国产精品原创巨作av| 一级毛片国产| 色爱区综合激月婷婷| 成人区精品一区二区不卡| 岛国大片在线播放| 日韩激情视频在线| 欧美丰满日韩| 国际av在线| 欧美美女18p| 婷婷精品进入| 交换国产精品视频一区| 97影院在线午夜| 亚洲最新在线观看| 中文字幕av一区二区三区四区| 女同一区二区| 亚洲欧美成aⅴ人在线观看| 国产高潮在线| 国产精品女主播视频| 在线不卡一区二区| 黑丝一区二区| 1区2区3区在线| 91xxx视频| 亚洲色图av在线| 国产欧美激情| 天堂男人av| 国产视频精品自拍| 麻豆久久一区二区| 骚视频在线观看| 在线日韩日本国产亚洲| 欧美探花视频资源| 久久一区二区三区四区| 日韩三区视频| 五丁香在线视频| 成人网中文字幕| 国产精品午夜在线| 国产精品扒开腿做爽爽爽视频软件| 日本精品专区| 一区二区三区欧美在线| 日韩中文字幕在线精品| 欧美韩日一区二区三区四区| 精品入口麻豆88视频| 精品国产百合女同互慰| 欧美体内she精视频在线观看| 白白色视频在线| 色噜噜狠狠狠综合曰曰曰| 欧美性20hd另类| 久久99久久久欧美国产| 中文久久电影小说| 黄色一级一级片| 视频直播国产精品| 色噜噜狠狠一区二区三区果冻| 成人做爰69片免费看网站| 精品视频在线观看免费观看 | 91精品国产91综合久久蜜臀| 亚洲免费影院| 婷婷午夜社区一区| 日韩在线免费播放| 国产精品一久久香蕉国产线看观看 | 欧美一卡二卡三卡| 久久久久久亚洲综合| 国产亚洲精品美女久久久久久久久久| 污视频网站在线| 国产av人人夜夜澡人人爽麻豆| 97在线日本国产| 亚洲大胆美女视频| 亚洲嫩草精品久久| 国产寡妇亲子伦一区二区| 99久久久久| a级日韩大片| 麻豆福利在线观看| 一级毛片免费观看| 国产三级国产精品国产专区50| 亚洲人成网站在线观看播放 | 成人影院www在线观看| 黄色三级电影网| 日韩欧美在线免费观看视频| 日韩一二区视频| 久久综合给合久久狠狠色| 操一操视频一区| 欧美在线观看一区二区三区| 97在线看福利| 欧美男插女视频| 插插插亚洲综合网| 欧美在线影院在线视频| 欧洲中文字幕国产精品| 国内精品中文字幕| 91精品视频在线看| 日本在线一区| 免费午夜视频在线观看| 黄色一级大片在线观看| 三年片观看免费观看大全视频下载| 午夜黄色一级片| 欧美a在线视频| 97中文在线| 成人资源视频网站免费| 好看的日韩精品| 日本一区高清在线视频| 在线播放豆国产99亚洲| 国产一级黄色录像片| 牛夜精品久久久久久久| 国产午夜视频| 久久久pmvav| avtt在线播放| 欧美一级免费| 欧美人与拘性视交免费看| 亚洲成av人电影| 国产精品白丝av| 亚洲三级电影网站| 制服丝袜国产精品| 在线一区二区日韩| 国产日韩欧美在线| 午夜久久久久久久久久久| 国产字幕中文| heyzo高清国产精品| 国产精品毛片久久| 成人a区在线观看| 日韩欧美你懂的| 国产在线播放不卡| 在线观看免费播放网址成人| 成人开心激情| 精品一区二区三区的国产在线播放| 国产三级精品在线| 亚洲国产成人一区| 国产欧美日韩一区| 污黄视频在线看| 视频在线观看免费影院欧美meiju| 奇米一区二区三区| 欧美美女直播网站| 国产chinese精品一区二区| 女生裸体视频网站免费观看| 亚洲国产精品免费视频| 国产成人免费高清| 少妇高潮 亚洲精品| 成人黄色片免费| 日本蜜桃在线观看视频| 毛片不卡一区二区| 亚洲欧美日韩第一区| 996这里只有精品| 日韩三级不卡| 日韩欧美久久久| 91成人免费观看网站| 成人福利在线观看|