最新可播放男同志69gay,最近高清中文字幕免费mv视频7

首個(gè)“開(kāi)源 ChatGPT ”來(lái)了：基于谷歌 5400 億參數(shù)大模型，網(wǎng)友吐槽：這誰(shuí)能跑

發(fā)布時(shí)間：2022-12-30 12:12:16 文章來(lái)源：IT之家

當(dāng)前位置：主頁(yè) > 資訊 > 國(guó)內(nèi) > 正文

就說(shuō)程序員的手速有多快吧，首個(gè)開(kāi)源 ChatGPT 項(xiàng)目已經(jīng)出現(xiàn)了！

(相關(guān)資料圖)

基于谷歌語(yǔ)言大模型 PaLM 架構(gòu)，以及使用從人類反饋中強(qiáng)化學(xué)習(xí)的方法（RLHF），華人小哥Phillip Wang復(fù)刻了一個(gè) ChatGPT 出來(lái)。

項(xiàng)目 GitHub 星已經(jīng)超過(guò) 1.7k 了，而且還在一路飆升 ing。

不過(guò)一反常態(tài)的是，網(wǎng)友們看到“開(kāi)源 ChatGPT”卻沒(méi)有火速開(kāi)沖，反倒齊刷刷在發(fā)問(wèn)：

這…… 有人能 run？

開(kāi)源了但沒(méi)完全開(kāi)？

項(xiàng)目的核心內(nèi)容，是在 PaLM 架構(gòu)上實(shí)現(xiàn)基于人類反饋的強(qiáng)化學(xué)習(xí)。

其中，PaLM（Pathways Language Model）是谷歌在今年 4 月發(fā)布的5400 億參數(shù)全能大模型，基于 Pathways 系統(tǒng)訓(xùn)練，BERT 之父 Jacob Devlin 為主要貢獻(xiàn)者之一。

PaLM 可以完成寫代碼、聊天、語(yǔ)言理解等任務(wù)，并且在大多數(shù)任務(wù)上實(shí)現(xiàn)了 SOTA 少樣本學(xué)習(xí)性能。

另一個(gè)核心點(diǎn)是 RLHF“從人類反饋中強(qiáng)化學(xué)習(xí)”。

OpenAI 提出 InstructGPT 時(shí)就用到了這一方法，它能讓 AI 的回答更加符合情景要求，降低“有害性”。

具體分三步：

第一步，找一些人寫下示范答案，來(lái)微調(diào) GPT-3 模型，訓(xùn)練監(jiān)督模型 baseline。

第二步，收集某個(gè)問(wèn)題的幾組不同輸出數(shù)據(jù)，由人類對(duì)幾組答案進(jìn)行排序，在此數(shù)據(jù)集上訓(xùn)練獎(jiǎng)勵(lì)模型。

第三步，使用 RM 作為獎(jiǎng)勵(lì)函數(shù)，近端策略優(yōu)化（PPO）算法微調(diào) GPT-3 策略，以強(qiáng)化學(xué)習(xí)方法最大化獎(jiǎng)勵(lì)。

ChatGPT使用的 GPT-3.5，其中 text-davinci-002 就是在 code-davinci-002 的基礎(chǔ)上，采用了 InstructGPT 訓(xùn)練方法改進(jìn)得到。

正是基于如上兩方面核心內(nèi)容，作者實(shí)現(xiàn)了 ChatGPT 的復(fù)刻。

大致步驟有 3 步：

首先來(lái)訓(xùn)練一下 PaLM，就和其他自回歸 Transformer 一樣。

第二……

等等，訓(xùn)練 PaLM？？？這確定不是在開(kāi)玩笑？

現(xiàn)在明白為啥大家都覺(jué)得這個(gè)開(kāi)源項(xiàng)目完全不能 run 了……

打個(gè)不恰當(dāng)?shù)谋确?，這就像如果想吃熊肉，那先自己去打頭熊來(lái)。

項(xiàng)目中只有 PaLM 架構(gòu)和代碼，沒(méi)有預(yù)先訓(xùn)練好的權(quán)重。

所以完成第一步，大概效果就是……

話雖如此，但還是繼續(xù)接著往下看看……

第二步，就要訓(xùn)練基于 RLHF 的獎(jiǎng)勵(lì)模型了。作者使用的是一種輕量級(jí)訓(xùn)練大語(yǔ)言模型方法 LoRA，這種方法是開(kāi)源的。

然后，再把之前訓(xùn)練好的模型和獎(jiǎng)勵(lì)模型用強(qiáng)化學(xué)習(xí)進(jìn)行微調(diào)。

經(jīng)過(guò)這三步后，就能得到一個(gè)開(kāi)源版的 ChatGPT 了。

這中間面臨的問(wèn)題包括巨大的計(jì)算量、超大模型和難收集的文本…… 所以有人也不免發(fā)問(wèn)：

有沒(méi)有一種可能，它也沒(méi)啥用？

不過(guò)有網(wǎng)友覺(jué)得這本質(zhì)上還是一件好事啦。

AI 的一個(gè)關(guān)鍵區(qū)別就是，每有一個(gè)重大突破，很快就會(huì)出現(xiàn)一個(gè)開(kāi)源版本。

實(shí)際上，開(kāi)源項(xiàng)目作者小哥 Philip Wang 一直都熱衷于復(fù)刻各種明星項(xiàng)目，過(guò)去還嘗試過(guò) Dall E 2、AlphaFold 2 等。

以及 LAION 也發(fā)起了一個(gè)類似項(xiàng)目Open Assistant，他們將通過(guò)“眾籌腦力”的方式，共同開(kāi)發(fā)一個(gè)開(kāi)源的聊天 AI。

Stable Diffusion 用的開(kāi)放數(shù)據(jù)集，就是這一組織做的。

標(biāo)簽：強(qiáng)化學(xué)習(xí) 進(jìn)行微調(diào) 語(yǔ)言模型

首個(gè)“開(kāi)源 ChatGPT ”來(lái)了：基于谷歌 52022-12-30

【獨(dú)家】特斯拉新車型亮相廣州車展，預(yù)計(jì)202022-12-30

剛剛，教育部發(fā)布通知2022-12-30

今亮點(diǎn)！Mysteel調(diào)研：虎年辭去，兔年來(lái)臨2022-12-30

【環(huán)球快播報(bào)】包裹每天超1億件，小快遞如2022-12-30

果然是喜劇界扛把子！馬東這條新春視頻太太2022-12-30

每日消息!年線收官，黃金今天能刷新新高嗎2022-12-30

全球消息！許凡金銀油12.30視頻簡(jiǎn)要總結(jié)2022-12-30

淘氣天尊：午后能不能沖上3100點(diǎn)圓滿收官？2022-12-30

通訊！全國(guó)哪里的小吃最好吃？2022-12-30

黑椰棗和黃椰棗有什么區(qū)別？2022-12-30

天天亮點(diǎn)！12月30日擒牛姐盤中提示2022-12-30

世界今亮點(diǎn)！綠殼雞蛋與普通雞蛋的區(qū)別2022-12-30

當(dāng)前通訊！上五花肉和下五花肉區(qū)別2022-12-30

世界聚焦：跨界者華民股份喜獲1512噸硅棒、2022-12-30

河南2022年11月份太陽(yáng)能12.21億千瓦時(shí),同比2022-12-30

【環(huán)球時(shí)快訊】2022年11月全國(guó)新能源并網(wǎng)消2022-12-30

世界最資訊丨supreme中文名叫什么？是什么2022-12-30

焦點(diǎn)消息！男人都是大豬蹄子是什么意思？大2022-12-30

焦點(diǎn)快播：端硯是什么產(chǎn)品？出產(chǎn)于哪個(gè)省市2022-12-30

當(dāng)前報(bào)道:電影找到你講述了什么故事？結(jié)局2022-12-30

彥佑君出自哪部電視?。渴鞘裁瓷矸?？2022-12-30

世界視點(diǎn)！狗十三中李玩養(yǎng)的寵物犬是什么品2022-12-30

【播資訊】莫若菲是誰(shuí)扮演的？本人是男孩子2022-12-30

世界熱門:易什么什么處是什么成語(yǔ)？成語(yǔ)出2022-12-30

有關(guān)什么人什么什么的成語(yǔ)有哪些？2022-12-30

環(huán)球視點(diǎn)！山河破碎風(fēng)飄絮出自哪首詩(shī)？下一2022-12-30

【報(bào)資訊】花蛇是指什么？花蛇是貶義詞嗎？2022-12-30

企鵝一般生活在哪里？企鵝以什么為食？2022-12-30

每日熱議!荷蘭弟原名是什么？是哪國(guó)人？2022-12-30

聚焦

經(jīng)濟(jì)

世界新資訊：1—11月，合肥蜀山區(qū)經(jīng)濟(jì)發(fā)展持續(xù)穩(wěn)定向好

視訊！國(guó)道321（納西段）改建項(xiàng)目進(jìn)入重點(diǎn)控制性工程施工

安徽懷遠(yuǎn)打造數(shù)字農(nóng)業(yè)種菜“高大上”

焦點(diǎn)觀察：駐村第一書(shū)記的“詩(shī)和遠(yuǎn)方”

笛聲響處筑夢(mèng)圓

科技創(chuàng)新推動(dòng)綠色發(fā)展

999精品,丝袜综合,大陆老熟妇性,中国老女人AV,亚洲精品国产第一区二区三区

最近更新