StableVicuna
StableVicuna 是由 Stable Diffusion 背后的 StabilityAI 推出的第一個通過基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)訓(xùn)練的大規(guī)模開源聊天機(jī)器人。StableVicuna是Vicuna v0 13b的進(jìn)一步指令微調(diào)和RLHF訓(xùn)練版本,它是一個指令微調(diào)的 LLaMA 130億模型。
網(wǎng)址預(yù)覽
數(shù)據(jù)評估
關(guān)于 StableVicuna 特別聲明
本站 稀飯網(wǎng)址提供的 StableVicuna都來源于網(wǎng)絡(luò),不保證外部鏈接的準(zhǔn)確性和完整性,同時,對于該外部鏈接的指向,不由 稀飯網(wǎng)址實(shí)際控制,在 2023年5月8日 上午1:07收錄時,該網(wǎng)頁上的內(nèi)容,都屬于合規(guī)合法,后期網(wǎng)頁的內(nèi)容如出現(xiàn)違規(guī),可以直接聯(lián)系網(wǎng)站管理員進(jìn)行刪除, 稀飯網(wǎng)址不承擔(dān)任何責(zé)任。
相關(guān)導(dǎo)航
暫無評論...