StableVicuna 是由 Stable Diffusion 背后的 StabilityAI 推出的第一個通過基于人類反饋的強化學習(RLHF)訓練的大規(guī)模開源聊天機器人。StableVicuna是Vicuna v0 13b的進一步指令微調(diào)和RLHF訓練版本