WeLM是微信AI團隊開發的一個中文預訓練語言模型,能夠在零樣本和少樣本情境下完成多種NLP任務。
WeLM的功能和特點:
WeLM擁有處理跨多語言(中英日)任務的能力,并且具有mutilingual的能力。
WeLM具有記憶能力、自我糾正和檢查能力,能夠學習少量的文本轉換例子即可達到對任意類型的文本轉換。
在14項中文NLP任務上,WeLM的整體表現超出了所有同大小的模型,甚至能夠匹配比它大25倍的模型。
WeLM使用62k的SentencePiece tokenizer進行詞表處理,再加上3萬個中文符號和中文中常見的英語、日語、韓語等語言的常用詞也被包括在內。
相關技術論文《WeLM: A Well-Read Pre-trained Language Model for Chinese》已經發布于論文預印本網站arXiv(https://arxiv.org/abs/2209.10372)
網址預覽
數據評估
關于 微信WeLM 特別聲明
本站 稀飯網址提供的 微信WeLM都來源于網絡,不保證外部鏈接的準確性和完整性,同時,對于該外部鏈接的指向,不由 稀飯網址實際控制,在 2023年11月22日 上午8:52收錄時,該網頁上的內容,都屬于合規合法,后期網頁的內容如出現違規,可以直接聯系網站管理員進行刪除, 稀飯網址不承擔任何責任。
相關導航
暫無評論...