大規模語言模型Baichuan-13B

Baichuan-13B 是由百川智能繼Baichuan-7B 之後開發的包含130 億參數的開源可商用的大規模語言模型,在權威的中文和英文benchmark 上均取得同尺寸最好的效果。本次發布包含有預訓練(Baichuan-13B-Base) 和對齊(Baichuan-13B-Chat) 兩個版本。 Baichuan-13B 有如下幾個特點: 更大尺寸、更多數據:Baichuan-13B 在Baichuan-7B 的基礎上進一步擴大參數量到130 億,並且在高質量的語料上訓練了1.4 萬億tokens,超過LLaMA-…

#大規模語言模型Baichuan13B

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *