LLM 基準測試:Vicuna 奪冠,清華ChatGLM 排名第五

LMSYS ORG (Large Model Systems Organization) 最新推出了一個大語言模型(LLM) 基準平台Chatbot Arena,旨在對目前市場上的大語言模型進行基準測試。具體表現為,通過在大語言模型間進行隨機匿名的1V1 battle 方式,並基於Elo 評級系統得出排名。 LMSYS ORG 是一個開放的研究組織,由加州大學伯克利分校的學生和教師…

#LLM #基準測試Vicuna #奪冠清華ChatGLM #排名第五

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *