Massively Multilingual Speech (MMS) 是由Meta 開源的一個AI 語音識別模型。支持1107 種語言的語音轉文本和文本轉語音,以及4000 多種語言的語言識別。 MMS 項目將支持的語言數量增加了10-40 倍,具體取決於任務。主要成分是一個新的數據集,該數據集基於對公開宗教文本的閱讀,並有效地利用了自我監督學習。項目團隊構建了涵蓋1406 種語言的預訓練wav2vec 2.0 模型、1107 種語言的單一多語言自動語音識別模型、相同數… |
#將語音技術擴展到1000 #種語言MMS