中新網(wǎng)約翰內(nèi)斯堡11月27日電 西非語言沃洛夫語和普拉爾語,撒哈拉以南地區(qū)非洲語言林加拉語、斯瓦希里語和班巴拉語等被納入大語言模型開發(fā)視野。
法國電信公司Orange當(dāng)?shù)貢r間26日公布,其將與人工智能技術(shù)公司OpenAI、互動媒體與服務(wù)公司Meta合作,用非洲本土語言訓(xùn)練人工智能大模型。
該倡議從2025年上半年開始,最初將專注于通過“微調(diào)”O(jiān)penAI的Whisper語音模型和Meta的Llama文本模型,整合兩種西非語言:沃洛夫語和普拉爾語。
沃洛夫語是塞內(nèi)加爾、岡比亞和毛里塔尼亞南部的一種語言,而普拉爾語則主要在塞內(nèi)加爾使用。這兩種語言的使用人數(shù)分別約為1600萬人和600萬人。
Orange首席人工智能官史蒂夫·賈瑞特(Steve Jarrett)表示,公司將使用本地語言模型與客戶互動,并計劃將其免費提供給公共衛(wèi)生和教育服務(wù)等使用。該項目明年將針對林加拉語、斯瓦希里語和班巴拉語等其他撒哈拉以南地區(qū)非洲語言進(jìn)行訓(xùn)練。
目前,大型人工智能公司用于訓(xùn)練算法的數(shù)據(jù)大部分都來自美國,這意味著當(dāng)涉及歐洲、中東和非洲等不同地區(qū)時,他們的模型可能會失去文化和語言等重要背景信息。(完)
Copyright ? 2001-2024 湖北荊楚網(wǎng)絡(luò)科技股份有限公司 All Rights Reserved
營業(yè)執(zhí)照 - 增值電信業(yè)務(wù)許可證 - 互聯(lián)網(wǎng)出版機(jī)構(gòu) - 網(wǎng)絡(luò)視聽節(jié)目許可證 - 廣播電視節(jié)目許可證
關(guān)于我們 - 版權(quán)聲明 - 合作咨詢
版權(quán)為 荊楚網(wǎng) www.cnhubei.com 所有 未經(jīng)同意不得復(fù)制或鏡像