我們擅長商業(yè)策略與用戶體驗的完美結(jié)合。
歡迎瀏覽我們的案例。
Facebook 推出了一個名為 SoundSpaces 的新的開源工具,專為所謂的 "嵌入式 AI "而設(shè)計。該工具旨在通過允許機(jī)器人分析環(huán)境聲音,幫助他們更有效地找到自己的方向。
音頻對導(dǎo)航很有用。例如,如果用戶要求假想的機(jī)器人家庭助理取回正在響鈴的智能手機(jī),則將聲音追蹤到其來源可能比目視檢查設(shè)備可能位于的每個房間要快得多。
SoundSpaces 是一個主要基于 3D 環(huán)境聲學(xué)模擬的音頻渲染信息集。該信息集設(shè)計用于 Facebook 的開放供應(yīng)模擬平臺 AI Habitat,它提供了一個軟件程序傳感器,使其可以在掃描的真實世界環(huán)境中插入聲源的模擬。
SoundSpaces 提供了一系列音頻文件,AI 開發(fā)者可以用這些文件在模擬中訓(xùn)練聲音感知的 AI 模型。Facebook 方面表示,這些音頻文件不是簡單的錄音,而是 "幾何聲學(xué)模擬"。這些模擬包括關(guān)于波浪如何從墻壁等表面反射的信息、它們?nèi)绾闻c不同的材料相互作用、以及一些其他數(shù)據(jù),開發(fā)人員可以使用這些數(shù)據(jù)來創(chuàng)建聽起來很真實的模擬,以訓(xùn)練 AI 模型。
Facebook 研究科學(xué)家 Kristen Grauman 和 Dhruv Batra 在博客中寫道,"據(jù)我們所知,這是第一次嘗試訓(xùn)練既能看到又能聽到的深度強(qiáng)化學(xué)習(xí)代理,以映射新環(huán)境并定位發(fā)聲目標(biāo)。通過這種方法,我們在導(dǎo)航方面實現(xiàn)了比使用單模態(tài)同行更快的訓(xùn)練和更高的準(zhǔn)確性。"
此外,F(xiàn)acebook 方面還表示,他們已經(jīng)開源了一個名為“Semantic MapNet”的工具,開發(fā)人員可以用來為模型提供某種空間內(nèi)存以改善導(dǎo)航的軟件模塊。
(邯鄲網(wǎng)站制作)
小米應(yīng)用商店發(fā)布消息稱 持續(xù)開展“APP 侵害用戶權(quán)益治理”系列行動 11:37:04
騰訊云與CSIG成立政企業(yè)務(wù)線 加速數(shù)字技術(shù)在實體經(jīng)濟(jì)中的落地和應(yīng)用 11:34:49
樂視回應(yīng)還有400多人 期待新的朋友加入 11:29:25
亞馬遜表示 公司正在將其智能購物車擴(kuò)展到馬薩諸塞州的一家全食店 10:18:04
三星在元宇宙平臺推出游戲 玩家可收集原材料制作三星產(chǎn)品 09:57:29
特斯拉加州San Mateo裁減229名員工 永久關(guān)閉該地區(qū)分公司 09:53:13