我們擅長商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。
歡迎瀏覽我們的案例。
9月15日消息,《連線》網(wǎng)站撰文指出,F(xiàn)acebook名為Rosetta的人工智能技術(shù)平??煞治鰯?shù)十億張包含文本的圖像,能夠分析表情包,但它能像人類那樣理解表情包的內(nèi)涵嗎?
以下是文章主要內(nèi)容:
每天都有數(shù)十億的文本帖子、照片和視頻被上傳到社交媒體上,這是人類審核員無法全面篩選的一個(gè)信息量級(jí)。因此,F(xiàn)acebook和YouTube等公司長期以來一直依賴人工智能來幫助解決垃圾郵件和色情內(nèi)容等問題。
不過,對(duì)于機(jī)器來說,審核像白人至上主義的表情包這樣的東西可能更具挑戰(zhàn)性,因?yàn)檫@項(xiàng)任務(wù)需要同時(shí)處理幾種不同的視覺元素。自動(dòng)化系統(tǒng)需要檢測(cè)和“讀取”疊加在照片上的文字,并分析圖像本身。表情包也是一種復(fù)雜的文化產(chǎn)物,很難脫離語境去理解。盡管它們帶來了挑戰(zhàn),但一些社交平臺(tái)已經(jīng)在使用人工智能來分析表情包,其中包括社交網(wǎng)絡(luò)巨頭Facebook。Facebook本周分享了它如何使用一種名為Rosetta的工具來分析包含文本的照片和視頻的細(xì)節(jié)。
Facebook表示,它已經(jīng)在使用Rosetta來自動(dòng)檢測(cè)違反其仇恨言論政策等規(guī)定的內(nèi)容。該公司本周還宣布,在該工具的幫助下,它正在擴(kuò)大其第三方事實(shí)核查的努力,納入照片和視頻,而不僅僅是基于文本的文章。Rosetta將自動(dòng)檢查包含文本的圖像和視頻是否曾被標(biāo)記為錯(cuò)誤,從而幫助完成審查。
Rosetta通過將光學(xué)字符識(shí)別(OCR)技術(shù)與其他機(jī)器學(xué)習(xí)技術(shù)相結(jié)合來處理照片和視頻中的文本。首先,它使用OCR來識(shí)別文本在表情包或視頻中的位置。你可能以前用過類似OCR的東西;它可以讓你快速瀏覽紙質(zhì)表單,并將其轉(zhuǎn)換為可編輯的文檔。該自動(dòng)化程序知道文本塊的位置,并能將它們與你應(yīng)該簽名的地方區(qū)分開來。
一旦Rosetta知道文本在哪里,F(xiàn)acebook就會(huì)使用一個(gè)神經(jīng)網(wǎng)絡(luò)來轉(zhuǎn)錄文本并理解其含義。然后,它可以將文本傳輸?shù)狡渌南到y(tǒng),比如一個(gè)檢查表情包是否與已經(jīng)被揭穿的病毒騙局有關(guān)的系統(tǒng)。
Rosetta的研究人員表示,該工具現(xiàn)在可以實(shí)時(shí)從公開上傳到Facebook的每張圖片中提取文本,并且可以“閱讀”多種語言的文本,包括英語、西班牙語、德語和阿拉伯語。(Facebook表示,Rosetta不會(huì)用于掃描用戶在時(shí)間軸上私密分享的圖像或私信。)
Rosetta可以分析包含多種文本形式的圖像,比如抗議標(biāo)識(shí)、餐廳菜單、店面等的照片。在Facebook工作的軟件工程師維斯瓦納斯·西瓦庫馬爾(Viswanath Sivakumar)在一封電子郵件中說,這個(gè)工具既能識(shí)別景觀中的文本(比如街道標(biāo)識(shí)),也能識(shí)別表情包——但后者更具挑戰(zhàn)性。他寫道,“在主動(dòng)檢測(cè)仇恨言論和其他違反政策內(nèi)容的情況下,分析表情包式的圖像是一項(xiàng)更加復(fù)雜的人工智能挑戰(zhàn)。”
西瓦庫馬爾指出,與人類不同,人工智能通常需要看到成千上萬個(gè)例子才能學(xué)會(huì)完成復(fù)雜的任務(wù)。但是,即便是對(duì)于Facebook而言,表情包方面的例子也不是無窮無盡的,而且在不同的語言上收集足夠多的例子也很困難。尋找高質(zhì)量的訓(xùn)練數(shù)據(jù)是人工智能研究的一個(gè)持續(xù)性挑戰(zhàn)。數(shù)據(jù)通常需要花費(fèi)大量的功夫來進(jìn)行手工標(biāo)記,而且許多數(shù)據(jù)庫都受到版權(quán)法的保護(hù)。
為了訓(xùn)練Rosetta,F(xiàn)acebook的研究人員使用了在網(wǎng)站上公開發(fā)布的含有某種文本形式的圖片,以及它們的標(biāo)注和發(fā)布地點(diǎn)信息。他們還創(chuàng)建了一個(gè)程序來生成額外的示例,這種做法的靈感來自于牛津大學(xué)的一個(gè)研究團(tuán)隊(duì)在2016年設(shè)計(jì)的一種方法。這意味著整個(gè)過程在某種程度上是自動(dòng)化的:一個(gè)程序自動(dòng)地產(chǎn)生表情包,然后另一個(gè)程序試圖分析它們。
不同的語言還給Facebook的人工智能團(tuán)隊(duì)帶來了其它的挑戰(zhàn)。例如,研究人員必須找到一種變通方法來使得Rosetta能夠用于阿拉伯語等語言。阿拉伯語從右到左閱讀,與英語等其他語言相反。Rosetta倒著“閱讀”阿拉伯語,經(jīng)過處理后,F(xiàn)acebook將那些字符顛倒過來。研究人員在他們的博客中寫道:“這個(gè)技巧的效果出奇的好,讓我們有了一個(gè)統(tǒng)一的模型,它既適用于從左到右的語言,也適用于從右到左的語言。”
雖然自動(dòng)化系統(tǒng)在內(nèi)容審核方面非常有用,但它們并不總是萬無一失的。例如,騰訊的微信絡(luò)使用兩個(gè)不同的算法來過濾圖像,多倫多大學(xué)公民實(shí)驗(yàn)室的一個(gè)研究團(tuán)隊(duì)成功地騙過了它們。第一個(gè)算法是基于OCR的程序,會(huì)過濾含有特定話題文本的照片,而另一個(gè)算法則會(huì)審查那些看起來與中國政府可能創(chuàng)建的黑名單相似的照片。
研究人員能夠通過改變圖像的屬性,比如顏色或方向,輕易地避開微信的過濾器。雖然Facebook的Rosetta更加先進(jìn),但可能也不是完美無缺;該系統(tǒng)可能會(huì)受困于難以閱讀的文本或扭曲的字體。所有的圖像識(shí)別算法也仍然可能會(huì)受到對(duì)抗性的例子的影響,那些經(jīng)過輕微改動(dòng)的圖像在人類看來是一樣的,但會(huì)導(dǎo)致人工智能陷入混亂。
在對(duì)特定種類的內(nèi)容的審核方面,F(xiàn)acebook和Twitter、YouTube和Reddit等其他的平臺(tái)在多個(gè)國家都面臨著巨大的壓力。周三,歐盟提出了一項(xiàng)新的法規(guī),要求社交媒體公司在接到通知后一小時(shí)內(nèi)刪除恐怖分子的帖子,否則將面臨罰款。Rosetta和其他類似的自動(dòng)化工具已經(jīng)在幫助Facebook和其他平臺(tái)在德國等地遵守類似的法律。
它們?cè)谀欠矫嬉沧龅酶昧耍簝赡昵?,F(xiàn)acebook首席執(zhí)行官馬克·扎克伯格(Mark Zuckerberg)曾說,F(xiàn)acebook的人工智能系統(tǒng)只能主動(dòng)捕捉到該公司所刪除內(nèi)容的一半左右;人們必須先要標(biāo)記其余要?jiǎng)h除的內(nèi)容?,F(xiàn)在,F(xiàn)acebook表示,它的人工智能工具可以檢測(cè)到幾乎100%的垃圾郵件、99.5%的恐怖內(nèi)容和86%的暴力圖片。YouTube等其他平臺(tái)在利用自動(dòng)內(nèi)容檢測(cè)系統(tǒng)上也取得了同等程度的成功。
然而,這些喜人的數(shù)字并不意味著像Rosetta這樣的人工智能系統(tǒng)是完美的解決方案,尤其是當(dāng)涉及到更微妙的表達(dá)形式的時(shí)候。與餐館菜單不同的是,如果不知道表情包的發(fā)布背景,就很難理解它的含義。這就是為什么有很多網(wǎng)站在致力于解釋它們。表情包通常描述的是圈內(nèi)笑話,或者是針對(duì)特定的網(wǎng)絡(luò)亞文化。人工智能仍然不能像人類那樣理解表情包或視頻。就目前而言,F(xiàn)acebook仍需要依靠人工審核員來決定是否應(yīng)該刪除某個(gè)表情包。
?。?a href="http://m.jinteng090.cn/">邯鄲小程序開發(fā))
小米應(yīng)用商店發(fā)布消息稱 持續(xù)開展“APP 侵害用戶權(quán)益治理”系列行動(dòng) 11:37:04
騰訊云與CSIG成立政企業(yè)務(wù)線 加速數(shù)字技術(shù)在實(shí)體經(jīng)濟(jì)中的落地和應(yīng)用 11:34:49
樂視回應(yīng)還有400多人 期待新的朋友加入 11:29:25
亞馬遜表示 公司正在將其智能購物車擴(kuò)展到馬薩諸塞州的一家全食店 10:18:04
三星在元宇宙平臺(tái)推出游戲 玩家可收集原材料制作三星產(chǎn)品 09:57:29
特斯拉加州San Mateo裁減229名員工 永久關(guān)閉該地區(qū)分公司 09:53:13