我們擅長商業(yè)策略與用戶體驗的完美結(jié)合。
歡迎瀏覽我們的案例。
谷歌旗下 AI 實驗室 DeepMind 的工程師團隊在 Nature 官網(wǎng)發(fā)表了一篇論文,稱使用深度強化學習發(fā)現(xiàn)了更快的排序算法。
排序或散列等基本算法在一天內(nèi)的使用量可達數(shù)萬億次,隨著計算需求的增長,讓這些算法盡可能高效變得至關重要?;A排序算法在過去取得了顯著的進步,但如要進一步提高這些算法例程的效率,對人類科學家和已知的計算方法都具有挑戰(zhàn)性。
而 DeepMind 通過將 “尋找更好的排序程序” 任務制定成一個名為 AssemblyGame 的單人游戲。在這個游戲中,玩家需要選擇一系列低級 CPU 指令(匯編指令),然后將其組合起來產(chǎn)生一種新的高效排序算法。
然后 DeepMind 訓練了一個新的深度強化學習代理 ”AlphaDev“來玩這個游戲,AlphaDev 的主要學習算法是 AlphaZero 代理的擴展,并使用深度神經(jīng)網(wǎng)絡指導蒙特卡洛樹搜索 (MCTS) 規(guī)劃過程。
最終,AlphaDev 從零開始地發(fā)現(xiàn)了幾項新的小型排序算法,分別可用于對大小為 3、4 和 5 的列表進行排序,且均優(yōu)于已知的人類基準。
目前這些算法已經(jīng)集成到 LLVM 標準 C++ 排序庫 中,使用強化學習的新算法替換掉了原有的 LLVM libc++ 標準排序 3、排序 4 和排序 5 算法,這些基礎算法是 C++ 排序庫的基本組件,通常被較大的排序算法多次調(diào)用。
值得一提的是,DeepMind 的提交是十多年來對 LLVM libc+ 排序算法子程序的首次更改。
(碼上科技)