我們擅長(zhǎng)商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。
歡迎瀏覽我們的案例。
亞馬遜發(fā)力捍衛(wèi)在云計(jì)算領(lǐng)域的領(lǐng)先地位,一邊升級(jí)自研的云芯片、推出亞馬遜版的GPT——人工智能(AI)聊天機(jī)器人,一邊深化同英偉達(dá)的合作,推出基于英偉達(dá)芯片的新服務(wù)、和英偉達(dá)共同研發(fā)超級(jí)計(jì)算機(jī)。
AWS的副總裁Dave Brown表示,通過(guò)將自研芯片的設(shè)計(jì)重點(diǎn)放在對(duì)客戶重要的實(shí)際工作負(fù)載上,AWS能為他們提供最先進(jìn)的云基礎(chǔ)設(shè)施。此次推出的Graviton4是五年內(nèi)的第四代芯片產(chǎn)品,隨著人們對(duì)生成式 AI 興趣的高漲,第二代AI芯片Trainium2 將幫助客戶以更低的成本和更高的能效更快地訓(xùn)練自己的機(jī)器學(xué)習(xí)模型。
Graviton4計(jì)算性能較前代提高多達(dá)30%
美東時(shí)間11月28日周二,亞馬遜旗下云計(jì)算業(yè)務(wù)AWS宣布,推出新一代的AWS自研芯片。其中,通用芯片Graviton4的計(jì)算性能較前代Graviton3提高多達(dá)30%,內(nèi)核增加50%,內(nèi)存帶寬提升75%,從而在亞馬遜云服務(wù)器托管服務(wù)Amazon Elastic Compute Cloud(EC2)上提供最高性價(jià)比和能源利用效果。
Graviton4還通過(guò)對(duì)所有高速物理硬件接口進(jìn)行完全加密提高安全性。AWS稱,Graviton4 將應(yīng)用于內(nèi)存優(yōu)化的Amazon EC2 R8g 實(shí)例,讓客戶能改進(jìn)高性能數(shù)據(jù)庫(kù)、內(nèi)存緩存和大數(shù)據(jù)分析工作負(fù)載的執(zhí)行。R8g 實(shí)例提供更大的實(shí)例大小,比前代 R7g實(shí)例的 vCPU 高最多三倍的,內(nèi)存高三倍。
應(yīng)用Graitons4的電腦將在未來(lái)數(shù)月內(nèi)上市。AWS稱,啟動(dòng)Garviton項(xiàng)目約五年來(lái),已生產(chǎn)超過(guò)200萬(wàn)個(gè)Garviton處理器,AWS EC2的前100位用戶都選擇使用Graviton。
Trainium2速度提高四倍 訓(xùn)練萬(wàn)億參數(shù)級(jí)模型
AWS的另一款新品——新一代AI芯片Trainium2速度比前代Trainium1快四倍,將能在EC2 UltraCluster中部署多達(dá)10萬(wàn)個(gè)芯片,讓用戶能在很短的時(shí)間內(nèi)訓(xùn)練數(shù)以萬(wàn)億參數(shù)的基礎(chǔ)模型(PM)和大語(yǔ)言模型 (LLM),同時(shí)能源利用率較前代提高多達(dá)兩倍。
Trainium2 將用于Amazon EC2 Trn2 實(shí)例,單個(gè)實(shí)例中包含16 個(gè)Trainium 芯片。Trn2 實(shí)例旨在幫助客戶在下一代 EC2 UltraCluster中擴(kuò)展芯片應(yīng)用數(shù)量至多達(dá)10萬(wàn)個(gè)Trainium2 芯片,聯(lián)通AWS Elastic Fabric Adapter (EFA) petabit級(jí)網(wǎng)絡(luò),提供高達(dá) 65 exaflops 的算力。
AWS稱,Trainium2將從明年開始用于支持新的服務(wù)。
升級(jí)版Grace Hopper的首家大客戶 DGX云采用GH200 NVL32 速度最快GPU驅(qū)動(dòng)AI超算
除了自研芯片,AWS周二還在年度大會(huì)re:Invent期間同英偉達(dá)共同宣布,擴(kuò)大戰(zhàn)略合作,提供最先進(jìn)的基礎(chǔ)設(shè)施、軟件和服務(wù),助力客戶的生成式AI創(chuàng)新。
AWS 將成為第一家在云上采用全新多節(jié)點(diǎn)NVLink技術(shù)英偉達(dá)H200 Grace Hopper超級(jí)芯片的云服務(wù)商,也就是說(shuō),AWS將是升級(jí)版Grace Hopper的第一個(gè)大客戶。
英偉達(dá)的H200 NVL32 多節(jié)點(diǎn)平臺(tái)將 32 個(gè) Grace Hopper芯片與 NVLink 和 NVSwitch 技術(shù)共同用于一個(gè)實(shí)例。該平臺(tái)將用于與亞馬遜網(wǎng)絡(luò)EFA連接的Amazon EC2實(shí)例,并由高級(jí)虛擬化 (AWS Nitro System) 和超大規(guī)模集群 (Amazon EC2 UltraClusters) 提供支持,使亞馬遜和英偉達(dá)共同的客戶能夠擴(kuò)展部署數(shù)以千計(jì)的H200芯片。
英偉達(dá)和AWS將共同在AWS上托管英偉達(dá)的AI 訓(xùn)練即服務(wù)DGX Cloud,它將是第一個(gè)采用GH200 NVL32 的 DGX 云,能為開發(fā)人員提供單個(gè)實(shí)例中最大的共享內(nèi)存。AWS 的DGX云將提高尖端生成式AI 和超過(guò)1萬(wàn)億參數(shù)的大語(yǔ)言模型的訓(xùn)練。
英偉達(dá)和AWS 正在共同研發(fā)名為Ceiba 的項(xiàng)目,設(shè)計(jì)世界上速度最快的GPU驅(qū)動(dòng)AI 超級(jí)計(jì)算機(jī),這是一個(gè)采用 GH200 NVL32 和 Amazon EFA 互連的大規(guī)模系統(tǒng)。它是搭載1.6384萬(wàn)塊GH200超級(jí)芯片的超級(jí)計(jì)算機(jī) ,AI處理能力達(dá)65 exaflops。英偉達(dá)將用它推動(dòng)下一波生成式AI 創(chuàng)新。
企業(yè)客戶機(jī)器人亞馬遜Q預(yù)覽版上線 幫助在AWS上開發(fā)App
除了芯片和云服務(wù),AWS還推出了自己的AI聊天機(jī)器人預(yù)覽版,名為亞馬遜Q。它是生成式AI技術(shù)支持的新型數(shù)字助手,可根據(jù)企業(yè)客戶的業(yè)務(wù)進(jìn)行工作,幫助企業(yè)客戶搜索信息、編寫代碼和審查業(yè)務(wù)指標(biāo)。
Q接受了AWS內(nèi)部有關(guān)代碼和文檔的部分培訓(xùn),可供AWS云的開發(fā)者使用。
開發(fā)者可以用Q在AWS上創(chuàng)建App、研究最佳實(shí)踐、改正錯(cuò)誤、獲得為App編寫新功能的幫助。用戶可以通過(guò)對(duì)話式的問答功能與Q進(jìn)行交互,學(xué)習(xí)新知識(shí)、研究最佳實(shí)踐以及了解如何在AWS上構(gòu)建App,無(wú)需將注意力從 AWS 控制臺(tái)上移開。
Q還將被添加到亞馬遜的企業(yè)智能軟件、呼叫中心工作人員和物流管理的程序。 AWS表示,客戶可以根據(jù)公司的數(shù)據(jù)或個(gè)人資料,對(duì)Q進(jìn)行定制。
Q 對(duì)話式問答功能目前在所有提供企業(yè)AWS的地區(qū)提供預(yù)覽版。
亞馬遜發(fā)力捍衛(wèi)云地位,升級(jí)自研AI芯片,發(fā)布聊天機(jī)器人Q,搶先用英偉達(dá)新一代超級(jí)芯片 09:00:17
聯(lián)發(fā)科回應(yīng)擬投資英國(guó)新創(chuàng)企業(yè):以人工智能及 IC 設(shè)計(jì)技術(shù)為主 10:59:57
小鵬汽車 Xmart OS 4.4.0 今晚全量推送,新增無(wú)圖 20 城 10:56:20
滿 200-30 元!2023 淘寶年終好價(jià)節(jié) 12 月 9 日開啟,現(xiàn)已開始招商 10:54:48
消息稱 Shein 秘密申請(qǐng)赴美上市,最早 2024 年 IPO 10:47:14
一周一漲:特斯拉中國(guó) Model Y 長(zhǎng)續(xù)航版升至 30.64 萬(wàn)元 10:35:18