OpenAI 宣布推出其最新旗艦生成式 AI 模型 GPT-4o,該模型將在未來幾周內(nèi)分階段集成至 OpenAI 的各個產(chǎn)品之中。最讓人驚喜的是,GPT-4o 將免費提供給所有用戶使用。
OpenAI 首席技術官穆里?穆拉蒂 (Muri Murati) 表示,GPT-4o 將提供與 GPT-4 同等水平的智能,但在文本、圖像以及語音處理方面均取得了進一步提升。
“GPT-4o 可以綜合利用語音、文本和視覺信息進行推理,”穆拉蒂在 OpenAI 公司總部舉行的主題演講中表示。GPT-4 是 OpenAI 此前的旗艦模型,可以處理由圖像和文本混合而成的信息,并能完成諸如從圖像中提取文字或描述圖像內(nèi)容等任務,GPT-4o 則在此基礎上新增了語音處理能力。
GPT-4o 的運行速度將大大提升,最大亮點在于其語音交互模式采用了新技術。OpenAI 一直致力于讓用戶通過語音與 ChatGPT 進行交流,仿佛與真人對話一般。然而,之前的版本由于延遲問題,嚴重影響了對話的沉浸感。GPT-4o 則采用了全新的技術,讓聊天機器人對話的響應速度大幅提升。
發(fā)布會上 OpenAI 展示了使用 GPT-4o 進行語音對話的演示。演示者提問結束后,GPT-4o 幾乎可以即時回應,并通過文本轉(zhuǎn)語音功能進行朗讀,讓對話感覺更加自然逼真。
另一個演示展示了 GPT-4o 根據(jù)要求調(diào)整說話時語氣,GPT-4o 可以根據(jù)指令改變聲音,從夸張戲劇到冰冷機械,展現(xiàn)了出色的可塑性。最后,演示還展示了 GPT-4o 的唱歌功能。
以往,OpenAI 發(fā)布新版 ChatGPT 模型時,通常會將其置于付費墻之后。不過這次 GPT-4o 將免費提供給所有用戶,付費用戶則可以享受五倍的調(diào)用額度。
此外,OpenAI 還發(fā)布了桌面版的 ChatGPT 和新的用戶界面。“我們認識到這些模型正變得越來越復雜,” 穆拉蒂說道,“但我們希望用戶與人工智能模型的交互體驗能夠更加自然、輕松,讓用戶可以將注意力完全集中在與模型的協(xié)作上,而無需在意界面本身。”
OpenAI 發(fā)布全新旗艦生成式 AI 模型 GPT-4o:語音對話更流暢,免費提供 09:01:29
淘寶 App 首頁改版:“淘寶好價、淘寶買菜”頻道變?yōu)椤鞍賰|補貼”、圖標欄入口縮為一欄 08:57:24
商城購物小程序:引領購物新風尚,讓消費更便捷 09:24:30
服務預約小程序開發(fā):商家服務的新經(jīng)營模式與行業(yè)現(xiàn)狀分析。 09:18:17
為巴黎奧運安保“鋪路”,戛納電影節(jié)將部署可識別可疑行為的 AI 攝像頭 09:13:51
騰訊 QQ / 微信上線地震預警功能,首批支持四川省及周邊 50 公里內(nèi)地區(qū) 08:57:16