哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI Five是如何訓練的、為什么選擇打Dota以及AI在打Dota的時候在想什么?

DPVg_AI_era ? 來源:lp ? 2019-04-19 09:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在上周末徹底攻陷了Dota人類頂級職業(yè)戰(zhàn)隊OG后,OpenAI站出來介紹了OpenAIFive是如何訓練的、為什么選擇打Dota以及AI在打Dota的時候在想什么。

OpenAIFive是第一個在電子競技游戲中擊敗世界冠軍的人工智能,在上周末與2-0大敗世界冠軍Dota2團隊OG,這是AI第一次在直播中擊敗了電子競技專家。

OG和OpenAI開發(fā)組

本次比賽還得出了兩個驚人的發(fā)現(xiàn):

盡管訓練的時候?qū)W⒂趽魯∑渌偪?a href="http://m.greenbey.cn/v/tag/1247/" target="_blank">電腦,但OpenAIFive在比賽中卻展現(xiàn)出和人類玩家的優(yōu)秀的團隊協(xié)作意識。這意味著未來的AI系統(tǒng)可以從競爭型AI轉(zhuǎn)變?yōu)楹献餍虯I

總決賽讓OpenAI的科學家可以回答一個重要的研究問題:OpenAIFive在多大程度、以何種方式能夠被確定的打敗?并且可能是有史以來最大規(guī)模的、人們可以有意識地與之交互的高強度深層強化學習智能體的部署

徹底攻陷了人類頂級職業(yè)玩家后,OpenAI站出來介紹了OpenAIFive是如何訓練的、為什么選擇打Dota以及AI在打Dota的時候在想什么。

為什么選擇Dota?

OpenAIFive的初衷是為了解決現(xiàn)有深度強化學習算法無法實現(xiàn)的問題。為此需要大幅增加工具的的能力、復雜的算法思想(例如分層強化學習)。

OpenAIFive將世界視為一堆必須破譯的數(shù)字。它使用相同的通用學習代碼,無論這些數(shù)字代表Dota游戲(約20,000個數(shù)字)或機器人手(約200個)的狀態(tài)

為了構(gòu)建OpenAIFive,研究人員創(chuàng)建了一個名為Rapid的系統(tǒng),以前所未有的規(guī)模運行PPO。結(jié)果超出了研究人員最大的期望,產(chǎn)生出了世界級的Dota機器人,沒有觸及任何基本的性能限制。

當今的監(jiān)督學習算法之所以能有如此強大功能,是以大量經(jīng)驗為代價的,這在游戲或模擬環(huán)境之外是不切實際的。研究人員認為減少經(jīng)驗量是深度學習的下一個挑戰(zhàn)。

研究人員表示,從今天開始OpenAIFive將不會繼續(xù)打比賽,但取得的進步和技術(shù)的發(fā)展將繼續(xù)推動未來的工作。研究人員認為Dota對于監(jiān)督學習開發(fā)來說比現(xiàn)在使用的標準環(huán)境更具有內(nèi)在的趣味性和難度。

算力

OpenAIFive這次的勝利是由于一次重大變化:訓練計算量增加了8倍。前期階段研究人員通過提高培訓規(guī)模來推動進一步的發(fā)展,之后將絕大部分算力用于培訓單一的OpenAIFive模型,相當于延長了訓練時間。

總的來說,當前版本的OpenAIFive已經(jīng)消耗了800petaflop/s-days,并且在10個實時月內(nèi)獲得了45000年的游戲經(jīng)驗,平均每天獲得250年的模擬經(jīng)驗。OpenAIFive的總決賽版本與TI版本相比,勝率為99.9%。

遷移學習

盡管模型大小和游戲規(guī)則發(fā)生了變化,但目前版本的OpenAIFive自2018年6月以來一直在不斷訓練。在每種情況下,研究人員都能夠?qū)⒛P娃D(zhuǎn)移并繼續(xù)培訓,這對于其他領域的監(jiān)督學習來說是一個開放的挑戰(zhàn)。

據(jù)悉,這可能是監(jiān)督學習智能體第一次使用如此長期的訓練課程進行訓練。

更多Dota英雄

研究人員看到從訓練5個英雄到訓練18英雄速度并沒有減弱的很明顯,于是假設對更多英雄來說也是如此,隨后開始大量嘗試整合新英雄。

研究人員花了幾個星期的時間訓練英雄池,最多達到了25個英雄。將這些英雄帶到大約5kMMR(大約95%的Dota玩家)。盡管在進步,但學習速度還不夠快,無法在總決賽之前達到職業(yè)水平。

研究人員沒有太多時間調(diào)查原因,但他們認為可能需要更好的匹配擴展的英雄池,需要更多的訓練時間讓新英雄達到老英雄的同等水平。想象一下當你習慣了某個英雄后,學習新英雄的難度是多么大!

協(xié)同模式

它實際上感覺很好;我的毒蛇在某些時候為我獻出了生命。他試圖幫助我,想著“我確定她知道她在做什么”然后顯然我沒有。但是,你知道,他相信我。對于[人類]隊友,我并沒有那么多.-無論如何

在總決賽期間,研究人員展示了OpenAI Five與人類一起在團隊中的表現(xiàn),兩隊的成員都是2個真人帶3個智能體

OpenAIFive與人類的協(xié)同作戰(zhàn)能力為人類與人工智能互動的未來提供了一個引人注目的愿景:人工智能系統(tǒng)能夠和人類協(xié)作并增強人類體驗。

玩家認為從機器人隊友哪里感受到了戰(zhàn)友之情,并從這些先進的系統(tǒng)中學到了很多東西,整體來說是一種有趣的體驗。

值得注意的是,OpenAIFive展示了zero-shot遷移學習,與人類并肩作戰(zhàn)或者對抗人類。研究人員非常驚訝這一點和它一樣有效。事實上,研究人員考慮在國際上進行協(xié)同作案韓比賽,但認為需要專門的訓練。

OpenAI Five Arena

目前研究人員還不知道OpenAIFive在多大程度上能夠通過更機智的策略被擊敗,所以研究人員推出了OpenAIFiveArena。這是一項公開的實驗,任何人都可以跟OpenAIFive組隊或者對戰(zhàn)。

競技場于4月18日星期四太平洋標準時間下午6點開放,并于4月21日星期日太平洋標準時間晚上11:59關閉。玩家需要注冊,所有游戲的結(jié)果將自動報告給競技場公共排行榜。

下一步干什么

一旦研究人員審查了OpenAIFiveArena的結(jié)果,研究人員將發(fā)布對OpenAIFive的更多技術(shù)分析,之后將繼續(xù)使用OpenAI中的Dota2環(huán)境。

研究人員已經(jīng)看到過去兩年在監(jiān)督學習能力方面取得了快速進展,并認為Dota2將在推進無論是通過較少的數(shù)據(jù)還是真正的人工智能合作實現(xiàn)有能力的表現(xiàn)方面,持續(xù)提供幫助。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1820

    文章

    50304

    瀏覽量

    266859
  • 深度學習
    +關注

    關注

    73

    文章

    5604

    瀏覽量

    124613
  • 遷移學習
    +關注

    關注

    0

    文章

    74

    瀏覽量

    5856

原文標題:官方揭秘OpenAI Five如何打敗人類:遷移學習+海量訓練,10個月訓練4.5萬年

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何為 Vision Five 2 編譯自定義 Linux 內(nèi)核?

    參考、幫助和鏈接,說明如何為 Vision Five 2 編譯自定義內(nèi)核以及 StarFive 開發(fā)團隊必須提供哪些驅(qū)動程序,那就太好了。
    發(fā)表于 02-24 07:44

    AI推理芯片需求爆發(fā),OpenAI欲尋求新合作伙伴

    電子發(fā)燒友網(wǎng)綜合報道,在人工智能迅猛發(fā)展的當下,AI推理芯片需求正呈爆發(fā)式增長。 ? AI推理,即支撐如ChatGPT這類AI模型響應用戶問題和請求的計算過程。過去,英偉達在訓練大型
    的頭像 發(fā)表于 02-03 17:15 ?3235次閱讀

    OpenAI前首席科學家Ilya Sutskever重磅預言:純靠“堆算力”的AI時代正在終結(jié)?

    OpenAI
    江蘇易安聯(lián)
    發(fā)布于 :2026年01月22日 14:11:06

    OpenAI尋找美國供應商,發(fā)力機器人與AI設備

    電子發(fā)燒友網(wǎng)報道 近期,OpenAI啟動了美國本土采購招標流程,旨在加強其在美國的硬件供應鏈,為進軍消費級設備、機器人以及云數(shù)據(jù)中心領域提供堅實的硬件支持。此次招標涵蓋了芯片、電機、封裝材料以及
    的頭像 發(fā)表于 01-16 15:19 ?6151次閱讀

    AI業(yè)界新聞:OpenAI官宣自研首顆芯片 黃仁勛時隔9年再次給馬斯克“送貨”

    給大家?guī)硪恍?b class='flag-5'>AI業(yè)界新聞: OpenAI官宣自研首顆芯片 OpenAI宣布與博通合作自研AI芯片,首顆芯片預計9個月后量產(chǎn);2026年起部署,2030年前完成10GW算力系統(tǒng)。該芯片
    的頭像 發(fā)表于 10-14 18:42 ?2083次閱讀

    第四次工業(yè)革命AI將實現(xiàn)十億倍增長 | 中國AI芯片與英偉達的角色

    內(nèi)容提要:黃仁勛BG2專訪:英偉達、OpenAI、算力未來與美國夢AI規(guī)模定律與推理的革命:在傳統(tǒng)的AI規(guī)模定律(預訓練、后訓練)之上,引入
    的頭像 發(fā)表于 09-29 07:20 ?1328次閱讀
    第四次工業(yè)革命<b class='flag-5'>AI</b>將實現(xiàn)十億倍增長 | 中國<b class='flag-5'>AI</b>芯片與英偉達的角色

    NVIDIA攜手OpenAI構(gòu)建AI基礎設施

    NVIDIA 首席執(zhí)行官黃仁勛、OpenAI 首席執(zhí)行官 Sam Altman 和 OpenAI 總裁 Greg Brockman 宣布了一項新的合作伙伴關系,旨在推動 OpenAI 的發(fā)展,并支持幾乎所有行業(yè)和用戶大規(guī)模使用
    的頭像 發(fā)表于 09-23 14:38 ?1081次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    (Sparsely-gatedMixture of Experts Layer)是這些模型的關鍵組成部分,它由眾多簡單的前饋專家網(wǎng)絡和一個負責選擇專家的可訓練門控網(wǎng)絡組成,這有助于動態(tài)和稀疏地激活專家以處理每個輸入
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升算力還是智力

    持續(xù)發(fā)展體現(xiàn)在: 1、收益遞減 大模型的基礎的需要極大的算力,這首先源于昂貴的高性能AI芯片,然后是寶貴的電力、水等與環(huán)境相關的資源。 收益遞減體現(xiàn)在: ①模型大小 ②訓練數(shù)據(jù)量 ③訓練算法的優(yōu)化 2
    發(fā)表于 09-14 14:04

    OpenAI將與博通合作量產(chǎn)自研AI芯片 博通第四財季AI芯片收入展望超預期

    據(jù)外媒《金融時報》的報道稱 OpenAI 將與博通公司開啟大規(guī)模的合作,希望能夠借住博通推動OpenAI?自研 AI 芯片的量產(chǎn)落地。 據(jù)稱,OpenAI 的首款自研芯片主要是專注于
    的頭像 發(fā)表于 09-05 11:06 ?2014次閱讀

    OpenAI開源模型登陸IBM watsonx.ai開發(fā)平臺

    OpenAI 已向公眾發(fā)布了兩款 AI 模型,允許開發(fā)者和企業(yè)可自由下載、運行并進行定制。其中一款模型現(xiàn)已部署在 IBM watsonx.ai 開發(fā)平臺上。
    的頭像 發(fā)表于 08-26 15:36 ?1139次閱讀

    ai_cube訓練模型最后部署失敗是什么原因?

    ai_cube訓練模型最后部署失敗是什么原因?文件保存路徑里也沒有中文 查看AICube/AI_Cube.log,看看報什么錯?
    發(fā)表于 07-30 08:15

    使用 ai cude 里面自帶的案例訓練UI顯示異常的原因?怎么解決?

    案例的配置是默認的,顯示訓練ui更改顯示異常
    發(fā)表于 06-23 06:21

    海思SD3403邊緣計算AI數(shù)據(jù)訓練概述

    AI數(shù)據(jù)訓練:基于用戶特定應用場景,用戶采集照片或視頻,通過AI數(shù)據(jù)訓練工程師**(用戶公司****員工)** ,進行特征標定后,將標定好的訓練
    發(fā)表于 04-28 11:11

    Deepseek海思SD3403邊緣計算AI產(chǎn)品系統(tǒng)

    海思SD3403邊緣計算AI框架,提供了一套開放式AI訓練產(chǎn)品工具包,解決客戶低成本AI系統(tǒng),針對差異化AI 應用場景,自己采集樣本數(shù)據(jù),進
    發(fā)表于 04-28 11:05
    股票| 车致| 桦甸市| 弥渡县| 安岳县| 旌德县| 西青区| 磐石市| 临颍县| 嘉黎县| 长寿区| 安徽省| 玉林市| 府谷县| 保定市| 云阳县| 西乌珠穆沁旗| 平陆县| 嘉兴市| 崇文区| 田东县| 通榆县| 壤塘县| 海口市| 新野县| 班玛县| 长宁县| 河间市| 青岛市| 东城区| 潜山县| 会泽县| 无极县| 乐安县| 肥乡县| 鱼台县| 河间市| 牡丹江市| 肥乡县| 佛山市| 旬邑县|