哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CMU、Facebook聯(lián)合打造“賭神”AI,六人德?lián)鋼魯∪祟?/h1>

CMU 和 Facebook 聯(lián)合打造的史上最強(qiáng)德州撲克 AI “Pluribus”在六人德州撲克這項(xiàng)復(fù)雜游戲中擊敗了頂級(jí)人類玩家。今天,Science雜志以封面重磅的形式發(fā)表了該研究論文,詳細(xì)描述了Pluribus的策略。

前不久,一款名叫 “Pluribus” 的 AI 撲克牌機(jī)器人在六人無(wú)限注德州撲克這項(xiàng)復(fù)雜游戲中,碾壓了人類職業(yè)選手!

這是 AI 首次在規(guī)模超過(guò)兩人的復(fù)雜對(duì)局中擊敗頂級(jí)人類玩家。

“Pluribus” 是CMU 和 Facebook 聯(lián)合打造的史上最強(qiáng)德州撲克 AI,重點(diǎn)解決了多人對(duì)局環(huán)境下的非零和博弈和隱藏信息推理問(wèn)題,是該領(lǐng)域的一個(gè)重大突破。

今天,“Pluribus”的論文更是以封面的形式登上Science雜志!

來(lái)自CMU和Facebook AI的Noam Brown和Tuomas Sandholm教授,在論文中詳細(xì)解讀了“Pluribus”的策略。

作者表示,撲克一直是一個(gè)具有挑戰(zhàn)性的問(wèn)題,過(guò)去AI在這類基準(zhǔn)測(cè)試中取得的成功僅限于兩人參與的游戲。然而,傳統(tǒng)上玩撲克的人不止兩個(gè)人。多人撲克是一個(gè)公認(rèn)的AI里程碑。

“Pluribus”AI在六人無(wú)限制注德?lián)渲姓宫F(xiàn)了比頂級(jí)人類專業(yè)玩家更強(qiáng)大的技能。

接下來(lái),新智元帶來(lái)這篇論文的解讀,完整論文可點(diǎn)擊文末鏈接查看。

基于MCCFR的“藍(lán)圖”策略

三人或三人以上的博弈對(duì)博弈論提出了挑戰(zhàn)。對(duì)于兩個(gè)玩家的零和博弈,存在這樣一種策略,即沒(méi)有玩家可以通過(guò)切換到不同的策略來(lái)提高他們的機(jī)會(huì)。這種所謂的納什均衡被認(rèn)為是博弈的一個(gè)解。

但對(duì)于多人游戲,期望獎(jiǎng)勵(lì)可能因納什均衡的不同而有所不同。保證收斂到納什均衡的快速算法,例如虛擬遺憾最小化算法(CFR),在多人游戲中可能失效。盡管如此,CFR在一些多人游戲領(lǐng)域仍顯示出良好的經(jīng)驗(yàn)表現(xiàn)。

Pluribus首先通過(guò)自我游戲(self-play)來(lái)學(xué)習(xí)通用技巧,我們稱之為“藍(lán)圖”(blueprint)策略。

然后,在實(shí)際游戲中,它根據(jù)游戲的當(dāng)前狀態(tài)計(jì)算一個(gè)實(shí)時(shí)策略來(lái)細(xì)化blueprint策略。Pluribus程序通過(guò)名為Monte Carlo CFR (MCCFR)的CFR變體學(xué)習(xí)blueprint策略,并進(jìn)行一些改進(jìn)。

Pluribus會(huì)反復(fù)模擬所有玩家使用相同策略的撲克手牌;在每一手牌之后,它會(huì)遞歸地檢查每個(gè)決策,并與在相同情況下可能選擇的其他操作相比,評(píng)估該決策的預(yù)期結(jié)果。

為了提高Pluribus中MCCFR算法的效率,作者在訓(xùn)練的早期階段引入了linear weighted discounting,并在訓(xùn)練的后期對(duì)negative-regret行為進(jìn)行策略剪枝。

系統(tǒng)中最復(fù)雜的部分是實(shí)時(shí)策略組件。為了處理不完美信息,Pluribus執(zhí)行嵌套搜索,維護(hù)搜索樹(shù)的根節(jié)點(diǎn)和每個(gè)玩家持有的牌的根節(jié)點(diǎn)的概率分布,前提是假設(shè)所有玩家使用相同的(已知的)策略。

為了有效評(píng)估葉節(jié)點(diǎn),Pluribus考慮了blueprint 策略的四種不同變體。

在Abstraction機(jī)制中,Pluribus通過(guò)將類似的情況打包在一起,減少了關(guān)于是否跟注(call)、加注(raise)或棄牌(fold)的決策點(diǎn)的數(shù)量。使用蒙特卡羅虛擬遺憾最小化(MCCFR),將撲克游戲中樹(shù)搜索的復(fù)雜性從一個(gè)棘手的問(wèn)題降低到一個(gè)可解決的問(wèn)題。

真實(shí)游戲

Pluribus需要為每個(gè)場(chǎng)景提供一個(gè)動(dòng)作(跟注、加注或棄牌)。

抽象游戲

類似的方案,比如高牌9和高牌10一起。

抽象策略

Pluribus使用MCCFR通過(guò)操作將每個(gè)bucket映射到一個(gè)分布。

真實(shí)策略

每個(gè)方案都根據(jù)其bucket的抽象策略映射到操作上的分布。

對(duì)于大型復(fù)雜的游戲,狀態(tài)和動(dòng)作的抽象可以用來(lái)抑制搜索樹(shù)的增長(zhǎng)。這對(duì)于完整的六人無(wú)限德州撲克游戲來(lái)說(shuō)是必要的,因?yàn)榈聯(lián)涮^(guò)復(fù)雜而無(wú)法直接搜索。

相反,如上面的示意圖所示,Pluribus模擬了一個(gè)更簡(jiǎn)單的游戲版本,將類似的決策點(diǎn)組合在一起,并消除了一些操作。

“賭神”AI訓(xùn)練只需144美元

最后,Pluribus的blueprint策略是在64核服務(wù)器上在8天內(nèi)計(jì)算出來(lái)的,總共使用了12400個(gè)CPU核心小時(shí),所需內(nèi)存小于512 GB。按照當(dāng)前的云計(jì)算費(fèi)用,這花費(fèi)了大約144美元。

這與最近其他所有的超級(jí)AI里程碑游戲形成了鮮明的對(duì)比,那些AI使用了大量的服務(wù)器和/或GPU集群。更多的內(nèi)存和計(jì)算可以支持更細(xì)粒度的blueprint,這將帶來(lái)更好的性能,但也會(huì)導(dǎo)致Pluribus使用更多內(nèi)存或在實(shí)時(shí)搜索變慢。

研究人員將blueprint策略抽象的大小設(shè)置為允許Pluribus在一臺(tái)內(nèi)存不超過(guò)128GB的機(jī)器上實(shí)時(shí)運(yùn)行,同時(shí)在內(nèi)存中存儲(chǔ)blueprint策略的壓縮形式。

由于無(wú)限德州撲克的規(guī)模和復(fù)雜性,整個(gè)游戲的blueprint 策略必然是粗粒度的。Pluribus只在第一輪投注(四次投注)中根據(jù)這個(gè)blueprint策略進(jìn)行操作,其中決策點(diǎn)的數(shù)量足夠少,以至于blueprint策略可以不使用信息抽象,并且在操作抽象中進(jìn)行了很多操作。

在第一輪之后(甚至在第一輪中,如果對(duì)手選擇的賭注大小與blueprint action抽象中的大小完全不同),Pluribus將進(jìn)行實(shí)時(shí)搜索,以確定針對(duì)當(dāng)前情況的更好、更細(xì)粒度的策略。

結(jié)論

self play 的形式與搜索的形式相結(jié)合,在完全信息的二人零和博弈中取得了許多引人注目的成功。然而,現(xiàn)實(shí)世界中的大多數(shù)戰(zhàn)略交互都包含隱藏的信息和兩個(gè)以上的參與者。這使得這個(gè)問(wèn)題在理論和實(shí)踐上都有很大的不同和困難。

為多人德?lián)溟_(kāi)發(fā)一個(gè)超級(jí)AI是該領(lǐng)域的一個(gè)公認(rèn)的里程碑。在本文中,我們描述了Pluribus,一個(gè)AI,能夠在六人無(wú)限注德州撲克中擊敗人類專業(yè)玩家。

Pluribus的成功表明,盡管對(duì)多人博弈的性能缺乏已知的強(qiáng)有力的理論保證,但仍存在大規(guī)模、復(fù)雜的多人博弈不完全信息設(shè)置,在這種情況下,精心構(gòu)造的self play搜索算法可以生成超越人類的策略。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31449

    瀏覽量

    223677
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4806

    瀏覽量

    98564
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1432

    瀏覽量

    59356

原文標(biāo)題:Science封面重磅:CMU、Facebook聯(lián)合打造“賭神”AI,六人德?lián)鋼魯∪祟?/p>

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    與施瓦茨和KT聯(lián)合演示AI增強(qiáng)的無(wú)線傳輸性能

    在6G AI概念驗(yàn)證聯(lián)合演示中,羅與施瓦茨(以下簡(jiǎn)稱“R&S”)CMX500一體化測(cè)試儀顯示基于AI的無(wú)線傳輸相比傳統(tǒng)技術(shù)可顯著提升下行吞吐量。演示還直觀展現(xiàn)了這一性能提升如何改善視
    的頭像 發(fā)表于 03-16 11:28 ?1472次閱讀
    羅<b class='flag-5'>德</b>與施瓦茨和KT<b class='flag-5'>聯(lián)合</b>演示<b class='flag-5'>AI</b>增強(qiáng)的無(wú)線傳輸性能

    論馬斯克的預(yù)言:AI使人類邊緣化

    當(dāng)?shù)貢r(shí)間3月11日,在“Abundance Summit”科技峰會(huì)上,馬斯克談及AI進(jìn)展時(shí)表示,AI已經(jīng)進(jìn)入自我改進(jìn)階段,在超高量級(jí)AI面前,人類終將走向邊緣化。以下是對(duì)這一預(yù)言的相關(guān)
    發(fā)表于 03-14 05:27

    天津聯(lián)通聯(lián)合華為成功打造全國(guó)首個(gè)AI×寬上行樣板點(diǎn)

    近日,在天津通管局和中國(guó)聯(lián)通集團(tuán)的指導(dǎo)下,中國(guó)聯(lián)通天津分公司(簡(jiǎn)稱“天津聯(lián)通”)聯(lián)合華為在北辰園區(qū)成功打造全國(guó)首個(gè)“AI×寬上行”樣板點(diǎn)。實(shí)測(cè)數(shù)據(jù)顯示,居民樓內(nèi)深度覆蓋提升14dB,小區(qū)邊緣上行
    的頭像 發(fā)表于 02-09 15:35 ?713次閱讀

    賽西威推出機(jī)器智能基座AI Cube

    近日,賽西威正式發(fā)布機(jī)器智能基座AI Cube,該產(chǎn)品是面向機(jī)器領(lǐng)域的AI計(jì)算終端,集成了業(yè)界領(lǐng)先的高性能計(jì)算平臺(tái)、中間件與算法框架。
    的頭像 發(fā)表于 11-05 18:05 ?2765次閱讀

    軟通智慧與華為打造AI+產(chǎn)業(yè)園區(qū)聯(lián)合解決方案

    一站式“行業(yè)+AI”解決方案,讓服務(wù)更精準(zhǔn)、決策更高效、治理更智能。本期將重點(diǎn)呈現(xiàn)軟通智慧與華為共同打造AI+產(chǎn)業(yè)園區(qū)聯(lián)合解決方案,讓我們一起見(jiàn)證
    的頭像 發(fā)表于 10-24 09:25 ?1229次閱讀
    軟通智慧與華為<b class='flag-5'>打造</b><b class='flag-5'>AI</b>+產(chǎn)業(yè)園區(qū)<b class='flag-5'>聯(lián)合</b>解決方案

    南京微雀與華為打造法律AI一體機(jī)聯(lián)合解決方案

    一站式“行業(yè)+AI”解決方案,讓服務(wù)更精準(zhǔn)、決策更高效、治理更智能。本期將重點(diǎn)呈現(xiàn)南京微雀與華為共同打造的法律AI一體機(jī)聯(lián)合解決方案,讓我們一起見(jiàn)證
    的頭像 發(fā)表于 10-24 09:23 ?1200次閱讀
    南京微雀與華為<b class='flag-5'>打造</b>法律<b class='flag-5'>AI</b>一體機(jī)<b class='flag-5'>聯(lián)合</b>解決方案

    新點(diǎn)軟件與華為打造政務(wù)智能助手聯(lián)合解決方案

    一站式“行業(yè)+AI”解決方案,讓服務(wù)更精準(zhǔn)、決策更高效、治理更智能。本期將重點(diǎn)呈現(xiàn)新點(diǎn)軟件與華為共同打造的政務(wù)智能助手聯(lián)合解決方案,讓我們一起見(jiàn)證AI大模型在政務(wù)服務(wù)場(chǎng)景中的創(chuàng)新實(shí)踐與
    的頭像 發(fā)表于 10-24 09:21 ?1093次閱讀
    新點(diǎn)軟件與華為<b class='flag-5'>打造</b>政務(wù)智能助手<b class='flag-5'>聯(lián)合</b>解決方案

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    AI被賦予了的智能,科學(xué)家們希望在沒(méi)有人類的引導(dǎo)下,AI自主的提出科學(xué)假設(shè),諾貝爾獎(jiǎng)級(jí)別的假設(shè)哦。 AI驅(qū)動(dòng)科學(xué)被認(rèn)為是科學(xué)發(fā)現(xiàn)的第五個(gè)范
    發(fā)表于 09-17 11:45

    地圖攜手夸克AI眼鏡開(kāi)啟出行新方式

    而高地圖與夸克AI眼鏡的聯(lián)合創(chuàng)新,不僅為智能眼鏡行業(yè)注入了新的活力,也為整個(gè)出行生態(tài)帶來(lái)了顛覆性變革。
    的頭像 發(fā)表于 08-06 16:35 ?2126次閱讀

    廣汽華為聯(lián)合AI解決方案入選國(guó)際電聯(lián)全球標(biāo)桿案例

    。峰會(huì)期間,ITU正式發(fā)布《人工智能向善:創(chuàng)新擴(kuò)大影響案例集》(AI for Good - Innovate for Impact Report)2025年中期報(bào)告,其中,廣汽集團(tuán)聯(lián)合華為公司共同打造的“
    的頭像 發(fā)表于 07-24 14:34 ?1487次閱讀

    云深處科技利用Arm架構(gòu)打造AI機(jī)器

    設(shè)想未來(lái),機(jī)器能像動(dòng)物一樣敏捷地穿越崎嶇地形,處理危險(xiǎn)或重復(fù)性的任務(wù),例如檢查受損電線或搜尋災(zāi)后廢墟,人類將無(wú)需身涉險(xiǎn)境。云深處科技 (DEEP Robotics) 的四足機(jī)器已在工業(yè)巡檢和緊急
    的頭像 發(fā)表于 07-03 14:40 ?1581次閱讀

    北京建工建集團(tuán)與軟通動(dòng)力達(dá)成戰(zhàn)略合作

    ,通過(guò)資源互補(bǔ)與聯(lián)合創(chuàng)新,攜手推動(dòng)建筑行業(yè)數(shù)智化轉(zhuǎn)型升級(jí)。儀式上,雙方聯(lián)合打造的“放線智能機(jī)器”一代機(jī)正式亮相。
    的頭像 發(fā)表于 06-30 16:26 ?1004次閱讀

    NVIDIA攜手諾和諾借助AI加速藥物研發(fā)

    NVIDIA 宣布與諾和諾開(kāi)展合作,借助創(chuàng)新 AI 應(yīng)用加速藥物研發(fā)。此次合作也將支持諾和諾與丹麥 AI 創(chuàng)新中心 (DCAI) 關(guān)于使用 Gefion
    的頭像 發(fā)表于 06-12 15:49 ?1490次閱讀

    大象機(jī)器攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開(kāi)源軸機(jī)械臂產(chǎn)品

    全球80多個(gè)國(guó)家和地區(qū)。近日,大象機(jī)器聯(lián)合進(jìn)迭時(shí)空推出全球首款RISC-V全棧開(kāi)源軸機(jī)器臂“myCobot280RISC-V”,為開(kāi)發(fā)者打造全新的機(jī)器
    的頭像 發(fā)表于 06-06 16:55 ?1680次閱讀
    大象機(jī)器<b class='flag-5'>人</b>攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開(kāi)源<b class='flag-5'>六</b>軸機(jī)械臂產(chǎn)品

    地圖攜手雷鳥(niǎo)創(chuàng)新打造新一代AI+AR智能導(dǎo)航解決方案

    近日,高地圖與雷鳥(niǎo)創(chuàng)新RayNeo宣布達(dá)成戰(zhàn)略合作,雙方將深度融合人工智能體和空間交互等前沿技術(shù)框架,共同打造新一代AI+AR智能導(dǎo)航解決方案。此次合作,標(biāo)志著高空間計(jì)算引擎進(jìn)一步
    的頭像 發(fā)表于 05-26 16:01 ?866次閱讀

    孟州市| 荣成市| 平昌县| 麻江县| 呈贡县| 神农架林区| 旬阳县| 兴业县| 婺源县| 鄂伦春自治旗| 巴林右旗| 威海市| 天镇县| 大理市| 青州市| 新巴尔虎右旗| 洪洞县| 贡嘎县| 全南县| 正蓝旗| 保山市| 潍坊市| 尼勒克县| 新津县| 铁岭市| 新丰县| 河北省| 成武县| 台南市| 巨野县| 陆良县| 阜城县| 繁昌县| 海南省| 囊谦县| 新巴尔虎右旗| 云南省| 台南县| 安吉县| 嘉鱼县| 弥渡县|