在线免费黄色AV网站,熟女三区亚洲

長期以來，AI的目標(biāo)就是準(zhǔn)確地描述圖像，而不僅僅是像笨拙的機(jī)器人。谷歌在2016年表示，其人工智能可以為人類提供幾乎與人類一樣的字幕圖像，準(zhǔn)確度達(dá)到94%?，F(xiàn)在，微軟表示，它走得更遠(yuǎn)：它的研究人員建立了一個(gè)AI系統(tǒng)，甚至比人類更準(zhǔn)確-以至于現(xiàn)在坐上了榜首的nocaps圖像字幕標(biāo)桿。微軟聲稱其自2015年以來一直使用的圖像字幕模型要好兩倍。

盡管這本身就是一個(gè)顯著的里程碑，但微軟不僅僅是將這項(xiàng)技術(shù)保留在自己手中。現(xiàn)在，它作為Azure認(rèn)知服務(wù)的一部分提供了新的字幕模型，因此任何開發(fā)人員都可以將其引入他們的應(yīng)用程序中。今天，它也可以在Seeing AI中使用，Seeing AI是面向盲人和視障用戶的Microsoft應(yīng)用程序，可以描述周圍的世界。今年下半年，字幕模型還將改善您在PowerPoint中針對(duì)Web，Windows和Mac的演示文稿。它還會(huì)在桌面平臺(tái)的Word和Outlook中彈出。

Azure AI的CVP Eric Boyd在接受Engadget采訪時(shí)說：“圖像捕獲是AI中最難的問題之一。它不僅代表理解場景中的對(duì)象，還包括它們之間的交互方式，以及如何描述它們?！本?xì)的字幕技術(shù)可以為每個(gè)用戶提供幫助：它使在搜索引擎中查找所需圖像變得更加容易;對(duì)于視障用戶，它可以使瀏覽網(wǎng)絡(luò)和軟件變得更加出色。

看到公司吹捧他們的AI研究創(chuàng)新并不少見，但是將這些發(fā)現(xiàn)迅速部署到運(yùn)輸產(chǎn)品中卻很少見。Azure AI認(rèn)知服務(wù)的CTO Huang Xuedong出于對(duì)用戶的潛在好處，推動(dòng)將其迅速集成到Azure中。他的團(tuán)隊(duì)使用標(biāo)記有特定關(guān)鍵字的圖像對(duì)模型進(jìn)行了訓(xùn)練，這有助于使它成為大多數(shù)AI框架所沒有的視覺語言。通常，這些類型的模型是使用圖像和完整標(biāo)題訓(xùn)練的，這使得模型更難于學(xué)習(xí)特定對(duì)象的交互方式。

“視覺詞匯預(yù)訓(xùn)練本質(zhì)上是訓(xùn)練系統(tǒng)所需的教育;我們正在嘗試教育這種運(yùn)動(dòng)記憶，”黃在博客文章中說。這就是這種新模型在nocaps基準(zhǔn)測試中的優(yōu)勢(shì)，該基準(zhǔn)測試側(cè)重于確定AI可以如何為字幕創(chuàng)建字幕，這些字幕從未見過。

但是，盡管要打破基準(zhǔn)很重要，但微軟新模型的真正考驗(yàn)將是它在現(xiàn)實(shí)世界中的功能。據(jù)博伊德說，Seeing AI開發(fā)人員Saqib Shaik也在自己的盲人手中推動(dòng)了Microsoft的更大可訪問性，他說這是對(duì)他們先前產(chǎn)品的巨大改進(jìn)。既然微軟已經(jīng)設(shè)定了一個(gè)新的里程碑，那么有趣的是，看看來自Google和其他研究人員的競爭模型也將如何競爭。

責(zé)任編輯：lq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

微軟

微軟

+關(guān)注

關(guān)注
4

文章
6752

瀏覽量
108081
機(jī)器人

機(jī)器人

+關(guān)注

關(guān)注
213

文章
31442

瀏覽量
223647
AI

AI

+關(guān)注

關(guān)注
91

文章
41107

瀏覽量
302589

哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

搜索歷史

圖像捕獲是AI中最難的問題之一

評(píng)論