吳恩達(dá)一生中有很多頭銜,你也許知道他是谷歌大腦團(tuán)隊(duì)的創(chuàng)始人,或者是百度的前首席科學(xué)家。你也許是上過(guò)他的課,通過(guò)廣受歡迎的在線課程,他向無(wú)數(shù)學(xué)生、好奇的聽(tīng)眾和商業(yè)領(lǐng)袖傳授了機(jī)器學(xué)習(xí)的原理。
目前,他在 2017 年創(chuàng)立的最新創(chuàng)業(yè)項(xiàng)目 Landing AI 中,探索沒(méi)有龐大數(shù)據(jù)集可供利用的企業(yè)如何加入 AI 革命。
3 月 23 日,吳恩達(dá)在《麻省理工技術(shù)評(píng)論》的虛擬 EmTech Digital 峰會(huì)上分享了他的經(jīng)驗(yàn)教訓(xùn)。
《麻省理工技術(shù)評(píng)論》:我敢肯定人們經(jīng)常問(wèn)你:“怎么建立一個(gè)以 AI 為先的企業(yè)呢?”你通常會(huì)怎么回答呢?
吳恩達(dá):我通常會(huì)說(shuō):“不要那樣做”。如果我在帶一個(gè)團(tuán)隊(duì),就會(huì)說(shuō):“嘿,大家請(qǐng)以人工智能為先” ,團(tuán)隊(duì)就會(huì)把重點(diǎn)放在技術(shù)上,這也許對(duì)一個(gè)研究實(shí)驗(yàn)室來(lái)說(shuō)挺好的。但做生意時(shí),我一般是以客戶或任務(wù)為導(dǎo)向,幾乎沒(méi)有以技術(shù)為導(dǎo)向過(guò)。
《麻省理工技術(shù)評(píng)論》:你建立了這個(gè)叫作 Landing AI 的新創(chuàng)業(yè)項(xiàng)目。你能告訴我們這個(gè)項(xiàng)目是什么嗎?以及你為什么選擇做這個(gè)項(xiàng)目?
吳恩達(dá):在谷歌和百度帶過(guò) AI 團(tuán)隊(duì)后,我意識(shí)到 AI 已經(jīng)改變了消費(fèi)類軟件互聯(lián)網(wǎng),比如網(wǎng)絡(luò)搜索和在線廣告,但我想把 AI 運(yùn)用到其他所有行業(yè),這在經(jīng)濟(jì)中占更大比重。
所以在研究了很多不同行業(yè)之后,我決定從制造業(yè)下手。我覺(jué)得很多行業(yè)已經(jīng)具備了創(chuàng)建 AI 的條件,但一個(gè)行業(yè)創(chuàng)建 AI 條件更成熟的一個(gè)模式就是它正在經(jīng)歷數(shù)字轉(zhuǎn)型,這樣就會(huì)有一些數(shù)據(jù),這為 AI 團(tuán)隊(duì)利用數(shù)據(jù)創(chuàng)造價(jià)值提供了機(jī)會(huì)。
我最近很感興趣的一個(gè)項(xiàng)目是制造視覺(jué)檢測(cè),看著從生產(chǎn)線上下來(lái)的智能手機(jī)的圖片,你能看出圖片有沒(méi)有缺陷呢?或者能看出汽車(chē)部件上有沒(méi)有凹痕呢?
一個(gè)巨大的區(qū)別是在消費(fèi)類軟件互聯(lián)網(wǎng)上,也許你有 10 億用戶和大量的數(shù)據(jù)。但在制造業(yè),沒(méi)有一家工廠生產(chǎn)過(guò) 10 億部甚至 100 萬(wàn)部刮花的智能手機(jī)。所以挑戰(zhàn)是你能用 AI 處理 100 張圖像嗎?
事實(shí)證明,你可以做到,用少量的數(shù)據(jù)就可以做這么多事情,我每次都驚嘆不已。所以,盡管所有圍繞 AI 的宣傳、熱度和公關(guān)都是以巨大的數(shù)據(jù)集為賣(mài)點(diǎn),但我覺(jué)得我們也還有很大的發(fā)展空間來(lái)開(kāi)創(chuàng)其他挑戰(zhàn)大不相同的應(yīng)用程序。
《麻省理工技術(shù)評(píng)論》:你是怎么運(yùn)營(yíng)這個(gè)項(xiàng)目的?
吳恩達(dá):我看到首席執(zhí)行官和首席信息官經(jīng)常犯的一個(gè)錯(cuò)誤是,他們對(duì)我說(shuō):“嘿,安德魯,我們沒(méi)有那么多數(shù)據(jù),我的數(shù)據(jù)一團(tuán)糟。所以給我兩年時(shí)間來(lái)建立一個(gè)完善的 IT 基礎(chǔ)設(shè)施,這樣我們就有了構(gòu)建 AI 所需的海量數(shù)據(jù)?!蔽铱偦卮鸬溃骸斑@是錯(cuò)的。別這么做。”
首先,我認(rèn)為當(dāng)今世界上沒(méi)有一家公司,甚至是科技巨頭會(huì)覺(jué)得他們的數(shù)據(jù)是完美無(wú)瑕的,這是一個(gè)過(guò)程。而花 2-3 年時(shí)間構(gòu)建一個(gè)漂亮的數(shù)據(jù)基礎(chǔ)設(shè)施,意味著你沒(méi)有 AI 團(tuán)隊(duì)的反饋,來(lái)幫助你優(yōu)先考慮要構(gòu)建什么樣的 IT 基礎(chǔ)設(shè)施。
例如,如果你有很多用戶,你是否應(yīng)該優(yōu)先給他們做調(diào)查問(wèn)卷來(lái)獲得更多數(shù)據(jù)?或者在工廠里,你是否應(yīng)該優(yōu)先升級(jí)傳感器,從記錄每秒 10 次震動(dòng)到每秒 100 次震動(dòng)?通常情況下,在開(kāi)始 AI 項(xiàng)目時(shí),你掌握的數(shù)據(jù)能夠讓 AI 團(tuán)隊(duì)給你提供反饋,幫助你優(yōu)先考慮還要收集哪些數(shù)據(jù)。
在不具備消費(fèi)類軟件互聯(lián)網(wǎng)規(guī)模的行業(yè),我覺(jué)得我們需要從大數(shù)據(jù)轉(zhuǎn)向優(yōu)質(zhì)數(shù)據(jù)。如果你有一百萬(wàn)張圖片,那就用吧。但使用小得多、標(biāo)簽清晰、精心整理的數(shù)據(jù)集就會(huì)出現(xiàn)很多問(wèn)題。
《麻省理工技術(shù)評(píng)論》:你能舉個(gè)例子嗎?你說(shuō)的優(yōu)質(zhì)數(shù)據(jù)是什么意思?
吳恩達(dá):我先舉一個(gè)語(yǔ)音識(shí)別的例子,我在使用語(yǔ)音搜索時(shí),會(huì)聽(tīng)到有人說(shuō),“嗯,今天的天氣”的音頻片段,問(wèn)題是這個(gè)音頻片段該怎么正確轉(zhuǎn)錄呢?是“嗯,今天的天氣”,還是“嗯、、、今天的天氣”呢?抑或是“嗯”這個(gè)詞我們沒(méi)抄下來(lái)?
其實(shí)這三種都可以,但不同的轉(zhuǎn)錄器用這三種標(biāo)記方式就有問(wèn)題了,這樣數(shù)據(jù)就會(huì)有噪音,損害語(yǔ)音識(shí)別系統(tǒng)?,F(xiàn)在,你有數(shù)百萬(wàn)或 10 億用戶時(shí),就可以把那些噪音數(shù)據(jù)平均分配一下——學(xué)習(xí)算法就可以很好做到這一點(diǎn)。但如果你的數(shù)據(jù)集比較小的話,如 100 個(gè)例子,那這類噪音數(shù)據(jù)會(huì)讓效果大打折扣。
還有一個(gè)是制造業(yè)的例子:我們?cè)阡摬臋z驗(yàn)方面做了很多工作。如果你開(kāi)一輛側(cè)面曾經(jīng)是用鋼板做的車(chē),有時(shí)鋼板上會(huì)有一些小褶皺、小凹痕或斑點(diǎn),你就可以用相機(jī)和計(jì)算機(jī)視覺(jué)來(lái)檢查是否有缺陷。
但不同的貼標(biāo)人員會(huì)對(duì)數(shù)據(jù)進(jìn)行不同的標(biāo)記,有些人會(huì)在整個(gè)區(qū)域周?chē)乓粋€(gè)巨大的限位框,有些人會(huì)在小粒子周?chē)O(shè)置小小的限位框。當(dāng)你的數(shù)據(jù)集很小時(shí),確保不同的質(zhì)檢人員統(tǒng)一標(biāo)記數(shù)據(jù)是最重要的事情之一。
對(duì)很多 AI 項(xiàng)目來(lái)說(shuō),你從 GitHub 上下載的開(kāi)源模型——你可以從文獻(xiàn)中獲得的神經(jīng)網(wǎng)絡(luò)——(這)已經(jīng)夠好了,(雖然)這不能解決所有問(wèn)題,但可以解決主要問(wèn)題。所以我跟我團(tuán)隊(duì)很多人說(shuō),“嘿,大家,神經(jīng)網(wǎng)絡(luò)已經(jīng)夠好了。我們不要再攪亂代碼了。你們現(xiàn)在唯一要做的就是建立流程來(lái)提高數(shù)據(jù)質(zhì)量?!笔聦?shí)證明,這通常能讓算法的性能提高得更快。
《麻省理工技術(shù)評(píng)論》:你提到較小的數(shù)據(jù)集時(shí),是指多大的數(shù)據(jù)?一百個(gè)例子?還是十個(gè)例子?
吳恩達(dá):機(jī)器學(xué)習(xí)太多樣化了,很難給出一刀切的答案。我曾經(jīng)處理過(guò)有 2 億到 3 億張圖片的問(wèn)題,也處理過(guò)只有 10 張圖片的問(wèn)題,以及介于這兩者之間的我也都處理過(guò)。我觀察制造業(yè)應(yīng)用程序時(shí),我認(rèn)為一個(gè)缺陷類有幾十或上百個(gè)圖像是很正常的,但即使在工廠內(nèi)部也有很大的差異。
我確實(shí)發(fā)現(xiàn),訓(xùn)練集的規(guī)模低于比如說(shuō) 10000 個(gè)例子時(shí),AI 實(shí)踐就會(huì)切換,因?yàn)檫@是一個(gè)閾值,工程師基本可以查看每個(gè)例子,自己設(shè)計(jì)、然后做出決定。
最近,我和一位非常出色、在一家大型科技公司工作的工程師聊天。我問(wèn)他:“嘿,如果標(biāo)簽不一致的話你會(huì)怎么辦?”他回答道:“嗯,我們?cè)诤M庥袔装偃说膱F(tuán)隊(duì)做標(biāo)簽,所以我會(huì)寫(xiě)下標(biāo)簽說(shuō)明,讓三個(gè)人給每張圖片貼上標(biāo)簽,然后我取一個(gè)平均值?!蔽艺f(shuō):“是的,數(shù)據(jù)集很大時(shí)就得這么做?!钡液鸵粋€(gè)較小的團(tuán)隊(duì)合作時(shí),如果標(biāo)簽不一致,我就會(huì)找到這兩個(gè)意見(jiàn)不一致的人,讓他們打一個(gè) Zoom 視頻電話,互相交談一下,試圖達(dá)成一個(gè)解決方案。
《麻省理工技術(shù)評(píng)論》:現(xiàn)在我想請(qǐng)你談?wù)剬?duì)一般 AI 產(chǎn)業(yè)的看法。我收集了我們讀者想問(wèn)你的問(wèn)題。一位讀者問(wèn)道:AI 的發(fā)展似乎主要分兩種方向,一種是學(xué)術(shù)研究,一種是大規(guī)模、資源密集型的大公司項(xiàng)目,如 OpenAI 和 DeepMind。這并沒(méi)有給小型創(chuàng)業(yè)公司留下太多的空間。你認(rèn)為小公司可以關(guān)注哪些實(shí)際問(wèn)題來(lái)推動(dòng) AI 的真正商業(yè)應(yīng)用呢?
吳恩達(dá):我認(rèn)為很多媒體都把注意力放在大公司上,有時(shí)也放在大型學(xué)術(shù)機(jī)構(gòu)上。但如果你參加學(xué)術(shù)會(huì)議,就會(huì)發(fā)現(xiàn)很多工作是由小型研究小組和研究實(shí)驗(yàn)室完成的。我和不同公司各行各業(yè)的人士交談時(shí),我覺(jué)得他們可以利用 AI 來(lái)解決很多商業(yè)應(yīng)用問(wèn)題。我通常去問(wèn)商業(yè)領(lǐng)袖:“你們最大的商業(yè)問(wèn)題是什么?你最擔(dān)心的事情是什么?”這樣我就能更好理解企業(yè)的目標(biāo),然后集思廣益是否有 AI 解決方案,有時(shí)找不到解決方案的話,那也沒(méi)關(guān)系。
也許我要提幾個(gè)我覺(jué)得興奮的差異,我認(rèn)為今天構(gòu)建 AI 系統(tǒng)仍然需要大量的手工操作。你有一些聰明的機(jī)器學(xué)習(xí)工程師和數(shù)據(jù)科學(xué)家在計(jì)算機(jī)上做事情,然后把事情推向生產(chǎn),在這個(gè)過(guò)程中有很多手動(dòng)步驟。因此,我對(duì) ML Ops(機(jī)器學(xué)習(xí)操作)感到興奮,因?yàn)檫@是一門(mén)新興學(xué)科,有助于讓構(gòu)建和部署 AI 系統(tǒng)的過(guò)程更加系統(tǒng)化。
此外,如果你看看許多典型的商業(yè)問(wèn)題(從營(yíng)銷(xiāo)到人才)的所有職能,就會(huì)發(fā)現(xiàn)自動(dòng)化和效率提高的空間很大。
我也希望 AI 社區(qū)能夠關(guān)注最大的社會(huì)問(wèn)題,看看我們能為氣候變化、無(wú)家可歸或貧困做些什么。除了有時(shí)非常有價(jià)值的商業(yè)問(wèn)題,我們也應(yīng)該致力于最大的社會(huì)問(wèn)題。
《麻省理工技術(shù)評(píng)論》:你如何確定是否有機(jī)會(huì)在你的企業(yè)中進(jìn)行機(jī)器學(xué)習(xí)呢?
吳恩達(dá):我會(huì)試著自己學(xué)習(xí)一些商業(yè)知識(shí),也會(huì)試著幫助商業(yè)領(lǐng)袖學(xué)習(xí)一些有關(guān) AI 的知識(shí),然后我們通常會(huì)集思廣益一組項(xiàng)目,對(duì)于每個(gè)想法,我會(huì)同時(shí)在技術(shù)和業(yè)務(wù)上作出努力。我們將著眼于:你是否有足夠的數(shù)據(jù)?精度是多少?您將其部署到生產(chǎn)環(huán)境中時(shí),是否存在長(zhǎng)尾現(xiàn)象?你如何填充數(shù)據(jù),為持續(xù)學(xué)習(xí)形成閉合回路?所以要確保問(wèn)題在技術(shù)上是可行的。然后是商業(yè)方面做出的努力:我們要確保這會(huì)實(shí)現(xiàn)我們期待的投資回報(bào)率。在這個(gè)過(guò)程之后,你通常要做這樣的事情,比如評(píng)估資源、里程碑。
另一個(gè)建議是:開(kāi)始要快,這很重要,從小處開(kāi)始也沒(méi)關(guān)系。我在谷歌第一個(gè)有意義的商業(yè)應(yīng)用程序是語(yǔ)音識(shí)別,而不是網(wǎng)絡(luò)搜索或廣告,但幫助谷歌語(yǔ)音團(tuán)隊(duì)提高語(yǔ)音識(shí)別的準(zhǔn)確度,給大腦團(tuán)隊(duì)確立了信譽(yù)以及提供必要的資金去追求更大的合作伙伴。
所以谷歌地圖是我們第二大合作伙伴,我們使用計(jì)算機(jī)視覺(jué),讀取房屋號(hào)碼,在谷歌地圖上定位房屋。只有在前兩個(gè)項(xiàng)目成功之后,我才與廣告團(tuán)隊(duì)好好探討了一下。我想我看到過(guò)很多公司因?yàn)槠鸩教蠖?,這比起步太小而失敗的要多。作為一個(gè)組織,你可以先做一個(gè)較小的項(xiàng)目,了解一下使用AI的感覺(jué),然后再繼續(xù)做大。
《麻省理工技術(shù)評(píng)論》:為了在自己的公司里實(shí)現(xiàn) AI,我們的用戶明天應(yīng)該開(kāi)始做一件什么事?
吳恩達(dá):投入。AI 正在改變?cè)S多行業(yè)的格局,所以,如果你的公司還沒(méi)有做出非常浩大和明智的投資,這是一個(gè)好時(shí)機(jī)。
原文標(biāo)題:吳恩達(dá):不要建立AI先行的企業(yè),而要從任務(wù)導(dǎo)向開(kāi)始 | 專訪
文章出處:【微信公眾號(hào):DeepTech深科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
責(zé)任編輯:haq
-
AI
+關(guān)注
關(guān)注
91文章
41107瀏覽量
302589 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
67文章
8564瀏覽量
137222
原文標(biāo)題:吳恩達(dá):不要建立AI先行的企業(yè),而要從任務(wù)導(dǎo)向開(kāi)始 | 專訪
文章出處:【微信號(hào):deeptechchina,微信公眾號(hào):deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
AI大模型微調(diào)企業(yè)項(xiàng)目實(shí)戰(zhàn)課
透過(guò)吳文俊獎(jiǎng),看見(jiàn)中國(guó)AI的產(chǎn)學(xué)研時(shí)刻
硅光成AI勝負(fù)手?英偉達(dá)20億美元戰(zhàn)略投資Marvell
嵌入式AI開(kāi)發(fā)必看:杜絕幻覺(jué),才是工業(yè)級(jí)IDE的核心底氣
恩智浦與英偉達(dá)攜手推出面向先進(jìn)物理AI的創(chuàng)新方案
企業(yè)級(jí)AI Agent王炸! 英偉達(dá)GTC將開(kāi)源 NemoClaw
恩智浦?jǐn)y手COMPREDICT加速邊緣AI在汽車(chē)應(yīng)用落地
恩智浦推出全新eIQ Agentic AI框架
第一線DYXnet:以AI驅(qū)動(dòng)的一體化云網(wǎng)安全,賦能2026新階段企業(yè)升級(jí)
恩智浦受邀出席第七屆全球IC企業(yè)家大會(huì)
恩智浦助力億境虛擬打造新一代AI眼鏡解決方案
繼HBM之后,英偉達(dá)帶火又一AI內(nèi)存模組!顛覆AI服務(wù)器與PC
恩智浦如何實(shí)現(xiàn)負(fù)責(zé)任的邊緣AI
AI智能體對(duì)電子企業(yè)的幫助是什么
吳恩達(dá):不要建立一個(gè)以AI為先的企業(yè)
評(píng)論