哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么AI的翻譯水平還遠(yuǎn)不能和人類相比?

電子工程師 ? 來源:未知 ? 作者:工程師李察 ? 2018-08-18 08:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前一段時間,大家都在熱議 Google 的翻譯系統(tǒng)出現(xiàn)了一些相當(dāng)奇怪的結(jié)果,例如下圖呈現(xiàn)的是最被大家談及的一個翻譯結(jié)果。

后來 Google 發(fā)言人也對包括數(shù)據(jù)在內(nèi)等因素做出了解釋(“這只是一個將無意義的話語輸入系統(tǒng)然后產(chǎn)生無意義輸出的功能”),隨后界內(nèi)一些技術(shù)人員也發(fā)表了分析與評論,表示這可能與 Google 采用的 NMT(神經(jīng)機(jī)器翻譯) 技術(shù)有關(guān)。

然而經(jīng)過這一系列事件過后,大家又重新開始思考一個問題:AI 的翻譯水平真的已經(jīng)可以和人類媲美了嗎?而本文的作者從 NMT 技術(shù)出發(fā),分析了這項(xiàng)技術(shù)仍存在的問題,給出了自己明確的態(tài)度及答案:AI的翻譯水平還遠(yuǎn)不能和人類相比。

最近,諸多媒體都報道了有關(guān)人工智能的翻譯已經(jīng)可以達(dá)到人類譯者水平的新聞,如:

The Verge – Google's AI translation system is approaching human-level accuracy

The Verge – 谷歌 AI 翻譯系統(tǒng)的準(zhǔn)確度趨近于人類

Quartz – AI-based translation to soon reach human levels

Quartz – 基于人工智能的翻譯即將達(dá)到人類水平

ZDNet - Microsoft researchers match human levels in translation news from Chinese to English

ZDNet - 微軟研究員表示,機(jī)器翻譯中文新聞的水平可與人類匹敵

這一顯著突破源于神經(jīng)機(jī)器翻譯(Neural Machine Translation, NMT)的出現(xiàn),該方法使用神經(jīng)網(wǎng)絡(luò)來進(jìn)行機(jī)器翻譯。這項(xiàng)技術(shù)應(yīng)用起來非常出色,是因?yàn)樗刑幚泶笠?guī)模翻譯數(shù)據(jù)的能力。谷歌、Facebook 等大型科技公司在過去幾年都引入了 NMT,并開發(fā)出了較高水平的翻譯功能。

一個例子:引入 NMT 后,谷歌翻譯的水平有明顯提升

但 NMT 系統(tǒng)真的可以像上述題目說的那樣,已經(jīng)可以和人類譯者相比了嗎?還差得遠(yuǎn)呢。我們發(fā)現(xiàn),目前的 NMT 系統(tǒng)并沒有他們所說的那么好用,他們忽視了翻譯中的許多關(guān)鍵問題。

什么是 NMT?

NMT 在整個 AI 領(lǐng)域中的位置

機(jī)器翻譯(MT)是 AI 的一個分支,它致力于通過軟件來進(jìn)行不同語言之間的翻譯。神經(jīng)機(jī)器翻譯(NMT)是一種較新穎的方法,它利用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)機(jī)器翻譯。神經(jīng)網(wǎng)絡(luò)可以被訓(xùn)練,對數(shù)據(jù)進(jìn)行模式識別,從而將輸入數(shù)據(jù)轉(zhuǎn)換為我們所需要的形式。接下來,我們看一個有關(guān) NMT 系統(tǒng)的例子:

一個例子:將法語翻譯成英語,引入 NMT 后質(zhì)量有所提高

如果要將一句法語翻譯成英語,NMT 的執(zhí)行過程如下:先把需要翻譯的法語句子輸入網(wǎng)絡(luò),其中每個單詞都會被編碼成由數(shù)字組成的向量,這樣網(wǎng)絡(luò)才能對其進(jìn)行處理。接下來,這些數(shù)字經(jīng)過一系列數(shù)學(xué)公式的計算,最終生成一個新的數(shù)字序列,這個序列就代表了要輸出的英文句子。

除了上述過程,在實(shí)際情況中,還有幾個重要步驟:

在進(jìn)行翻譯前,人類工程師需要決定網(wǎng)絡(luò)的具體結(jié)構(gòu);

工程師若要運(yùn)行這樣的網(wǎng)絡(luò),需要使用具備強(qiáng)大處理能力的計算機(jī);

網(wǎng)絡(luò)需要基于大量的語料數(shù)據(jù),進(jìn)行反復(fù)訓(xùn)練,才能具備合格的翻譯水平;

最后,在測試 NMT 系統(tǒng)過程中,工程師要使用訓(xùn)練數(shù)據(jù)集中沒有的語句進(jìn)行測試,以確保系統(tǒng)在處理外部數(shù)據(jù)時也能正常工作。
強(qiáng)大的神經(jīng)網(wǎng)絡(luò)來源于強(qiáng)大的數(shù)據(jù)

引入海量數(shù)據(jù)后,深度神經(jīng)網(wǎng)絡(luò)的表現(xiàn)超過了其他模型

神經(jīng)網(wǎng)絡(luò)近期獲得的成功源于大規(guī)模數(shù)據(jù)的出現(xiàn)。當(dāng)有了足夠多的數(shù)據(jù)作支撐,深度神經(jīng)網(wǎng)絡(luò)的提升尤為明顯。同時,網(wǎng)絡(luò)達(dá)到足夠的深度,NMT 系統(tǒng)翻譯的語句相比于過去技術(shù)翻譯的結(jié)果也更為流暢。這里的“流暢”是指,輸出的文本不會過于生硬,甚至有時候會被認(rèn)為是人工翻譯的結(jié)果。

NMT 存在什么問題?

回想文章開頭提到的幾個題目 -- NMT 聽起來極其卓越,但它真的可以與人工翻譯相比嗎?根本不可能。事實(shí)上,與人類相比 NMT 在很多方面都存在缺陷。

這些缺陷可歸為三類:可靠性、記憶力和判斷力。

可靠性:這可能是最令人擔(dān)憂的一點(diǎn),NMT 翻譯并不可靠。NMT 系統(tǒng)無法保證準(zhǔn)確度,常常出現(xiàn)漏掉否定詞、整個單詞甚至整個短語的情況。

記憶力:NMT 系統(tǒng)還有嚴(yán)重的短期記憶缺陷。目前,我們所建立的系統(tǒng)每次只能翻譯一句話,導(dǎo)致其忽略了上文中可能包含的信息。

判斷力:NMT 系統(tǒng)對外部的信息與知識幾乎沒有判斷能力。對翻譯工作來說,把握一段內(nèi)容在特定語境中的理解是很重要的,但對機(jī)器來說這很難做到。

在接下來的內(nèi)容里,我會闡述有關(guān)這三個缺陷的細(xì)節(jié)。

可靠性

NMT 無法檢查其輸出的信息是否真實(shí)。例如,NMT 系統(tǒng)可能漏掉否定詞或整段信息。這些錯誤會導(dǎo)致什么后果呢?

“The US did not attack the EU! Nothing to fear,”

這是著名報紙 Le Monde 中用法語報道的內(nèi)容,然后機(jī)器翻譯成英語的結(jié)果是:

“The US attacked the EU! Fearless.”

試想象,如果這樣錯誤的翻譯遍布互聯(lián)網(wǎng),在假新聞病毒式傳播之前我們來得及更正嗎?令人沮喪的是,這樣的災(zāi)難幾乎無法挽回。

▌記憶力

當(dāng)前的 NMT 系統(tǒng)還有一個明顯的不足:每次只能單獨(dú)翻譯一個句子。這意味著機(jī)器并不知道它們當(dāng)前翻譯的句子之前的內(nèi)容。而作為人類,我們閱讀文章的時候會聯(lián)系上下文。

那么為什么我們在訓(xùn)練 NMT 系統(tǒng)時,每次只用一個句子而不是整段文檔呢?這里面有技術(shù)原因:首先,對神經(jīng)系統(tǒng)來說,讀取一段長文檔,儲存所有信息并快速調(diào)用都很困難;其次,當(dāng)輸入的信息量過大時,系統(tǒng)運(yùn)行的時間也會更長。所以為了提高效率,我們在訓(xùn)練過程中都使用了單獨(dú)的語句。

總之,不能聯(lián)系上下文是 NMT 的主要問題,尤其對于翻譯一個故事來說至關(guān)重要。講故事是人類的行為,是創(chuàng)造力、智慧和表達(dá)的結(jié)合,也因此將我們與動物區(qū)分開來。如果 AI 翻譯系統(tǒng)連有條理地翻譯一個故事都做不到,更不用說文法上是否優(yōu)雅,怎么能說它們達(dá)到了人類的水平呢?

▌判斷力

假設(shè)你在讀一篇關(guān)于音樂會的文章,然后使用 NMT 系統(tǒng)把英語翻譯成法語,發(fā)給了你講法語的朋友。在英文原文中,文章記錄了對許多音樂會參與者的采訪,其中包括一位年輕人的感慨:

“I’m a huge metal fan!”

但這句話被翻譯成了:

“Je suis un énorme ventilateur en métal” (“I’m a large ventilator made of metal.”)

在這篇文章中,系統(tǒng)并不知道 "metal fan" 是指熱愛金屬音樂的一類人,直接翻譯成了由金屬制造的通風(fēng)裝置。

這個問題在機(jī)器發(fā)展初期就存在了,但至今無法解決。早在 1958 年的相關(guān)論文中就提到了該問題,這里有一個經(jīng)典的例子:

The box was in the pen.

對此 NMT 系統(tǒng)會被 "pen" 這個單詞困擾:它在這里指寫字的工具還是圍欄呢?

對 NMT 系統(tǒng)來說,關(guān)于世界的常識知識對翻譯來說尤為重要。然而,對這些知識全部進(jìn)行編碼以及從大量數(shù)據(jù)中提取都是很困難的。我們需要一個有自主判斷力的機(jī)制,并將常識知識引入到神經(jīng)網(wǎng)絡(luò)中。

什么是好的翻譯?

我們應(yīng)該如何評估機(jī)器翻譯系統(tǒng)的水平?目前,最常用的方法是 BLEU score。我們把機(jī)器翻譯出的內(nèi)容與人工翻譯的內(nèi)容做對比,分別計算其 BLEU 分?jǐn)?shù)。如果機(jī)器翻譯結(jié)果中的單詞和短語與人工的結(jié)果相似度很高,那么系統(tǒng)就會得到較高的 BLEU 分?jǐn)?shù)。

BLEU score 是一種簡單卻有效的翻譯評估方法,尤其在評估性能低的系統(tǒng)時。然而研究者發(fā)現(xiàn),BLEU score 也經(jīng)常與人類的觀點(diǎn)不同。這意味著 BLEU 指標(biāo)只能在若干低性能系統(tǒng)中挑選出最佳的一個,而面對性能更好的系統(tǒng)進(jìn)行評估時比較吃力。

相比于 BLEU 評估方法,對翻譯結(jié)果直接進(jìn)行人工評估的方法更加出色,但也并非沒有缺點(diǎn)。關(guān)于人工對機(jī)器翻譯進(jìn)行評估,存在兩個不可忽視的問題:

人工評估不是自動的,所以成本較高且效率低。

人工評估往往會出現(xiàn)分歧。這個問題不僅存在于 BLEU 方法與人類之間,也存在于人類評估者之間。

總地來說,雖然人工評估效果更好,但它需要很高的成本,同時要求盡量不能出錯。進(jìn)一步來說,在將 NMT 系統(tǒng)與人類譯者做對比時,要考慮到評估機(jī)制的限制因素。

我們?nèi)栽诶^續(xù)努力!未來會如何發(fā)展?

NMT 正在飛速發(fā)展,新的進(jìn)步與突破也在被頻繁報道著。新的研究正致力于解決以上提出的所有問題:可靠性、數(shù)據(jù)偏差、無意義輸出、記憶力、對常識的判斷力以及評估標(biāo)準(zhǔn)。

過去幾年,NMT 在表現(xiàn)和效率方面都有所突破。這源于新系統(tǒng)不再需要連續(xù)處理數(shù)據(jù),如按照從左到右或從右到左的順序,從而使我們可以同時訓(xùn)練更多的數(shù)據(jù),最后生成更合理的翻譯結(jié)果。

同時,我們可以期待會有越來越多關(guān)于新研究的報道。哈佛的 OpenNMT -- 一個可用于 LuaTorch、PyTorch 和 Tensorflow 的開源神經(jīng)機(jī)器翻譯工具包,正在迅速融入新的方法,以便于大家可以建立最好的翻譯系統(tǒng)。由前谷歌研究員開發(fā)的新型商業(yè)系統(tǒng) deepL,聲稱已經(jīng)超越谷歌的翻譯系統(tǒng)。這是一個發(fā)展迅速的領(lǐng)域,這也是一個見證 NMT 不斷突破的時代。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6257

    瀏覽量

    111945
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40941

    瀏覽量

    302525
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50290

    瀏覽量

    266842

原文標(biāo)題:為什么AI的翻譯水平還遠(yuǎn)不能和人類相比?

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    不僅僅是硬件!視美泰AI翻譯機(jī)解決方案,為企業(yè)級客戶打造一站式翻譯服務(wù)

    分散管理困難,IT運(yùn)維成本高這是一套完整的AI翻譯機(jī)解決方案視美泰AI翻譯機(jī)解決方案,不是簡單的硬件銷售,而是一套完整的軟硬件一體化產(chǎn)品,包含:方案核心三大件①核心主板——RK3568
    的頭像 發(fā)表于 04-03 14:09 ?1228次閱讀
    不僅僅是硬件!視美泰<b class='flag-5'>AI</b><b class='flag-5'>翻譯</b>機(jī)解決方案,為企業(yè)級客戶打造一站式<b class='flag-5'>翻譯</b>服務(wù)

    亮亮視野聯(lián)合智譜AI推出AR+AI會議翻譯系統(tǒng)

    2026中關(guān)村論壇主會場,亮亮視野(LLVision)聯(lián)合智譜AI推出并部署了全球首創(chuàng)的AR+AI會議翻譯系統(tǒng),為主論壇及多場平行論壇提供大會翻譯保障。這套系統(tǒng)深度融合亮亮視野AR眼鏡
    的頭像 發(fā)表于 03-30 11:39 ?418次閱讀

    論馬斯克的預(yù)言:AI使人類邊緣化

    依據(jù) 馬斯克認(rèn)為AI已進(jìn)入“遞歸式自我改進(jìn)”階段,新一代的AI模型由上一代模型參與訓(xùn)練,人類監(jiān)督的角色正在被邊緣化。他預(yù)計完全自動化的AI自我改進(jìn)可能在2026年底或2027年實(shí)現(xiàn),屆
    發(fā)表于 03-14 05:27

    面對AI降維打擊,陳天橋的全新解法:人類必須“肉身進(jìn)化”

    “堅(jiān)船利炮已經(jīng)出現(xiàn)在地平線上,而我們堅(jiān)持用大刀長矛守港口?!?這是陳天橋在最新文章中對當(dāng)前人類處境的驚人比喻。這里的“堅(jiān)船利炮”,指的是正在爆發(fā)的人工智能。與主流觀點(diǎn)擔(dān)憂AI搶走工作不同,陳天橋
    的頭像 發(fā)表于 01-16 17:11 ?1042次閱讀

    VS680 HDMI AI分析解決方案 #目標(biāo)識別 #視頻翻譯 #AI #芯片

    AI
    深蕾半導(dǎo)體
    發(fā)布于 :2025年11月12日 10:29:33

    如何讓AIoT設(shè)備時刻“智商在線”?移遠(yuǎn)AI太懂了!

    當(dāng)前,AIoT產(chǎn)業(yè)正從“連接驅(qū)動”向“AI驅(qū)動”跨越,設(shè)備的自主“思考決策”能力已成為衡量場景落地價值的關(guān)鍵指標(biāo)。而移遠(yuǎn)通過技術(shù)創(chuàng)新與AI能力,讓“大腦”真正“長”在了終端上,為行業(yè)破局提供了新思路
    的頭像 發(fā)表于 10-31 19:07 ?666次閱讀
    如何讓AIoT設(shè)備時刻“智商在線”?移<b class='flag-5'>遠(yuǎn)</b><b class='flag-5'>AI</b>太懂了!

    聲智科技AI翻譯耳機(jī)重塑智能聽覺體驗(yàn)

    在日益緊密的全球化浪潮中,跨語言溝通的障礙正在被前沿的聲學(xué)AI技術(shù)逐步瓦解。聲智AI翻譯耳機(jī),憑借深厚的聲學(xué)AI積累,率先實(shí)現(xiàn)了“跨語種音色與情感復(fù)刻技術(shù)”在實(shí)時
    的頭像 發(fā)表于 10-21 15:28 ?1132次閱讀
    聲智科技<b class='flag-5'>AI</b><b class='flag-5'>翻譯</b>耳機(jī)重塑智能聽覺體驗(yàn)

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    AI大家都很了解了吧;AGI是什么呢? AGI:通用人工智能,可以再各個應(yīng)用領(lǐng)域都具備AI的處理能力。 AGI可以組成能夠24小時連續(xù)工作的優(yōu)秀員工隊(duì)伍,他們擁有比人類更強(qiáng)的能力和領(lǐng)導(dǎo)力,能夠
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    AI被賦予了人的智能,科學(xué)家們希望在沒有人類的引導(dǎo)下,AI自主的提出科學(xué)假設(shè),諾貝爾獎級別的假設(shè)哦。 AI驅(qū)動科學(xué)被認(rèn)為是科學(xué)發(fā)現(xiàn)的第五個范式了,與實(shí)驗(yàn)科學(xué)、理論科學(xué)、計算科學(xué)、數(shù)據(jù)驅(qū)
    發(fā)表于 09-17 11:45

    聲智科技出席2025年北京市多語種AI語音翻譯大賽

    8月20日,由北京市科委、中關(guān)村管委會主辦,北京語言大學(xué)、北京第二外國語學(xué)院、北京市翻譯協(xié)會、中國人工智能百人會共同承辦的“2025年北京市多語種AI語音翻譯大賽”在中關(guān)村展示中心順利啟幕。聲智作為
    的頭像 發(fā)表于 08-25 17:18 ?1352次閱讀

    AI輸出“偏見”,人類能否信任它的“三觀”?

    人工智能(AI)已成為我們不可分割的“伙伴”。從聊天機(jī)器人、語音助手到自動翻譯,AI不斷介入人與人之間的交流和理解。然而,它能做到“客觀中立”嗎?據(jù)美國《麻省理工科技評論》官網(wǎng)報道,一項(xiàng)國際研究指出
    的頭像 發(fā)表于 08-04 13:43 ?1434次閱讀
    <b class='flag-5'>AI</b>輸出“偏見”,<b class='flag-5'>人類</b>能否信任它的“三觀”?

    “端云+多模態(tài)”新范式:《移遠(yuǎn)通信AI大模型技術(shù)方案白皮書》正式發(fā)布

    7月28日,移遠(yuǎn)通信聯(lián)合智次方研究院正式發(fā)布《AI大模型技術(shù)方案白皮書》(以下簡稱“白皮書”)。這份白皮書系統(tǒng)梳理了AI大模型的技術(shù)特點(diǎn)、產(chǎn)業(yè)發(fā)展態(tài)勢與多元應(yīng)用場景,以及移遠(yuǎn)通信“端云
    的頭像 發(fā)表于 07-28 13:08 ?1389次閱讀
    “端云+多模態(tài)”新范式:《移<b class='flag-5'>遠(yuǎn)</b>通信<b class='flag-5'>AI</b>大模型技術(shù)方案白皮書》正式發(fā)布

    AI耳機(jī)變身翻譯官+會議總結(jié)大師?涂鴉AI音頻開發(fā)方案,讓耳機(jī)升級到下一個level

    在接入AI能力后,耳機(jī)這種日?;漠a(chǎn)品,能有多大的想象空間?它不僅能幫你輕松聽懂全球外語和地方方言,還能將語音轉(zhuǎn)化為文字、翻譯成不同語言,甚至自動總結(jié)會議要點(diǎn)、生成思維導(dǎo)圖,適配辦公、學(xué)習(xí)、跨語言
    的頭像 發(fā)表于 07-10 18:47 ?2239次閱讀
    <b class='flag-5'>AI</b>耳機(jī)變身<b class='flag-5'>翻譯</b>官+會議總結(jié)大師?涂鴉<b class='flag-5'>AI</b>音頻開發(fā)方案,讓耳機(jī)升級到下一個level

    遠(yuǎn)通信全棧 AI 解決方案沙龍圓滿收官,攜手火山引擎共啟消費(fèi)品AI升級新征程

    。會上,移遠(yuǎn)通信全棧AI解決方案與火山引擎豆包大模型、扣子AI硬件方案的協(xié)同應(yīng)用成為焦點(diǎn),與會嘉賓深入解析了抖音電商如何賦能精準(zhǔn)營銷,為泛AI
    的頭像 發(fā)表于 04-30 18:35 ?879次閱讀
    移<b class='flag-5'>遠(yuǎn)</b>通信全棧 <b class='flag-5'>AI</b> 解決方案沙龍圓滿收官,攜手火山引擎共啟消費(fèi)品<b class='flag-5'>AI</b>升級新征程
    广宁县| 扎赉特旗| 武汉市| 三亚市| 阳朔县| 修文县| 老河口市| 潮州市| 高安市| 珲春市| 大石桥市| 海淀区| 眉山市| 怀远县| 九龙城区| 平利县| 高青县| 安平县| 米林县| 莆田市| 江达县| 东明县| 乌恰县| 常德市| 武安市| 浏阳市| 赤城县| 沂水县| 永宁县| 辽阳县| 醴陵市| 尚义县| 余干县| 申扎县| 平泉县| 连平县| 岳普湖县| 海安县| 广元市| 孟村| 邳州市|