哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RealTalk系統(tǒng)利用文本輸入生成逼近真人聲音 社會(huì)影響巨大

電子工程師 ? 來源:yxw ? 2019-05-20 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

加拿大創(chuàng)業(yè)公司 Dessa 開發(fā)出一個(gè)語音合成系統(tǒng) RealTalk,與以往基于語音輸入學(xué)習(xí)人聲的系統(tǒng)不同,它可以僅基于文本輸入生成完美逼近真人的聲音。不過,出于倫理、社會(huì)影響等方面的考慮,Dessa 并未公布該項(xiàng)目的研究細(xì)節(jié)、模型和數(shù)據(jù)集。

加拿大創(chuàng)業(yè)公司 Dessa 近日發(fā)布了一項(xiàng)新研究:利用其最新開發(fā)的 RealTalk 系統(tǒng),僅利用文本輸入即可生成完美逼近真人的聲音。其 demo 中展示了美國著名脫口秀喜劇演員、主持人 Joe Rogan 的聲音(Joe Rogan 就是那個(gè)讓馬斯克在節(jié)目中嗨了的主持人)。

所有音頻均為機(jī)器學(xué)習(xí)模型使用文本輸入生成的。音頻中包括換氣聲、「um」「ah」等詞語和噪聲。

視頻中,「Joe Rogan」用他一貫的語調(diào)和風(fēng)格,談?wù)摵谛尚汕髑蜿?duì)、快速說繞口令,甚至模擬了一段「Joe Rogan 被人工智能研究者困在機(jī)器中」的情境……

Joe Rogan 本人在聽了模擬音頻后表示:「it's terrifyingly accurate」。有 twitter 網(wǎng)友評(píng)論道「你應(yīng)該和 AI Joe Rogan 來一次訪談,lol」……

Joe Rogan 發(fā) ins 表示:「我的立場(chǎng)就是驚訝地聳肩搖頭,然后接受它。未來越來越奇怪了,朋友們。」

復(fù)制 Rogan 聲音這一項(xiàng)目是由 Dessa 公司機(jī)器學(xué)習(xí)工程師 Hashiam Kadhim、Joe Palermo 和 Rayhane Mama 組成的團(tuán)隊(duì)創(chuàng)造的,他們使用了一個(gè)文本轉(zhuǎn)語音的深度學(xué)習(xí)系統(tǒng) RealTalk,可以僅基于文本輸入生成逼真的語音。

是不是很瘋狂?Dessa 首席機(jī)器學(xué)習(xí)架構(gòu)師 Alex Krizhevsky (是的沒錯(cuò),他就是 AlexNet 的發(fā)明者)認(rèn)為這是「我所看到的人工智能領(lǐng)域最酷也最恐怖的事件之一。與理論上 40100 年后才會(huì)出現(xiàn)的奇點(diǎn)不同,語音合成已經(jīng)成為現(xiàn)實(shí)?!挂苍S大家和他的想法是一樣的。

這意味著什么?會(huì)產(chǎn)生什么社會(huì)影響?

想想看,Dessa 的工程師用 AI 合法地創(chuàng)建了 Joe Rogan 聲音的逼真復(fù)制品,多么不可思議。而且,該模型能夠復(fù)制任何人的聲音,只要能夠獲得足夠的訓(xùn)練數(shù)據(jù)。

而作為構(gòu)建現(xiàn)實(shí)世界應(yīng)用的 AI 從業(yè)者,Dessa 也考慮到了這一點(diǎn):這項(xiàng)技術(shù)會(huì)帶來什么影響?

很明顯,語音合成等技術(shù)的社會(huì)影響是巨大的。它會(huì)影響到每一個(gè)人:不管有錢沒錢,不管是企業(yè)還是政府。

目前,要?jiǎng)?chuàng)建像 RealTalk 這樣性能良好的模型需要技術(shù)知識(shí)、獨(dú)創(chuàng)性、計(jì)算能力和數(shù)據(jù)。所以,不是任何人都可以實(shí)現(xiàn)它。但是在接下來的幾年里(甚至更短的時(shí)間內(nèi)),技術(shù)可能會(huì)發(fā)展到只需要幾秒鐘的音頻就能復(fù)制出世界上任何人的聲音。

這樣就很恐怖了。

如果這種技術(shù)落入壞人之手,可能會(huì)發(fā)生下面的情況:

垃圾郵件發(fā)送者假冒你母親或者愛人來獲取你的個(gè)人信息;

以霸凌或騷擾為目的冒充別人;

冒充政府官員進(jìn)入絕密區(qū)域;

利用政客的「audio deepfake」來操縱選舉或引發(fā)社會(huì)暴動(dòng);

……

除了消極影響之外,Dessa 也考慮了這項(xiàng)技術(shù)的積極一面。

如果這項(xiàng)技術(shù)被正確利用的話,則:

和語音助手說話的時(shí)候感覺很自然,就像與朋友聊天一樣。

可以定制語音應(yīng)用程序,比如,健身 app 里鼓勵(lì)大家鍛煉的個(gè)性化話語來自阿諾·施瓦辛格。

為只能通過文本-語音設(shè)備進(jìn)行交流的人提供了一種交流選項(xiàng),比如患有盧·格里克?。u凍人癥,ALS)的人。

用任何語言為任意媒體文件自動(dòng)配音。

正如牛津大學(xué)人類未來研究所在最近發(fā)布的一份報(bào)告《The Malicious Use of Artificial Intelligence》中所提到的那樣:人工智能領(lǐng)域的進(jìn)步不僅擴(kuò)大了現(xiàn)有威脅,還帶來了新的威脅。

如何從倫理方面考慮來構(gòu)建這個(gè)技術(shù),Dessa 還沒有完全得出答案。但未來幾年里,這項(xiàng)技術(shù)將不可避免地建立起來并應(yīng)用到現(xiàn)實(shí)世界中。因此,除了提高意識(shí)和承認(rèn)問題以外,Dessa 表示希望這項(xiàng)研究能夠開啟關(guān)于語音合成技術(shù)的對(duì)話和討論。

每個(gè)人都應(yīng)該知道,隨著語音合成技術(shù)的發(fā)展,可能會(huì)發(fā)生什么樣的情況。正如 Deepfake 技術(shù)出現(xiàn)時(shí)我們看到的那樣,公眾意識(shí)和對(duì)話促使政府、政策制定者、立法者迅速采取行動(dòng)并制定對(duì)策。

Dessa 在相關(guān)博客中表示:作為應(yīng)用人工智能公司,Dessa 的一個(gè)重要責(zé)任是,了解在研究領(lǐng)域探索 AI 和在現(xiàn)實(shí)中應(yīng)用 AI 有著巨大的差別。為了負(fù)責(zé)任地對(duì)待這種技術(shù),他們認(rèn)為在開源該項(xiàng)目之前,應(yīng)該讓公眾首先意識(shí)到語音合成模型的影響。

也因此,Dessa 目前沒有公開研究細(xì)節(jié)、模型或數(shù)據(jù)集。

Dessa 表示后續(xù)將發(fā)布博客,介紹 RealTalk 的工作原理和構(gòu)建過程。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41114

    瀏覽量

    302600
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8565

    瀏覽量

    137224
  • 語音合成技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    2681

原文標(biāo)題:語音版deepfake出現(xiàn):從文本到逼真人聲,被模仿者高呼真得可怕

文章出處:【微信號(hào):smartman163,微信公眾號(hào):網(wǎng)易智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AD7324:高性能12位逐次逼近型ADC的技術(shù)解析

    AD7324:高性能12位逐次逼近型ADC的技術(shù)解析 在電子工程師的日常設(shè)計(jì)中,模擬數(shù)字轉(zhuǎn)換器(ADC)是一個(gè)關(guān)鍵組件,它的性能直接影響到整個(gè)系統(tǒng)的精度和穩(wěn)定性。今天,我們就來深入探討一款高性能
    的頭像 發(fā)表于 04-02 10:10 ?153次閱讀

    詳解DBC的Signal與JSON文本結(jié)合

    為了優(yōu)化CAN數(shù)據(jù)發(fā)送與接收的操作流程,更改以前手動(dòng)輸入狀態(tài)對(duì)應(yīng)數(shù)據(jù)的模式,采用下拉列表選擇內(nèi)容,但這需要用到超出DBC原有承載能力的信息。因此,將JSON與其結(jié)合,采用JSON格式文本寫入Signal的Comment屬性,將Comment屬性的字符串通過JSON
    的頭像 發(fā)表于 01-06 10:57 ?424次閱讀
    詳解DBC的Signal與JSON<b class='flag-5'>文本</b>結(jié)合

    數(shù)據(jù)中心不斷演進(jìn)以滿足 AI 的巨大電力需求

    隨著大型語言模型徹底改變我們?cè)L問數(shù)據(jù)的方式,人工智能(AI) 的進(jìn)步正在顛覆各行各業(yè)及社會(huì)對(duì)數(shù)據(jù)中心計(jì)算資源的運(yùn)用模式。我們正逐步進(jìn)入能夠直接向 AI 提問并獲取詳盡答案的時(shí)代,這與向真人提問無異
    的頭像 發(fā)表于 12-01 14:37 ?7138次閱讀
    數(shù)據(jù)中心不斷演進(jìn)以滿足 AI 的<b class='flag-5'>巨大</b>電力需求

    萬里紅文本生成算法通過國家網(wǎng)信辦備案

    近日,國家互聯(lián)網(wǎng)信息辦公室發(fā)布了第十四批深度合成服務(wù)算法備案信息,北京萬里紅科技有限公司(以下簡(jiǎn)稱:萬里紅)自主研發(fā)的“萬里紅文本生成算法”正式通過備案。該算法致力于通過自動(dòng)化的方式,提升知識(shí)問答、RAG分類、預(yù)測(cè)、文檔生成的準(zhǔn)確率,確保信息的安全性和合規(guī)性,為用戶提供及
    的頭像 發(fā)表于 11-14 09:06 ?817次閱讀

    大模型驅(qū)動(dòng)下的人機(jī)交互革命,“超擬真人互動(dòng)”?讓玩具讀懂你的情緒

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)日前,在大灣區(qū)AI玩具生態(tài)大會(huì)上,百度智能云正式發(fā)布基于“超擬真人互動(dòng)”理念的智能硬件多模態(tài)交互解決方案。該方案通過大模型與多模態(tài)技術(shù)的深度融合,從技術(shù)架構(gòu)到場(chǎng)景落地
    的頭像 發(fā)表于 10-31 09:21 ?6654次閱讀
    大模型驅(qū)動(dòng)下的人機(jī)交互革命,“超擬<b class='flag-5'>真人</b>互動(dòng)”?讓玩具讀懂你的情緒

    【內(nèi)測(cè)活動(dòng)同步開啟】這么???這么強(qiáng)?新一代大模型MCP開發(fā)板來啦!

    ,將碰撞出怎樣的智能火花?關(guān)注并私信獲得內(nèi)測(cè)資格! 視頻: 「Arcs-Mini」聆思打造全新大模型MCP開發(fā)板小巧機(jī)身,蘊(yùn)含強(qiáng)大能量 實(shí)現(xiàn)真人般自然對(duì)話體驗(yàn),會(huì)感知、會(huì)表達(dá)、會(huì)表情、懂共情,獨(dú)家人聲
    發(fā)表于 09-25 11:47

    如何進(jìn)行聲音定位?

    文章主要介紹了如何利用一種簡(jiǎn)單的TDOA算法進(jìn)行聲音點(diǎn)位,并使用數(shù)據(jù)采集卡進(jìn)行聲音定位的實(shí)驗(yàn)。
    的頭像 發(fā)表于 09-23 15:47 ?2132次閱讀
    如何進(jìn)行<b class='flag-5'>聲音</b>定位?

    如何利用 DDR 參數(shù)文件生成 Linux 映像?

    如何利用 DDR 參數(shù)文件生成 Linux 映像
    發(fā)表于 09-02 06:39

    聲源定位模塊-AR1105# 聲源定位# 聲音定位

    聲音降噪
    深圳市聲訊電子有限公司
    發(fā)布于 :2025年08月01日 16:01:09

    Copilot操作指南(一):使用圖片生成原理圖符號(hào)、PCB封裝

    “ ?上周推出支持圖片生成模型的華秋發(fā)行版之后,得到了很多小伙伴的肯定。但看到更多的回復(fù)是:為什么我的 Copilot 無法生成符號(hào)?只有普通的文本回復(fù)?今天就為大家詳細(xì)講解下圖片生成
    的頭像 發(fā)表于 07-15 11:14 ?5270次閱讀
    Copilot操作指南(一):使用圖片<b class='flag-5'>生成</b>原理圖符號(hào)、PCB封裝

    飛書開源“RTV”富文本組件 重塑鴻蒙應(yīng)用富文本渲染體驗(yàn)

    近日,飛書正式將其自研的富文本組件庫?RichTextVista(簡(jiǎn)稱“RTV”)開源,并上線OpenHarmony?三方庫中心倉。該組件以領(lǐng)先的性能、流暢的渲染體驗(yàn)與高度的開放性,為鴻蒙生態(tài)提供了
    的頭像 發(fā)表于 07-11 15:20 ?785次閱讀
    飛書開源“RTV”富<b class='flag-5'>文本</b>組件 重塑鴻蒙應(yīng)用富<b class='flag-5'>文本</b>渲染體驗(yàn)

    關(guān)于鴻蒙App上架中“AI文本生成模塊的資質(zhì)證明文件”的情況說明

    的應(yīng)用缺少AI文本生成模塊的資質(zhì)證明文件,不符合相關(guān)法律法規(guī)要求。 修改建議:AI文本生成模塊需補(bǔ)充提供《安全評(píng)估報(bào)告》并加手寫簽名、《安全評(píng)估報(bào)告》在全國互聯(lián)網(wǎng)安全服務(wù)管理平臺(tái)的提交結(jié)果截圖,且現(xiàn)場(chǎng)
    發(fā)表于 06-30 18:37

    從代碼到聲音,Air8000 TTS開源應(yīng)用開啟創(chuàng)作新紀(jì)元!

    Air8000顛覆傳統(tǒng)TTS開發(fā)模式,以開源之力重塑語音合成領(lǐng)域!獲取應(yīng)用源碼,開發(fā)者即可自由修改參數(shù)、適配多場(chǎng)景,讓文字與聲音的結(jié)合,迸發(fā)無限創(chuàng)意價(jià)值。 TTS (Text-to-Speech文本
    的頭像 發(fā)表于 06-27 17:06 ?665次閱讀
    從代碼到<b class='flag-5'>聲音</b>,Air8000 TTS開源應(yīng)用開啟創(chuàng)作新紀(jì)元!

    邊緣生成式AI面臨哪些工程挑戰(zhàn)?

    本文由TechSugar編譯自electronicdesign當(dāng)大多數(shù)人想到人工智能(AI)時(shí),他們通常能想到的是能夠生成文本、圖像或語音內(nèi)容的應(yīng)用。像ChatGPT這樣流行的文本應(yīng)用(在幾天
    的頭像 發(fā)表于 06-25 10:44 ?1292次閱讀
    邊緣<b class='flag-5'>生成</b>式AI面臨哪些工程挑戰(zhàn)?

    利用NVIDIA 3D引導(dǎo)生成式AI Blueprint控制圖像生成

    AI 賦能的圖像生成技術(shù)突飛猛進(jìn),從早期模型會(huì)生成手指過多的人類圖像,到現(xiàn)在能創(chuàng)造出令人驚嘆的逼真視覺效果。即使取得了如此飛躍,仍然存在一個(gè)挑戰(zhàn):實(shí)現(xiàn)創(chuàng)意掌控。
    的頭像 發(fā)表于 06-05 09:24 ?1010次閱讀
    读书| 武山县| 仁怀市| 灌云县| 上蔡县| 南宁市| 炉霍县| 玉门市| 永登县| 哈巴河县| 唐海县| 鸡泽县| 昌图县| 中山市| 佛冈县| 大悟县| 高密市| 阜宁县| 五寨县| 体育| 延安市| 云南省| 丰顺县| 隆回县| 嘉定区| 商都县| 白河县| 平江县| 抚顺县| 达尔| 龙门县| 宁国市| 报价| 青神县| 广德县| 哈巴河县| 夹江县| 仙居县| 正宁县| 景德镇市| 西城区|