哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

視頻產(chǎn)業(yè)的創(chuàng)意活力,被百度蒸汽機這顆“動力心臟”激活了

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2025-08-25 18:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

wKgZPGipVIqAMZ87AAfB8hkM8rw001.jpg

1776 年,瓦特改良蒸汽機,將傳統(tǒng)手工作坊轉(zhuǎn)化為規(guī)?;a(chǎn)的工廠,蒸汽機由此成為工業(yè)革命的動力心臟。今天,AIGC技術(shù)在視頻內(nèi)容產(chǎn)業(yè)引發(fā)深刻變革,行業(yè)都在尋找那一部讓視頻制作從手工作坊到工業(yè)化生產(chǎn)的“蒸汽機”。

從機器原型到產(chǎn)業(yè)動力心臟,瓦特蒸汽機完成了兩大轉(zhuǎn)變:一是工業(yè)化,通過氣缸恒溫技術(shù),顯著提升了蒸汽機運行效率,能支持規(guī)模化的工業(yè)生產(chǎn);二是商業(yè)化,與大量工廠主建立合作,推動蒸汽機深度融入經(jīng)濟生產(chǎn)活動。

這正是百度商業(yè)體系在做的,視頻生成模型的產(chǎn)業(yè)級探索。8月21日,百度蒸汽機(MuseSteamer)迎來重要產(chǎn)品迭代,突破性實現(xiàn)多人有聲視頻的一體化生成功能。

在工業(yè)化維度,該模型實現(xiàn)了環(huán)境音效與人物自然語音的同步生成技術(shù)落地,有望大幅提升視頻制作效率;商業(yè)化進程中,百度蒸汽機實施價格優(yōu)化策略,通過 Turbo版、Lite版、Pro版及有聲版的梯度化產(chǎn)品矩陣,全系列服務(wù)定價降至行業(yè)平均水平的70%,并完成與千帆大模型平臺的深度集成。企業(yè)用戶可通過千帆平臺獲取高性能視頻生成服務(wù),C端用戶則可通過百度搜索入口或“繪想”平臺體驗產(chǎn)品功能。

這一系列舉措背后,標志著AI模型作為視頻內(nèi)容產(chǎn)業(yè)的動力心臟,正牽引整個行業(yè)踏入規(guī)?;a(chǎn)的全新階段。而支撐這場視頻內(nèi)容產(chǎn)業(yè)智能化的核心——百度蒸汽機,我們有必要對其抽絲剝繭,一探究竟。

wKgZPGipVIuADkEEAAHjnBHxxcs092.jpg

自O(shè)penAI于2024年推出Sora后,市場涌現(xiàn)的眾多視頻生成模型,但深入行業(yè)實踐不難發(fā)現(xiàn),AIGC技術(shù)革新的表象之下,視頻內(nèi)容產(chǎn)業(yè)的核心痛點依然存在。

首先,通用視頻生成模型在設(shè)計理念上追求大而全,與具體生產(chǎn)需求難以適配。以AI短劇為例,觀眾更喜歡看多人角色互動,但現(xiàn)有通用視頻生成模型在多個角色對話場景時,普遍存在眼神交互失準、肢體動作協(xié)調(diào)性不足等缺陷。同時,音視頻同步生成技術(shù)尚未完全成熟,創(chuàng)作者仍需在圖像生成、音頻制作、口型匹配等多個環(huán)節(jié)進行跨平臺協(xié)同作業(yè)。谷歌Veo3升級后雖實現(xiàn)了音畫同步輸出功能,但因缺乏中文支持,無法有效進入華語市場。

不僅模型與場景的矛盾現(xiàn)實存在,成本與效率的矛盾也尤為突出。Sora演示的20秒視頻片段雖然技術(shù)表現(xiàn)驚艷,但背后巨大的算力消耗使得中小規(guī)模制作機構(gòu)難以承受,加之單次生成的成功率有限,反復(fù)操作的結(jié)果,就是進一步推高了生產(chǎn)成本。

此外,制作與分發(fā)之間也存在脫節(jié)。當(dāng)前多數(shù)視頻生成模型仍局限于內(nèi)容生產(chǎn)環(huán)節(jié),與平臺分發(fā)系統(tǒng)之間缺乏有效的銜接,難以實現(xiàn)與廣告投放系統(tǒng)的協(xié)同優(yōu)化,導(dǎo)致創(chuàng)意內(nèi)容在商業(yè)轉(zhuǎn)化過程中,價值大打折扣。

回溯歷代工業(yè)革命會發(fā)現(xiàn),從蒸汽動力到電能、互聯(lián)網(wǎng),那些真正具備影響力的技術(shù),是能夠滿足業(yè)務(wù)場景實際需求、完成產(chǎn)業(yè)化落地的完整技術(shù)體系。

以產(chǎn)業(yè)需求為標尺,是百度蒸汽機誕生的原點,也指引著模型的進化方向。

此前,百度商業(yè)團隊在攻克短劇投放的難題時,敏銳洞察到傳統(tǒng)廣告素材制作存在策劃、拍攝、剪輯等冗長環(huán)節(jié),啟動專項研發(fā),歷經(jīng)多輪迭代將模型打磨成一站式智能創(chuàng)作平臺。今年7月,百度蒸汽機(MuseSteamer)發(fā)布,用戶僅需上傳一張參考圖片與一句創(chuàng)作提示詞,系統(tǒng)便能輸出高清視頻,實現(xiàn)從創(chuàng)意構(gòu)思到成片產(chǎn)出的全流程一體化生成。

百度蒸汽機(MuseSteamer)發(fā)布之后,迅速獲得百度內(nèi)部業(yè)務(wù)線及影視創(chuàng)作者、廣告主群體的廣泛關(guān)注與試用。據(jù)百度副總裁、移動生態(tài)商業(yè)體系負責(zé)人陳一凡透露,上線50天以來,百度也收到了用戶的諸多訴求,比如:

運鏡能不能不再是簡單的推拉,也能提供環(huán)繞、搖鏡等復(fù)雜鏡頭?

畫質(zhì)能否進一步提升,從720P畫質(zhì)升級到1080P?

人物口型與臺詞的吻合,能否進一步對齊,讓視頻更有感染力?

畫面和音頻能否一次生成,減少后期配音、生成音頻的繁瑣操作?

雖然邀測期間免費,但后續(xù)還想接著用,成本還能不能再降一降?

用戶有需求,百度就有回應(yīng)。最新升級的蒸汽機2.0 版本,就一口氣解決了上述痛點。具體是怎么改變的呢?

wKgZO2ipVIyALXKmAAHSuvJRVZQ080.jpg

升級后的百度蒸汽機2.0,創(chuàng)作者只需提供一張概念圖與自然語言指令,即可輸出包含多角色對話、環(huán)境音效與高清畫面的完整視頻,而且支持中文。

可以說,借助百度蒸汽機2.0有聲版模型,AIGC視頻創(chuàng)作真正迎來無配音時代。AI視頻制作也從跨平臺的手工作坊階段,進入可一站式規(guī)模化量產(chǎn)的工業(yè)時代。具體來說,要解決幾大難題:

wKgZPGipVI2AbjOKAAYjcZV9DmE052.jpg

一是多模態(tài)同步生成的精度難題。傳統(tǒng)分步式生成方案,口型和聲音容易錯位,而多人有聲音視頻一體化生成,不僅要一次搞定多模態(tài),還要保持語音與唇形、表情、動作的毫秒級精準對齊,復(fù)雜場景下依然穩(wěn)定,技術(shù)挑戰(zhàn)更高。

據(jù)百度商業(yè)研發(fā)首席架構(gòu)師李雙龍介紹,百度蒸汽機采用端到端訓(xùn)練模式,摒棄傳統(tǒng)模塊化訓(xùn)練思路,采用統(tǒng)一神經(jīng)網(wǎng)絡(luò)架構(gòu)同步學(xué)習(xí)畫面渲染、語音合成、音效匹配等核心技術(shù)的內(nèi)在規(guī)律,極大提升了訓(xùn)練效率與生成質(zhì)量。

比如這個長達一分多鐘的AI視頻,涉及多個場景的切換,以及復(fù)雜的多人對話,百度蒸汽機2.0可以實現(xiàn)語音信號與唇形動畫的毫秒級時序?qū)R、語調(diào)情感與面部表情的一致性映射、人物肢體動作與場景設(shè)定的邏輯自洽。

高精度的多模態(tài)同步生成,可以直接減少后期剪輯的復(fù)雜度與工作量。以伊利倍暢宣傳片制作項目為例,應(yīng)用該技術(shù)后,項目周期從原先的4周縮短至3天,展現(xiàn)出強大的應(yīng)用價值與技術(shù)優(yōu)勢。

二是電影級敘事所要求的連貫性和感染力。傳統(tǒng)視頻生成過程中,畫面渲染、語音合成、音效處理等獨立模塊進行訓(xùn)練,不可避免地產(chǎn)生信息丟失,比如畫面生成模型難以捕捉語音中的情感強度變化,音效處理算法無法準確模擬場景的空間聲學(xué)特性,導(dǎo)致視頻創(chuàng)作流程需頻繁切換多個平臺。

百度蒸汽機采用首創(chuàng)的多模態(tài)潛在空間規(guī)劃技術(shù)(Latent Multi-Modal Planner),具備強大的多角色交互自主規(guī)劃能力,能夠自主協(xié)調(diào)構(gòu)建角色身份、情感表達及互動關(guān)系,打造真實細膩的人物表現(xiàn)力。

比如,我們上傳了一張網(wǎng)圖,兩位身穿古代盔甲的武士打麻將,讓兩個角色展開交互,并且文生音頻與表情的一致性很高,人物表現(xiàn)也跟圖片背景比較匹配?!耙粡垐D講故事”,就是點一下鼠標的事兒。

大家應(yīng)該發(fā)現(xiàn)了,一體化生成與中文場景深度適配的本土化視頻,百度蒸汽機的中文能力,成了華語創(chuàng)作者的福音。為啥之前沒有這類中文音視頻同步生成的工具呢?

挑戰(zhàn)在于,中文語音存在四種聲調(diào),聲調(diào)系統(tǒng)更為復(fù)雜,而且高度依賴語境的語義表達,同一個詞在不同語境下的解釋不同,所需要搭配的表情、音色、聲調(diào)自然也不一樣。這要求AI視頻模型不僅具備文本識別能力,更需構(gòu)建深層次的文化語義理解體系。

百度蒸汽機2.0展現(xiàn)出的中文場景適配性,來自數(shù)據(jù)與算法的雙重創(chuàng)新。數(shù)據(jù)層面,系統(tǒng)采集并標注了覆蓋七大漢語方言區(qū)、總時長達10萬小時的語音語料庫,并構(gòu)建了包含語境信息與情感維度的標注體系,解決了歧義句的語義解析難題;算法層面,超98%的還原度精準,能夠細膩地展現(xiàn)中文語音細節(jié)與情感表達。

此外,在畫質(zhì)與運鏡方面,此次百度蒸汽機2.0支持1080P高清分辨率,配合環(huán)繞、搖鏡、推軌等數(shù)十種專業(yè)鏡頭語言,實現(xiàn)了超越行業(yè)標準的專業(yè)級影像表達,為創(chuàng)作者提供更多的創(chuàng)作可能性。

百度蒸汽機2.0,就像給視頻內(nèi)容產(chǎn)業(yè)裝上了一臺超給力的發(fā)動機。不管是專業(yè)的影視工作室,還是剛?cè)腴T的內(nèi)容小白,只要有想法,都能把創(chuàng)意變成一個個爆款視頻,輕松打造屬于自己的內(nèi)容工廠。

但僅僅是生產(chǎn)制作,不足以撼動內(nèi)容產(chǎn)業(yè)。百度蒸汽機的另一重隱藏價值,在于制作與分發(fā)體系的全面打通,這是視頻生成模型領(lǐng)域所少有的。

wKgZO2ipVI2AB_U2AAHZP_vHKm4715.jpg

AI視頻模型如果沒有商業(yè)體系的支撐,技術(shù)突破的價值終將消散在成本黑洞與分發(fā)壁壘中。構(gòu)建一套讓創(chuàng)意轉(zhuǎn)化為收益的商業(yè)體系,是產(chǎn)業(yè)所需要的,也是百度所擅長的。

通過促增長、降成本的雙重賦能,百度商業(yè)體系正在讓AI視頻生成技術(shù)被高效傳導(dǎo)至產(chǎn)業(yè)末梢。

具體來說,百度商業(yè)體系為企業(yè)構(gòu)建了以視頻為核心的增長引擎,打通生產(chǎn)-分發(fā)-變現(xiàn)的全鏈路。

企業(yè)生成的視頻可直接接入百度搜索廣告系統(tǒng),根據(jù)用戶畫像動態(tài)調(diào)整畫面節(jié)奏與話術(shù)。對于C端創(chuàng)作者,百度也構(gòu)建了多元的收益通道,百家號對蒸汽機生成的優(yōu)質(zhì)內(nèi)容給予流量加權(quán),創(chuàng)作者可以獲得廣告分成收益。

視頻內(nèi)容想要規(guī)?;慨a(chǎn),另一個條件是成本足夠低。百度蒸汽機的工程化能力,進一步降低了AI視頻制作的成本。

好萊塢視效指導(dǎo)姚騏用百度蒸汽機生成的科幻短片《歸途》,共有40多個鏡頭,傳統(tǒng)制作方式需要百萬美元的預(yù)算,如今成本僅需百元。C端用戶也可以通過繪想平臺每月贈送15個5秒視頻的“想象力值”,免費體驗全流程AI視頻創(chuàng)作。

百度商業(yè)體系商業(yè)研發(fā)總經(jīng)理劉林介紹道,依托多年積累的GPU架構(gòu)和工程化實踐,通過算子優(yōu)化、訓(xùn)練集調(diào)整等技術(shù)手段,百度蒸汽機將視頻生成推理成本降至行業(yè)均價的70%,未來還有望進一步降低。

wKgZPGipVI6ATvDCAAXbO4lKBP0782.jpg

總結(jié)一下,百度蒸汽機是通過技術(shù)創(chuàng)新+商業(yè)體系的雙重賦能,讓每個參與者分享AI紅利。對企業(yè)而言,意味著從購買工具轉(zhuǎn)向接入生態(tài),以更低成本獲得更高商業(yè)回報;對創(chuàng)作者來說,是從技術(shù)追隨者變?yōu)閯?chuàng)意主導(dǎo)者,釋放個體內(nèi)容生產(chǎn)力。

這顆由百度技術(shù)與商業(yè)體系共同鍛造的動力心臟,正驅(qū)動視頻內(nèi)容產(chǎn)業(yè)的創(chuàng)新齒輪加速轉(zhuǎn)動。

wKgZO2ipVI6ACfC9AAICuxW_6EY799.jpg

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40905

    瀏覽量

    302472
  • AIGC
    +關(guān)注

    關(guān)注

    1

    文章

    393

    瀏覽量

    3266
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    百度地圖與NIMO眼鏡達成深度合作

    近日,百度地圖與NIMO眼鏡達成深度合作,將百度地圖全棧導(dǎo)航能力以輕量化、低功耗、極簡交互的方式落地智能眼鏡場景,為騎行、步行、日常通勤用戶提供抬頭即見、安全隨行的新一代導(dǎo)航體驗。
    的頭像 發(fā)表于 04-09 10:00 ?220次閱讀

    數(shù)據(jù)中心電能質(zhì)量“隱形殺手”:APView350如何守護算力心臟?

    電壓暫降可能導(dǎo)致服務(wù)器宕機、數(shù)據(jù)丟失,造成的損失難以估量。 在AI算力需求爆發(fā)的今天,數(shù)據(jù)中心已經(jīng)成為數(shù)字經(jīng)濟的“心臟”。這顆心臟的健康狀況,直接關(guān)系到千行業(yè)的正常運行。而安科瑞AP
    的頭像 發(fā)表于 03-27 11:39 ?218次閱讀
    數(shù)據(jù)中心電能質(zhì)量“隱形殺手”:APView350如何守護算<b class='flag-5'>力心臟</b>?

    百度文心大模型5.0正式版上線

    今天,在百度文心Moment大會現(xiàn)場,文心大模型5.0正式版上線。
    的頭像 發(fā)表于 01-23 16:48 ?1442次閱讀

    2025百度世界大會精彩回顧

    百度創(chuàng)始人李彥宏在演講時表示,“我們更關(guān)心如何讓AI跟我們要做的每一項任務(wù),都能夠進行有機的結(jié)合,讓AI成為企業(yè)發(fā)展和個人成長的原生推動力?!?/div>
    的頭像 發(fā)表于 11-17 15:01 ?827次閱讀

    百度世界大會亮點 五年五芯 百度宣布打造最硬AI云

    自2006年以來,百度世界大會已連續(xù)舉辦近20屆,百度世界大會是百度每年面向行業(yè)、媒體、合作伙伴和廣大用戶的最高級別盛事,作為百度年度最重要的的戰(zhàn)略、技術(shù)、產(chǎn)品發(fā)布會,自2006年以來
    的頭像 發(fā)表于 11-13 15:47 ?1859次閱讀

    百度世界2025進行中 百度昆侖芯超節(jié)點亮相 性能巨幅提升

    百度世界大會是百度每年面向行業(yè)、媒體、合作伙伴和廣大用戶的最高級別盛事,作為百度年度最重要的的戰(zhàn)略、技術(shù)、產(chǎn)品發(fā)布會,自2006年以來已連續(xù)舉辦19年,持續(xù)為行業(yè)搭建起交流前沿技術(shù)、碰撞創(chuàng)新
    的頭像 發(fā)表于 11-13 11:51 ?1437次閱讀

    動力心臟的智能樞紐:ETHERCAT轉(zhuǎn)PROFINET網(wǎng)關(guān)節(jié)能實戰(zhàn)

    動力心臟的智能樞紐:ETHERCAT轉(zhuǎn)PROFINET網(wǎng)關(guān)節(jié)能實戰(zhàn) 在工業(yè)自動化領(lǐng)域,不同協(xié)議設(shè)備之間的互聯(lián)互通一直是工程師面臨的挑戰(zhàn)。特別是在能源與動力設(shè)備領(lǐng)域,如空壓機、起重設(shè)備和石油機械等
    的頭像 發(fā)表于 10-22 10:05 ?317次閱讀
    <b class='flag-5'>動力心臟</b>的智能樞紐:ETHERCAT轉(zhuǎn)PROFINET網(wǎng)關(guān)節(jié)能實戰(zhàn)

    珠海泰芯半導(dǎo)體攜手百度共筑智能硬件產(chǎn)業(yè)新生態(tài)

    2025年8月29日,北京國際會議中心二期迎來科技行業(yè)年度盛會。由百度智能云與極客公園聯(lián)合主辦的百度云智大會AI+智能硬件專場論壇圓滿舉行,珠海泰芯半導(dǎo)體有限公司總經(jīng)理唐振中作為特邀嘉賓出席,共同見證‘芯’潮澎湃智能硬件芯片聯(lián)盟成立儀式。
    的頭像 發(fā)表于 09-01 17:46 ?1201次閱讀

    昆侖芯科技亮相2025百度云智大會

    近日,2025百度云智大會在北京國家會議中心二期隆重啟幕。本屆大會以“智能,生成無限可能”為主題,聚焦人工智能從技術(shù)到產(chǎn)業(yè)的全鏈條落地,深入探討AI賦能千行業(yè)的實踐路徑與未來機遇。
    的頭像 發(fā)表于 09-01 11:00 ?1453次閱讀

    永銘鉭電容:藏在筆記本“電力心臟”中的精密藝術(shù)

    筆記本中的藝術(shù)當(dāng)你用筆記本電腦流暢剪輯4K視頻、激戰(zhàn)高畫質(zhì)3A游戲時,是否想過是誰在幕后默默保障電力穩(wěn)定?在纖薄機身與強悍性能并存的今天,筆記本電腦正面臨“既要極致輕薄,又要澎湃動力”的雙重挑戰(zhàn)。從
    的頭像 發(fā)表于 09-01 09:57 ?895次閱讀
    永銘鉭電容:藏在筆記本“電<b class='flag-5'>力心臟</b>”中的精密藝術(shù)

    65%央企大模型落地首選百度智能云

    今天,很榮幸地分享一個好消息,百度智能云已牽手65%的央企,共同推進大模型產(chǎn)業(yè)落地。得益于全棧的AI能力,百度聯(lián)合眾多央國企伙伴,針對各類不同業(yè)務(wù)場景,打造了一大批可推廣、可復(fù)制的標桿案例。
    的頭像 發(fā)表于 06-11 15:44 ?1001次閱讀

    百度地圖重磅發(fā)布地圖AI開放平臺

    近日,在WGDC25全球時空智能大會上,百度地圖重磅發(fā)布地圖AI開放平臺。百度地圖深耕20年的數(shù)據(jù)能力、引擎能力與AI技術(shù)全面開放,向開發(fā)者深度開放四大核心能力和五大場景解決方案。
    的頭像 發(fā)表于 05-26 11:26 ?1960次閱讀

    電機與電力拖動基礎(chǔ)1

    是第一次工業(yè)革命的開創(chuàng)性的發(fā)明,它的發(fā)明為世界帶來了一種更加有效和更加強勁的動力。由于蒸汽機的出現(xiàn),冶金、煤礦和紡織業(yè)等得到了空前的發(fā)展:由于蒸汽機的出現(xiàn),世界(當(dāng)時主要是英國)的紡織業(yè)實現(xiàn)了機械化:由于
    發(fā)表于 05-14 16:46

    百度在AI領(lǐng)域的最新進展

    近日,我們在武漢舉辦了Create2025百度AI開發(fā)者大會,與全球各地的5000多名開發(fā)者,分享了百度在AI領(lǐng)域的新進展。
    的頭像 發(fā)表于 04-30 10:14 ?1449次閱讀

    上汽大眾與百度地圖達成戰(zhàn)略合作

    近日,上海國際車展期間,百度地圖與上汽大眾舉行科技X生態(tài)戰(zhàn)略合作伙伴簽約儀式,雙方將基于百度領(lǐng)先的車道級地圖產(chǎn)品,為上汽大眾千萬車主打造更安全、高效的智能化出行體驗。上汽大眾總經(jīng)理陶海龍、百度副總裁尚國斌等出席簽約儀式。
    的頭像 發(fā)表于 04-29 17:28 ?1357次閱讀
    潞城市| 安顺市| 区。| 万全县| 普兰县| 汕头市| 兰西县| 沙湾县| 老河口市| 宾阳县| 依兰县| 贵阳市| 温州市| 若尔盖县| 修水县| 三都| 寻乌县| 理塘县| 滦平县| 邹平县| 青海省| 铜山县| 盐源县| 清河县| 漳浦县| 名山县| 阜新| 鸡西市| 郑州市| 从江县| 宽甸| 淮滨县| 米易县| 平利县| 桓仁| 开原市| 绥芬河市| 栾川县| 留坝县| 西宁市| 岚皋县|