哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Stability AI開源圖像生成模型Stable Diffusion

倩倩 ? 來源:AI前線 ? 作者:Anthony Alford ? 2022-09-21 15:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Stability AI 對外發(fā)布了 Stable Diffusion 的預(yù)訓(xùn)練模型權(quán)重,這是一個文本至圖像的 AI 模型。根據(jù)文本提示,Stable Diffusion 能夠生成逼真的 512x512 像素的圖像以描述提示中的場景。

在模型權(quán)重公開發(fā)布之前,它的代碼已經(jīng)發(fā)布,模型權(quán)重也有限發(fā)布給了研究社區(qū)。在最新的版本中,任何用戶都可以在消費(fèi)者級別的硬件中下載并運(yùn)行 Stable Diffusion。除了文本至圖像的生成,該模型還支持圖像至圖像的風(fēng)格轉(zhuǎn)換以及圖像質(zhì)量提升。在發(fā)布該版本的同時,Stable AI 還發(fā)布了 beta 版本的 API 以及模型的 Web UI,名為 DreamStudio。Stable AI 這樣說到:

Stable Diffusion 是一個文本至圖像的模型,它能讓數(shù)十億人在幾秒鐘內(nèi)創(chuàng)建出令人贊嘆的藝術(shù)品。在速度和質(zhì)量方面,它都有所突破,這意味著它能在消費(fèi)者級別的 GPU 上運(yùn)行……這能夠讓研究人員和……公眾在各種條件下運(yùn)行,使圖像生成技術(shù)走向大眾。我們期待圍繞該模型和其他模型出現(xiàn)一個開放的生態(tài)系統(tǒng),以探索潛在空間的邊界。

Stable Diffusion 基于名為潛在擴(kuò)散模型(latent diffusion models,LDMs)的圖像生成技術(shù)。與其他的流行的圖像合成方法不同,如生成對抗網(wǎng)絡(luò)(generative adversarial networks,GANs)和 DALL-E 使用的自動回歸技術(shù),LDMs 通過在一個潛在表示空間中迭代“去噪”數(shù)據(jù)來生成圖像,然后將表示結(jié)果解碼為完整的圖像。LDM 是由 Ludwig Maximilian University of Munich 的機(jī)器視覺與學(xué)習(xí)(Machine Vision and Learning)研究組開發(fā)的,并在最近的 IEEE / CVF 計(jì)算機(jī)視覺和模式識別會議(Computer Vision and Pattern Recognition Conference)上發(fā)表的一篇論文中進(jìn)行了闡述。在今年早些時候,InfoQ 曾經(jīng)報道過谷歌的 Imagen 模型,它是另一個基于擴(kuò)散的圖像生成 AI。

Stable Diffusion 模型支持多種操作。與 DALL-E 類似,它能夠根據(jù)所需圖像的文本描述,生成符合匹配該描述的高質(zhì)量圖像。它還可以根據(jù)一個簡單的草圖再加上所需圖像的文本描述,生成一個看起來更逼真的圖像。Meta AI 最近發(fā)布了名為 Make-A-Scene 的模型,具有類似的圖像至圖像的功能。

Stable Diffusion 的很多用戶已經(jīng)公開發(fā)布了生成圖像的樣例,Stability AI 的首席開發(fā)者 Katherine Crowson 在推特上分享了許多圖像?;?AI 的圖像合成可能會對藝術(shù)家和藝術(shù)領(lǐng)域帶來一定的影響,有些評論者對此感到不安。就在 Stable Diffusion 發(fā)布的同一周,一幅由 AI 生成的藝術(shù)品在科羅拉多州博覽會的藝術(shù)比賽中獲得了一等獎。Django 框架的共同創(chuàng)建者 Simon Williamson 認(rèn)為:

我見過一種說法,認(rèn)為 AI 藝術(shù)沒有資格獲得版權(quán)保護(hù),因?yàn)椤八仨殮w功于全人類”——如果基于文本生成的設(shè)計(jì)尚不足以說服公眾的話,那 [圖像至圖像] 技術(shù)可能會打破這種平衡。

Stable AI 的創(chuàng)始人 Emad Mostaque 在推特上回答了一些關(guān)于該模型的問題。在回答一位試圖估算訓(xùn)練模型所需的計(jì)算資源和成本的用戶時,Mostaque 說到:

實(shí)際上,我們?yōu)檫@個模型使用了 256 個 A100 顯卡,總共 15 萬小時,所以按市場價格計(jì)算為 60 萬美元。

Mostaque 給出了 Reddit 上一篇文章的鏈接,其中給出了如何最好地使用該模型來生成圖像的技巧。

Stable Diffusion 的代碼可以在 GitHub 上找到。模型的權(quán)重以及 Colab notebook 和示例 Web UI 都可以在 HuggingFace 上找到。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40905

    瀏覽量

    302476
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3810

    瀏覽量

    52246
  • 圖像生成
    +關(guān)注

    關(guān)注

    0

    文章

    25

    瀏覽量

    7181

原文標(biāo)題:Stability AI 開源圖像生成模型 Stable Diffusion

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA Jetson模型賦能AI在邊緣端落地

    開源生成AI 模型不再局限于數(shù)據(jù)中心,而是開始深入到現(xiàn)實(shí)世界的各種機(jī)器中。從 Orin 到 Thor,NVIDIA Jetson 系列正在成為運(yùn)行 NVIDIA Nemotron、
    的頭像 發(fā)表于 03-16 16:27 ?569次閱讀
    NVIDIA Jetson<b class='flag-5'>模型</b>賦能<b class='flag-5'>AI</b>在邊緣端落地

    大曉機(jī)器人開源實(shí)時生成世界模型Kairos 3.0-4B

    近日,大曉機(jī)器人重磅開源開悟世界模型3.0(Kairos 3.0)-4B 系列具身原生世界模型。作為業(yè)內(nèi)首個實(shí)現(xiàn) “多模態(tài)理解 — 生成 — 預(yù)測” 一體化的
    的頭像 發(fā)表于 03-14 16:54 ?1979次閱讀
    大曉機(jī)器人<b class='flag-5'>開源</b>實(shí)時<b class='flag-5'>生成</b>世界<b class='flag-5'>模型</b>Kairos 3.0-4B

    模型 ai coding 比較

    序 我主要用途是 ai coding,從各種渠道獲取到了很多 不同的大模型排序 最多的是 opus 4.6 > k2.5 > glm5 >
    發(fā)表于 02-19 13:43

    使用NORDIC AI的好處

    提升能效,適合音頻、圖像和高采樣率傳感器等更重的 AI 負(fù)載。[Axon NPU 技術(shù)頁] 模型更小、更快、更省電 Neuton 模型相較 TensorFlow Lite:* 內(nèi)存
    發(fā)表于 01-31 23:16

    從炫技到量產(chǎn),具身智能要突破哪些瓶頸?

    LingBot-VLA 開源,具身智能的 Stable Diffusion 來了?
    的頭像 發(fā)表于 01-28 17:12 ?9144次閱讀
    從炫技到量產(chǎn),具身智能要突破哪些瓶頸?

    使用Firebase AI Logic生成圖像模型的兩種新功能

    為您的應(yīng)用添加自定義圖像,能夠顯著改善和個性化用戶體驗(yàn),有效提高用戶參與度。本文將探討使用 Firebase AI Logic 生成圖像的兩種新功能: 其一是 Imagen 專屬編輯功
    的頭像 發(fā)表于 11-30 09:28 ?527次閱讀

    本地部署Stable Diffusion實(shí)現(xiàn)AI文字生成高質(zhì)量矢量圖片應(yīng)用于電子商務(wù)

    本地部署Stable Diffusion
    的頭像 發(fā)表于 11-28 07:19 ?869次閱讀

    openDACS 2025 開源EDA與芯片賽項(xiàng) 賽題七:基于大模型生成式原理圖設(shè)計(jì)

    (Large Language Models, LLMs)正逐步成為EDA工具變革的核心驅(qū)動力之一。近年來,以GPT、DeepSeek、通義千問等為代表的通用大模型在文本生成、語義理解、代碼生成、
    發(fā)表于 11-13 11:49

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    AI的應(yīng)用多種多樣。比如:DALL-E2、Midjourney、Stable Diffusion等,不僅包括對話功能,還包括生成圖像、視頻、
    發(fā)表于 09-12 16:07

    成都匯陽投資關(guān)于大模型白熱化,應(yīng)用加速分化

    ? ? ? ?大模型: 加速多模態(tài)研發(fā) ,閉源模型逐步逆襲開源 多模態(tài)技術(shù)路線尚未收斂 , 國內(nèi)外大模型廠商持續(xù)刷新 SOAT。 圖片領(lǐng)域 ,GPT-4o
    的頭像 發(fā)表于 09-09 09:30 ?1071次閱讀

    【Sipeed MaixCAM Pro開發(fā)板試用體驗(yàn)】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)

    1. 項(xiàng)目概述 本項(xiàng)目旨在開發(fā)并部署一個高精度的深度學(xué)習(xí)模型,用于自動鑒別一張圖片是由AI生成(如Stable Diffusion, DAL
    發(fā)表于 08-21 13:59

    谷歌新一代生成AI媒體模型登陸Vertex AI平臺

    我們在 Vertex AI 上推出新一代生成AI 媒體模型: Imagen 4、Veo 3 和 Lyria 2。
    的頭像 發(fā)表于 06-18 09:56 ?1277次閱讀

    利用NVIDIA 3D引導(dǎo)生成AI Blueprint控制圖像生成

    AI 賦能的圖像生成技術(shù)突飛猛進(jìn),從早期模型生成手指過多的人類圖像,到現(xiàn)在能創(chuàng)造出令人驚嘆的逼
    的頭像 發(fā)表于 06-05 09:24 ?993次閱讀

    Gemini API集成Google圖像生成模型Imagen 3

    開發(fā)者現(xiàn)在可以通過 Gemini API 訪問 Google 最先進(jìn)的圖像生成模型 Imagen 3。該模型最初僅對付費(fèi)用戶開放,不久后也將面向免費(fèi)用戶推出。
    的頭像 發(fā)表于 05-14 16:53 ?1425次閱讀
    资源县| 沙洋县| 大石桥市| 类乌齐县| 扎囊县| 永宁县| 汉中市| 高密市| 城口县| 金门县| 阳泉市| 大厂| 安顺市| 平果县| 勃利县| 元朗区| 红河县| 漳平市| 呼伦贝尔市| 印江| 博罗县| 余江县| 广宗县| 冕宁县| 安乡县| 偏关县| 南雄市| 定襄县| 武汉市| 温泉县| 茌平县| 霍城县| 永修县| 彭州市| 石林| 金溪县| 日喀则市| 高密市| 麟游县| 苏尼特右旗| 四子王旗|