日本a√视频在线,久久青青亚洲国产,亚洲一区欧美二区,免费g片在线观看网站

<style id="k3y6c"><u id="k3y6c"></u></style>

<mark id="k3y6c"></mark>

<mark id="k3y6c"></mark>

<sub id="rxvwh"></sub>

<th id="rxvwh"><style id="rxvwh"></style></th><sub id="rxvwh"></sub>

"); //-->

博客專欄

EEPW首頁 > 博客 > OpenAI的DALL·E迎來升級，不止文本生成圖像，還可二次創(chuàng)作

OpenAI的DALL·E迎來升級，不止文本生成圖像，還可二次創(chuàng)作

發(fā)布人：機器之心時間：2022-04-09 來源：工程師

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

發(fā)布文章

在令人嘆為觀止方面，OpenAI 從不令人失望。

去年 1 月 6 日，OpenAI 發(fā)布了新模型 DALL·E，不用跨界也能從文本生成圖像，打破了自然語言與視覺次元壁，引起了 AI 圈的一陣歡呼。

時隔一年多后，DALL·E 迎來了升級版本——DALL·E 2。

與 DALL·E 相比，DALL·E 2 在生成用戶描述的圖像時具有更高的分辨率和更低的延遲。并且，新版本還增添了一些新的功能，比如對原始圖像進行編輯。

不過，OpenAI 沒有直接向公眾開放 DALL·E 2。目前，研究者可以在線注冊預覽該系統(tǒng)。OpenAI 希望以后可以將它用于第三方應用程序。

試玩 Waitlist 地址：https://labs.openai.com/waitlist

OpenAI 還公布了 DALL·E 2 的研究論文《Hierarchical Text-Conditional Image Generation with CLIP Latents》，OpenAI 研究科學家、共同一作 Prafulla Dhariwal 表示，「這個神經(jīng)網(wǎng)絡真是太神奇了，根據(jù)文本描述就能生成對應圖像。」

論文地址：https://cdn.openai.com/papers/dall-e-2.pdf

網(wǎng)友紛紛曬出了使用 DALL·E 2 生成的圖像，比如玩滑板的熊貓靚仔。

又比如席地而坐看星空的小孩和小狗。

DALL·E 2 生成藝術大作

DALL·E 2 的表現(xiàn)如何呢？我們先睹為快。首先，DALL·E 2 可以從文本描述中創(chuàng)建原始、逼真的圖像和藝術，它可以組合概念、屬性和風格進行圖像生成。例如一位騎著馬的宇航員：

生成的圖像可不止一張（官網(wǎng)示例給出 10 張），它還能生成下圖這樣的（一位騎著馬的宇航員），真是風格多變：

DALL·E 2 可以根據(jù)自然語言字幕對現(xiàn)有圖像進行編輯。它可以在考慮陰影、反射和紋理的同時添加和刪除元素。如下圖所示，左邊是原始圖像，右邊是 DALL·E 2 編輯后的圖像。兩張圖對比后，我們發(fā)現(xiàn)左圖中有數(shù)字 1、2、3，點擊相應的位置，可以添加元素例如柯基犬，下圖選擇在 1 處添加柯基犬。

你也可以在 3 處添加一只柯基犬。

DALL·E 2 可以根據(jù)原圖像進行二次創(chuàng)作，創(chuàng)造出不同的變體：

你可能會問，DALL·E 2 比一代模型到底好在哪？簡單來說 DALL·E 2 以 4 倍的分辨率生成更逼真、更準確的圖像。例如下圖生成一幅「日出時坐在田野里的狐貍，生成的圖像為莫奈風格。」DALL·E 2 生成的圖像更準確。

看完上述展示，我們可以將 DALL·E 2 的特點歸結如下：DALL·E 2 的一項新功能是修復，在 DALL·E 1 的基礎上，將文本到圖像生成應用在圖像更細粒度的級別上。用戶可以從現(xiàn)有的圖片開始，選擇一個區(qū)域，讓模型對圖像進行編輯，例如，你可以在客廳的墻上畫一幅畫，然后用另一幅畫代替它，又或者在咖啡桌上放一瓶花。該模型可以填充 (或刪除) 對象，同時考慮房間中陰影的方向等細節(jié)。

DALL·E 2 的另一個功能是生成圖像不同變體，用戶上傳一張圖像，然后模型創(chuàng)建出一系列類似的變體。此外，DALL·E 2 還可以混合兩張圖片，生成包含這兩種元素的圖片。其生成的圖像為 1024 x 1024 像素，大大超過了 256 x 256 像素。

生成模型的迭代

DALL·E 2 建立在 CLIP 之上，OpenAI 研究科學家 Prafulla Dhariwal 說：「DALL·E 1 只是從語言中提取了 GPT-3 的方法并將其應用于生成圖像：將圖像壓縮成一系列單詞，并且學會了預測接下來會發(fā)生什么?！?/span>

這是許多文本 AI 應用程序使用的 GPT 模型。但單詞匹配并不一定能符合人們的預期，而且預測過程限制了圖像的真實性。CLIP 旨在以人類的方式查看圖像并總結其內(nèi)容，OpenAI 迭代創(chuàng)建了一個 CLIP 的倒置版本——「unCLIP」，它能從描述生成圖像，而 DALL·E 2 使用稱為擴散（diffusion）的過程生成圖像。

訓練數(shù)據(jù)集由圖像 x 及其對應的字幕 y 對 (x, y) 組成。給定圖像 x， z_i 和 z_t 分別表示 CLIP 圖像和文本嵌入。OpenAI 生成堆棧以使用兩個組件從字幕生成圖像：

先驗 P(z_i |y) 生成以字幕 y 為條件的 CLIP 圖像嵌入 z_i;
**** P(x|z_i , y) 以 CLIP 圖像嵌入 z_i（以及可選的文本字幕 y）為條件生成圖像 x。

****允許研究者在給定 CLIP 圖像嵌入的情況下反演圖像（invert images），而先驗允許學習圖像嵌入本身的生成模型。堆疊這兩個組件產(chǎn)生一個圖像 x 、給定字幕 y 的生成模型 P(x|y) ：

DALL·E 的完整模型從未公開發(fā)布，但其他開發(fā)人員在過去一年中已經(jīng)構建了一些模仿 DALL·E 功能的工具。最受歡迎的主流應用程序之一是 Wombo 的 Dream 移動應用程序，它能夠根據(jù)用戶描述的各種內(nèi)容生成圖片。

OpenAI 已經(jīng)采取了一些內(nèi)置的保護措施。該模型是在已剔除不良數(shù)據(jù)的數(shù)據(jù)集上進行訓練的，理想情況下會限制其產(chǎn)生令人反感的內(nèi)容的能力。

為避免生成的圖片被濫用，DALL·E 2 在生成的圖片上都標有水印，以表明該作品是 AI 生成的。此外，該模型也無法根據(jù)名稱生成任何可識別的面孔。

DALL·E 2 將由經(jīng)過審查的合作伙伴進行測試，但有一些要求：禁止用戶上傳或生成「可能造成傷害」的圖像。他們還必須說明用 AI 生成圖像的作用，并且不能通過應用程序或網(wǎng)站將生成的圖像提供給其他人。

但 OpenAI 希望稍后再將 DALL·E 2 其添加到該組織的 API 工具集中，使其能夠為第三方應用程序提供支持。Dhariwal 說：「我們希望分階段進行這個過程，以從獲得的反饋中不斷評估如何安全地發(fā)布這項技術?！?/span>

參考鏈接：

https://openai.com/dall-e-2/

https://www.theverge.com/2022/4/6/23012123/openai-clip-dalle-2-ai-text-to-image-generator-testing

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： AI

相關推薦

WTC-AI型太陽能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽能熱水器電路熱水器 | 2012-07-30

Nvidia的CEO談AI的未來：“我們將需要三臺電腦... 一臺來創(chuàng)建AI... 一臺來模擬AI... 一臺來運行AI”

智能計算 AI | 2024-07-31

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

瑞薩電子AI單元解決方案成功提高GE醫(yī)療（日本）日野工廠的生產(chǎn)力

winni945 | 2018-09-12

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計算 AI 智能計算深圳 | 2024-07-30

如何快速搭建手寫體識別演示系統(tǒng)

視頻 digikey AI 手寫體識別 | 2022-07-29

萬家樂JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬家樂 | 2013-01-17

“破局AI開發(fā)，釋放邊緣算力開發(fā)者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

繼上次海聯(lián)達Ai-ap100拆機之電源改造

zhuwei0710 | 2013-04-03

CSR8670CSR8675智能語音Alexa藍牙方案開發(fā)

資源下載 AI 智能語音 | 2017-12-14

AI驅動的嵌入式聲音和振動識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

釋說芯語16：硬科技：構建企業(yè)未來之路（附PPT）

jackwang | 2018-10-22

加大調(diào)整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

蘋果表示其AI模型是在谷歌的定制芯片上訓練的

智能計算 AI | 2024-07-30

國際奧委會：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會體育 | 2024-07-26

大嘴業(yè)話-AI目前市場分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術 | 2023-04-25

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

AI+機器視覺成趨勢，圖文詳解N大應用場景

智能計算安森美 AI 機器視覺 | 2024-07-31

iPhone 16將不會預裝AI功能？計劃通過iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過 Meta AI 模型安全系統(tǒng)

智能計算 Meta AI | 2024-07-31

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來頭？

視頻 AI 機器人 | 2021-02-26

WTC-AI太陽能熱水器電路圖

設計方案 WTC-AI 太陽能熱水器電路圖 | 2012-07-24

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

海聯(lián)達（Aigale）Ai-HD1 無線全高清套件拆解

zhuwei0710 | 2013-04-28

摩根士丹利：僅 GB200 AI 服務器業(yè)務，就為英偉達創(chuàng)造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

蘋果承認：AI模型使用谷歌定制芯片訓練

智能計算蘋果 AI 谷歌定制芯片 | 2024-07-30

焦點

推薦視頻

更多>>

技術專區(qū)

關閉

<pre id="a7lve"></pre>

<xmp id="a7lve">

<th id="a7lve"><style id="a7lve"></style></th>