Gaano OpenAI's DALL-E Binabago ng Modelo ang AI Image Generation - ChatGPT Online: Matuklasan OpenAIAng Nangungunang AI ChatBot

Ang pagbuo ng imahe ng AI ay ganap na nagbago sa nakalipas na ilang taon. Ang dating teknolohiyang niche na pinaghihigpitan sa malalaking kumpanya ng teknolohiya ay naa-access na ngayon ng sinumang may koneksyon sa internet, salamat sa mga bagong modelo ng malalim na pag-aaral tulad ng DALL-E.

Sa post na ito, bibigyan kita ng breakdown ng DALL-E modelo - kung ano ito, kung paano ito gumagana, at ilan sa mga nakakaakit na imahe na maaari nitong gawin. Tatalakayin din natin ang mga implikasyon ng teknolohiyang ito at kung paano ito maaaring makaapekto sa stock photography, digital art, at higit pa.

Magsimula na tayo!

Talaan ng nilalaman

Ano ang DALL-E?

DALL-E ay isang AI system na nilikha ng OpenAI na maaaring makabuo ng mga makatotohanang larawan at sining mula sa isang paglalarawan ng teksto.

Ang pangalan ay hango sa iconic na Spanish surrealist artist na si Salvador Dali at ang friendly na robot ng Pixar na WALL-E. Pagsama-samahin ang mga ito at makukuha mo DALL-E!

Ilang halimbawa ng text prompt at mga larawang ginawa ni DALL-E ay kinabibilangan ng:

Isang armchair sa hugis ng isang avocado -> Isang photo-realistic na ginawang imahe ng nasabing armchair
Isang daisy na gawa sa rubi -> Isang daisy na may mga talulot na gawa sa kumikinang na pulang gemstones
Isang baby peregrine falcon na nakasuot ng maliit na niniting na scarf -> Isang kaibig-ibig na falcon hatchling na nakasuot ng scarf

Tulad ng iyong nakikita, DALL-E may napakagandang imahinasyon!

Ang pangunahing bagay na nagbibigay-daan DALL-E upang makabuo ng mga mapag-imbentong larawan ay neural network.

Gaano DALL-E Nakikinabang sa Mga Neural Network

DALL-E gumagamit ng isang uri ng malalim na pagkatuto na tinatawag na a transpormer na neural network.

Ang modelo ay sinanay sa bilyun-bilyong pares ng imahe-text mula sa internet upang magtatag ng mga koneksyon sa pagitan ng mga konseptong tekstuwal at mga visual na elemento.

Halimbawa, sa pamamagitan ng pagtingin sa milyun-milyong naka-caption na larawan online, nauunawaan ng AI na ang isang larawang may text na "pet dog" ay malamang na naglalaman ng larawan ng isang mabalahibong hayop sa aso.

Kapag binigyan ng bagong text prompt, DALL-E sinusuri ang malawak nitong database ng pag-iisip upang kunin ang mga nauugnay na visual na bahagi na pinakamahusay na tumutugma sa paglalarawan. Pagkatapos ay malikhain nitong pinagsasama at ginagawa ang mga elementong ito sa isang ganap na nobela na larawang nabuo para lamang sa prompt na iyon!

Binibigyang-daan nito ang AI system na hindi lamang muling paghaluin ang mga umiiral na larawan ngunit sa autonomously gunigunihin at lumikha mga larawang ganap na bago.

Ngunit ang pagbuo ng mga nakakumbinsi na imahe ay nangangailangan ng higit pa sa pagkuha ng mga konsepto - ang mga imahe ay kailangan ding magmukhang makatotohanan.

Iyan na kung saan mga modelo ng pagsasabog pasok ka…

Mga Modelo ng Diffusion para sa Makatotohanang Pagbuo ng Larawan

Ang mga tradisyunal na neural network ay mahihirapang mag-render ng makatotohanang mga texture at magkakaugnay na mga imahe.

DALL-E nakakasagabal dito mga modelo ng pagsasabog. Ito ay isang cutting-edge na diskarte sa AI na nagsasangkot ng 'diffusing' o randomizing ingay sa isang imahe ng libu-libong beses hanggang sa isang nakikilalang imahe ay lumabas mula sa kaguluhan!

Sa pamamagitan ng pag-fine-tune sa proseso ng diffusion na ito, natututo ang AI kung paano magpakilala ng ingay sa mas matalinong mga paraan upang ang huling output ay magmukhang presko, malinaw, at kapansin-pansing makatotohanan.

Pinapayagan nito DALL-E upang makagawa ng mga larawang may magagandang detalye na tumpak na naglalarawan ng mga materyales, liwanag, anino, at mga kulay na nakakagulat na nakakumbinsi sa mga taong manonood.

Ang pagsasama-sama ng mga mapanlikhang kapasidad ng mga transformer sa pagiging totoo ng mga modelo ng pagsasabog ang nagbibigay DALL-E ang natatanging likas na malikhain nito.

Tingnan natin ang ilang halimbawa!

Anong Uri ng mga Larawan ang Magagawa DALL-E Bumuo?

Nakita na natin yan DALL-E maaaring mag-render ng mga hindi pangkaraniwang konsepto tulad ng isang avocado armchair o gemstone na bulaklak. Ngunit ano ang mga praktikal na paggamit ng pagbuo ng imahe ng AI?

Well, simula noon DALL-E ay sinanay sa isang malaking dataset ng kultura, maaari nitong mailarawan ang isang malawak na hanay ng mga paksa na sumasaklaw sa iba't ibang panahon, genre, at medium.

Ang ilang mga halimbawa nito ay:

Mga Ilustrasyon – orihinal na digital na likhang sining na naglalarawan ng mga kamangha-manghang eksena
Infographics – biswal na nagpapaliwanag ng mga konsepto gamit ang mga chart, mapa, timeline
Mga ni-retoke na larawan – matalinong pagpapahusay ng mga larawan tulad ng pag-alis ng mga bagay o pagtanda ng mga mukha
Photography – pagpo-pose ng mga produkto, tao, o hayop sa mga malikhaing photo shoot
Mga Advertisement – kunwaring mga ad para sa mga produktong hindi pa umiiral
Landscapes – mga mundong umiiral lamang sa fiction o sa iyong imahinasyon
Fashion – mga disenyo ng damit at damit na namodelo sa mga mannequin
Arkitektura – masalimuot na 3D rendering ng mga gusaling totoo o pinangarap

At iyon ay ilan lamang sa mga kategorya! DALL-E ay nakabuo ng higit sa 2 milyong mga imahe at nagbibilang para sa higit sa 200,000 mga gumagamit.

Ang mga posibilidad ay tila walang katapusan. Bilang isa DALL-E sabi ng user: “Ito ay tulad ng pagkakaroon ng isang milyong Picassos sa iyong computer!"

Ngunit paano maihahambing ang mga imaheng binuo ng AI na ito sa kung ano ang maaaring likhain ng mga tao?

Maihahambing ba ang AI Art sa Pagkamalikhain ng Tao?

Walang duda tulad ng mga sistema ng AI DALL-E magpakita ng kahanga-hangang antas ng pagkamalikhain at imahinasyon.

Ang teknolohiya ay naghihikayat ng maraming pilosopikal na tanong - ano is pagkamalikhain? Maaari bang maging tunay na malikhain ang mga makina? Ano ang tumutukoy sa sining?

Mga kumplikadong isyu na walang madaling sagot.

Sa praktikal na pagsasalita, ang mga imaheng binuo ng AI ay madalas na ginagaya at nire-remix ang mga elemento na makikita sa data ng pagsasanay nito sa halip na lubos na baguhin ang buong paradigma ng visual na kultura.

Kaya may mga limitasyon sa pagka-orihinal at pangitain ng makina. Iyon ang dahilan kung bakit marami ang naniniwala na ang mga tao na artista ay naghahari pa rin pagdating sa pagpapakita ng groundbreaking na pagkamalikhain, pagpapahayag ng mayamang damdamin, at pagpapayunir ng ganap na mga istilo ng nobela.

Gayunpaman, dahil lang sa nagmula ang isang imahe DALL-E hindi ginagawang mas kahanga-hanga o nakakapukaw ng pag-iisip! Ang AI art ay nakatayo bilang isang hindi kapani-paniwalang teknikal at kultural na tagumpay.

At artista man o hindi, DALL-E nagbibigay-daan sa sinuman na mag-tap sa radikal na pagkamalikhain – gawing madaling makita ang iyong imahinasyon.

Ang ganitong uri ng pagiging malikhain ay magkakaroon ng malaking implikasyon sa maraming visual na larangan at industriya.

Ang Epekto ng AI Image Generation

Mga tool tulad ng DALL-E hinulaan kung paano mababago ng AI ang mga trabahong may kinalaman sa photography, digital art, graphic na disenyo, at higit pa.

Ang ilang mga application ay kinabibilangan ng:

Pagpapalakas ng Indibidwal na Pagkamalikhain – kahit sino ay maaaring lumikha ng mga graphics, mga eksena, at mga poster nang walang teknikal na kasanayan sa sining
Pagtulong sa mga Working Creative Professionals – Ang AI ay maaaring mabilis na makapagbigay ng mga paunang konsepto/draft na dapat gawin
Pag-automate at Pag-scale ng Paggawa ng Nilalaman - DALL-E massively amplifies ang output ng visual media
Pag-uudyok ng Innovation Sa Itinatag na Media – pagtuklas ng mga bagong paraan tulad ng AI/human collaborations
Paganahin ang mga Bagong Anyo ng Generative Art – gamit ang AI upang ipakita ang mga mapanlikhang panloob na mundo
Pagtataas ng Mga Legal na Tanong Tungkol sa Copyright at Pagmamay-ari – sino ang nagmamay-ari ng imaheng binuo ng AI? Maaari bang bumuo ang AI ng sarili nitong malikhaing IP?

Ang mga ito ay lahat ng aktibong talakayan sa mga artista at malikhaing industriya na nakikipagbuno sa teknolohiyang ito.

Bagama't tiyak na may mga bukas na tanong, nasasabik akong makita kung paano ang pagbuo ng imahe ng AI ay nagpapasigla ng higit na pagkamalikhain, hindi mas mababa!

Isipin na lang kung ano ang maaari nating maisip kung maaalis ng mga teknikal na hadlang. O kung paano maaaring isama ng mga creative ang teknolohiyang ito sa kanilang mga imbentaryo.

At para sa pang-araw-araw na tao, ang paggawa ng anumang bagay na naiisip mo ay maaaring gawing mas kasiya-siya at makabuluhan ang digital art!

Hindi ko alam tungkol sa iyo, ngunit ang aking isip ay puno ng mga ideya upang subukan ngayon. Ito ay nag-uudyok sa akin sa aking susunod na punto...

Paano Mo Maa-access DALL-E ngayon

Noong nakaraan, naka-lock ang mga advanced na AI system sa mga research lab na nakalaan para sa mga PhD sa computer science.

Ngunit salamat sa OpenAImisyon tungo sa ligtas at responsableng pagpapaunlad ng AI, DALL-E ay available na ngayon sa pampublikong beta para sa mga nagnanais na pang-araw-araw na creator!

Upang mag-sign up para sa DALL-E pag-access:

Pumunta sa OpenAINi DALL-E pahina ng waitlist
Ilagay ang iyong email para sa waitlist
Maghintay para sa isang imbitasyon upang lumikha ng isang OpenAI account!

Kapag nakakuha ka ng access, magkakaroon ka ng panimulang balanse sa kredito upang makabuo ng mga larawan DALL-E. Maaaring mayroong mga opsyon para sa ilang partikular na user na makakuha ng karagdagang mga libreng kredito.

Subukan ang mga hindi kapani-paniwala, kahanga-hanga, o kahit na makamundong mga ideya - mapagtanto ang iyong mga malikhaing pangitain nang mas mabilis kaysa dati salamat sa AI!

Ingat lang na wag lalabag OpenAIpatakaran sa nilalaman ni, na nagbabawal sa marahas, ilegal, o mapanlinlang na koleksyon ng imahe.

Kaya't matuwa at mag-sign up ngayon upang simulan ang pagpapakita ng iyong visual na imahinasyon gamit ang rebolusyonaryong teknolohiyang ito!

At nariyan ka - isang komprehensibong pagtingin sa OpenAIAng pagbabago ng laro DALL-E modelo para sa pagbuo ng imahe ng AI.

Tinakpan namin kung paano DALL-E gumagamit ng mga neural network at mga modelo ng pagsasabog upang makabuo ng mga nakakagulat na makatotohanan at malikhaing mga imahe.

Ang teknolohiyang ito ay nagpapakita ng mga mapanlikhang kakayahan ng AI habang pinupunan ang mga natatanging lakas ng tao tulad ng emosyonal na pagpapahayag at pangunguna sa pagbabago.

DALL-E nangangako na bigyang kapangyarihan ang indibidwal na pagkamalikhain, tulungan ang mga propesyonal na artist, i-automate ang paggawa ng nilalaman, at pukawin ang mga bagong anyo ng generative art.

Kaya mag-sign up at subukan DALL-E ngayon upang makita ang iyong visual na imahinasyon na binibigyang buhay!

Ipaalam sa akin kung anong radikal, nakakatawa, o talagang kakaibang mga larawan ang niluluto mo gamit ang futuristic na teknolohiyang ito. Hindi ako makapaghintay upang makita kung ano ang imahinasyon ng ChatGPT dumating up sa!

Gaano OpenAINi DALL-E Ang Modelo ay Nagre-revolutionize ng AI Image Generation