Endezyariya bilez

Nêrînek Nêzîk li DALL-E 3 ya OpenAI

Published

1 day ago

October 31, 2023

Di Generative AI cîhan, bi ya herî dawî re domdarî navê lîstikê ye. Û dema ku ew tê ser çêkirina wêneyan, Belavbûna Stable û midjourney bûn platforma ku her kes li ser dipeyivî - heta niha.

OpenAI, ku ji hêla giant teknolojî Microsoft ve hatî piştgirî kirin, destnîşan kir DALL E 3 di 20-ê Septemberlonê, 2023 de.

DALL-E 3 ne tenê çêkirina wêneyan e; ew e ku hûn ramanên xwe bidin jiyîn, bi awayê ku we wan xeyal dikir. Û beşa herî baş? Ew zû ye, mîna, bi rastî zû. We ramanek heye, hûn wê bidin DALL-E 3, û geş bikin, wêneya we amade ye.

Ji ber vê yekê, di vê gotarê de, em ê li ser çi ye DALL-E 3 kûr bikolin. Em ê biaxivin ka ew çawa dixebite, çi wê ji yên mayî cuda dike, û çima dibe ku ew tenê amûrek be ku we nizanibû ku hûn hewce ne. Ku hûn sêwirîner, hunermendek, an tenê kesek bi gelek ramanên xweş bin, hûn ê bixwazin ku ji bo vê yekê bisekinin. Werin em dest pê bikin.

Tişta nû ya DALL·E 3 ev e ku ew ji DALL·E 2-ê pir çêtir çarçoweyê digire. Dibe ku guhertoyên berê hin hûrgulî ji dest dane an jî çend hûrgulî li vir û wir paşguh kirine, lê DALL·E 3 li ser xalê ye. Ew hûrguliyên rastîn ên tiştê ku hûn jê dipirsin hildibijêre, wêneyek ku ji ya ku we xeyal kiriye nêzîktir dide we.

Beşa xweş? DALL·E 3 û GPT chat niha bi hev re entegre bûne. Ew bi hev re dixebitin da ku ji bo safîkirina ramanên we bibin alîkar. Hûn konseptekê diavêjin, ChatGPT di birêkûpêkkirina daxwazê de dibe alîkar, û DALL·E 3 wê zindî dike. Heke hûn ne heyranê wêneyê ne, hûn dikarin ji ChatGPT bipirsin ku daxwazê biguhezîne û DALL·E 3 ji nû ve biceribîne. Ji bo dravdana mehane ya 20$, hûn gihîştin GPT-4, DALL·E 3, û gelek taybetmendiyên din ên xweş.

Microsoft bingchat DALL·E 3 hê berî ku ChatGPT-ya OpenAI-yê bike, girtiye destê xwe, û naha ew ne tenê pargîdaniyên mezin lê her kesê ku dikare belaş bi wê re bilîze. Yekbûna nav Bing Chat û Bing Image Afirînerê karanîna wê ji bo her kesî pir hêsantir dike.

Rabûna Modelên Diffusion

Di 3 salên dawî de, vîzyona AI-ê bûye şahidê bilindbûna modelên belavbûnê, bi taybetî di hilberîna wêneyê de gavekî girîng diavêje. Berî modelên belavbûnê, Torên Dijbera Generative (GAN) teknolojiyek ji bo çêkirina wêneyên realîst bûn.

GANs

Lêbelê, wan kêşeyên wan hebûn, di nav de hewcedariya jimarek mezin a daneyan û hêza hesabkerî, ku bi gelemperî ji wan re mijûl bûn.

Derbasbûn belavbûn modelên. Ew ji GAN-an re wekî alternatîfek bi îstîqrar û bikêrhatî derketin holê. Berevajî GAN-an, modelên belavbûnê bi lêzêdekirina deng li daneyan tevdigerin, wê vedişêrin heya ku tenê rasthatî bimîne. Dûv re ew bi paş ve dixebitin ku vê pêvajoyê berevajî bikin, daneyên watedar ji deng ji nû ve ava dikin. Ev pêvajo îsbat kiriye ku bi bandor û kêm çavkanî ye, ku modelên belavbûnê di civata AI-ê de mijarek germ dike.

Xala zivirîna rastîn li dora sala 2020-an hat, bi rêzek kaxezên nûjen û danasîna CLIP-a OpenAI teknolojiyê, ku bi girîngî kapasîteyên modelên belavbûnê pêşkeftî kir. Vê yekê modelên belavbûnê di senteza nivîs-bi-wêne de bi taybetî baş kir, hişt ku ew ji ravekirinên nivîsê wêneyên realîst biafirînin. Ev serkeftin ne tenê di hilberîna wêneyan de, di heman demê de di warên mîna de jî bûn pêkhatina muzîkê û lêkolîna bijîjkî.

Îro, modelên belavbûnê ne tenê mijarek berjewendiya akademîk in lê di senaryoyên pratîk, cîhana rastîn de têne bikar anîn.

Modela Hilberînerî û Qatên Xwe- Baldarî: DALL-E 3

Kanî

Yek ji pêşkeftinên krîtîk ên di vî warî de pêşkeftina modela hilberîner e, digel nêzîkatiyên nimûne-based mîna modela hilberîner a xweser û pêvajoyên belavbûnê ku rê li ber digirin. Wan modelên nivîs-bi-wêne veguherandine, ku rê li ber çêtirkirinên performansê yên berbiçav vedike. Bi dabeşkirina hilberîna wêneyê li gavên veqetandî, ev model ji bo fêrbûna torên neuralî hêsantir bûne û hêsantir bûne.

Di heman demê de, karanîna qatên xwe-baldariyê rolek girîng lîstiye. Van qatan, li hev kom bûne, di afirandina wêneyan de bêyî hewcedariya netewandîyên cîhêyî yên nepenî, pirsgirêkek hevpar a bi tevliheviyan re bûne alîkar. Vê veguheztinê hişt ku modelên nivîs-bi-wêne bi rengek pêbawer mezin bibin û pêşve bibin, ji ber taybetmendiyên pîvandinê yên baş-fêmkirî yên veguherîneran.

Pirsgirêk û Çareserî di Nifşa Wêne de

Tevî van pêşkeftinan, kontrolkirina di hilberîna wêneyê de pirsgirêkek dimîne. Pirsgirêkên wekî şopandina bilez, ku dibe ku model bi nivîsa têketinê ve girêdayî nebe, serdest bûne. Ji bo çareserkirina vê yekê, nêzîkatiyên nû yên wekî başkirina sernavê hatine pêşniyar kirin, ku armanc ew e ku di berhevokên perwerdehiyê de qalîteya cotên nivîs û wêneyan zêde bikin.

Pêşveçûna Sernavê: Nêzîktêdayînek Roman

Pêşveçûna sernavê ji bo wêneyan sernavên çêtir-kalîteyê hilberîne, ku di encamê de di perwerdekirina modelên nivîs-bi-wêne rasttir de dibe alîkar. Ev bi sernavek wêneya bihêz a ku raveyên hûrgulî û rast ên wêneyan çêdike, tê bidestxistin. Bi perwerdekirina li ser van sernavên pêşkeftî DALL-E 3 karîbû bigihîje encamên berbiçav, ku ji nêz ve dişibin wêne û karên hunerî yên ku ji hêla mirovan ve hatine çêkirin.

Perwerde li ser Daneyên sentetîk

Têgeha perwerdehiya li ser daneyên sentetîk ne nû ye. Lêbelê, tevkariya bêhempa li vir di afirandina romanek, pergala sernavkirina wêneya raveker de ye. Bandora karanîna sernavên sentetîk ji bo perwerdehiya modelên hilberîner girîng bûye, ku rê li ber çêtirkirina kapasîteya modelê ya ku bi rêkûpêk bişopîne.

Nirxandina DALL-E 3

Bi gelek nirxandin û berhevdana bi modelên berê yên mîna DALL-E 2 û Stable Diffusion XL, DALL-E 3 performansa bilindtir destnîşan kir, nemaze di karên ku bi şopandina bilez ve girêdayî ne.

Berawirdkirina modelên nivîs-bi-wêne li ser nirxandinên cihêreng

Bikaranîna nirxandin û pîvanên otomatîkî delîlên zelal ên kapasîteyên wê peyda kiriye, pozîsyona xwe wekî hilberînerek nivîs-bi-wêne ya herî pêşkeftî zexm dike.

DALL-E 3 Pêşniyar û Kabîliyetên

DALL-E 3 ji bo afirandina dîmenan nêzîkatiyek maqûltir û paqijtir pêşkêşî dike. Gava ku hûn lê digerin, hûn ê bala xwe bidin ka DALL-E çawa her wêneyek, bi tevliheviya rastbûn û xeyalê ku bi leza hatî dayîn re vedibêje, çêdike.

Berevajî selefê xwe, ev guhertoya nûvekirî di rêzkirina tiştan bi xwezayî di hundurê dîmenek de û bi rêkûpêk xêzkirina taybetmendiyên mirovî, heya hejmara rast a tiliyên li ser destekî, jêhatî ye. Pêşveçûn berbi hûrguliyên hûrgulî dirêj dibin û naha bi çareseriyek bilindtir têne peyda kirin, ku encamek rastîn û profesyoneltir peyda dike.

Kapasîteyên vegotina nivîsê jî pêşkeftinek berbiçav dîtiye. Cîhê ku guhertoyên berê yên DALL-E nivîsek gibber çêdikir, DALL-E 3 naha dikare tîpên xwenda û bi şêwazê profesyonel (carinan), û carinan logoyên paqij jî çêbike.

Têgihiştina modelê ya daxwazên wêneya tevlihev û nuwaze bi girîngî zêde bûye. DALL-E 3 naha dikare bi duristî danasînên hûrgulî bişopîne, tewra di senaryoyên bi gelek hêman û rêwerzên taybetî de, kapasîteya xwe ya hilberîna wêneyên hevgirtî û baş-pêkhatî destnîşan dike. Werin em hin şîretan û hilbera têkildar a ku me girt lêkolîn bikin:

Design the packaging for a line of organic teas. Include space for the product name and description.

Wêneyên DALL-E 3 li ser bingeha daxwazên nivîsê

Wêneyên DALL-E 3 li ser bingeha pêşniyarên nivîsê (Bêbînî ku postera çepê rastnivîsîna xelet e)

Create a web banner advertising a summer sale on outdoor furniture. The image feature a beach setting with different pieces of outdoor furniture, and text announcing 'Huge Summer Savings!'

Wêneyên DALL-E 3 li ser bingeha daxwazên nivîsê

A vintage travel poster of Paris with bold and stylized text saying 'Visit Paris' at the bottom.

Wêneyên DALL-E 3 li ser bingeha pêşniyarên nivîsê (Bêbînî ku her du poster jî rastnivîsên çewt hene)

A bustling scene of the Diwali festival in India, with families lighting lamps, fireworks in the sky, and traditional sweets and decorations.

Wêneyên DALL-E 3 li ser bingeha daxwazên nivîsê

A detailed marketplace in ancient Rome, with people in period-appropriate clothing, various goods for sale, and architecture of the time.

Wêneyên DALL-E 3 li ser bingeha daxwazên nivîsê

Generate an image of a famous historical figure, like Cleopatra or Leonardo da Vinci, placed in a contemporary setting, using modern technology like smartphones or laptops.

Wêneyên DALL-E 3 li ser bingeha daxwazên nivîsê

Sînorkirin û Rîska DALL-E 3

OpenAI gavên girîng avêtine da ku naveroka eşkere ji daneyên perwerdehiya DALL-E 3 fîltre bike, bi mebesta kêmkirina alîgiran û baştirkirina hilberîna modelê. Di vê yekê de serîlêdana fîlterên taybetî yên ji bo kategoriyên naverokên hesas û guheztinek bendavên ji bo fîlterên berfireh pêk tê. Di stûna kêmkirinê de çend qatên parastinê jî vedihewîne, wek mekanîzmayên redkirinê di ChatGPT de ji bo mijarên hesas, dabeşkerên têketina bilez ji bo pêşîgirtina li binpêkirinên polîtîkayê, lîsteyên blokan ji bo kategoriyên naverokê yên taybetî, û veguhertinan ji bo ku pêbawer bi rêwerzan re bibin yek.

Tevî pêşkeftinên wê, DALL-E 3 di têgihîştina têkiliyên mekanî de, rastkirina nivîsa dirêj, û afirandina dîmenên taybetî de tixûb hene. OpenAI van dijwariyan qebûl dike û ji bo guhertoyên pêşerojê li ser çêtirkirinan dixebite.

Pargîdanî di heman demê de li ser awayên cûdakirina wêneyên çêkirî yên AI-ê ji yên ku ji hêla mirovan ve hatî çêkirin de dixebite, ku pabendbûna wan bi zelalî û karanîna berpirsiyariya AI-ê re nîşan dide.

DALL E 3

DALL-E 3, guhertoya herî dawî, dê di qonaxan de peyda bibe ku bi komên xerîdar ên taybetî dest pê dike û paşê berbi laboratîfên lêkolînê û karûbarên API-ê ve dibe. Lêbelê, dîrokek serbestberdana gelemperî ya belaş hîn nehatiye pejirandin.

OpenAI bi rastî bi DALL-E 3 re di warê AI-ê de standardek nû datîne, bêkêmasî kapasîteyên teknîkî yên tevlihev û navbeynkariya bikarhêner-heval bi hev re dike. Yekbûna DALL-E 3 di platformên berfireh ên wekî Bing de veguheztinek ji serîlêdanên pispor berbi celebên şahî û bikêrhatî yên berfireh, gihîştîtir nîşan dide.

Guherîna lîstika rastîn di salên pêş de dê bibe hevsengiya di navbera nûbûn û bihêzkirina bikarhêner de. Pargîdaniyên ku pêşkeftî ne dê ew bin ku ne tenê sînorên tiştê ku AI dikare bidest bixe, di heman demê de ji bikarhêneran re xweserî û kontrola ku ew dixwazin peyda dikin. OpenAI, bi pabendbûna xwe ya bi AI-ya exlaqî re, vê rêyê bi baldarî dimeşîne. Armanc zelal e: afirandina amûrên AI-yê yên ku ne tenê bi hêz in, lê di heman demê de pêbawer û tevlihev in, bicîh bikin ku feydeyên AI-ê ji her kesî re bigihîjin.

Ma Miss

Hacking û Bikaranîna Bilez a LLM-an

Aayush Mittal

Min pênc salên paşîn derbas kir ku xwe di cîhana balkêş a Fêrbûna Makîne û Fêrbûna Kûr de derbas kir. Hezbûn û pisporiya min hişt ku ez beşdarî zêdetirî 50 projeyên endezyariya nermalava cihêreng, bi taybetî li ser AI / ML-ê bikim. Meraqa min a domdar di heman demê de ez ber bi Pêvajoya Zimanê Xwezayî ve jî kişandim, qadek ku ez dixwazim bêtir lê vekolim.