stuacach Súil Níos Géire ar DALL-E 3 de chuid OpenAI - Unite.AI
Ceangail le linn

Innealtóireacht Pras

Súil Níos Géire ar DALL-E 3 de chuid OpenAI

mm

foilsithe

 on

DALL E 3

sa AI giniúna domhan, ag coinneáil suas leis a dhéanaí is ainm an chluiche. Agus nuair a thagann sé chun íomhánna a ghiniúint, Cobhsaí Idirleathadh agus Meán-turas an ardán a raibh gach duine ag caint faoi – go dtí seo.

Thug OpenAI, le tacaíocht ón fathach teicneolaíochta Microsoft, isteach DALL E 3 ar 20 Meán Fómhair, 2023.

Ní bhaineann DALL-E 3 le híomhánna a chruthú amháin; is éard atá i gceist leis do chuid smaointe a thabhairt ar an saol, díreach mar a shamhlaigh tú iad. Agus an chuid is fearr? Tá sé tapa, cosúil le, i ndáiríre go tapa. Tá smaoineamh agat, cothaíonn tú é go DALL-E 3, agus borradh, tá do íomhá réidh.

Mar sin, san Airteagal seo, táimid ag dul a Léim go domhain isteach cad é DALL-E 3 ar fad faoi. Labhróimid faoi conas a oibríonn sé, cad a leagann amach é ón gcuid eile, agus cén fáth go bhféadfadh sé a bheith díreach mar an uirlis nach raibh a fhios agat a bhí uait. Cibé an bhfuil tú dearthóir, ealaíontóir, nó díreach duine éigin a bhfuil go leor smaointe fionnuara, beidh tú ag iarraidh a bata thart le haghaidh seo. Ar aghaidh linn.

Is é an rud atá nua le DALL·E 3 ná go n-éiríonn leis comhthéacs i bhfad níos fearr ná DALL·E 2. Seans gur chaill leaganacha níos luaithe amach ar roinnt sonraí nó neamhaird a dhéanamh ar roinnt sonraí anseo agus ansiúd, ach tá DALL·E 3 ar an bpointe. Roghnaíonn sé na sonraí cruinne faoina bhfuil tú ag iarraidh, ag tabhairt pictiúr duit atá níos gaire don méid a shamhlaigh tú.

An chuid fionnuar? DALL·E 3 agus ComhráGPT atá comhtháite le chéile anois. Oibríonn siad le chéile chun cabhrú le do chuid smaointe a bheachtú. Déanann tú coincheap, cabhraíonn ChatGPT leis an leid a mhionchoigeartú, agus tugann DALL·E 3 beo é. Mura bhfuil lucht leanúna na híomhá agat, is féidir leat iarraidh ar ChatGPT an leid a mhionathrú agus DALL·E 3 a fháil chun triail eile a bhaint as. Ar tháille mhíosúil de 20$, gheobhaidh tú rochtain ar GPT-4, DALL·E 3, agus go leor gnéithe fionnuara eile.

Microsoft Comhrá Bing fuair sé a lámha ar DALL·E 3 fiú roimh ChatGPT OpenAI, agus anois ní hé amháin na fiontair mhóra ach gach duine a fhaigheann a imirt timpeall leis saor in aisce. Mar gheall ar chomhtháthú le Bing Chat agus Bing Image Creator tá sé i bhfad níos éasca é a úsáid do dhuine ar bith.

Ardú na Samhlacha Idirleata

Le 3 bliana anuas, tá méadú tagtha ar mhúnlaí idirleata le fís AI, ag dul chun cinn suntasach, go háirithe i nginiúint íomhá. Roimh mhúnlaí idirleata, Líonraí Sáraíochta Giniteacha (GANanna) an teicneolaíocht chun íomhánna réalaíocha a ghiniúint.

GANanna

GANanna

Mar sin féin, bhí a sciar féin de dhúshláin acu lena n-áirítear an gá le méideanna ollmhóra sonraí agus cumhacht ríomhaireachtúil, rud a d'fhág go raibh sé deacair iad a láimhseáil go minic.

Iontráil craolacháin samhlacha. Tháinig siad chun cinn mar mhalairt níos cobhsaí agus níos éifeachtaí in ionad GANanna. Murab ionann agus GANanna, feidhmíonn samhlacha idirleata trí thorann a chur le sonraí, á cheilt go dtí nach bhfanann ach randamacht. Ansin oibríonn siad ar gcúl chun an próiseas seo a aisiompú, ag athchruthú sonraí fiúntacha ón torann. Tá an próiseas seo cruthaithe a bheith éifeachtach agus níos lú acmhainní-dian, ag déanamh samhlacha idirleathadh ábhar te i measc an phobail AI.

Tháinig an casadh fíor thart ar 2020, le sraith páipéar nuálaíoch agus tugadh isteach CLIP OpenAI teicneolaíocht, rud a chuir cumas samhlacha idirleata chun cinn go mór. Rinne sé seo samhlacha idirleata an-mhaith ag sintéis téacs-go-íomhá, rud a ligeann dóibh íomhánna réalaíocha a ghiniúint ó chur síos téacs. Ní hamháin go raibh na cinn seo i nginiúint íomhá, ach freisin i réimsí mar comhdhéanamh ceoil agus taighde bithleighis.

Sa lá atá inniu ann, ní ábhar spéise acadúil amháin iad samhlacha idirleata ach baintear úsáid astu i gcásanna praiticiúla sa saol fíor.

Samhaltú Ginideach agus Sraitheanna Féinaird: DALL-E 3

Ar cheann de na dul chun cinn ríthábhachtach sa réimse seo tá éabhlóid na samhaltú ginideach, le cineálacha cur chuige bunaithe ar shampláil ar nós samhaltú ginideach uath-aischéimnitheach agus próisis idirleata chun tosaigh. Tá samhlacha téacs-go-íomhá athraithe acu, rud a d'éirigh go hiontach le feabhsuithe feidhmíochta. Trí ghiniúint íomhánna a bhriseadh síos ina gcéimeanna scoite, tá na samhlacha seo tar éis éirí níos inrianaithe agus níos éasca do líonraí néaracha a fhoghlaim.

Ag an am céanna, bhí ról ríthábhachtach ag baint le húsáid sraitheanna féin-aird. Chabhraigh na sraitheanna seo, atá cruachta le chéile, le híomhánna a ghiniúint gan aon ghá le claontaí spásúla intuigthe, saincheist choitianta le convolutions. Cheadaigh an t-athrú seo samhlacha téacs-go-íomhá chun scála agus feabhsú go hiontaofa, mar gheall ar airíonna scálaithe na gclaochladáin a thuigeann go maith.

Dúshláin agus Réitigh i nGiniúint Íomhá

In ainneoin na dul chun cinn seo, is dúshlán fós é inrialaitheacht i nginiúint íomhá. Bhí saincheisteanna cosúil le leideanna a leanúint, nuair a d’fhéadfadh nach gcloífeadh an tsamhail go dlúth leis an téacs ionchuir, i réim. Chun aghaidh a thabhairt air seo, tá cur chuige nua cosúil le feabhsú fotheideal molta, dírithe ar fheabhas a chur ar cháilíocht na bpéirí téacs agus íomhánna i dtacar sonraí oiliúna.

Feabhsú ar Fhotheideal: Cur Chuige Úrscéal

Is éard atá i gceist le feabhsú fotheideal ná fortheidil ar chaighdeán níos fearr a ghiniúint d’íomhánna, rud a chabhraíonn le hoiliúint a chur ar mhúnlaí téacs-go-íomhá níos cruinne. Baintear é seo amach trí fhotheidealóir íomhá láidir a tháirgeann cur síos mionsonraithe agus cruinn ar íomhánna. Trí oiliúint a chur ar na fortheidil fheabhsaithe seo bhí DALL-E 3 in ann torthaí iontacha a bhaint amach, atá cosúil go dlúth le grianghraif agus saothair ealaíne arna dtáirgeadh ag daoine.

Traenáil ar Sonraí Sintéiseacha

Níl coincheap na hoiliúna ar shonraí sintéiseacha nua. Mar sin féin, is é an rud ar leith atá anseo ná córas úrscríofa, tuairisciúil chun fotheidealú íomhánna a chruthú. Bhí tionchar suntasach ag baint úsáide as fortheidil shintéiseacha chun samhlacha giniúna a thraenáil, rud a d'fhág go bhfuil feabhsuithe ar chumas na samhla leideanna a leanúint go cruinn.

DALL-E3 a mheas

Trí mheastóireacht iolrach agus comparáidí le samhlacha roimhe seo cosúil le DALL-E 2 agus Stable Diffusion XL, tá feidhmíocht níos fearr léirithe ag DALL-E 3, go háirithe i dtascanna a bhaineann le pras a leanúint.

Comparáid idir samhlacha téacs-go-íomhá ar mheastóireachtaí éagsúla

Comparáid idir samhlacha téacs-go-íomhá ar mheastóireachtaí éagsúla

Le húsáid meastóireachtaí uathoibrithe agus tagarmharcanna tá fianaise shoiléir ar a chumais curtha ar fáil, rud a dhaingnigh a seasamh mar ghineadóir téacs-go-íomhá den scoth.

DALL-E 3 Leideanna agus Cumais

Cuireann DALL-E 3 cur chuige níos loighciúla agus níos scagtha ar fáil chun amhairc a chruthú. Agus tú ag dul tríd, tabharfaidh tú faoi deara conas a dhéanann DALL-E gach íomhá, le cumasc de chruinneas agus samhlaíocht a thagann leis an leid a thugtar.

Murab ionann agus a réamhtheachtaí, is fearr an leagan uasghrádaithe seo maidir le réada a shocrú go nádúrtha laistigh de radharc agus gnéithe daonna a léiriú go cruinn, síos go dtí an líon ceart méar ar lámh. Síneann na feabhsuithe chuig sonraí níos míne agus tá siad ar fáil anois ar thaifeach níos airde, ag cinntiú aschur níos réadúla agus gairmiúla.

Tá feabhas suntasach tagtha ar chumais rindreála téacs freisin. Sa chás gur chruthaigh leaganacha roimhe seo de DALL-E téacs gibberish, is féidir le DALL-E 3 litreacha inléite agus stílithe gairmiúla a ghiniúint anois (uaireanta), agus fiú lógónna a ghlanadh uaireanta.

Tá feabhas suntasach tagtha ar thuiscint na samhla ar iarratais ar íomhánna casta agus mionn. Is féidir le DALL-E 3 cur síos mionsonraithe a leanúint go beacht anois, fiú i gcásanna ina bhfuil gnéithe iolracha agus treoracha sonracha, rud a léiríonn a chumas íomhánna comhleanúnacha dea-chumtha a tháirgeadh. Déanaimis iniúchadh ar roinnt leideanna agus an t-aschur faoi seach a fuaireamar:

Design the packaging for a line of organic teas. Include space for the product name and description.

DALL-E 3 íomhá bunaithe ar leideanna téacs

DALL-E 3 íomhá bunaithe ar leideanna téacs (Tabhair faoi deara go bhfuil litriú mícheart ar an bpóstaer ar chlé)

Create a web banner advertising a summer sale on outdoor furniture. The image feature a beach setting with different pieces of outdoor furniture, and text announcing 'Huge Summer Savings!'

DALL-E 3 íomhá bunaithe ar leideanna téacs

DALL-E 3 íomhá bunaithe ar leideanna téacs

A vintage travel poster of Paris with bold and stylized text saying 'Visit Paris' at the bottom.

DALL-E 3 íomhá bunaithe ar leideanna téacs

DALL-E 3 íomhá bunaithe ar leideanna téacs (Tabhair faoi deara go bhfuil litriú mícheart ar an dá phóstaer)

A bustling scene of the Diwali festival in India, with families lighting lamps, fireworks in the sky, and traditional sweets and decorations.
DALL-E 3 íomhá bunaithe ar leideanna téacs

DALL-E 3 íomhá bunaithe ar leideanna téacs

A detailed marketplace in ancient Rome, with people in period-appropriate clothing, various goods for sale, and architecture of the time.
DALL-E 3 íomhá bunaithe ar leideanna téacs

DALL-E 3 íomhá bunaithe ar leideanna téacs

Generate an image of a famous historical figure, like Cleopatra or Leonardo da Vinci, placed in a contemporary setting, using modern technology like smartphones or laptops.
DALL-E 3 íomhá bunaithe ar leideanna téacs

DALL-E 3 íomhá bunaithe ar leideanna téacs

Teorainneacha & Riosca DALL-E 3

Tá céimeanna suntasacha glactha ag OpenAI chun ábhar follasach ó shonraí oiliúna DALL-E 3 a scagadh, arb é is aidhm dó laofachtaí a laghdú agus aschur na samhla a fheabhsú. Áirítear leis seo scagairí sonracha a chur i bhfeidhm do chatagóirí íogaire ábhair agus athbhreithniú ar thairseacha do scagairí níos leithne. Áirítear sa chruach maolaithe freisin roinnt sraitheanna de chosaintí, amhail meicníochtaí diúltaithe i ChatGPT le haghaidh topaicí íogaire, aicmitheoirí ionchuir pras chun sáruithe beartais a chosc, blocliostaí do chatagóirí ábhair ar leith, agus claochluithe chun a chinntiú go bhfuil leideanna ag teacht le treoirlínte.

In ainneoin an dul chun cinn atá déanta aige, tá teorainneacha ag DALL-E 3 maidir le caidrimh spásúla a thuiscint, téacs fada a sholáthar go cruinn, agus sainíomhánna a ghiniúint. Admhaíonn OpenAI na dúshláin seo agus tá sé ag obair ar fheabhsuithe do leaganacha amach anseo.

Tá an chuideachta ag obair freisin ar bhealaí chun íomhánna AI-ghinte a idirdhealú ó na cinn a dhéanann daoine, rud a léiríonn a dtiomantas do thrédhearcacht agus úsáid fhreagrach AI.

DALL E

DALL E 3

Beidh DALL-E 3, an leagan is déanaí, ar fáil i gcéimeanna ag tosú le grúpaí custaiméirí sonracha agus ag leathnú níos déanaí chuig saotharlanna taighde agus seirbhísí API. Mar sin féin, níl dáta scaoilte poiblí in aisce deimhnithe fós.

Tá OpenAI i ndáiríre ag leagan síos caighdeán nua i réimse AI le DALL-E 3, ag nascadh cumais theicniúla casta agus comhéadain atá éasca le húsáid gan uaim. Léiríonn comhtháthú DALL-E 3 isteach in ardáin a úsáidtear go forleathan mar Bing aistriú ó fheidhmchláir speisialaithe go cineálacha siamsaíochta agus fóntais níos leithne agus níos inrochtana.

Is dócha gurb í an chothromaíocht idir nuálaíocht agus cumasú na n-úsáideoirí a bheidh mar phríomhathrú ar na cluichí sna blianta amach romhainn. Is iad na cuideachtaí a n-éireoidh leo ná na cuideachtaí a bhrúnn ní hamháin teorainneacha an méid is féidir le AI a bhaint amach, ach a thugann an neamhspleáchas agus an smacht is mian leo d'úsáideoirí freisin. Tá OpenAI, lena thiomantas do AI eiticiúil, ag déanamh an chosáin seo go cúramach. Tá an sprioc soiléir: uirlisí AI a chruthú nach bhfuil ach cumhachtach, ach freisin iontaofa agus cuimsitheach, ag cinntiú go bhfuil na buntáistí a bhaineann le AI inrochtana do chách.

Tá cúig bliana anuas caite agam ag tumadh mé féin i ndomhan iontach na Foghlama Meaisín agus an Fhoghlaim Dhomhain. Chuir mo phaisean agus mo shaineolas orm cur le breis agus 50 tionscadal innealtóireachta bogearraí éagsúla, le fócas ar leith ar AI/ML. Tá mo fiosracht leanúnach tar éis mé a tharraingt i dtreo Próiseáil Teanga Nádúrtha, réimse a bhfuil fonn orm tuilleadh a chíoradh.