stub Sùil nas dlùithe air DALL-E 3 aig OpenAI - Unite.AI
Ceangal leinn

Innleadaireachd sgiobalta

Sùil nas mionaidiche air DALL-E 3 aig OpenAI

mm

Published

 on

DALL E 3

Anns a Ginealach AI saoghal, a 'cumail suas ris an fheadhainn as ùire tha ainm a' gheama. Agus nuair a thig e gu bhith a’ gineadh ìomhaighean, bidh Stable Diffusion agus Meadhan-siubhail an e an àrd-ùrlar air an robh a h-uile duine a’ bruidhinn - gu ruige seo.

Thug OpenAI, le taic bhon fhuamhaire teignigeach Microsoft, a-steach DALL E 3 air 20 Sultain, 2023.

Chan ann dìreach mu bhith a’ cruthachadh ìomhaighean a tha DALL-E 3; tha e mu dheidhinn do bheachdan a thoirt beò, dìreach mar a smaoinich thu orra. Agus am pàirt as fheàrr? Tha e luath, mar, gu math luath. Tha beachd agad, bidh thu ga bhiadhadh gu DALL-E 3, agus boom, tha an ìomhaigh agad deiseil.

Mar sin, san artaigil seo, tha sinn gu bhith a’ dàibheadh ​​​​gu domhainn a-steach do na tha DALL-E 3 mu dheidhinn. Bruidhnidh sinn mu mar a tha e ag obair, dè a tha ga chuir air leth bhon chòrr, agus carson a dh’ fhaodadh gur e dìreach an inneal air nach robh fios agad a bha a dhìth ort. Co-dhiù a tha thu nad dhealbhadair, nad neach-ealain, no dìreach cuideigin le tòrr bheachdan inntinneach, tha thu gu bhith airson cumail timcheall airson seo. Feuch an tòisich sinn.

Is e an rud a tha ùr le DALL·E 3 gu bheil e a’ faighinn co-theacs fada nas fheàrr na DALL·E 2. Dh’ fhaodadh gun do dh’ ionndrainn dreachan na bu thràithe air cuid de mhion-fhiosrachadh no gun do mhothaich iad beagan mion-fhiosrachaidh an seo agus an sin, ach tha DALL·E 3 air a’ phuing. Bidh e a’ togail air an dearbh fhiosrachadh mu na tha thu ag iarraidh, a’ toirt dhut dealbh a tha nas fhaisge air na bha thu a’ smaoineachadh.

Am pàirt fionnar? DALL·E 3 agus Bruidhinn GPT a-nis air an aonachadh ri chèile. Bidh iad ag obair còmhla gus do bheachdan ùrachadh. Bidh thu a’ losgadh bun-bheachd, bidh ChatGPT a’ cuideachadh le bhith a’ gleusadh a’ bhrosnachaidh, agus bidh DALL · E 3 ga thoirt beò. Mura h-eil thu dèidheil air an ìomhaigh, faodaidh tu iarraidh air ChatGPT an t-sanas tweak agus faigh DALL·E 3 gus feuchainn a-rithist. Airson cosgais mìosail de 20 $, gheibh thu cothrom air GPT-4, DALL · E 3, agus mòran fheartan fionnar eile.

Microsoft Chat Bing fhuair e làmh air DALL·E 3 eadhon mus do rinn OpenAI ChatGPT, agus a-nis chan e dìreach na h-iomairtean mòra a th’ ann ach a h-uile duine a gheibh cluich leis an-asgaidh. Tha amalachadh a-steach do Bing Chat agus Bing Image Creator ga dhèanamh fada nas fhasa a chleachdadh do dhuine sam bith.

Àrdachadh Modalan Sgaoileadh

Anns na 3 bliadhna a dh’ fhalbh, tha lèirsinn AI air a bhith a’ faicinn àrdachadh ann am modalan sgaoilidh, a’ gabhail ceum mòr air adhart, gu sònraichte ann an gineadh ìomhaighean. Mus tèid modailean sgaoilidh a dhèanamh, Lìonraidhean Ginealach Nàimhdeil (GANs) b’ e seo an teicneòlas airson a bhith a’ cruthachadh ìomhaighean fìor.

GANan

GANan

Ach, bha an roinn de dhùbhlain aca a’ toirt a-steach an fheum air tòrr dàta agus cumhachd coimpiutaireachd, a bha gu tric gan dèanamh duilich a làimhseachadh.

Cuir a-steach Sgaoileadh modailean. Thàinig iad am bàrr mar roghainn nas seasmhaiche agus nas èifeachdaiche an àite GANn. Eu-coltach ri GANn, bidh modalan sgaoilidh ag obair le bhith a’ cur fuaim ri dàta, ga fhalach gus nach bi ach air thuaiream air fhàgail. Bidh iad an uairsin ag obair air ais gus am pròiseas seo a thionndadh air ais, ag ath-chruthachadh dàta brìoghmhor bhon fhuaim. Tha am pròiseas seo air a bhith èifeachdach agus nas lugha de ghoireasan, a’ dèanamh modalan sgaoilidh na chuspair teth anns a’ choimhearsnachd AI.

Thàinig an fhìor àite tionndaidh timcheall air 2020, le sreath de phàipearan ùr-ghnàthach agus toirt a-steach CLIP aig OpenAI teicneòlas, a thug air adhart comasan mhodailean sgaoilidh gu mòr. Rinn seo modalan sgaoilidh air leth math air co-chur teacsa-gu-ìomhaigh, a’ leigeil leotha ìomhaighean fìrinneach a ghineadh bho thuairisgeulan teacsa. Bha na leasachaidhean sin chan ann a-mhàin ann an gineadh ìomhaighean, ach cuideachd ann an raointean mar sgrìobhadh ciùil agus rannsachadh bith-mheidigeach.

An-diugh, chan e dìreach cuspair acadaimigeach a th’ ann am modalan sgaoilidh ach thathas gan cleachdadh ann an suidheachaidhean practaigeach san t-saoghal.

Modail ginealach agus sreathan fèin-aire: DALL-E 3

Is e aon de na h-adhartasan as cudromaiche san raon seo mean-fhàs modaladh ginealach, le dòighean-obrach stèidhichte air samplachadh leithid modaladh ginealachd fèin-ghluasadach agus pròiseasan sgaoilidh a’ stiùireadh na slighe. Tha iad air modalan teacsa-gu-ìomhaigh atharrachadh, a’ leantainn gu leasachaidhean mòra dèanadais. Le bhith a’ briseadh sìos gineadh ìomhaighean gu ceumannan air leth, tha na modailean sin air fàs nas so-ruigsinniche agus nas fhasa do lìonraidhean neural ionnsachadh.

Aig an aon àm, tha àite deatamach air a bhith aig cleachdadh sreathan fèin-aire. Tha na sreathan sin, air an càrnadh còmhla, air cuideachadh le bhith a’ gineadh ìomhaighean gun fheum air claonaidhean spàsail, cùis chumanta le convolutions. Tha an gluasad seo air leigeil le modalan teacsa-gu-ìomhaigh sgèileadh agus leasachadh gu h-earbsach, mar thoradh air na feartan sgèileachaidh aig cruth-atharraichean a tha air an deagh thuigsinn.

Dùbhlain agus Fuasglaidhean ann an Gineadh Ìomhaighean

A dh’ aindeoin na h-adhartasan sin, tha smachd ann an gineadh ìomhaighean fhathast na dhùbhlan. Tha cùisean mar leantainn sgiobalta, far nach biodh am modail a’ cumail gu dlùth ris an teacsa cuir a-steach, air a bhith cumanta. Gus dèiligeadh ris an seo, chaidh dòighean-obrach ùra leithid leasachadh caption a mholadh, a tha ag amas air càileachd co-chruinneachaidhean teacsa is ìomhaighean àrdachadh ann an stòran-dàta trèanaidh.

Leasachadh caption: dòigh-obrach ùr-nodha

Tha leasachadh caption a’ toirt a-steach a bhith a’ gineadh fo-thiotalan de chàileachd nas fheàrr airson ìomhaighean, a bhios an uair sin a’ cuideachadh le bhith a’ trèanadh mhodalan teacsa-gu-ìomhaigh nas cruinne. Tha seo air a choileanadh tro captioner ìomhaigh làidir a bheir a-mach tuairisgeul mionaideach agus ceart air ìomhaighean. Le bhith a’ trèanadh air na fo-thiotalan leasaichte sin tha DALL-E 3 air a bhith comasach air toraidhean iongantach a choileanadh, a tha gu math coltach ri dealbhan agus obraichean ealain a rinn daoine.

Trèanadh air Dàta synthetach

Chan eil bun-bheachd trèanadh air dàta synthetigeach ùr. Ach, tha an tabhartas sònraichte an seo ann a bhith a’ cruthachadh siostam ceann-sgrìobhaidh ùr, tuairisgeulach. Tha a’ bhuaidh a th’ aig a bhith a’ cleachdadh fo-thiotalan synthetigeach airson modalan ginealachd trèanaidh air a bhith susbainteach, a’ leantainn gu leasachaidhean ann an comas a’ mhodail gus molaidhean a leantainn gu ceart.

A’ measadh DALL-E 3

Tro ioma-mheasadh agus coimeasan le modalan roimhe leithid DALL-E 2 agus Stable Diffusion XL, tha DALL-E 3 air coileanadh nas fheàrr a nochdadh, gu sònraichte ann an gnìomhan co-cheangailte ri leantainn sgiobalta.

Coimeas eadar modailean teacsa-gu-ìomhaigh air diofar mheasaidhean

Coimeas eadar modailean teacsa-gu-ìomhaigh air diofar mheasaidhean

Tha cleachdadh mheasaidhean fèin-ghluasadach agus slatan-tomhais air fianais shoilleir a thoirt seachad mu na comasan aige, a’ daingneachadh a shuidheachadh mar ghineadair teacsa-gu-ìomhaigh ùr-nodha.

DALL-E 3 Molaidhean agus Comasan

Tha DALL-E 3 a’ tabhann dòigh-obrach nas loidsigeach agus nas grinne airson ìomhaighean a chruthachadh. Mar a bhios tu a’ gluasad troimhe, chì thu mar a bhios DALL-E a’ ciùird gach ìomhaigh, le measgachadh de chruinneas agus mac-meanmna a tha a’ freagairt air a’ ghoireas a chaidh a thoirt seachad.

Eu-coltach ris an fhear a bh’ ann roimhe, tha an dreach ùraichte seo air leth math ann a bhith a’ rèiteachadh nithean gu nàdarra taobh a-staigh sealladh agus a’ nochdadh feartan daonna gu ceart, sìos chun àireamh cheart de chorragan air làmh. Tha na leasachaidhean a’ leudachadh gu mion-fhiosrachadh agus tha iad a-nis rim faighinn aig rùn nas àirde, a’ dèanamh cinnteach à toradh nas reusanta agus nas proifeiseanta.

Tha na comasan toirt seachad teacsa cuideachd air adhartas mòr fhaicinn. Far an tug dreachan roimhe DALL-E teacsa gibberish a-mach, faodaidh DALL-E 3 a-nis litrichean furasta a leughadh agus le stoidhle proifeasanta a ghineadh (uaireannan), agus eadhon suaicheantasan glan uaireannan.

Tha tuigse a’ mhodail air iarrtasan ìomhaigh iom-fhillte agus adhartach air àrdachadh gu mòr. Faodaidh DALL-E 3 a-nis tuairisgeulan mionaideach a leantainn gu ceart, eadhon ann an suidheachaidhean le grunn eileamaidean agus stiùireadh sònraichte, a’ nochdadh a chomas ìomhaighean ciallach agus air an deagh sgrìobhadh a dhèanamh. Nì sinn sgrùdadh air cuid de mholaidhean agus na toraidhean a fhuair sinn:

Design the packaging for a line of organic teas. Include space for the product name and description.

Ìomhaighean DALL-E 3 stèidhichte air molaidhean teacsa

Ìomhaighean DALL-E 3 stèidhichte air molaidhean teacsa (Thoir an aire gu bheil litreachadh ceàrr air a’ phostair chlì)

Create a web banner advertising a summer sale on outdoor furniture. The image feature a beach setting with different pieces of outdoor furniture, and text announcing 'Huge Summer Savings!'

Ìomhaighean DALL-E 3 stèidhichte air molaidhean teacsa

Ìomhaighean DALL-E 3 stèidhichte air molaidhean teacsa

A vintage travel poster of Paris with bold and stylized text saying 'Visit Paris' at the bottom.

Ìomhaighean DALL-E 3 stèidhichte air molaidhean teacsa

Ìomhaighean DALL-E 3 stèidhichte air molaidhean teacsa (Thoir an aire gu bheil litreachadh ceàrr air an dà phostair)

A bustling scene of the Diwali festival in India, with families lighting lamps, fireworks in the sky, and traditional sweets and decorations.
Ìomhaighean DALL-E 3 stèidhichte air molaidhean teacsa

Ìomhaighean DALL-E 3 stèidhichte air molaidhean teacsa

A detailed marketplace in ancient Rome, with people in period-appropriate clothing, various goods for sale, and architecture of the time.
Ìomhaighean DALL-E 3 stèidhichte air molaidhean teacsa

Ìomhaighean DALL-E 3 stèidhichte air molaidhean teacsa

Generate an image of a famous historical figure, like Cleopatra or Leonardo da Vinci, placed in a contemporary setting, using modern technology like smartphones or laptops.
Ìomhaighean DALL-E 3 stèidhichte air molaidhean teacsa

Ìomhaighean DALL-E 3 stèidhichte air molaidhean teacsa

Crìochan & Cunnart DALL-E 3

Tha OpenAI air ceumannan mòra a ghabhail gus susbaint soilleir a shìoladh bho dhàta trèanaidh DALL-E 3, ag amas air claon-bhreith a lughdachadh agus toradh a’ mhodail a leasachadh. Tha seo a’ toirt a-steach cur an sàs sìoltachain sònraichte airson roinnean susbaint mothachail agus ath-sgrùdadh air stairsnich airson sìoltachain nas fharsainge. Tha an stac lasachaidh cuideachd a’ toirt a-steach grunn shreathan de dhìonan, leithid dòighean diùltadh ann an ChatGPT airson cuspairean mothachail, seòrsachadh cuir a-steach sgiobalta gus casg a chuir air brisidhean poileasaidh, liostaichean bloca airson roinnean susbaint sònraichte, agus cruth-atharrachaidhean gus dèanamh cinnteach gu bheil molaidhean a rèir stiùiridhean.

A dh’ aindeoin adhartasan, tha crìochan aig DALL-E 3 ann a bhith a’ tuigsinn dhàimhean spàsail, a’ toirt seachad teacsa fada gu ceart, agus a’ gineadh ìomhaighean sònraichte. Tha OpenAI ag aithneachadh na dùbhlain sin agus tha e ag obair air leasachaidhean airson dreachan san àm ri teachd.

Tha a’ chompanaidh cuideachd ag obair air dòighean gus eadar-dhealachadh a dhèanamh air ìomhaighean a ghineadh le AI bhon fheadhainn a rinn daoine, a’ nochdadh an dealas a thaobh follaiseachd agus cleachdadh AI ciallach.

DALL E

DALL E 3

Bidh DALL-E 3, an dreach as ùire, ri fhaighinn ann an ìrean a’ tòiseachadh le buidhnean sònraichte de luchd-ceannach agus a’ leudachadh nas fhaide air adhart gu deuchainn-lannan rannsachaidh agus seirbheisean API. Ach, chan eil ceann-latha foillseachaidh poblach an-asgaidh air a dhearbhadh fhathast.

Tha OpenAI dha-rìribh a’ suidheachadh inbhe ùr ann an raon AI le DALL-E 3, a’ ceangal gu sgiobalta ri comasan teicnigeach iom-fhillte agus eadar-aghaidh furasta a chleachdadh. Tha amalachadh DALL-E 3 a-steach do àrd-ùrlaran a tha air an cleachdadh gu farsaing mar Bing a’ nochdadh gluasad bho thagraidhean sònraichte gu cruthan dibhearsain is goireasach nas fharsainge agus nas ruigsinneach.

Is dòcha gur e an fhìor atharrachadh geama anns na bliadhnachan ri teachd an cothromachadh eadar ùr-ghnàthachadh agus cumhachd luchd-cleachdaidh. Is e companaidhean a bhios a’ soirbheachadh an fheadhainn a bhios chan ann a-mhàin a’ putadh crìochan na as urrainn dha AI a choileanadh, ach a bheir cuideachd an neo-eisimeileachd agus an smachd a tha iad ag iarraidh do luchd-cleachdaidh. Tha OpenAI, le dealas a thaobh AI beusach, a’ stiùireadh na slighe seo gu faiceallach. Tha an amas soilleir: innealan AI a chruthachadh nach eil a-mhàin cumhachdach, ach cuideachd earbsach agus in-ghabhalach, a’ dèanamh cinnteach gu bheil buannachdan AI ruigsinneach dha na h-uile.

Tha mi air na còig bliadhna a dh’ fhalbh a’ bogadh fhèin ann an saoghal inntinneach Ionnsachadh Inneal agus Ionnsachadh domhainn. Tha an dìoghras agus an t-eòlas agam air toirt orm cur ri còrr air 50 pròiseact innleadaireachd bathar-bog eadar-mheasgte, le fòcas sònraichte air AI/ML. Tha mo fheòrachas leantainneach cuideachd air mo tharraing a dh’ ionnsaigh Natural Language Processing, raon air a bheil mi airson tuilleadh sgrùdaidh a dhèanamh.