stubbur EasyPhoto: Persónuleg gervigreindarmyndavélin þín - Unite.AI
Tengja við okkur

Artificial Intelligence

EasyPhoto: Persónulegi gervigreindarmyndavélin þín

mm
Uppfært on
EasyPhoto: Persónuleg gervigreindarmyndamyndavél

Stöðugt dreifing Web User Interface, eða SD-WebUI, er yfirgripsmikið verkefni fyrir Stable Diffusion módel sem notar Gradio bókasafnið til að bjóða upp á vafraviðmót. Í dag ætlum við að tala um EasyPhoto, nýstárlega WebUI viðbót sem gerir endanotendum kleift að búa til AI andlitsmyndir og myndir. EasyPhoto WebUI viðbótin býr til gervigreindarmyndir með því að nota ýmis sniðmát, sem styður mismunandi ljósmyndastíla og margar breytingar. Að auki, til að auka getu EasyPhoto enn frekar, geta notendur búið til myndir með því að nota SDXL líkanið fyrir fullnægjandi, nákvæmari og fjölbreyttari niðurstöður. Byrjum.

Kynning á EasyPhoto og stöðugri dreifingu

Stöðugur dreifingarrammi er vinsæll og öflugur kynslóðarrammi sem byggir á dreifingu sem forritarar nota til að búa til raunhæfar myndir byggðar á textalýsingum. Þökk sé getu sinni, státar Stable Diffusion ramma af fjölbreyttu úrvali af forritum, þar á meðal mynd yfirmálun, myndmálun og mynd-til-mynd þýðingar. Stable Diffusion Web UI, eða SD-WebUI, stendur upp úr sem eitt vinsælasta og þekktasta forritið í þessari ramma. Það er með vafraviðmóti byggt á Gradio bókasafninu, sem veitir gagnvirkt og notendavænt viðmót fyrir Stable Diffusion módel. Til að auka enn frekar stjórn og notagildi við myndagerð samþættir SD-WebUI fjölmörg Stable Diffusion forrit.

Vegna þæginda sem SD-WebUI ramma býður upp á, ákváðu verktaki EasyPhoto ramma að búa það til sem vefviðbót frekar en fullbúið forrit. Öfugt við núverandi aðferðir sem oft þjást af sjálfsmyndarmissi eða setja óraunhæfa eiginleika inn í myndir, notar EasyPhoto ramma mynd-í-mynd getu Stable Diffusion líkananna til að framleiða nákvæmar og raunhæfar myndir. Notendur geta auðveldlega sett upp EasyPhoto ramma sem viðbót innan vefviðmótsins, sem eykur notendavænni og aðgengi fyrir breiðari hóp notenda. EasyPhoto ramminn gerir notendum kleift að búa til auðkennisstýrða, hágæða og raunhæfar gervigreindarmyndir sem líkjast mjög inntaksauðkenninu.

Í fyrsta lagi biður EasyPhoto ramminn notendur um að búa til stafræna tvíganga sína með því að hlaða upp nokkrum myndum til að þjálfa andlit LoRA eða Low-Rank Adaptation líkan á netinu. LoRA ramminn fínstillir dreifingarlíkönin fljótt með því að nota lágstiga aðlögunartækni. Þetta ferli gerir grunnlíkaninu kleift að skilja auðkennisupplýsingar tiltekinna notenda. Þjálfuðu módelin eru síðan sameinuð og samþætt í grunnlínu Stable Diffusion líkanið fyrir truflun. Ennfremur, meðan á truflunarferlinu stendur, notar líkanið stöðug dreifingarlíkön til að reyna að endurmála andlitssvæðin í truflunarsniðmátinu og líkindin á milli inntaks- og úttaksmyndanna eru sannreynd með því að nota hinar ýmsu ControlNet einingar. 

EasyPhoto ramminn notar einnig tveggja þrepa dreifingarferli til að takast á við hugsanleg vandamál eins og landamæragripi og auðkennismissi, og tryggir þannig að myndirnar sem myndast lágmarki sjónrænt ósamræmi á sama tíma og viðheldur sjálfsmynd notandans. Ennfremur er truflunarleiðsla í EasyPhoto ramma ekki aðeins takmörkuð við að búa til andlitsmyndir, heldur er einnig hægt að nota hana til að búa til allt sem tengist auðkenni notandans. Þetta þýðir að þegar þú hefur þjálfað LoRA líkan fyrir tiltekið auðkenni geturðu búið til mikið úrval af gervigreindarmyndum og því getur það haft útbreidd forrit, þar á meðal sýndarprófanir. 

Þú draga saman, EasyPhoto ramma

  1. Stingur upp á nýrri nálgun til að þjálfa LoRA líkanið með því að fella inn mörg LoRA líkan til að viðhalda andlitstrú myndanna sem myndast. 
  2. Notar ýmsar styrktarnámsaðferðir til að hámarka LoRA líkanin fyrir verðlaun fyrir andlitsauðkenni sem hjálpar enn frekar við að auka líkindi sjálfsmynda á milli þjálfunarmyndanna og niðurstaðna sem myndast. 
  3. Stingur upp á tvíþrepa dreifingarferli sem byggir á málningu sem miðar að því að búa til gervigreindarmyndir með mikilli fagurfræði og líkindi. 

EasyPhoto : Arkitektúr og þjálfun

Eftirfarandi mynd sýnir þjálfunarferli EasyPhoto AI ramma. 

Eins og sjá má biður ramminn notendur fyrst um að setja inn þjálfunarmyndirnar og framkvæmir síðan andlitsgreiningu til að greina andlitsstaðsetningar. Þegar umgjörðin hefur greint andlitið klippir hún inntaksmyndina með því að nota fyrirfram skilgreint tiltekið hlutfall sem einbeitir sér eingöngu að andlitssvæðinu. Umgjörðin setur síðan upp húðfegrunar- og áberandi greiningarlíkan til að fá hreina og skýra andlitsþjálfunarmynd. Þessar tvær gerðir gegna mikilvægu hlutverki við að auka sjónræn gæði andlitsins og tryggja einnig að bakgrunnsupplýsingarnar hafi verið fjarlægðar og þjálfunarmyndin inniheldur aðallega andlitið. Að lokum notar ramminn þessar unnar myndir og inntaksleiðbeiningar til að þjálfa LoRA líkanið og útbúa það þannig getu til að skilja notendasértæka andlitseinkenni á skilvirkari og nákvæmari hátt. 

Ennfremur, á þjálfunarstiginu, inniheldur ramminn mikilvægt staðfestingarskref, þar sem ramminn reiknar andlitsauðkennisbilið á milli innsláttarmyndar notanda og sannprófunarmyndarinnar sem var búin til af þjálfaða LoRA líkaninu. Staðfestingarskrefið er grundvallarferli sem gegnir lykilhlutverki við að ná fram samruna LoRA líkananna, sem tryggir að lokum að þjálfað LoRA ramma breytist í tvígang, eða nákvæma stafræna framsetningu notandans. Að auki verður staðfestingarmyndin sem hefur ákjósanlegasta face_id stigið valin sem face_id mynd, og þessi face_id mynd verður síðan notuð til að auka auðkennislíkingu truflunarmyndunarinnar. 

Með því að halda áfram, byggt á ensemble ferlinu, þjálfar ramminn LoRA líkönin þar sem líkindamat er aðalmarkmiðið, en að varðveita líkindi í andliti er niðurstreymismarkmiðið. Til að takast á við þetta mál notar EasyPhoto ramminn styrkingartækni til að hámarka niðurstreymismarkmiðið beint. Fyrir vikið sýna andlitseinkennin sem LoRA-líkönin læra umbætur sem leiða til aukinnar líkingar milli sniðmátsmyndaðra niðurstaðna og sýnir einnig alhæfingu milli sniðmáta. 

Truflunarferli

Eftirfarandi mynd sýnir truflunarferlið fyrir einstaklingsnotandaauðkenni í EasyPhoto ramma og er skipt í þrjá hluta

  • Andlitsforvinnsla til að fá ControlNet tilvísunina og forunnar inntaksmynd. 
  • Fyrsta dreifing sem hjálpar til við að búa til grófar niðurstöður sem líkjast notandainntaki. 
  • Önnur dreifing sem lagar landamæragripina og gerir þannig myndirnar nákvæmari og virðast raunsærri. 

Fyrir inntakið tekur ramminn face_id mynd (mynduð við þjálfunarprófun með því að nota ákjósanlega face_id stig) og truflunarsniðmát. Úttakið er mjög ítarleg, nákvæm og raunsæ mynd af notandanum og líkist mjög auðkenni og einstöku útliti notandans á grundvelli ályktunarsniðmátsins. Við skulum skoða þessa ferla ítarlega.

Face PreProcess

Leið til að búa til gervigreindarmynd sem byggir á truflunarsniðmáti án meðvitaðs rökstuðnings er að nota SD líkanið til að mála andlitssvæðið í truflunarsniðmátinu. Að auki, að bæta ControlNet ramma við ferlið eykur ekki aðeins varðveislu auðkennis notenda heldur eykur líka líkindi myndanna sem myndast. Hins vegar, með því að nota ControlNet beint fyrir svæðisbundið málverk, getur það kynnt hugsanleg vandamál sem geta falið í sér

  • Ósamræmi milli inntaksins og myndarinnar sem myndast: Það er augljóst að lykilatriðin í sniðmátsmyndinni eru ekki samhæf við lykilatriðin í face_id myndinni og þess vegna getur það að nota ControlNet með face_id myndinni sem tilvísun leitt til ósamræmis í úttakinu. 
  • Gallar á Inpaint svæðinu: Að gríma svæði og mála það síðan með nýju andliti gæti leitt til áberandi galla, sérstaklega meðfram innmálsmörkunum sem mun ekki aðeins hafa áhrif á áreiðanleika myndarinnar sem myndast, heldur hefur það einnig neikvæð áhrif á raunsæi myndarinnar. 
  • Kennitap af Control Net: Þar sem þjálfunarferlið notar ekki ControlNet rammann, gæti notkun ControlNet á truflunarfasanum haft áhrif á getu þjálfaðra LoRA líkana til að varðveita auðkenni inntaks notanda. 

Til að takast á við vandamálin sem nefnd eru hér að ofan leggur EasyPhoto ramminn til þrjár aðferðir. 

  • Jafna og líma: Með því að nota reiknirit fyrir andlitslímingu miðar EasyPhoto ramminn að því að takast á við vandamálið um misræmi milli kennileita í andliti milli andlitsauðkennis og sniðmátsins. Í fyrsta lagi reiknar líkanið út kennileiti andlits sniðmátsmyndarinnar og sniðmátsmyndarinnar, í kjölfarið ákvarðar líkanið tengda umbreytingarfylki sem verður notað til að samræma kennileiti andlits sniðmátsmyndarinnar við mynd myndarinnar. Myndin sem myndast heldur sömu kennileiti og face_id myndinni og er einnig í takt við sniðmátsmyndina. 
  • Andlitsöryggi: Face Fuse er ný nálgun sem er notuð til að leiðrétta landamæragripi sem eru afleiðing af grímumálningu og það felur í sér leiðréttingu á gripum með ControlNet ramma. Aðferðin gerir EasyPhoto ramma kleift að tryggja varðveislu samræmdra brúna og leiðbeina þannig að lokum ferli myndsköpunar. Andlitssamruna reikniritið sameinar enn frekar roop (ground truth user images) myndina og sniðmátið, sem gerir samruna myndinni sem myndast kleift að sýna betri stöðugleika á jaðarmörkunum, sem síðan leiðir til aukins úttaks á fyrsta dreifingarstigi. 
  • ControlNet leiðsögn staðfesting: Þar sem LoRA líkanin voru ekki þjálfuð með því að nota ControlNet ramma, gæti notkun þess í ályktunarferlinu haft áhrif á getu LoRA líkansins til að varðveita auðkennin. Til þess að auka alhæfingargetu EasyPhoto tekur ramminn til greina áhrif ControlNet rammans og inniheldur LoRA líkön frá mismunandi stigum. 

Fyrsta dreifing

Fyrsta dreifingarstigið notar sniðmátsmyndina til að búa til mynd með einstöku auðkenni sem líkist inntaks notandaauðkenni. Inntaksmyndin er samruni inntaksmyndar notanda og sniðmátsmyndarinnar, en kvarðaða andlitsgríman er inntaksgríman. Til að auka enn frekar stjórn á myndmyndun, samþættir EasyPhoto ramma þrjár ControlNet einingar þar sem fyrsta ControlNet einingin einbeitir sér að stjórnun sameinuðu myndanna, önnur ControlNet eining stjórnar litum samruna myndarinnar og síðasta ControlNet einingin er opinn (rauntíma stjórn á mannlegum stellingum) af myndinni sem skipt var út sem inniheldur ekki aðeins andlitsbyggingu sniðmátsmyndarinnar, heldur einnig andlitsauðkenni notandans.

Önnur dreifing

Á öðru dreifingarstigi eru gripirnir nálægt mörkum andlitsins betrumbættir og fínstilltir ásamt því að veita notendum sveigjanleika til að fela tiltekið svæði í myndinni til að reyna að auka skilvirkni kynslóðarinnar á því sérstaka svæði. Á þessu stigi sameinar ramminn úttaksmyndina sem er fengin frá fyrsta dreifingarþrepinu við roop-myndina eða niðurstöðu myndar notandans og myndar þannig inntaksmyndina fyrir annað dreifingarstigið. Á heildina litið gegnir annað dreifingarstigið mikilvægu hlutverki við að auka heildargæði og smáatriði myndarinnar sem myndast. 

Fjölnotendaauðkenni

Einn af hápunktum EasyPhoto er stuðningur þess við að búa til mörg notendaauðkenni og myndin hér að neðan sýnir leiðslu truflunarferlisins fyrir fjölnotendaauðkenni í EasyPhoto ramma. 

Til að veita stuðning fyrir fjölnotenda auðkenni framkvæmir EasyPhoto ramma fyrst andlitsgreiningu á truflunarsniðmátinu. Þessum truflunarsniðmátum er síðan skipt niður í fjölmargar grímur, þar sem hver gríma inniheldur aðeins eitt andlit, og restin af myndinni er grímuð í hvítu, þannig að fjölnotenda auðkennisgerðin er skipt í einfalt verkefni að búa til einstök notendaauðkenni. Þegar ramminn býr til notendaauðkennismyndirnar eru þessar myndir sameinaðar í ályktunarsniðmátið og auðveldar þannig óaðfinnanlega samþættingu sniðmátsmyndanna við myndaðar myndir, sem að lokum leiðir til hágæða myndar. 

Tilraunir og niðurstöður

Nú þegar við höfum skilning á EasyPhoto ramma er kominn tími fyrir okkur að kanna frammistöðu EasyPhoto ramma. 

Myndin hér að ofan er búin til af EasyPhoto viðbótinni og hún notar SD líkan sem byggir á stíl fyrir myndagerðina. Eins og sjá má líta myndirnar sem myndaðar eru raunsæjar út og eru nokkuð nákvæmar. 

Myndin sem bætt er við hér að ofan er búin til af EasyPhoto ramma með því að nota SD líkan sem byggir á Comic Style. Eins og sést líta grínmyndasögurnar og raunsæju myndirnar nokkuð raunsæjar út og líkjast inntaksmyndinni á grundvelli leiðbeininga eða kröfu notenda. 

Myndin sem bætt er við hér að neðan hefur verið búin til af EasyPhoto ramma með því að nota Multi-Person sniðmát. Eins og vel sést eru myndirnar sem myndast skýrar, nákvæmar og líkjast upprunalegu myndinni. 

Með hjálp EasyPhoto geta notendur nú búið til breitt úrval af gervigreindarmyndum, eða búið til mörg notendaauðkenni með því að nota varðveitt sniðmát, eða notað SD líkanið til að búa til ályktunarsniðmát. Myndirnar sem bætt er við hér að ofan sýna getu EasyPhoto ramma til að framleiða fjölbreyttar og hágæða gervigreindarmyndir.

Niðurstaða

Í þessari grein höfum við talað um EasyPhoto, a skáldsaga WebUI viðbót sem gerir endanotendum kleift að búa til AI andlitsmyndir og myndir. EasyPhoto WebUI viðbótin býr til gervigreindarmyndir með handahófskenndum sniðmátum og núverandi afleiðingar EasyPhoto WebUI styður mismunandi ljósmyndastíla og margar breytingar. Að auki, til að auka enn frekar getu EasyPhoto, hafa notendur sveigjanleika til að búa til myndir með SDXL líkaninu til að búa til fullnægjandi, nákvæmari og fjölbreyttari myndir. EasyPhoto ramminn notar stöðugt dreifingargrunnlíkan ásamt forþjálfuðu LoRA líkani sem framleiðir hágæða myndúttak.

Hefur þú áhuga á myndavélum? Við bjóðum einnig upp á lista yfir Bestu AI Headshot Generatorarnir og Bestu gervigreindarmyndavélarnar sem eru auðveld í notkun og krefjast engrar tækniþekkingar.

"Verkfræðingur að atvinnu, rithöfundur utanbókar". Kunal er tæknilegur rithöfundur með djúpa ást og skilning á gervigreind og ML, tileinkað því að einfalda flókin hugtök á þessum sviðum með grípandi og upplýsandi skjölum.