ປັນຍາປະດິດ
EasyPhoto: ເຄື່ອງສ້າງຮູບພາບ AI ສ່ວນບຸກຄົນຂອງທ່ານ
ການແຜ່ກະຈາຍຄົງທີ່ Web User Interface, ຫຼື SD-WebUI, ແມ່ນໂຄງການທີ່ສົມບູນແບບສໍາລັບຕົວແບບການແຜ່ກະຈາຍແບບຄົງທີ່ທີ່ນໍາໃຊ້ຫ້ອງສະຫມຸດ Gradio ເພື່ອສະຫນອງການໂຕ້ຕອບຂອງຕົວທ່ອງເວັບ. ມື້ນີ້, ພວກເຮົາຈະເວົ້າກ່ຽວກັບ EasyPhoto, plugin WebUI ທີ່ມີນະວັດຕະກໍາທີ່ຊ່ວຍໃຫ້ຜູ້ໃຊ້ສຸດທ້າຍສາມາດສ້າງຮູບຄົນແລະຮູບພາບ AI. ປັ໊ກອິນ EasyPhoto WebUI ສ້າງຮູບຄົນ AI ໂດຍໃຊ້ແມ່ແບບຕ່າງໆ, ສະຫນັບສະຫນູນຮູບແບບຮູບພາບທີ່ແຕກຕ່າງກັນແລະການດັດແກ້ຫຼາຍ. ນອກຈາກນັ້ນ, ເພື່ອເພີ່ມຄວາມສາມາດຂອງ EasyPhoto ຕື່ມອີກ, ຜູ້ໃຊ້ສາມາດສ້າງຮູບພາບໂດຍໃຊ້ຕົວແບບ SDXL ເພື່ອໃຫ້ຜົນໄດ້ຮັບທີ່ຫນ້າພໍໃຈ, ຖືກຕ້ອງ, ແລະຫຼາກຫຼາຍ. ໃຫ້ເລີ່ມຕົ້ນ.
ການແນະນໍາກ່ຽວກັບ EasyPhoto ແລະການແຜ່ກະຈາຍທີ່ຫມັ້ນຄົງ
ກອບການແຜ່ກະຈາຍທີ່ຄົງທີ່ແມ່ນກອບການຜະລິດທີ່ອີງໃສ່ການແຜ່ກະຈາຍທີ່ນິຍົມແລະແຂງແຮງທີ່ໃຊ້ໂດຍຜູ້ພັດທະນາເພື່ອສ້າງຮູບພາບທີ່ແທ້ຈິງໂດຍອີງໃສ່ຄໍາອະທິບາຍຂໍ້ຄວາມທີ່ປ້ອນເຂົ້າ. ຂໍຂອບໃຈກັບຄວາມສາມາດຂອງມັນ, ກອບການແຜ່ກະຈາຍຄວາມຫມັ້ນຄົງມີຄໍາຮ້ອງສະຫມັກທີ່ຫລາກຫລາຍ, ລວມທັງການແຕ້ມຮູບ, ການແຕ້ມຮູບແລະການແປຮູບພາບເປັນຮູບພາບ. Stable Diffusion Web UI, ຫຼື SD-WebUI, ໂດດເດັ່ນເປັນໜຶ່ງໃນແອັບພລິເຄຊັ່ນທີ່ນິຍົມ ແລະ ຮູ້ຈັກກັນດີຂອງກອບວຽກນີ້. ມັນມີສ່ວນຕິດຕໍ່ຂອງຕົວທ່ອງເວັບທີ່ສ້າງຂຶ້ນໃນຫ້ອງສະຫມຸດ Gradio, ສະຫນອງການໂຕ້ຕອບແບບໂຕ້ຕອບແລະເປັນມິດກັບຜູ້ໃຊ້ສໍາລັບຕົວແບບການແຜ່ກະຈາຍທີ່ຫມັ້ນຄົງ. ເພື່ອເພີ່ມການຄວບຄຸມ ແລະ ການນຳໃຊ້ໃນການຜະລິດຮູບພາບ, SD-WebUI ໄດ້ລວມເອົາຄໍາຮ້ອງສະຫມັກ Stable Diffusion ຈໍານວນຫລາຍ.
ເນື່ອງຈາກຄວາມສະດວກສະບາຍທີ່ສະເໜີໃຫ້ໂດຍກອບ SD-WebUI, ຜູ້ພັດທະນາກອບຂອງ EasyPhoto ໄດ້ຕັດສິນໃຈສ້າງມັນເປັນເວັບ plugin ແທນທີ່ຈະເປັນແອັບພລິເຄຊັນທີ່ເຕັມໄປດ້ວຍຄວາມສາມາດ. ກົງກັນຂ້າມກັບວິທີການທີ່ມີຢູ່ແລ້ວທີ່ມັກຈະທົນທຸກຈາກການສູນເສຍຕົວຕົນຫຼືແນະນໍາລັກສະນະທີ່ບໍ່ເປັນຈິງເຂົ້າໄປໃນຮູບພາບ, ກອບຂອງ EasyPhoto ນໍາໃຊ້ຄວາມສາມາດຂອງຮູບພາບຕໍ່ຮູບພາບຂອງຕົວແບບການແຜ່ກະຈາຍທີ່ຫມັ້ນຄົງເພື່ອຜະລິດຮູບພາບທີ່ຖືກຕ້ອງແລະຈິງ. ຜູ້ໃຊ້ສາມາດຕິດຕັ້ງກອບຂອງ EasyPhoto ໄດ້ຢ່າງງ່າຍດາຍເປັນສ່ວນຂະຫຍາຍພາຍໃນ WebUI, ປັບປຸງຄວາມເປັນມິດກັບຜູ້ໃຊ້ແລະການເຂົ້າຫາຜູ້ໃຊ້ຢ່າງກວ້າງຂວາງ. ໂຄງຮ່າງການ EasyPhoto ອະນຸຍາດໃຫ້ຜູ້ໃຊ້ສາມາດສ້າງຕົວຕົນທີ່ນໍາພາ, ຄຸນນະພາບສູງ, ແລະ ຮູບພາບ AI ທີ່ແທ້ຈິງ ທີ່ຄ້າຍກັບຕົວຕົນການປ້ອນຂໍ້ມູນຢ່າງໃກ້ຊິດ.
ຫນ້າທໍາອິດ, ໂຄງຮ່າງການ EasyPhoto ຂໍໃຫ້ຜູ້ໃຊ້ສ້າງ doppelganger ດິຈິຕອນຂອງເຂົາເຈົ້າໂດຍການອັບໂຫລດຮູບພາບຈໍານວນຫນ້ອຍຫນຶ່ງເພື່ອຝຶກອົບຮົມໃບຫນ້າ LoRA ຫຼືຕົວແບບການປັບຕົວຂັ້ນຕ່ໍາອອນໄລນ໌. ກອບຂອງ LoRA ປັບຕົວແບບການແຜ່ກະຈາຍໄດ້ໄວໂດຍການໃຊ້ເທັກໂນໂລຍີການປັບຕົວລະດັບຕໍ່າ. ຂະບວນການນີ້ອະນຸຍາດໃຫ້ຕົວແບບພື້ນຖານເຂົ້າໃຈຂໍ້ມູນ ID ຂອງຜູ້ໃຊ້ສະເພາະ. ຮູບແບບທີ່ໄດ້ຮັບການຝຶກອົບຮົມຫຼັງຈາກນັ້ນໄດ້ຖືກລວມເຂົ້າກັນແລະປະສົມປະສານເຂົ້າໄປໃນຮູບແບບການແຜ່ກະຈາຍຄົງທີ່ພື້ນຖານສໍາລັບການແຊກແຊງ. ຍິ່ງໄປກວ່ານັ້ນ, ໃນຂະບວນການແຊກແຊງ, ຮູບແບບການນໍາໃຊ້ຕົວແບບການແຜ່ກະຈາຍທີ່ຫມັ້ນຄົງໃນຄວາມພະຍາຍາມທີ່ຈະ repaint ພາກພື້ນໃບຫນ້າໃນແມ່ແບບການແຊກແຊງ, ແລະຄວາມຄ້າຍຄືກັນລະຫວ່າງການປ້ອນຂໍ້ມູນແລະຮູບພາບຜົນຜະລິດໄດ້ຖືກກວດສອບໂດຍໃຊ້ຫນ່ວຍ ControlNet ຕ່າງໆ.
ກອບຂອງ EasyPhoto ຍັງໃຊ້ຂະບວນການແຜ່ກະຈາຍສອງຂັ້ນຕອນເພື່ອແກ້ໄຂບັນຫາທີ່ອາດເກີດຂຶ້ນເຊັ່ນ: ປອມຊາຍແດນ & ການສູນເສຍຕົວຕົນ, ດັ່ງນັ້ນການຮັບປະກັນວ່າຮູບພາບທີ່ສ້າງຂຶ້ນຈະຫຼຸດຜ່ອນຄວາມບໍ່ສອດຄ່ອງທາງສາຍຕາໃນຂະນະທີ່ຮັກສາຕົວຕົນຂອງຜູ້ໃຊ້. ນອກຈາກນັ້ນ, ທໍ່ການແຊກແຊງໃນກອບຂອງ EasyPhoto ບໍ່ພຽງແຕ່ຈໍາກັດການສ້າງຮູບຄົນເທົ່ານັ້ນ, ແຕ່ມັນຍັງສາມາດຖືກນໍາໃຊ້ເພື່ອສ້າງສິ່ງໃດທີ່ກ່ຽວຂ້ອງກັບ ID ຂອງຜູ້ໃຊ້. ນີ້ຫມາຍຄວາມວ່າເມື່ອທ່ານຝຶກອົບຮົມ ຮູບແບບ LoRA ສໍາລັບ ID ໂດຍສະເພາະ, ທ່ານສາມາດສ້າງ array ກວ້າງຂອງຮູບພາບ AI, ແລະດັ່ງນັ້ນມັນຈຶ່ງສາມາດມີຄໍາຮ້ອງສະຫມັກທີ່ກວ້າງຂວາງລວມທັງການທົດລອງ virtual.
ທ່ານສະຫຼຸບ, ກອບຂອງ EasyPhoto
- ສະເໜີວິທີການນະວະນິຍາຍເພື່ອຝຶກອົບຮົມຮູບແບບ LoRA ໂດຍການລວມຕົວແບບ LoRA ຫຼາຍຮູບແບບເພື່ອຮັກສາຄວາມຊື່ສັດໃບຫນ້າຂອງຮູບພາບທີ່ສ້າງຂຶ້ນ.
- ໃຊ້ວິທີການຮຽນຮູ້ການເສີມສ້າງຕ່າງໆເພື່ອເພີ່ມປະສິດທິພາບແບບຈໍາລອງ LoRA ສໍາລັບລາງວັນຕົວຕົນໃບຫນ້າທີ່ຊ່ວຍເພີ່ມຄວາມຄ້າຍຄືກັນຂອງຕົວຕົນລະຫວ່າງຮູບພາບການຝຶກອົບຮົມ, ແລະຜົນໄດ້ຮັບທີ່ສ້າງຂຶ້ນ.
- ສະເໜີຂະບວນການກະຈາຍສີທີ່ອີງໃສ່ຂັ້ນຕອນສອງຂັ້ນຕອນທີ່ມີຈຸດປະສົງເພື່ອສ້າງຮູບພາບ AI ທີ່ມີຄວາມງາມສູງ, ແລະຄວາມຄ້າຍຄືກັນ.
EasyPhoto : ສະຖາປັດຕະຍະກໍາ & ການຝຶກອົບຮົມ
ຕົວເລກຕໍ່ໄປນີ້ສະແດງໃຫ້ເຫັນເຖິງຂະບວນການຝຶກອົບຮົມຂອງ EasyPhoto AI framework.
ດັ່ງທີ່ມັນສາມາດເຫັນໄດ້, ກອບການທໍາອິດຂໍໃຫ້ຜູ້ໃຊ້ໃສ່ຮູບພາບການຝຶກອົບຮົມ, ແລະຫຼັງຈາກນັ້ນດໍາເນີນການກວດຫາໃບຫນ້າເພື່ອກວດຫາສະຖານທີ່ໃບຫນ້າ. ເມື່ອໂຄງຮ່າງການກວດພົບໃບໜ້າ, ມັນຈະຕັດຮູບການປ້ອນຂໍ້ມູນໂດຍໃຊ້ອັດຕາສ່ວນສະເພາະທີ່ກຳນົດໄວ້ລ່ວງໜ້າ ເຊິ່ງເນັ້ນສະເພາະບໍລິເວນໃບໜ້າເທົ່ານັ້ນ. ຫຼັງຈາກນັ້ນ, ກອບດັ່ງກ່າວໄດ້ນຳໃຊ້ການເສີມຄວາມງາມຂອງຜິວໜັງ ແລະ ຮູບແບບການກວດຫາຄວາມເຄັມເພື່ອໃຫ້ໄດ້ຮູບການຝຶກໃບໜ້າທີ່ສະອາດ ແລະ ຊັດເຈນ. ສອງຕົວແບບນີ້ມີບົດບາດສໍາຄັນໃນການເສີມຂະຫຍາຍຄຸນນະພາບສາຍຕາຂອງໃບຫນ້າ, ແລະຍັງຮັບປະກັນວ່າຂໍ້ມູນພື້ນຖານໄດ້ຖືກໂຍກຍ້າຍອອກ, ແລະຮູບພາບການຝຶກອົບຮົມສ່ວນໃຫຍ່ແມ່ນປະກອບດ້ວຍໃບຫນ້າ. ສຸດທ້າຍ, ກອບການນໍາໃຊ້ຮູບພາບທີ່ປຸງແຕ່ງເຫຼົ່ານີ້ແລະການກະຕຸ້ນການປ້ອນຂໍ້ມູນເພື່ອຝຶກອົບຮົມແບບ LoRA, ແລະດັ່ງນັ້ນຈຶ່ງເຮັດໃຫ້ມັນມີຄວາມສາມາດໃນການເຂົ້າໃຈລັກສະນະຂອງໃບຫນ້າສະເພາະຂອງຜູ້ໃຊ້ຢ່າງມີປະສິດທິພາບແລະຖືກຕ້ອງ.
ນອກຈາກນັ້ນ, ໃນໄລຍະການຝຶກອົບຮົມ, ກອບປະກອບມີຂັ້ນຕອນການກວດສອບທີ່ສໍາຄັນ, ເຊິ່ງກອບການຄິດໄລ່ຊ່ອງຫວ່າງ ID ໃບ ໜ້າ ລະຫວ່າງຮູບພາບທີ່ຜູ້ໃຊ້ເຂົ້າມາ, ແລະຮູບພາບການຢັ້ງຢືນທີ່ສ້າງຂຶ້ນໂດຍຕົວແບບ LoRA ທີ່ໄດ້ຮັບການຝຶກອົບຮົມ. ຂັ້ນຕອນການກວດສອບແມ່ນຂະບວນການພື້ນຖານທີ່ມີບົດບາດສໍາຄັນໃນການບັນລຸການລວມຕົວຂອງຕົວແບບ LoRA, ໃນທີ່ສຸດຮັບປະກັນວ່າ ກອບ LoRA ທີ່ໄດ້ຮັບການຝຶກອົບຮົມ ປ່ຽນເປັນ doppelganger, ຫຼືການເປັນຕົວແທນດິຈິຕອນທີ່ຖືກຕ້ອງຂອງຜູ້ໃຊ້. ນອກຈາກນັ້ນ, ຮູບພາບການຢັ້ງຢືນທີ່ມີຄະແນນ face_id ທີ່ດີທີ່ສຸດຈະຖືກເລືອກເປັນຮູບ face_id, ແລະຮູບພາບ face_id ນີ້ຈະຖືກໃຊ້ເພື່ອເພີ່ມຄວາມຄ້າຍຄືກັນຂອງຕົວຕົນຂອງການສ້າງການແຊກແຊງ.
ການກ້າວໄປຂ້າງຫນ້າ, ໂດຍອີງໃສ່ຂະບວນການປະກອບ, ກອບການຝຶກອົບຮົມແບບຈໍາລອງ LoRA ດ້ວຍການປະເມີນຄວາມເປັນໄປໄດ້ເປັນຈຸດປະສົງຕົ້ນຕໍ, ໃນຂະນະທີ່ການຮັກສາຄວາມຄ້າຍຄືກັນຂອງໃບຫນ້າແມ່ນຈຸດປະສົງທາງລຸ່ມ. ເພື່ອແກ້ໄຂບັນຫານີ້, ກອບຂອງ EasyPhoto ໃຊ້ເຕັກນິກການຮຽນຮູ້ການເສີມສ້າງເພື່ອເພີ່ມປະສິດທິພາບຈຸດປະສົງທາງລຸ່ມໂດຍກົງ. ດັ່ງນັ້ນ, ລັກສະນະໃບຫນ້າທີ່ຕົວແບບ LoRA ຮຽນຮູ້ການປັບປຸງການສະແດງຜົນທີ່ນໍາໄປສູ່ຄວາມຄ້າຍຄືກັນລະຫວ່າງຜົນໄດ້ຮັບທີ່ສ້າງຂຶ້ນໃນແມ່ແບບ, ແລະຍັງສະແດງໃຫ້ເຫັນເຖິງການທົ່ວໄປໃນທົ່ວແມ່ແບບ.
ຂະບວນການແຊກແຊງ
ຕົວເລກຕໍ່ໄປນີ້ສະແດງໃຫ້ເຫັນເຖິງຂະບວນການແຊກແຊງສໍາລັບ ID ຜູ້ໃຊ້ສ່ວນບຸກຄົນໃນກອບຂອງ EasyPhoto, ແລະແບ່ງອອກເປັນສາມສ່ວນ.
- ຂັ້ນຕອນກ່ອນໃບໜ້າ ສໍາລັບການໄດ້ຮັບການກະສານອ້າງອີງ ControlNet, ແລະຮູບພາບການປ້ອນຂໍ້ມູນລ່ວງຫນ້າ.
- ການແຜ່ກະຈາຍຄັ້ງທໍາອິດ ທີ່ຊ່ວຍໃນການສ້າງຜົນໄດ້ຮັບຫຍາບຄາຍທີ່ຄ້າຍຄືກັບການປ້ອນຂໍ້ມູນຂອງຜູ້ໃຊ້.
- ການແຜ່ກະຈາຍຄັ້ງທີສອງ ທີ່ແກ້ໄຂສິ່ງປະດິດຂອງເຂດແດນ, ດັ່ງນັ້ນຈຶ່ງເຮັດໃຫ້ຮູບພາບຖືກຕ້ອງຫຼາຍຂຶ້ນ, ແລະປະກົດວ່າເປັນຈິງຫຼາຍຂຶ້ນ.
ສໍາລັບການປ້ອນຂໍ້ມູນ, ກອບຈະເອົາຮູບ face_id (ສ້າງຂຶ້ນໃນລະຫວ່າງການກວດສອບການຝຶກອົບຮົມໂດຍໃຊ້ຄະແນນ face_id ທີ່ດີທີ່ສຸດ), ແລະແມ່ແບບການແຊກແຊງ. ຜົນໄດ້ຮັບແມ່ນຮູບຄົນທີ່ມີຄວາມລະອຽດສູງ, ຖືກຕ້ອງ, ແລະເປັນຈິງຂອງຜູ້ໃຊ້, ແລະຄ້າຍຄືກັນຢ່າງໃກ້ຊິດກັບຕົວຕົນແລະຮູບລັກສະນະທີ່ເປັນເອກະລັກຂອງຜູ້ໃຊ້ບົນພື້ນຖານຂອງແມ່ແບບ infer. ຂໍໃຫ້ເບິ່ງລາຍລະອຽດກ່ຽວກັບຂະບວນການເຫຼົ່ານີ້.
ຂັ້ນຕອນກ່ອນໜ້າ
ວິທີການສ້າງຮູບຄົນ AI ໂດຍອີງໃສ່ແມ່ແບບການແຊກແຊງໂດຍບໍ່ມີການສົມເຫດສົມຜົນແມ່ນການໃຊ້ຮູບແບບ SD ເພື່ອສີໃສ່ພື້ນທີ່ໃບຫນ້າໃນແມ່ແບບການແຊກແຊງ. ນອກຈາກນັ້ນ, ການເພີ່ມກອບ ControlNet ໃນຂະບວນການບໍ່ພຽງແຕ່ເສີມຂະຫຍາຍການຮັກສາຕົວຕົນຂອງຜູ້ໃຊ້, ແຕ່ຍັງເພີ່ມຄວາມຄ້າຍຄືກັນລະຫວ່າງຮູບພາບທີ່ສ້າງຂຶ້ນ. ຢ່າງໃດກໍຕາມ, ການນໍາໃຊ້ ControlNet ໂດຍກົງສໍາລັບການສີໃນພາກພື້ນສາມາດແນະນໍາບັນຫາທີ່ອາດມີ
- ຄວາມບໍ່ສອດຄ່ອງລະຫວ່າງການປ້ອນຂໍ້ມູນ ແລະຮູບພາບທີ່ສ້າງຂຶ້ນ: ມັນເຫັນໄດ້ຊັດເຈນວ່າຈຸດສໍາຄັນໃນຮູບແມ່ແບບບໍ່ເຫມາະສົມກັບຈຸດສໍາຄັນໃນຮູບ face_id ຊຶ່ງເປັນເຫດຜົນທີ່ວ່າການນໍາໃຊ້ ControlNet ກັບຮູບພາບ face_id ເປັນການອ້າງອີງສາມາດນໍາໄປສູ່ຄວາມບໍ່ສອດຄ່ອງບາງຢ່າງໃນຜົນໄດ້ຮັບ.
- ຂໍ້ບົກພ່ອງໃນພາກພື້ນ Inpaint: ການປິດບັງພາກພື້ນ, ແລະຫຼັງຈາກນັ້ນການທາສີມັນດ້ວຍໃບຫນ້າໃຫມ່ອາດຈະເຮັດໃຫ້ຂໍ້ບົກພ່ອງທີ່ສັງເກດເຫັນ, ໂດຍສະເພາະຕາມຂອບເຂດ inpaint ທີ່ບໍ່ພຽງແຕ່ຈະສົ່ງຜົນກະທົບຕໍ່ຄວາມຖືກຕ້ອງຂອງຮູບພາບທີ່ສ້າງຂຶ້ນ, ແຕ່ຍັງມີຜົນກະທົບທາງລົບຕໍ່ຄວາມເປັນຈິງຂອງຮູບພາບ.
- ການສູນເສຍຕົວຕົນໂດຍການຄວບຄຸມສຸດທິ: ເນື່ອງຈາກຂະບວນການຝຶກອົບຮົມບໍ່ໄດ້ນໍາໃຊ້ກອບຂອງ ControlNet, ການນໍາໃຊ້ ControlNet ໃນໄລຍະການແຊກແຊງອາດຈະສົ່ງຜົນກະທົບຕໍ່ຄວາມສາມາດຂອງຕົວແບບ LoRA ທີ່ໄດ້ຮັບການຝຶກອົບຮົມເພື່ອຮັກສາຕົວຕົນຂອງຜູ້ໃຊ້ input.
ເພື່ອແກ້ໄຂບັນຫາທີ່ໄດ້ກ່າວມາຂ້າງເທິງ, ກອບຂອງ EasyPhoto ສະເຫນີສາມຂັ້ນຕອນ.
- ຈັດຮຽງ ແລະວາງ: ໂດຍການນຳໃຊ້ສູດການວາງໃບໜ້າ, ກອບຂອງ EasyPhoto ມີຈຸດປະສົງເພື່ອແກ້ໄຂບັນຫາຄວາມບໍ່ກົງກັນລະຫວ່າງຈຸດເດັ່ນຂອງໃບໜ້າລະຫວ່າງ ID ໃບໜ້າ ແລະ ແມ່ແບບ. ທຳອິດ, ຮູບແບບການຄຳນວນຈຸດສຳຄັນຂອງໃບໜ້າຂອງ face_id ແລະຮູບແມ່ແບບ, ຕໍ່ໄປນີ້ຕົວແບບຈະກຳນົດຄ່າການຫັນປ່ຽນແບບ affine matrix ທີ່ຈະໃຊ້ເພື່ອຈັດຮຽງຈຸດສຳຄັນທາງໜ້າຂອງຮູບແມ່ແບບດ້ວຍຮູບ face_id. ຮູບພາບຜົນໄດ້ຮັບຍັງຄົງເປັນຈຸດສໍາຄັນດຽວກັນຂອງຮູບ face_id, ແລະຍັງສອດຄ່ອງກັບຮູບແມ່ແບບ.
- ຟິວໜ້າ: Face Fuse ແມ່ນວິທີການໃຫມ່ທີ່ຖືກນໍາໃຊ້ເພື່ອແກ້ໄຂສິ່ງປະດິດຊາຍແດນທີ່ເປັນຜົນມາຈາກການທາສີຫນ້າກາກ, ແລະມັນກ່ຽວຂ້ອງກັບການແກ້ໄຂຂອງປອມໂດຍໃຊ້ກອບ ControlNet. ວິທີການດັ່ງກ່າວອະນຸຍາດໃຫ້ກອບຂອງ EasyPhoto ຮັບປະກັນການຮັກສາແຄມຂອງປະສົມກົມກຽວ, ແລະດັ່ງນັ້ນຈຶ່ງນໍາພາຂະບວນການສ້າງຮູບພາບໃນທີ່ສຸດ. ສູດການຟິວຂອງໃບໜ້າເຮັດໃຫ້ຮູບພາບ ແລະແມ່ແບບຂອງ roop (ຮູບຜູ້ໃຊ້ຄວາມຈິງພື້ນດິນ) ເພີ່ມເຕີມ, ເຊິ່ງຊ່ວຍໃຫ້ຮູບພາບທີ່ຟິວຊັນອອກມາເພື່ອສະແດງການຄົງທີ່ຂອງຂອບຂອບໄດ້ດີຂຶ້ນ, ເຊິ່ງຫຼັງຈາກນັ້ນນຳໄປສູ່ການເພີ່ມຜົນຜະລິດໃນໄລຍະການແຜ່ກະຈາຍຄັ້ງທຳອິດ.
- ControlNet ຊີ້ນໍາການກວດສອບ: ເນື່ອງຈາກຕົວແບບ LoRA ບໍ່ໄດ້ຖືກຝຶກອົບຮົມໂດຍໃຊ້ກອບ ControlNet, ການໃຊ້ມັນໃນລະຫວ່າງຂະບວນການ inference ອາດຈະສົ່ງຜົນກະທົບຕໍ່ຄວາມສາມາດຂອງຕົວແບບ LoRA ໃນການຮັກສາຕົວຕົນ. ເພື່ອເພີ່ມຄວາມສາມາດທົ່ວໄປຂອງ EasyPhoto, ກອບການພິຈາລະນາອິດທິພົນຂອງກອບ ControlNet, ແລະລວມເອົາຕົວແບບ LoRA ຈາກຂັ້ນຕອນຕ່າງໆ.
ການແຜ່ກະຈາຍຄັ້ງທໍາອິດ
ຂັ້ນຕອນການແຜ່ກະຈາຍຄັ້ງທໍາອິດໃຊ້ຮູບພາບແມ່ແບບເພື່ອສ້າງຮູບພາບທີ່ມີ id ເປັນເອກະລັກທີ່ຄ້າຍຄືກັບ ID ຜູ້ໃຊ້ທີ່ປ້ອນເຂົ້າ. ຮູບພາບການປ້ອນຂໍ້ມູນແມ່ນການລວມກັນຂອງຮູບພາບການປ້ອນຂໍ້ມູນຂອງຜູ້ໃຊ້, ແລະຮູບພາບແມ່ແບບ, ໃນຂະນະທີ່ໜ້າກາກໃບໜ້າທີ່ຖືກປັບເປັນໜ້າກາກປ້ອນຂໍ້ມູນ. ເພື່ອເພີ່ມການຄວບຄຸມການຜະລິດຮູບພາບ, ກອບຂອງ EasyPhoto ປະສົມປະສານສາມຫນ່ວຍ ControlNet ທີ່ຫນ່ວຍ ControlNet ທໍາອິດສຸມໃສ່ການຄວບຄຸມຮູບພາບທີ່ປະສົມປະສານ, ຫນ່ວຍ ControlNet ທີສອງຄວບຄຸມສີຂອງຮູບພາບທີ່ປະສົມປະສານ, ແລະຫນ່ວຍ ControlNet ສຸດທ້າຍແມ່ນ openpose. (ການຄວບຄຸມຮູບແບບຫຼາຍຄົນໃນເວລາທີ່ແທ້ຈິງ) ຂອງຮູບພາບທີ່ທົດແທນທີ່ບໍ່ພຽງແຕ່ປະກອບດ້ວຍໂຄງສ້າງໃບຫນ້າຂອງຮູບແບບຮູບແບບ, ແຕ່ຍັງມີຕົວຕົນໃບຫນ້າຂອງຜູ້ໃຊ້.
ການແຜ່ກະຈາຍຄັ້ງທີສອງ
ໃນຂັ້ນຕອນການແຜ່ກະຈາຍຄັ້ງທີສອງ, ປອມທີ່ຢູ່ໃກ້ກັບຂອບເຂດຂອງໃບຫນ້າໄດ້ຖືກປັບປຸງແລະປັບໄຫມພ້ອມກັບການໃຫ້ຜູ້ໃຊ້ທີ່ມີຄວາມຍືດຫຍຸ່ນໃນຫນ້າກາກພື້ນທີ່ສະເພາະໃນຮູບພາບໃນຄວາມພະຍາຍາມທີ່ຈະເພີ່ມປະສິດທິພາບຂອງການຜະລິດພາຍໃນພື້ນທີ່ທີ່ອຸທິດຕົນນັ້ນ. ໃນຂັ້ນຕອນນີ້, ກອບການ fuses ຮູບພາບຜົນຜະລິດທີ່ໄດ້ຮັບຈາກຂັ້ນຕອນຂອງການແຜ່ກະຈາຍຄັ້ງທໍາອິດກັບຮູບພາບ roop ຫຼືຜົນໄດ້ຮັບຂອງຮູບພາບຂອງຜູ້ໃຊ້, ດັ່ງນັ້ນການສ້າງຮູບພາບການປ້ອນຂໍ້ມູນສໍາລັບຂັ້ນຕອນຂອງການແຜ່ກະຈາຍທີສອງ. ໂດຍລວມແລ້ວ, ຂັ້ນຕອນການແຜ່ກະຈາຍທີສອງມີບົດບາດສໍາຄັນໃນການເສີມຂະຫຍາຍຄຸນນະພາບໂດຍລວມ, ແລະລາຍລະອຽດຂອງຮູບພາບທີ່ສ້າງຂຶ້ນ.
ID ຜູ້ໃຊ້ຫຼາຍອັນ
ຈຸດເດັ່ນອັນໜຶ່ງຂອງ EasyPhoto ແມ່ນການສະຫນັບສະຫນູນການສ້າງ ID ຜູ້ໃຊ້ຫຼາຍອັນ, ແລະຮູບຂ້າງລຸ່ມນີ້ສະແດງໃຫ້ເຫັນເຖິງທໍ່ຂອງຂະບວນການແຊກແຊງສໍາລັບ ID ຜູ້ໃຊ້ຫຼາຍອັນໃນກອບຂອງ EasyPhoto.
ເພື່ອສະຫນອງການສະຫນັບສະຫນູນການຜະລິດ ID ຜູ້ໃຊ້ຫຼາຍ, ກອບຂອງ EasyPhoto ທໍາອິດປະຕິບັດການກວດສອບໃບຫນ້າໃນແມ່ແບບການແຊກແຊງ. ຫຼັງຈາກນັ້ນ, ແມ່ແບບການແຊກແຊງເຫຼົ່ານີ້ຖືກແບ່ງອອກເປັນຫນ້າກາກຈໍານວນຫລາຍ, ເຊິ່ງແຕ່ລະຫນ້າກາກປະກອບມີພຽງແຕ່ຫນຶ່ງໃບຫນ້າ, ແລະສ່ວນທີ່ເຫຼືອຂອງຮູບພາບແມ່ນຫນ້າກາກສີຂາວ, ດັ່ງນັ້ນການທໍາລາຍການສ້າງ ID ຜູ້ໃຊ້ຫຼາຍຄົນເຂົ້າໄປໃນວຽກງານທີ່ງ່າຍດາຍຂອງການສ້າງ ID ຜູ້ໃຊ້ສ່ວນບຸກຄົນ. ເມື່ອກອບສ້າງຮູບພາບ ID ຜູ້ໃຊ້, ຮູບພາບເຫຼົ່ານີ້ຖືກລວມເຂົ້າກັບແມ່ແບບການສົມມຸດຕິຖານ, ດັ່ງນັ້ນການອໍານວຍຄວາມສະດວກໃນການປະສົມປະສານຂອງຮູບພາບແມ່ແບບກັບຮູບພາບທີ່ສ້າງຂຶ້ນ, ໃນທີ່ສຸດກໍ່ເຮັດໃຫ້ຮູບພາບທີ່ມີຄຸນນະພາບສູງ.
ການທົດລອງແລະຜົນໄດ້ຮັບ
ຕອນນີ້ພວກເຮົາມີຄວາມເຂົ້າໃຈກ່ຽວກັບກອບຂອງ EasyPhoto, ມັນແມ່ນເວລາທີ່ພວກເຮົາຈະຄົ້ນຫາການປະຕິບັດຂອງກອບ EasyPhoto.
ຮູບພາບຂ້າງເທິງແມ່ນສ້າງຂຶ້ນໂດຍປລັກອິນ EasyPhoto, ແລະມັນໃຊ້ຮູບແບບ SD ທີ່ອີງໃສ່ຮູບແບບສໍາລັບການສ້າງຮູບພາບ. ຍ້ອນວ່າມັນສາມາດສັງເກດເຫັນໄດ້, ຮູບພາບທີ່ສ້າງຂຶ້ນເບິ່ງຕົວຈິງ, ແລະແມ່ນຂ້ອນຂ້າງຖືກຕ້ອງ.
ຮູບພາບທີ່ເພີ່ມຂ້າງເທິງແມ່ນສ້າງຂື້ນໂດຍກອບຂອງ EasyPhoto ໂດຍໃຊ້ຮູບແບບ Comic Style ຕາມ SD. ຍ້ອນວ່າມັນສາມາດເຫັນໄດ້, ຮູບພາບຕະຫລົກ, ແລະຮູບພາບທີ່ແທ້ຈິງເບິ່ງຂ້ອນຂ້າງຈິງ, ແລະຄ້າຍຄືກັນກັບຮູບພາບການປ້ອນຂໍ້ມູນຢ່າງໃກ້ຊິດບົນພື້ນຖານການກະຕຸ້ນເຕືອນຂອງຜູ້ໃຊ້ຫຼືຄວາມຕ້ອງການ.
ຮູບພາບທີ່ເພີ່ມໃສ່ຂ້າງລຸ່ມນີ້ໄດ້ຖືກສ້າງຂື້ນໂດຍກອບຂອງ EasyPhoto ໂດຍການໃຊ້ແມ່ແບບຫຼາຍບຸກຄົນ. ຍ້ອນວ່າມັນສາມາດເຫັນໄດ້ຊັດເຈນ, ຮູບພາບທີ່ສ້າງຂຶ້ນແມ່ນຈະແຈ້ງ, ຖືກຕ້ອງ, ແລະຄ້າຍຄືກັບຮູບພາບຕົ້ນສະບັບ.
ດ້ວຍການຊ່ວຍເຫຼືອຂອງ EasyPhoto, ດຽວນີ້ຜູ້ໃຊ້ສາມາດສ້າງຮູບຄົນ AI ກວ້າງ, ຫຼືສ້າງ ID ຜູ້ໃຊ້ຫຼາຍອັນໂດຍໃຊ້ແມ່ແບບທີ່ເກັບຮັກສາໄວ້, ຫຼືໃຊ້ຮູບແບບ SD ເພື່ອສ້າງແມ່ແບບ inference. ຮູບພາບທີ່ເພີ່ມຂ້າງເທິງສະແດງໃຫ້ເຫັນເຖິງຄວາມສາມາດຂອງກອບຂອງ EasyPhoto ໃນການຜະລິດຮູບພາບ AI ທີ່ມີຄວາມຫຼາກຫຼາຍ, ແລະຄຸນນະພາບສູງ.
ສະຫຼຸບ
ໃນບົດຄວາມນີ້, ພວກເຮົາໄດ້ເວົ້າກ່ຽວກັບ EasyPhoto, a plugin WebUI ໃຫມ່ ທີ່ອະນຸຍາດໃຫ້ຜູ້ໃຊ້ສຸດທ້າຍສ້າງຮູບຄົນແລະຮູບພາບ AI. ປັ໊ກອິນ EasyPhoto WebUI ສ້າງຮູບຄົນ AI ໂດຍໃຊ້ແມ່ແບບທີ່ມັກ, ແລະຜົນສະທ້ອນໃນປະຈຸບັນຂອງ EasyPhoto WebUI ສະຫນັບສະຫນູນຮູບແບບຮູບພາບທີ່ແຕກຕ່າງກັນ, ແລະການດັດແກ້ຫຼາຍ. ນອກຈາກນັ້ນ, ເພື່ອເພີ່ມຄວາມສາມາດຂອງ EasyPhoto, ຜູ້ໃຊ້ມີຄວາມຍືດຫຍຸ່ນໃນການສ້າງຮູບພາບໂດຍໃຊ້ຕົວແບບ SDXL ເພື່ອສ້າງຮູບພາບທີ່ຫນ້າພໍໃຈ, ຖືກຕ້ອງ, ແລະມີຄວາມຫລາກຫລາຍ. ກອບຂອງ EasyPhoto ນໍາໃຊ້ຕົວແບບພື້ນຖານການແຜ່ກະຈາຍທີ່ຫມັ້ນຄົງບວກໃສ່ກັບຕົວແບບ LoRA ທີ່ໄດ້ຝຶກອົບຮົມໄວ້ກ່ອນເຊິ່ງເຮັດໃຫ້ຜົນຜະລິດຮູບພາບທີ່ມີຄຸນນະພາບສູງ.
ສົນໃຈເຄື່ອງສ້າງຮູບພາບບໍ? ພວກເຮົາຍັງສະຫນອງບັນຊີລາຍຊື່ຂອງ ທີ່ດີທີ່ສຸດ AI Headshot Generators ແລະ ເຄື່ອງສ້າງຮູບພາບ AI ທີ່ດີທີ່ສຸດ ທີ່ງ່າຍຕໍ່ການນໍາໃຊ້ແລະບໍ່ຈໍາເປັນຕ້ອງມີຄວາມຊໍານານດ້ານວິຊາການ.