Generative AI qanday ishlaydi?(rasm yaratuvchi diffuziya modellar misolida)
Faraz qiling, bir kulol ko'za yasayotganda tasodifan ko'za shaklini buzib qo'ydi. Endi uni qayta tiklash uchun buzilgan joyiga loy qo'yib qayta shakl berishga urinadi. Rasm yaratuvchi GenAI ham shunga o'xshash mantiq asosida ishlab chiqilgan. Xususan, bu quyidagi ikki asosiy unsurlardan iborat:
1.
Forward Process: shovqin (noise) qo‘shish
Bu jarayonda model rasmlarni buzishni o‘rganadi. U mavjud tasvirlarga oz-ozdan shovqin qo‘shib boradi va oxir-oqibat ularni butunlay tasodifiy shovqinga aylantiradi. Bu foto suratni asta-sekin xiralashtirib, barcha detallarni yo‘qotishga o‘xshaydi (rasmga qarang).
2.
Backward Process: shovqinni yo‘qotish
Bu jarayonda haqiqiy "sehr" sodir bo‘ladi. Model teskari yo‘nalishda ishlashni o‘rganadi — ya’ni tasodifiy shovqindan boshlab, har safar shovqinni oz-ozdan yo‘qotib, oxir-oqibat aniq va real tasvir hosil qiladi. Masalan, mushuk rasmini yaratish so'ralganda tasodifiy shovqindan boshlaydi. Forward Process'da orttirgan tajribasiga tayangan holda (masalan uy hayvoni tasviri to'la shovqinga aylanishidan bitta oldingi qadamda tahminan qanday bo'lishini o'rgangan edi) qadamma-qadam shovqinni yo'qotib ma'noli tasvirga erishadi.
Diffuziya modeliga misollar:🎨 DALL·E 2 – OpenAI
🖼 Imagen – Google
@lazizabdullaev