Nasihat (yohud Sun'iy Intellekt bu darajaga qanday yetib keldi)Nasihat – xatolardan olingan xulosa, yoki dars. Nasihatlar bizga xatolarni kamaytirishga yordam beradi. Bu postda hozirda bizni lol qoldirayotgan Sun’iy Intellektni(keyingi o’rinlarda SI deb keltiriladi) hozirgi darajaga olib chiqqan “nasihat-olish” mexanizmi haqida gaplashamiz.
Nasihatlar ikki xil bo’ladi: tashqi va ichki. O’zimizga o’zimiz qiladigan nasihatlar bu ichki nasihatlar. Bizga yaqin bo’lgan insonlar beradigani esa tashqi nasihatlardir. Nasihatning darajasi ham turli xil bo’ladi. Hayotiy nasihatlardan tortib, oddiy ovqatni yaxshiroq qilish uchun ishlatiladiganigacha.
Nasihat-olish mexanizmi qanday ishlaydi:(Ovqat qilish misolida)
Sizga ishlatilishi kerak bo’lgan mahsulotlar ma’lum, lekin miqdori noma’lum. Siz randomniy miqdorda berilgan mahsulotlarni bilan ovqat qilib ko’rasiz. Ovqat pishgandan keyin esa uni ta’tib ko’rib baho berasiz. Sho’r bo’lsa tuzini kamaytirasiz, achchiq bo’lsa garimdorini.
SI model o’rgatish ham shunga o’xshash bir jarayon.
1. Forward pass: Randomniy miqdorda olingan mahsulotlar bilan ovqat qilish
2. Calculating Loss: Tayyor bo’lgan ovqatga baho berish
3. Backward pass: Natijaga qarab turib qanday mahsulotda qancha solish kerakligin aniqlab olish
4. Update the model parameters: Aniqlab olingan miqdorlarni saqlab qo’yish.
Yuqoridagi 4-bosqichli jarayonni bir necha marotaba takrorlash orqali SI modellar o’rgatiladi va hozirgi ChatGPT darajasiga olib chiqiladi. Ya’ni SI o’ziga o’zi nasihat berish orqali o’zi pishirgan ovqatni yaxshilab boradi. Faqatgina keyingi takrorlanishlarda randomniy miqdorda mahsulot solish o’rniga, Backward pass da aniqlab olingan miqdorni ishlatadi.
Endi, savol tug’iladi:
"Biz insonlarning o’sishiga tashqi nasihatlar ham katta ta’sir ko’rsatadi. SI da shunday narsa bormi?"Ha albatta, bu jarayon RLHF(Reinforcement Learning with Human Feedback) deb nomlanadi. Bunda, nasihatchi insonlar guruhi SI pishirgan ovqat baholashadi va SI shu baholarga asoslanib o’zining ovqat pishirishda mahsulotlar miqdorini o’zgartirib boradi. Hayotimizda shunday holatlar bo'ladiki, unda biz qilayotgan xatolar o'zimizga ko'rinmaydi. Shunday vaziyatlarda biz tashqi nasihatga ehtiyoj sezamiz.
Surah At-Tin’da
“Insonlar eng zo’r shaklda yaratilgan” deb keltiriladi. Bizning nasihat olish qobilyatimiz bor. Va bu qobilyat qo’llagan SI shu darajaga yetib keldiki hozir u tarixda yozilmagan she’rlarni yoza oladi, san’at asarlarini chiza oladi.
Agar inson o’ziga o’zi nasihat qilishni to’xtatsa, SI albatta undan o’zib ketadi. Shunday ekan tinimsiz o’zingizga o’zingiz nasihat qiling, yaqinlardan nasihat oling, va ularga amal qilib, bu jarayonni takrorlang. Buning uchun kunlik, haftalik, va oylik vaqtlar ajrating.
Ravshan07.07.2024
Tashkent