🧠 “Insoniyatning Oxirgi Imtihoni ... ”
... deb nomlangan test ustida hozirda olimlar ish olib bormoqdalar.
AI rivojlanishini kuzatish uchun unga SAT darajasidagi matematika, fan, mantiqiy fikrlash kabi standart imtihonlar berilardi. Yillar davomida AI bu testlarni tobora yaxshiroq topshira boshladi.
Modellar haddan tashqari kuchayib, ilgari qiyin sanalgan testlarni oson yecha boshladi. Grafiklarga qaralsa, deyarli barcha testlarda AI’ning natijalari 50% dan yuqoriga chiqib bo‘ldi!
⚠️ “Humanity’s Last Exam” – bu endi AI qanchalik oldinga o‘tganini o‘lchash uchun eng so‘nggi chora! Bu yangi test eng ilg‘or AI modellarini ham cheklab turuvchi murakkab akademik ( ko'pi PhD yoki undan yuqori darajadagi) vazifalarni o‘z ichiga oladi. Hozircha, ko‘pgina oldingi benchmarklardan farqli ravishda, eng ilg'or AI modellar ham bu testda ancha past natija ko‘rsatmoqda (grafikda namoyon).
Bu test nomi negadir AI’ning oxir-oqibat bizni yengishiga ishora qilayotgandek… 💀
Manba: https://lastexam.ai/
@kilich_bek_blog
... deb nomlangan test ustida hozirda olimlar ish olib bormoqdalar.
AI rivojlanishini kuzatish uchun unga SAT darajasidagi matematika, fan, mantiqiy fikrlash kabi standart imtihonlar berilardi. Yillar davomida AI bu testlarni tobora yaxshiroq topshira boshladi.
Modellar haddan tashqari kuchayib, ilgari qiyin sanalgan testlarni oson yecha boshladi. Grafiklarga qaralsa, deyarli barcha testlarda AI’ning natijalari 50% dan yuqoriga chiqib bo‘ldi!
⚠️ “Humanity’s Last Exam” – bu endi AI qanchalik oldinga o‘tganini o‘lchash uchun eng so‘nggi chora! Bu yangi test eng ilg‘or AI modellarini ham cheklab turuvchi murakkab akademik ( ko'pi PhD yoki undan yuqori darajadagi) vazifalarni o‘z ichiga oladi. Hozircha, ko‘pgina oldingi benchmarklardan farqli ravishda, eng ilg'or AI modellar ham bu testda ancha past natija ko‘rsatmoqda (grafikda namoyon).
Bu test nomi negadir AI’ning oxir-oqibat bizni yengishiga ishora qilayotgandek… 💀
Manba: https://lastexam.ai/
@kilich_bek_blog