✅✅✅❗️
📱 SUN’IY INTELLEKT OLIMLARNI ISHSIZ QOLDIRADIMI?
❔ Savollardan namuna👇:
Apodiformes turkumiga mansub kolibrilarda, ajoyib ikki tomonlama juft oval suyagi (sesamoid suyak) mavjud. Bu sesamoid suyagi nechta juft tendonlarni qo‘llab-quvvatlaydi? Raqam bilan javob bering.
Sinovni yaratuvchilar ko‘rsatkichlar tez o‘sib borishiga va 2025-yil oxiriga kelib 50% dan oshishi mumkinligiga ishonchlari komil. Ehtimol, keyin yangi mezon kerak bo‘ladi, unda sun'iy intellektga odamlar javob berolmaydigan savollar beriladi.
Ammo bunday kuchli sun’iy intellekt ham inson olimlari uchun xavf tug‘dirishi dargumon, deydi test mualliflaridan biri, Berklilik fizik Kevin Chjou.
“Testdan o‘tish va amaliyotchi fizik yoki tadqiqotchi bo‘lish o‘rtasida katta farq bor. Hatto bu savollarga javob bera oladigan SI ham tadqiqotlarda yordam berishga tayyor emas”, deydi olim.
📱Telegram | 📱Instagram | 📱Facebook | 📱You tube | 📱X (Twitter)
📱 SUN’IY INTELLEKT OLIMLARNI ISHSIZ QOLDIRADIMI?
Sun'iy intellekt modellarining qobiliyatlarini baholash uchun ularga maxsus testlar - benchmarklar beriladi. Ular neyron tarmoqlarni turli sohalarda - matematikadan tortib tarjimalargacha sinovdan o‘tkazadi.
Mutaxassislar eng murakkab mezonlardan foydalanib, mavjud modellar kuchli SIga qanchalik yaqin ekanligini kuzatib boradi va ularning xavfsizligini baholaydi.
3 ming savoldan iborat testni 50 ta davlatdan turli sohalardan - analitik falsafadan tortib oliy matematika va raketashunoslikgacha bo‘lgan mingga yaqin olimlar (ko‘pchiligi fan doktorlari) tomonidan tuzildi. 50 ta eng yaxshi savol mualliflari 5 ming dollar bilan mukofotlandi.
❔ Savollardan namuna👇:
Apodiformes turkumiga mansub kolibrilarda, ajoyib ikki tomonlama juft oval suyagi (sesamoid suyak) mavjud. Bu sesamoid suyagi nechta juft tendonlarni qo‘llab-quvvatlaydi? Raqam bilan javob bering.
Oltita yetakchi SI modellari sinaldi:
➖Gemini 2.0 - Google dan,
➖Claude 3.5 Sonnet - Anthropic dan,
➖Grok-2 - xAI dan,
➖GPT-4o - OpenAI dan,
➖o1 - OpenAI dan,
➖DeepSeek-R1 Xitoy startapidan.
Ulradan hech biri 10% dan ko‘p ball to‘plamadi.
Eng yuqori ballni OpenAI-o1 (9,1%) va DeepSeek-R1 (9,4%) oldi, ammo Xitoy modeli rasmlar bilan ishlay olmagani uchun ba’zi muammolarni hal qilmadi.
Sinovni yaratuvchilar ko‘rsatkichlar tez o‘sib borishiga va 2025-yil oxiriga kelib 50% dan oshishi mumkinligiga ishonchlari komil. Ehtimol, keyin yangi mezon kerak bo‘ladi, unda sun'iy intellektga odamlar javob berolmaydigan savollar beriladi.
Ammo bunday kuchli sun’iy intellekt ham inson olimlari uchun xavf tug‘dirishi dargumon, deydi test mualliflaridan biri, Berklilik fizik Kevin Chjou.
“Testdan o‘tish va amaliyotchi fizik yoki tadqiqotchi bo‘lish o‘rtasida katta farq bor. Hatto bu savollarga javob bera oladigan SI ham tadqiqotlarda yordam berishga tayyor emas”, deydi olim.
📱Telegram | 📱Instagram | 📱Facebook | 📱You tube | 📱X (Twitter)