#6965 post — Axis of Ordinary (@axisofordinary)

TGStat

Qidiruv uchun matnni kiriting

Ilg‘or kanal qidiruvi

Uzbek

Sayt tili

Russian English Uzbek
Saytga kirish

Katalog

Kanal va guruhlar katalogi Kanallar qidiruvi
Kanal/guruh qo‘shish
Reytinglar

Kanallar reytingi Guruhlar reytingi Postlar reytingi
Brendlar va shaxslar reytingi
Analitika
Postlarda qidiruv
Telegram'ni kuzatish

Axis of Ordinary

8 Feb, 02:09

Telegram'da ochish Ulashish Shikoyat qilish

We finally have an answer to the debate over whether LLMs generalize to new math problems or they merely memorized the answers.

We evaluated them on the AIME 2025 I competition from *yesterday* and the results are good!

Source: https://x.com/mbalunovic/status/1887962694659060204