Mironshoh Inomjonov


Channel's geo and language: Uzbekistan, Uzbek


- KPI.com'da ML injener
- OpenReview'da paper reviewer (edim)
- Najot ta'limda ustoz

Related channels  |  Similar channels

Channel's geo and language
Uzbekistan, Uzbek
Statistics
Posts filter


LinkedInda ozarbayjonlik DS/ML/AI injenerlarning ba'zilari bilan connectionlarim bor va ular bilan hafta oralab 'Paper Reading club'lar tashkil qilamiz. Aniqrog'i ular tashkil qilishadi va qo'shilmoqchi bo'lganlarga suhbatga link berishadi.
Va ozarbayjonliklar aynan ozar tili bo'yicha har xil qiziq loyihalar qilishadi (bizdagi deylik Tahrirchiga o'xshagan).
Suratda ular qanday qilib ozar tilidagi ma'lumotlarni to'plaganliklari haqida diagramma.(kimgadir foydali bo'lib qolar).

Nima demoqchiman:
Low resource languages ya'ni kam ma'lumotli tillar bilan NLP maxsulotlarni yaratish har doim ham kerakmas yoki foydasiz degan fikrdan yiroq bo'lish kerak. Har holda ko'p ML injenerlar tayyor va katta dataset bilan ishlashni xohlashsa kerak. Lekin low resourse (masalan, turkiy tillar) tillar bilan ishlash birinchidan til rivoji uchun foydali.
Ikkinchidan, deylik, o'qish faoliyatingizni keyinchalik davom ettirmoqchi bo'lsangiz (MS yoki PhD) akademiya yoki professorlar sizdan faqatgina olamshumul ish qilganizni kutishmaydi. Aksincha, bunday loyihalar qilganingiz ularga yoqib tushishi ehtimoli baland. Ayniqsa sizning data gathering va preprocessingdagi tajribangiz aniq ustun tomoningizdan bo'ladi.




Menimcha bu leksiya haqidagi fikrlar va bu leksiyani ko'rishni tavsiya qilganlarni linkedinda ko'p ko'rgan bo'lsangiz kerak.
Bugun shu leksiyani ko'rib chiqdim. LLMlarni qurishni yaxshi tushuntirgan. LLMni arxitekturasiga to'xtalmagan unchalik. Pretraining (language modelin) va post training (SFT yoki RLHF) kabilarni tushuntirgan.
Guest lecture bo'lgani uchun ham juda murakkab tarzda tushuntirmagan (balki shunisi ham yaxshidir).
LLMlar qanday ishlashi qiziq bo'lsa ko'rib chiqinglar.
Lektor - Yann Dubois.

https://youtu.be/9vM4p9NN0Ts?si=e6YXOmnKsWZrDn-L


Oramizda PMlar yoki IT kompaniyada ishlaydiganlar bo'lsa offer olsam referral uchun suyunchisi bor.
Asosan ML engineer position uchun (deep learning bilan yoki klassik ML)
va Data Scientist position uchun vakansiyalar ko'rib chiqyapman.

@Mironshoh_Inomjonov
Shunga yozsangiz bo'ladi.




IELTS'imni yangilagandim. Natijasi shunaqa bo'ldi. Shukr.


OpenReview'da bitta paper berishdi menga. Review qilib, savollariga javob berib yubordim.

Paper reviewdan keyingi xulosalar:

1. Takrorlash - Paper mavzusi bo'yicha o'rganganlarimni yana qaytarib ko'rib chiqdim. Bu menga mustahkamlash bo'ldi.

2. Odatda paperlar fanga yangilik yoki mavjud yechimning o'rniga boshqa rakursdan olingan yechim taqdim qiladi. Shu sababdan ham 'keling muammoga unday emas bunday yondashamiz' kabi yo'nalishni ham qo'llash kerak ekan.

3. Paper uncha kattamas edi, lekin men o'qib chiqib tushunib olishimga biroz ko'proq vaqt kerak bo'ldi. Sababi men kam paper o'qiganman va umuman research bo'yicha tajribam deyarli yo'q (research internshipdan tashqari). Shuning uchun avval ko'proq real research loyihalarda qatnashib, paper publish qilishda ishtirok etib, keyin Paper reviewerlik qilinsa yaxshi bo'ladi.

4. Paper o'qish kerak ekan.

P.s: Iqboljon Sobirovdan paper review bo'yicha maslahat so'ragandim. Rasmda ularning javoblaridan asosiy qism.




(c)


"Strawberry problem" haqida balki eshitgandirsiz.


ChatGPT 'strawberry' so'zidagi 'r' harfi sonini noto'g'ri sanaydi. So'zda aslida 3ta bo'lgan bu harfni ChatGPT 2ta deb sanaydi.

Bu yerda o'qing

Sababi tokenization bilan bog'liq.
Ya'ni bu yerda urg'u LLMga qaratilgan. Ha, u fikrlamaydi, siz kiritgan so'zni ko'rmaydi. U raqamlar ustida amal bajaradi.

Lekin OpenAIning yangi chiqargan mahsuloti boshqacha 'performance' ko'rsatyapti. U 'r' harfi sonini to'g'ri sanadi.

Bu yerda o'qing.


OpenReview'da paper review qilaman. Qabul qilishdi.

MRL - Multilingual Representation Learning


Linkedin suggestion'da chiqib qoldi. Kimgadir foydali bo'lar. Karpathyning postini, menimcha ko'pchilik ko'rgan.

(c)


Ilmga boshqacha qiziqar edik

Litsey paytida litseyimizda bir an'ana bor edi. Yuqori sinflar o'zlaridan kichik ukalariga har kuni 'mutolaa' (kechkipayt dars qilinadigan vaqt bizda mutolaa deb atalardi) vaqtida fanlardan o'tilgan mavzularni tushuntirib berishardi va o'quvchilarda savol bo'lsa javob topishga yordamlashishardi.

Birorta misol yo masalamiz chiqmay qolsa, darrov yuqori sinflarni oldiga yugurardik. 5 yil o'sha litseyda o'qigan bo'lsak biror marta yordam so'rab chiqqanimizda "yo'q" deyishmagan. Biz ham shunday: yo'q demaganmiz.

O'quvchilar darslar va "nagruzka" ko'pligidan rostan charchab ketishardi. Lekin barbir "podyom"dan erta uyg'onib o'quv binoga chiqib dars qilishardi. Bunga ularni hechkim majburlamasdi, shunchaki - ilmga bo'lgan qiziqish shunaqa edi.

"Ilmdan o'zga najot yo'q va bo'lmagay"
Imom Buxoriy


P.S - suratni tasviriy san'at ustozimiz Muzaffar Qurbonov chizgan.


Epochlar soni haqida


Forward from: Not So Artificial Intelligence
Deep Learningni o'rganishni istagan iste'dodli yoshlar uchun imkoniyat: Behbudiy Akademiyasi.

Akademiyada ilg'or yoshlar va tajribali muhandislar yangi iste'dodlarga DL o'rgatamiz.

Agar talaba do'stlaringiz orasida olimpiadalar bilan shug'ullangan iqtidorlar bo'lsa, bu ular uchun yaxshi imkoniyat.

Hozircha cheklangan sonda o'rinlar mavjud va topshirish ushbu ilova orqali amalga oshiriladi.


Data Scientist aytibdimi, demak, bajarish kerak.






PyTorch vs Tensorflow

(c)



20 last posts shown.