Postlar filtri


Oxirgi 1-2.oy ichida ko'p intervyularda qatnashdim va ba'zi xulosalarim:
- Texnologiyadan ko'ra core algoritm yoki model ishlashini ko'proq o'rganish kerak.
Masalan transformer arxitekturasi qanaqa ishlashini bilmasangizu lekin PyTorchda birnimalar qilgan bo'lsangiz befoyda.
- Fine tuning jarayonida o'zi nimalar sodir bo'lishini bilish.
PEFT nima, LoRA va QLoRA qanday ishlaydi. Masalan nimaga u aynan 'low rank' adaptation deyiladi.
- Bilmaydigan narsani bilmayman deb aytish
- Eng ko'p ishlatiladigan texnologiyalar va mavzular: LangChain, RAG, fine-tuning, transformerlar, YOLO, deployment.


Masalan Ventionga intervyuda PyTorch bo'yicha bir savolga javob berolmadim, lekin transformerni yaxshi tushuntirib berdim. Lekin, menimcha, PyTorch savolga javob berib transformerni tushuntirolmaganimda reject bo'lardi


Ventiondan offer oldim.

Bugun oxirgi call bo'ldi: qachondan boshlash va boshqa masalalarni kelishib oldik. Yangi yilda nasib qilsa yangi ish joyda ish boshlayman.


Reinforcement Learning haqida.


Qiziq narsa ekan
Tom Yeh on LinkedIn: I flipped through 300 pages of deep learning math puzzles by hand ✍️ I… | 20 comments
I flipped through 300 pages of deep learning math puzzles by hand ✍️ I just received the first proof copy of the "Deep Learning Math Workbook" that combines… | 20 comments on LinkedIn


(c)


Kecha GDGga bormaganimga yarasha bir qiziqroq ish qildim.
2-3kun avval d2l.ai orqali BiRNN (Bidirectional Recurrent Neural Network)ni MovieLens datasetida train qilgandim.
Kecha shuni o'zbek tilidagi dataset uchun train qilishga harakat qildim va menimcha natijalar yomon emas. Kommentariyalar uchun sentiment analysis.
Rasmlarda ko'rishingiz mumkin natijalarni.
Kodni ozgina tozalab olay bu yerda ham ulashaman.

Dataset:
https://huggingface.co/datasets/behbudiy/uzbek-sentiment-analysis




Agar kuchayib ketib deep learning bo'yicha intervyu oladigan bo'lsam, birinchi savolim 'dot product' haqida bo'ladi.
Javobdan tushunvolish mumkin CNN va asosan transformerlarni rostan yaxshi tushunganmi yoki yodlaganmi.


LinkedInda ozarbayjonlik DS/ML/AI injenerlarning ba'zilari bilan connectionlarim bor va ular bilan hafta oralab 'Paper Reading club'lar tashkil qilamiz. Aniqrog'i ular tashkil qilishadi va qo'shilmoqchi bo'lganlarga suhbatga link berishadi.
Va ozarbayjonliklar aynan ozar tili bo'yicha har xil qiziq loyihalar qilishadi (bizdagi deylik Tahrirchiga o'xshagan).
Suratda ular qanday qilib ozar tilidagi ma'lumotlarni to'plaganliklari haqida diagramma.(kimgadir foydali bo'lib qolar).

Nima demoqchiman:
Low resource languages ya'ni kam ma'lumotli tillar bilan NLP maxsulotlarni yaratish har doim ham kerakmas yoki foydasiz degan fikrdan yiroq bo'lish kerak. Har holda ko'p ML injenerlar tayyor va katta dataset bilan ishlashni xohlashsa kerak. Lekin low resourse (masalan, turkiy tillar) tillar bilan ishlash birinchidan til rivoji uchun foydali.
Ikkinchidan, deylik, o'qish faoliyatingizni keyinchalik davom ettirmoqchi bo'lsangiz (MS yoki PhD) akademiya yoki professorlar sizdan faqatgina olamshumul ish qilganizni kutishmaydi. Aksincha, bunday loyihalar qilganingiz ularga yoqib tushishi ehtimoli baland. Ayniqsa sizning data gathering va preprocessingdagi tajribangiz aniq ustun tomoningizdan bo'ladi.




Menimcha bu leksiya haqidagi fikrlar va bu leksiyani ko'rishni tavsiya qilganlarni linkedinda ko'p ko'rgan bo'lsangiz kerak.
Bugun shu leksiyani ko'rib chiqdim. LLMlarni qurishni yaxshi tushuntirgan. LLMni arxitekturasiga to'xtalmagan unchalik. Pretraining (language modelin) va post training (SFT yoki RLHF) kabilarni tushuntirgan.
Guest lecture bo'lgani uchun ham juda murakkab tarzda tushuntirmagan (balki shunisi ham yaxshidir).
LLMlar qanday ishlashi qiziq bo'lsa ko'rib chiqinglar.
Lektor - Yann Dubois.

https://youtu.be/9vM4p9NN0Ts?si=e6YXOmnKsWZrDn-L


Oramizda PMlar yoki IT kompaniyada ishlaydiganlar bo'lsa offer olsam referral uchun suyunchisi bor.
Asosan ML engineer position uchun (deep learning bilan yoki klassik ML)
va Data Scientist position uchun vakansiyalar ko'rib chiqyapman.

@Mironshoh_Inomjonov
Shunga yozsangiz bo'ladi.




IELTS'imni yangilagandim. Natijasi shunaqa bo'ldi. Shukr.


OpenReview'da bitta paper berishdi menga. Review qilib, savollariga javob berib yubordim.

Paper reviewdan keyingi xulosalar:

1. Takrorlash - Paper mavzusi bo'yicha o'rganganlarimni yana qaytarib ko'rib chiqdim. Bu menga mustahkamlash bo'ldi.

2. Odatda paperlar fanga yangilik yoki mavjud yechimning o'rniga boshqa rakursdan olingan yechim taqdim qiladi. Shu sababdan ham 'keling muammoga unday emas bunday yondashamiz' kabi yo'nalishni ham qo'llash kerak ekan.

3. Paper uncha kattamas edi, lekin men o'qib chiqib tushunib olishimga biroz ko'proq vaqt kerak bo'ldi. Sababi men kam paper o'qiganman va umuman research bo'yicha tajribam deyarli yo'q (research internshipdan tashqari). Shuning uchun avval ko'proq real research loyihalarda qatnashib, paper publish qilishda ishtirok etib, keyin Paper reviewerlik qilinsa yaxshi bo'ladi.

4. Paper o'qish kerak ekan.

P.s: Iqboljon Sobirovdan paper review bo'yicha maslahat so'ragandim. Rasmda ularning javoblaridan asosiy qism.




(c)


"Strawberry problem" haqida balki eshitgandirsiz.


ChatGPT 'strawberry' so'zidagi 'r' harfi sonini noto'g'ri sanaydi. So'zda aslida 3ta bo'lgan bu harfni ChatGPT 2ta deb sanaydi.

Bu yerda o'qing

Sababi tokenization bilan bog'liq.
Ya'ni bu yerda urg'u LLMga qaratilgan. Ha, u fikrlamaydi, siz kiritgan so'zni ko'rmaydi. U raqamlar ustida amal bajaradi.

Lekin OpenAIning yangi chiqargan mahsuloti boshqacha 'performance' ko'rsatyapti. U 'r' harfi sonini to'g'ri sanadi.

Bu yerda o'qing.


OpenReview'da paper review qilaman. Qabul qilishdi.

MRL - Multilingual Representation Learning


Linkedin suggestion'da chiqib qoldi. Kimgadir foydali bo'lar. Karpathyning postini, menimcha ko'pchilik ko'rgan.

(c)

20 ta oxirgi post ko‘rsatilgan.