Ўзи ўзбек тилидаги AI ва корпус лингвистикаси бўйича тадқиқотлар олиб бориляптими, деган саволга жавоб бераман.
2024 йилда бу бўйича асосий тадқиқотлар қуйидаги илмий марказларда олиб борилди:
- Урганч давлат университети — Элмурод Қуриёзов ва Ғайрат Матлатипов бошқа олимлар билан ҳамкорликда нуфузли хориж журналларида тадқиқотларини эълон қилиб бормоқда. Ўзбекистон Миллий Университети тадқиқотчиси Бобур Аллабердиев билан ҳамкорликдаги битта тадқиқот ўзбек-қозоқ машина таржимаси учун параллель матнлар корпусини тақдим этади. Бу мақола Elsevier'да эълон қилинган. Яна бир тадқиқот эса аспектга асосланган сентимент таҳлили (Aspect-Based Sentiment Analysis, ABSA) инструментларига бағишланган. У ўзбек тилидаги илк юқори сифатли аннотацияли маълумотлар базасини (UzABSA) тақдим этади. Бу база ўзбек ресторанларининг онлайн изоҳлардан тўпланган бўлиб, ҳужжат сатҳидаги 3,5К, гап сатҳидаги 6,1+ изоҳни ўз ичига олади. Springer Nature'даги яна бир конференция материали ҳам шунга яқин мавзуда.
- Новосибирск давлат университети — Давлатёр Менглиев, Владимир Барахнин, Бобур Саидов, Жавоҳир Рўзимов ва бошқа тадқиқотчилар ўзбек ва қорақалпоқ тилларининг автоматик ишланмалари бўйича тадқиқотлар олиб бормоқда. Тиббиёт матнлари атоқли отлари ва номли борлиқларини автоматик таниш технологиялари, қорақалпоқча матнларнинг синтаксисини текшириш дастурлари, диалектларни стандартлаштириш бўйича тадқиқотлар шулар жумласидан.
- Ухань университети — бу ерда ишлаётган тадқиқотчилар Азизхайржон Юсуф, Азизгул Юсуф, Обидин Анвар, Комрон Азиз, Фэй Ли, Дунхун Цзи, Чун Тэн 2024 йилда ўзбек тилидаги номли борлиқлар бўйича иккита тадқиқот эълон қилди — икковиям Springer'да, бири конференция материали, бири Language Resources and Evaluation журналида.
Бу тадқиқотларнинг кўпида ҳамкор тадқиқотчи сифатида ЎзМУ вакилларини кўриш мумкин.
Мана шу тўрт илмий марказда ўзбек катта тил моделларини ишлаб чиқиш ва такомиллаштириш бўйича изланишлар олиб борилмоқда. Бошқалариям бўлиши мумкин, чоп этилган тадқиқотлар ичида энг кўп иқтибослилари шуларга тегишли.
@AsanovEldar
2024 йилда бу бўйича асосий тадқиқотлар қуйидаги илмий марказларда олиб борилди:
- Урганч давлат университети — Элмурод Қуриёзов ва Ғайрат Матлатипов бошқа олимлар билан ҳамкорликда нуфузли хориж журналларида тадқиқотларини эълон қилиб бормоқда. Ўзбекистон Миллий Университети тадқиқотчиси Бобур Аллабердиев билан ҳамкорликдаги битта тадқиқот ўзбек-қозоқ машина таржимаси учун параллель матнлар корпусини тақдим этади. Бу мақола Elsevier'да эълон қилинган. Яна бир тадқиқот эса аспектга асосланган сентимент таҳлили (Aspect-Based Sentiment Analysis, ABSA) инструментларига бағишланган. У ўзбек тилидаги илк юқори сифатли аннотацияли маълумотлар базасини (UzABSA) тақдим этади. Бу база ўзбек ресторанларининг онлайн изоҳлардан тўпланган бўлиб, ҳужжат сатҳидаги 3,5К, гап сатҳидаги 6,1+ изоҳни ўз ичига олади. Springer Nature'даги яна бир конференция материали ҳам шунга яқин мавзуда.
- Новосибирск давлат университети — Давлатёр Менглиев, Владимир Барахнин, Бобур Саидов, Жавоҳир Рўзимов ва бошқа тадқиқотчилар ўзбек ва қорақалпоқ тилларининг автоматик ишланмалари бўйича тадқиқотлар олиб бормоқда. Тиббиёт матнлари атоқли отлари ва номли борлиқларини автоматик таниш технологиялари, қорақалпоқча матнларнинг синтаксисини текшириш дастурлари, диалектларни стандартлаштириш бўйича тадқиқотлар шулар жумласидан.
- Ухань университети — бу ерда ишлаётган тадқиқотчилар Азизхайржон Юсуф, Азизгул Юсуф, Обидин Анвар, Комрон Азиз, Фэй Ли, Дунхун Цзи, Чун Тэн 2024 йилда ўзбек тилидаги номли борлиқлар бўйича иккита тадқиқот эълон қилди — икковиям Springer'да, бири конференция материали, бири Language Resources and Evaluation журналида.
Бу тадқиқотларнинг кўпида ҳамкор тадқиқотчи сифатида ЎзМУ вакилларини кўриш мумкин.
Мана шу тўрт илмий марказда ўзбек катта тил моделларини ишлаб чиқиш ва такомиллаштириш бўйича изланишлар олиб борилмоқда. Бошқалариям бўлиши мумкин, чоп этилган тадқиқотлар ичида энг кўп иқтибослилари шуларга тегишли.
@AsanovEldar