Мир гудит, капитализация цифровых гигантов падает, а сами гиганты срочно готовят пакты документов для судебных разбирательств. Что же случилось? Китайцы ворвались на рынок языковых моделей. Я, как человек с этими самыми моделями работающий довольно плотно, не могу пройти мимо. Так что это за модели такие?
Итак,
первой ласточкой была текстовая модель
DeepSeek. Зайти и попробовать просто - достаточно учетки гугла. По тестам модель успешно конкурирует с такими столпами, поделившими рынок, как ChatGPT (от компании OpenAI) и СlaudeAI (от Anthropic). Второй, кстати - мой, до последнего времени фаворит в работе с текстами и кодом, если кто думает с чего начать - рекомендую. Правда денег хочет, но отрабатывает их до копейки.
Тесты тестами, а что он может предложить?
Удар первый - он ПОКА бесплатен. До 8 февраля совсем. После - будет ценник, но планируется ценовой демпинг. OpenAI настолько напряглись, что сегодня начали раздавать подписку для новых пользователей на 3 месяца за 50% цены.
Удар второй - режим DeepThink (глубокое обдумывание), который только-только начали применять у конкурентов за большие деньги. Режим интересный, прежде чем дать ответ, как все уже привыкли, нейронка прогоняет прямо у вас перед глазами цепочку рассуждений, подтягивает данные, делает выводы, обобщает и лишь потом формулирует ответ. Очень интересный режим для работы с комплексными вопросами. Есть еще режим поиска в интернете, что сейчас востребовано, но он малость поломанный пока) издержки старта продукта.
Вывод пока делать рано, но что точно можно сказать - получилось отнюдь не плохо, и вполне можно попробовать в боевых задачах, тем более бесплатно. Кто работает с текстами или кодом, ученики, студенты - налетайте, только на практике можно понять соответствие.
Вторая ласточка прилетела со стороны китайского гиганта Alibaba. Те выкатили целую пачку моделей, объединенных общим именем Qwen. Опять же по тестам - уверенно конкурируют с вышеупомянутыми. Ключевые различия:
- бесплатность в принципе (как минимум на данный момент)
- опенсорсность и возможность запустить модели локально, у себя на компьютере или в облаке. То есть просто берете, скачиваете, настраиваете и пользуетесь.
- большой выбор моделей с разными возможностями, то есть мультимодальность. Есть специализированные на текстах, есть на математике и коде, есть работающие с изображениями, есть - с аудио и естественным языком, в общем - ассортимент на любой вкус и потребность.
Попробовать можно и без заморочек с установкой и облаками, в режиме чата.
https://chat.qwenlm.ai/ (чат поддерживает и генерацию изображений, и распознание, и даже генерацию видео, правда с последним тяжеловато, ресурсов, видать, не хватает)
Почитать обо всех моделях тут
https://qwen-ai.com/ (английский язык)
Если кто локально захочет поиграться - есть приятный сюрприз, можно подобрать модель с вполне скромными характеристиками, смотрите требования на сайте.
Резюмирую - китайцы на днях изменили рынок ИИ, в том виде, в котором он сложился за последние год-два. Появилась сильная конкуренция. Пошли ценовые войны. Это всегда хорошо для потребителя, а то что-то стала намечаться стагнация. Хорошая тенденция, следим за событиями, пользуемся преимуществами.