Российская нейросеть от "Сбера" стала самой быстрорастущей в мире

27 апреля 2023 11:38 Инара Ахамбекова

Нейросеть от «Сбера», генерирующая изображения по текстовому запросу Kandinsky 2.1, набрала аудиторию в 1 млн уникальных пользователей всего за четыре дня после релиза, а за шесть дней число пользователей выросло уже до 2 млн человек.

Примечательно, что этот результат превышает показатели известной и популярной нейросети от OpenAI — ChatGPT. Эта модель набирала свой первый миллион немного дольше — ей понадобилось для этого пять дней.

Результат генерации по запросу "В Атырау спецслужбы ищут бомбу в университете"

Если сравнивать с другими известными компаниями, то, например, Instagram набрал миллион загрузок лишь спустя 2,5 месяца после выхода в свет. В то же время Facebook на достижение отметки в миллион пользователей потребовалось ровно в четыре раза больше времени, чем другой соцсети Meta, — 10 месяцев.Модель поддерживает запросы на 101 языке мира, включая английский и русский. Над ней трудились исследователи Sber AI при партнерской поддержке ученых из Института искусственного интеллекта AIRI. Воспользоваться нейросетью можно бесплатно с помощью телеграм-бота или на сайте.

"На дне: бухгалтеры школ Жетысу начислили зарплату мертвым душам на 327 млн тенге"

Результаты Kandinsky 2.1 можно назвать впечатляющими. За счет столь стремительного роста нейросеть сегодня становится самой быстрорастущей в мире. Также удивительно и количество изображений, которое пользователи смогли сгенерировать за столь короткий срок, — более 10 млн.

Для «Сбера» уже не впервой занимать первые места в направлении hi-tech. К примеру, еще в феврале текущего года разработанная командой SberDevices языковая модель FRED-T5 стала лучшей в мире по пониманию русского языка. Кроме того, после введения санкций в компании взяли курс на импортозамещение. Так, банк уже разработал собственное ПО для банкоматов, внедрил собственную графовую платформу, которая позволяет увеличить эффективность управления бизнес-процессами с помощью больших данных и так далее.

Совсем недавно, 4 апреля, «Сбер» представил нейросеть Kandinsky 2.1 — это генеративная модель, которая умеет создавать изображения по текстовому описанию. Новинка стала новой версией модели Kandinsky, которая в свою очередь была основана на модели ruDALL-E.

У Kandinsky 2.1 появились новые возможности, которых не было у предшественников. Так, модель теперь может не только генерировать иллюстрации по запросам, но и смешивать различные изображения, дорисовывать картинки или просто генерировать изображения в режиме бесконечного полотна. Кроме того, с ее помощью можно получить больше вариаций той или иной картинки — стиль в таком случае сохранится.

"Пересмотреть пошлину на семена подсолнечника предлагают депутаты"

Примечательно, что нейросеть Kandinsky 2.1 унаследовала все веса прошлых версий (Kandinsky и ruDALL-E), которые были обучены на одном миллиарде пар «текст — изображение». Затем она была дополнительно обучена еще на 170 млн пар «текст — изображение» высокого разрешения. После этого Kandinsky 2.1 дообучили на отдельно созданном датасете, который состоял из 2 миллионов пар качественных изображений. Ключевое для этого датасета заключается в том, что туда попали изображения, которые считаются традиционно сложными для нейросетей. Например, тексты или лица людей. Моделям обычно их достаточно трудно генерировать, однако при грамотном обучении, которое прошла модель Kandinsky 2.1, никаких проблем с ними не будет.

Также это привело к увеличению числа параметров, которые содержит нейросеть. Если у Kandinsky 2.0 их было всего примерно 2 млрд, то у Kandinsky 2.1 их уже 3,3 млрд штук.

Лента новостей

все новости