8 сентября 2023

Как пользоваться нейросетью Kandinsky

Российский сервис, который помогает быстро создавать и редактировать изображения.

Автор Лайфхакера

Что такое Kandinsky

Kandinsky — это нейросеть «Сбера» для генерирования изображений. Она способна создавать картинки по текстовым запросам, а также представлять вариации уже готовых изображений и объединять стили из разных кадров.

Система определяет запросы на разных языках, в том числе уверенно работает на русском. Последняя версия сервиса на данный момент — это Kandinsky 2.2. Нейросеть учитывает дополнительные параметры при генерации результата, включая фон и стиль.

Что умеет нейросеть Kandinsky 2.2

Как уже упомянули выше, Kandinsky умеет не только выдавать картинки по запросу, но и формировать изображения с помощью смешения разных концепций или стилей. Нейросеть «Сбера» поддерживает несколько режимов работы. В стандартном она генерирует результат по введённому текстовому промпту. При объединении кадров она анализирует два и компонует из них новый.

Также системе можно «скормить» одну готовую картину или фотографию, дописав нужные характеристики. В этом случае Kandinsky создаст новое изображение, учитывая визуальный пример и промпт одновременно.

Кроме того, сервис поддерживает режим outpainting, или дорисовывание. Эта функция позволяет дополнять готовый кадр новыми деталями, которых там раньше не было. Ещё один режим работы — это перенос стиля. С его помощью получится использовать часть деталей исходной картинки на сгенерированном изображении.

Как пользоваться Kandinsky 2.2

Нейросеть доступна через несколько сервисов разных форматов. Так, Kandinsky можно протестировать на сайте Fusion Brain. Там получится сгенерировать картинки по текстовым командам, а также использовать инструмент дорисовки.

Также в Telegram доступен официальный бот Kandinsky. С его помощью получится создать изображения на основе текста, смешать две разных картинки, перенести стиль и сформировать вариации готовых кадров.

Кроме того, на сайте ruDALL‑E есть форма для создания изображений с базовыми настройками. Ещё нейросеть Kandinsky интегрирована в голосовой помощник «Салют» от «Сбера». Здесь необходимо запустить навык «Включи художника», чтобы генерировать картинки. К тому же сервисом можно пользоваться через бота «ВКонтакте» и на официальном сайте «Сбера».

Боту в Telegram достаточно указать режим работы соответствующей кнопкой, а затем ввести текст запроса или загрузить нужные изображения. Сервис работает бесплатно и выдаёт результаты довольно быстро. Сбои и ошибки случаются редко — при очень большом количестве одновременных команд от пользователей.

Инструмент для редактирования и расширения кадра в Kandinsky есть только на сайте Fusion Brain. Помимо этого для работы там предусмотрены широкая область с изображением, текстовое поле для промпта и выпадающее меню с десятками стилей. В списке можно выбрать один из популярных примеров — от киберпанка до советских мультфильмов.

Изображение: Kandinsky 2.2

Стиль не обязательно отмечать в настройках, его можно указать в текстовом запросе. Написать можно даже тот вариант, которого пока нет в базовом списке. В этом случае стоит оставить параметр «Без стиля» в меню.

Для картинок можно выбрать одно из доступных соотношений сторон и разрешений. Нейросеть выдаёт кадры размером 1 152 × 768 пикселей, 1 024 × 1 024 пикселя, 680 × 1 024 пикселя и наоборот, 576 × 1 024 пикселя и наоборот.

Дорисовка позволяет формировать картины из небольших идей. Достаточно выделить часть готового кадра и пустую область, а затем ввести текстовую команду, по которой Kandinsky определит, как именно нужно расширить указанный кадр, добавив к нему детали или продолжения объектов.

При работе над проектами с графикой можно быстро генерировать новые идеи с помощью нейросети «Сбера». Для этого пригодится инструмент «Ластик», или Erase, во Fusion Brain. Достаточно стереть часть готового кадра, а затем по текстовому описанию добавлять новые элементы на освободившееся место. При этом получится выдержать картинку в едином стиле или соединить разные концепции.

Во время переноса стиля с готового кадра на новый Kandinsky позволяет использовать позы людей с фотографии или картины, а также общие очертания исходного изображения. Например, на портрете получится заменить одного человека другим, при этом сохранив общую композицию и фон. Этот алгоритм работает через ⁠бота в Telegram.

При смешивании двух изображений система не сохраняет построение или расположение предметов. Объединение происходит случайным образом, что иногда приводит к неожиданным результатам и новым идеям.

В чём недостатки Kandinsky 2.2

Изображение: Kandinsky 2.2

Kandinsky 2.2 гораздо лучше справляется с генерированием реалистичных кадров по сравнению с предыдущими версиями. Результаты похожи на популярный сервис Midjourney, но пока ещё уступают по уровню детализации.

Для получения хороших результатов необходимо экспериментировать с параметрами и описанием запросов. Периодически Kandinsky выдаёт изображения с ошибками. Например, знакомые многим объекты архитектуры система отображает странным образом. Но это обычно происходит, если вводить слишком длинные промпты с большим количеством второстепенных деталей.

Как пользоваться нейросетью DALL-E 2, которая генерирует изображения

Как пользоваться YandexGPT — нейросетью, которая генерирует тексты на русском языке

6 нейросетей для создания логотипов

7 инструментов на основе нейросетей для улучшения качества видео

6 сервисов на основе нейросетей для улучшения качества звука

Лучшие предложения

Nahodki AliExpress: samye interesnye i poleznye tovary

Находки AliExpress: самые интересные и полезные товары

10 полезных товаров дешевле 500 рублей

Находки AliExpress: 20 полезных товаров дешевле 1 000 рублей

Новый год как в детстве: 6 праздничных традиций, которые поможет соблюсти техника Gorenje

Отборные скидки до 64% от AliExpress, Redmond и других магазинов

15 стильных пуховиков стоимостью от 3 000 до 15 000 рублей

10 наборов для вышивания, с которыми захочется заняться рукоделием

12 комфортных дутиков для зимних прогулок

Это интересно

7 гастрономических трендов, на которые стоит обратить внимание в 2025 году

Как не заскучать на новогодних каникулах: 8 идей для детей и взрослых

Обзор TECNO Phantom V Fold 2 — самого доступного «фолда»

Дайте две! Игра с промокодом на скидку 40% для всех, кто любит шоколад

Комментарии

Анастасия Наумцева

08.09.23 15:18

Кажется, неплохой вариант для тех, кто плохо дружит с английским

Руслан Арифуллин

08.09.23 16:24

А что там дружить? Английский на C++ написан.

1 2

09.09.23 00:16

Вопрос в другом: ЗАЧЕМ?

Арепьев Арепьев

23.03.24 18:06

Kandinsky (я пробовала 3.0) на мой взгляд отстой, для игр воспитанников детского сада.

Pavel Chagin

12.04.24 13:10

Какой в нем толк, если использовать результаты гернерации в коммерческих целях запрещено?

Что вы могли пропустить

Выбираем электронную книгу с цветными чернилами: 5 крутых моделей

09:00

Ликбез

Устройства

WhatsApp и Skype будут вынуждены делиться данными российских пользователей

Вчера

Веб-сервисы

Новости

Как выбрать пароочиститель для дома и не разочароваться

Вчера

Ликбез

Устройства

OhSnap выпустит вирусный выдвижной геймпад для смартфонов, придуманный 19-летним подростком

Вчера

Новости

Устройства

Представлен ONEXPLAYER G1 — игровой мини-ноутбук с геймпадом под отсоединяемой клавиатурой

20 декабря

Новости

Устройства

Представлена PETBRICK 65 — меховая клавиатура для любителей кошек

20 декабря

Новости

Устройства

15 надёжных посудомоечных машин, которые не подведут

20 декабря

Ликбез

Устройства

Lenovo готовится выпустить ноутбук с «вырастающим» экраном

20 декабря

Новости

Советы

YaOS от «Яндекса» может появиться на всех импортируемых в РФ телевизорах

19 декабря

Новости

Технологии

Пользователи в России жалуются на проблемы с YouTube даже на смартфонах

19 декабря

Веб-сервисы

Новости

20 отличных фитнес-трекеров и смарт-часов в 2025 году

19 декабря

Ликбез

Спорт и фитнес

Insta360 представила Connect — саундбар для видеоконференций с двумя веб-камерами и ИИ

19 декабря

Новости

Устройства

Сравнение пылесосов: какой выбрать и на что обратить внимание при покупке

19 декабря

Устройства

ChatGPT теперь доступен через WhatsApp — без регистрации и обходных путей

19 декабря

Новости

Технологии

Китай запустил отечественную альтернативу Bluetooth под названием Star Flash

18 декабря

Новости

Технологии

Новые комментарии

Jani jan19 минут назад

0 / 0

Фильм «Джокер: Безумие на двоих» выйдет в российских кинотеатрах 12 октября, обещая незабываемое кинематографическое переживание. Используйте Insta Pro, чтобы делиться впечатлениями, создавать креативные посты и захватывающие рилсы. Поделитесь моментами премьеры и соберите кинокритиков и поклонников на вашей странице для обсуждения этого долгожданного события. Click here https://appinstapro.com/download-insta-pro-2-apk/

«Джокера: Безумие на двоих» покажут в российских кинотеатрах 12 октября

Наталья З24 минуты назад

0 / 0

Спасибо! А я все думала, как же включить клавиши F1, F2, F3 на ноуте??? Обычным путем, как на компьютере, не получалось. Теперь узнала!!!! СПАСИБО!!!!!

Зачем нужна клавиша Fn и как её использовать

Ekaterina Evgenyevna1 час назад

0 / 0

Что за тупость? В моей семье несколько десятилетей рождаются дети только в високосный год.

Что нельзя делать в високосный год по народным поверьям и почему всё это — дичь

Пина Колада1 час назад

0 / 0

Лол, египетские школьники делают это совершенно бесплатно в рамках школьной программы. Причем их возят не только в пирамиды Гизы, но и во все сохранившиеся пирамиды