Чтобы все было честно, мы используем во всех них один и тот же промт. Мы хотим нарисовать иллюстрацию в 2D — рыжего котика, который играет с зеленой ленточкой. Нам понадобится промт на русском и английском языках, потому что некоторые нейросети из нашего списка понимают русский язык, а некоторые — нет. Не проблема: идем в DeepL, вставляем наш промт и получаем перевод:
рыжий котик играет с зеленой ленточкой, 2D, иллюстрация
ginger cat playing with green ribbon, 2D, illustration
Вот теперь мы готовы проверять нейросети. Посмотрим, как они справятся с нашим промтом.
Kandinsky
Она использует нейроинтерфейс Dall-E, и у нее много функций. Основная — генерировать изображения по запросу, но также Kandinsky может смешать два изображения, или перенести стиль одного на другое, или сделать вариации картинки. И большой плюс — эта нейросеть полностью бесплатна!
Для работы в Kandinsky не нужно регистрироваться в Discord: достаточно зайти в нужный Telegram-бот, приложение ВКонтакте или на сайт нейросети. Правда, не везде доступны все функции: в боте в Telegram, например, все функции доступны только в версии 2.2, а в более поздней 3.0 — только генерация изображения по тексту. И важный момент: в отличие от Midjourney, где вы при генерации получаете 4 изображения, Kandinsky выдает только одно. Чтобы получить несколько вариантов, нужно снова задать команду и повторить запрос.
Мы будем работать на официальном сайте нейросети. Туда доступ возможен только с регистрацией, но это единственное ограничение. Регистрируемся, нажимаем “Начать” — и вперед!
Вводим в окошко наш промт. Также тут можно выбрать негативный промт — то есть чего на нашей картинке быть не должно. Это как команда --no в Midjourney. И еще можно выбрать один из заданных стилей, их тут достаточно много. Затем нажимаем зеленую кнопку генерации. Когда у нас получится то, что нужно, выбираем нужную кнопку на панели задач и нажимаем “Скачать выбранные”.
Еще Кандинский умеет работать с готовыми картинками. Перетаскиваем рамочку от нашей картинки в другую сторону, чтобы там у нас было другое изображение. Затем нажимаем кнопку “Вставить изображение” и выбираем одного из тех, что мы сделали в Midjourney. Нажимаем “Сохранить”. И вот теперь уже этой картинке можно задать промт и выбрать нужный стиль. И обратите внимание, когда сохраняете картинки: если они стоят рядом, то могут сохраниться стык в стык как одно изображение.
Итог: Кандинский хорош тем, что он бесплатный, на русском языке, умеет не только создавать изображения по текстовому промту, но и работать с готовыми картинками. Но он не все детали запроса передает точно, да и со стилями у него получается когда как. С генерацией видео все совсем печально — по крайней мере, пока. Но для создания картинок разного формата Кандинский вполне подойдет.
Шедеврум
Вторая нейросеть, которую мы рассмотрим, тоже российская и тоже бесплатная; это Шедеврум от Яндекса. Там тоже можно генерировать изображения по тексту или попросить нейросеть написать разные текстовые произведения: тексты, песни, частушки и так далее. Это помогает делать встроенная Яндекс GPT. Веб-версии у Шедеврума нет: работать можно только через одноименное приложение.
Генерация изображения занимает где-то 40 секунд, текста — меньше. У нейросети здорово получаются милые картинки типа животных или елочных игрушек, но вот с логотипами, текстами или фотореализмом у нее дело плохо. У нас в промте как раз животное, давайте посмотрим, как справится Шедеврум.
Заходим в приложение, нажимаем на плюсик, затем на “изображение”. Вставляем наш скопированный промт и нажимаем “Создать”. Шедеврум засекает сначала 40, потом 20 секунд, и наконец выдает нам 4 картинки. У нас получились 2 фотографии и 2 иллюстрации. Мы можем выбрать одну из них и нажать “Опубликовать”. И это главный минус Шедеврума: вы можете опубликовать и потом сохранить только одну из 4 картинок, остальные просто пропадут. Да и рассмотреть картинки толком вы не сможете. Зато можно сразу выставлять изображения на общую стену и смотреть, что нарисовали другие пользователи. То есть Шедеврум — это скорее соцсеть, чем полноценный генератор изображений.
Итог: если вы хотите создать что-нибудь миленькое и сразу показать друзьям, то Шедеврум вам отлично подойдет. Если же вы хотите тщательно обдумать промт, рассмотреть все детали и потом обработать картинку, то лучше выбрать другую нейросеть с большим количеством функций.
Ideogram
Эта нейросеть англоязычная и может только генерировать изображения по запросу: сливать картинки или использовать ваши файлы она не может — по крайней мере, в текущей версии. У Ideogram есть платные тарифы, но нейросеть можно использовать и бесплатно. Правда, доступно всего 25 генераций картинок в день, но этого может быть достаточно, учитывая, что нейросеть тоже выдает 4 изображения, как и Midjourney. 100 картинок в день — это неплохо, согласитесь :)
Вставляем в строку генерации наш промт на английском языке. Тут можно выбрать стиль и поменять формат картинки. Можно поменять и видимость: public — картинки будут видны всем, private — только вам. Мы оставим видимость для всех, нам не жалко. Посмотрим, какие еще стили нам предложат. Добавляем painting, то есть картина красками. Нажимаем Generate и ждем 15 секунд: тут время генерации всегда фиксировано. И вот нейросеть создала нам 4 картинки. Их все можно открыть и рассмотреть получше. Нажимаем на кнопку, чтобы скачать нашу картинку.
Но это не все, что мы можем с ней сделать. Тут есть кнопка Remix, которая позволяет создать новую картинку на основе уже сделанной. Здесь мы можем поменять вес изображения, то есть насколько будущая картинка будет похожа на оригинал. Чем больше вес, тем больше похожа. Далее мы можем как дальше экспериментировать с одной из картинок, так и вернуться к картинке-”родителю”. А вот редактировать изображение мы сможем только в платной версии, о чем нам и говорит нейросеть. Так что нам остается только скачать готовую картинку.
Итог: Ideogram хорошо справляется с промтами и умеет работать в разных стилях. Особенно классно у нее получается 2D и лаконичные изображения. Еще, кстати, у нее хорошо получаются логотипы, и буквы она тоже пишет неплохо, иногда даже лучше Midjourney. Минус — то, что вы не можете поменять части изображения или загрузить свою картинку и работать с ней. Но для создания картинок по тексту Ideogram отлично подойдет.
Dall-E
Нейросеть Dall-E — разработка компании OpenAI, как и ChatGPT. Отличие Dall-E в том, что сама по себе эта нейросеть нигде не доступна. Она встроена в интерфейс ChatGPT 4, работает в интерфейсе Bing — но самого сервиса Dall-E в интернете нет. Впрочем, это не такая большая потеря: если вы работаете с ChatGPT 4, то можете точно так же использовать ее возможности. Нейросеть понимает запрос и на русском, и на английском языке, можете использовать любой.
Еще к возможностям встроенной в ChatGPT 4 Dall-E относится генерация картинок на основе заданной. Поскольку в четвертой версии ChatGPT можно грузить файлы, вы можете загрузить свою картинку и попросить представить ее в определенном стиле. Однако Dall-E не может редактировать готовые изображения.
Итог: Dall-E хороша тем, что хорошо умеет генерировать картинки по запросу и представлять их в другом стиле. Учитывая, что она встроена в функционал ChatGPT 4, это очень удобно. Минус — собственно то, что четвертая версия ChatGPT платная, ну и особенных возможностей редактирования изображений Dall-E не предоставляет. Но в пределах своих возможностей это хороший инструмент.
StarryAI
StarryAI от одноименной компании-разработчика умеет и генерировать картинки по запросу, и обрабатывать готовые изображения. Для использования сервиса нужна регистрация; бесплатно выдаются 5 кредитов в день, разные операции могут занять 1 или 2 кредита. Но для того, чтобы просто попробовать возможности StarryAI, этого вполне хватит.
Заходим на главную страницу сайта и нажимаем Create. Вставляем наш промт на английском языке: эта нейросеть запросы на русском не понимает, как и Midjourney. Дальше смотрим опции. Remove from image — это как негативный промт в Кандинском: то, чего на картинке быть не должно. Мы пока отключаем этот параметр. Кнопка Start image — это как раз для загрузки наших картинок, если мы захотим их обработать. Далее идут размеры. В бесплатной версии доступны только параметры 4:5, для остального нужна платная подписка. Остальное не трогаем и нажимаем на кнопку Generate. Готовых изображений снова 4, как в Midjourney и Ideogram, и можно примерно посмотреть картинки. Под ними есть кнопки, что дальше делать с изображением: скачать, изменить, удалить и так далее. Если захотите скачать, то обратите внимание, что здесь скачивается архив, где лежат все 4 картинки сразу; в других нейросетях мы скачивали отдельно каждую картинку. Также можно апскейлить наше изображение: доступен апскейл в 8 и даже 16 раз.
Можно загрузить и обработать картинку. На вкладке Color можно установить, насколько будет сохраняться цвет оригинала. На вкладке Structure вы можете выделить кистью область изображения, которую хотите поменять. Ластиком потом можно стереть лишние мазки. Нажимаем Done и возвращаемся к картинке. Аналогично закрасить нужные области можно на вкладках Depth и Scribble.
Чтобы вам было удобнее, мы собрали сравнительную таблицу всех наших графических нейросетей.