Генерация изображений с ИИ на конкретном примере

Я тут все пытаюсь придумать, каким должен быть мой канальчик, как должен называться, на какие темы делать акцент, хочу ли я чтобы в названии было мое имя и прочее.

Последняя идея, которая посетила мою светлую головушку, это назвать канал Nerdie с референсом к персонажу Barbie и отразить этот референс в изображении🥲 Сильно сомневаюсь, что так в итоге сделаю, но в потоке вдохновения решила погенерить аватарки с ИИ. Рассказываю, что использовала, и показываю, что получалось.

👉 Промпт.

Это описание ожидаемого конечного результата, которое я даю ИИ. Использовала разные вариации вот такой формулировки: “a nerdy barbie-like doll, dark short hair, a laptop, pink background, minimalistic monochrome style”. Стиль и элементы менялись.

👉 Модели.

ChatGPT (модель OpenAI - DALL.E)
- ▪️Регистрация. Для регистрации в ChatGPT нужна иностранная симка и VPN. Для генерации картинок нужна платная подписка. Для меня это был самый быстрый вариант, потому что подписка готова к использованию и ChatGPT всегда под рукой.
- ▪️Особенность. OpenAI сильно заморочены на тему авторских прав, открывалось не одно судебное дело с претензиями к разработчику. Одно из самый последних громких - это иск от New York Times. Поэтому, когда просишь сделать что-то похожее на Барби - он отшивает.🙃 Предлагает заменить Барби на “fashionable doll”, но получается все равно не очень. Сделать стикеры с Йодой или любым защищенным авторскими правами персонажем - не получится. Изображений мимо моих ожиданий было много.
- ▪️Итоги работы ChatGPT на картинке №1.
Stable Diffusion
- ▪️Регистрация не нужна. Можно купить подписку, чтобы удалить упоминание Stable Diffusion на картинке, улучшить качество изображения и ускорить генерацию и получить доступ к другим фичам. Для тестинга можно просто перейти на сайт и погенерить изображения.
- ▪️Особенность. Не почувствовала запары с авторскими правами. Прикольно, что сразу предлагается выбрать стиль картинки из длинного списка опций - способствует креативу.
- ▪️Итоги работы Stable Diffusion на картинке №2.
Midjourney (не тестила в этот раз, просто посчитала нужным добавить референс, так как Midjourney крут)
- ▪️Регистрация. Через дискорд. И генерация изображений через дискорд. Для генерации нужна платная подписка.
- ▪️Особенность. Midjourney пожалуй имеет лучшую выдачу, я видела результаты - они правда очень впечатляют. Но я так не люблю дискорд, что всегда сталкиваюсь с диким нежеланием заморачиваться с Midjourney. Куплю подписку, когда она реально будет СИЛЬНО нужна
- ▪️Итогом является отсутствие картинки🤗

neural frames (для видео!)

▪️Регистрация. Обычная. Есть бесплатный короткий trial на 10 секунд генерации видео.
▪️Особенность. Это сервис именно для генерации видео или анимации, не картинок. Надо разбираться, как кастомизировать видео под свои ожидания, я использовала дефолтные настройки для интереса и скорости, но поле для креатива очень широкое.
▪️Итоги работы neural frames в видео

Впечатления и выводы.

- Stable Diffusion - самый доступный,
- Midjourney - самый качественный,
- DALL.E - самый запаренный,
- neural frames - самый необычный.

Дополнительно:

- DALL.E потребовал много работы с промптом, но иногда был креативнее. Так как нельзя дать референсы (сделай картинку в стиле художника A или на подобие персонажа B), то надо все детально расшифровывать. Ну и сами смотрите насколько результат подчеркивает референс к Барби, по-моему - не очевидно.
- У Stable Diffusion проблемы с конечностями (см. пальцы кукол). Они были у всех моделей на каких-то этапах, но кажется Midjourney и DALL.E эти проблемы преодолели. Stable Diffusion тоже неплохо продвинулся, но иногда проблемы проглядываются. Хотя есть вероятность, что я просто использовала не самую последнюю модель.

PS. Идеи для названия канальчика я кстати пыталась генерить с ChatGPT, но рекомендации не нравятся, а их было очень много.

Генерация изображений с ИИ на конкретном примере

Читайте так же

Шпаргалка по моделям ИИ для генерации контента

Можно ли теперь делать презентации в ChatGPT?

ИИ-повестка в бизнесе и в науке