Генерация изображений с ИИ на конкретном примере

Про No-Code, AI и другие технологии, которые делают нашу жизнь проще. Канал исследователя и ноукодера. Контакт для связи: @natellanur

генерация изображенийstable diffusiondall.e

Я тут все пытаюсь придумать, каким должен быть мой канальчик, как должен называться, на какие темы делать акцент, хочу ли я чтобы в названии было мое имя и прочее.

Последняя идея, которая посетила мою светлую головушку, это назвать канал Nerdie с референсом к персонажу Barbie и отразить этот референс в изображении🥲 Сильно сомневаюсь, что так в итоге сделаю, но в потоке вдохновения решила погенерить аватарки с ИИ. Рассказываю, что использовала, и показываю, что получалось.

👉 Промпт.

Это описание ожидаемого конечного результата, которое я даю ИИ. Использовала разные вариации вот такой формулировки: “a nerdy barbie-like doll, dark short hair, a laptop, pink background, minimalistic monochrome style”. Стиль и элементы менялись.

👉 Модели.

  1. ChatGPT (модель OpenAI - DALL.E)
    • ▪️Регистрация. Для регистрации в ChatGPT нужна иностранная симка и VPN. Для генерации картинок нужна платная подписка. Для меня это был самый быстрый вариант, потому что подписка готова к использованию и ChatGPT всегда под рукой.
    • ▪️Особенность. OpenAI сильно заморочены на тему авторских прав, открывалось не одно судебное дело с претензиями к разработчику. Одно из самый последних громких - это иск от New York Times. Поэтому, когда просишь сделать что-то похожее на Барби - он отшивает.🙃 Предлагает заменить Барби на “fashionable doll”, но получается все равно не очень. Сделать стикеры с Йодой или любым защищенным авторскими правами персонажем - не получится. Изображений мимо моих ожиданий было много.
    • ▪️Итоги работы ChatGPT на картинке №1.
  2. Stable Diffusion
    • ▪️Регистрация не нужна. Можно купить подписку, чтобы удалить упоминание Stable Diffusion на картинке, улучшить качество изображения и ускорить генерацию и получить доступ к другим фичам. Для тестинга можно просто перейти на сайт и погенерить изображения.
    • ▪️Особенность. Не почувствовала запары с авторскими правами. Прикольно, что сразу предлагается выбрать стиль картинки из длинного списка опций - способствует креативу.
    • ▪️Итоги работы Stable Diffusion на картинке №2.
  3. Midjourney (не тестила в этот раз, просто посчитала нужным добавить референс, так как Midjourney крут)
    • ▪️Регистрация. Через дискорд. И генерация изображений через дискорд. Для генерации нужна платная подписка.
    • ▪️Особенность. Midjourney пожалуй имеет лучшую выдачу, я видела результаты - они правда очень впечатляют. Но я так не люблю дискорд, что всегда сталкиваюсь с диким нежеланием заморачиваться с Midjourney. Куплю подписку, когда она реально будет СИЛЬНО нужна
    • ▪️Итогом является отсутствие картинки🤗
  4. neural frames (для видео!)
    • ▪️Регистрация. Обычная. Есть бесплатный короткий trial на 10 секунд генерации видео.
    • ▪️Особенность. Это сервис именно для генерации видео или анимации, не картинок. Надо разбираться, как кастомизировать видео под свои ожидания, я использовала дефолтные настройки для интереса и скорости, но поле для креатива очень широкое.
    • ▪️Итоги работы neural frames в видео

Впечатления и выводы.

  • - Stable Diffusion - самый доступный,
  • - Midjourney - самый качественный,
  • - DALL.E - самый запаренный,
  • - neural frames - самый необычный.

Дополнительно:

  • - DALL.E потребовал много работы с промптом, но иногда был креативнее. Так как нельзя дать референсы (сделай картинку в стиле художника A или на подобие персонажа B), то надо все детально расшифровывать. Ну и сами смотрите насколько результат подчеркивает референс к Барби, по-моему - не очевидно.
  • - У Stable Diffusion проблемы с конечностями (см. пальцы кукол). Они были у всех моделей на каких-то этапах, но кажется Midjourney и DALL.E эти проблемы преодолели. Stable Diffusion тоже неплохо продвинулся, но иногда проблемы проглядываются. Хотя есть вероятность, что я просто использовала не самую последнюю модель.

PS. Идеи для названия канальчика я кстати пыталась генерить с ChatGPT, но рекомендации не нравятся, а их было очень много.