Шпаргалка по моделям ИИ для генерации контента

Про No-Code, AI и другие технологии, которые делают нашу жизнь проще. Канал исследователя и ноукодера. Контакт для связи: @natellanur

gpt4oclaude 3 opusgemini

👉 Генерация текста:

  1. GPT4o:
    • ▪Доступен тут: ChatGPT
    • ▪Разработчик: OpenAI
    • ▪Особенности: много моделей в одном окне, по многим направлениям - лучшее на рынке
  2. Claude 3 Opus:
    • ▪Доступен тут: Opus
    • ▪Разработчик: Anthropic
  3. Gemini:
    • ▪Доступен тут: Gemini
    • ▪Разработчик: Google
  4. Command-R+:
    • ▪Доступен тут: Coral
    • ▪Разработчик: Cohere
    • ▪Особенности: дает рефенсы, ссылки на источники. Модель разработана с акцентом на retrieval.

🔜 Чего ожидаем: Llama 3 400b - большая модель от Meta, которая должна появиться в ближайшие месяцы

****

👉 Генерация изображений:

  1. Midjourney:
    • ▪Доступен тут: Midjourney
    • ▪Разработчик: Midjourney
    • ▪Особенности: в своей нише, пожалуй, лучшее на рынке. Работает через дискорд
  2. DALL-E:
    • ▪Доступен тут: ChatGPT
    • ▪Разработчик: OpenAI
  3. Imagine Flash:
    • ▪Доступен тут: Meta AI
    • ▪Разработчик: Meta
    • ▪Особенности: самый быстрый, генерит в живом времени, пока вы печатаете промпт. Доступен без регистрации, но только с американским VPN.
  4. Stable Diffusion:

****

👉 Генерация музыки:

  1. Suno:
    • ▪Доступен тут: Suno AI
    • ▪Особенности: самый качественный звук, приятный UI
  2. Udio:
    • ▪Доступен тут: Udio
    • ▪Особенности: кажется чуточку креативнее

🔜 Чего ожидаем: ElevenLabs music - ребята - одни из лидеров рынка по генерации речи из текста. Недавно выпустили демо песни и это вау

****

👉 Генерация видео:

Анимация сгенерированных изображений:

  1. Midjourney
  2. Imagine Flash
  3. neural frames

Чуть ближе к генерации видео:

  1. Luma
  2. Pika
  3. Runway

По теме видео вот крутой канал с демонстрациями.

*Пост регулярно обновляется. Последнее обновление 13 июня 2024

Дискуссия

Andrey Varkentin
По лламе3 - уже доступны модельки поменьше, не знаю у кого есть кластер, чтоб гонять 400б Опенсорс обычно дообучают на ней, 7б версия впихивается в ноутбук По музыке есть ещё Udio и Music AI box от Гугла (недоступна широкому кругу)
Nerdie Chat
Andrey Varkentin
По лламе3 - уже доступны модельки поменьше, не знаю у кого есть кластер, чтоб гонять 400б Опенсорс обычно дообучают на ней, 7б версия впихивается в ноутбук По музыке есть ещё Udio и Music AI box от Гугла (недоступна широкому кругу)
Я предполагаю, что новая ллама будет внедрена в платформу meta.ai, и скорее как аналог chatgpt использовать… ну и логично было бы чтобы такую большую модель по api тоже можно было интегрировать, а не только у себя размещать, но ты прав совершенно, это лишь ожидания, посмотрим что будет в итоге)) По музыке - чекну, спасибо! Возможно добавлю в пост позднее🙌🏼
Nerdie Chat
Andrey Varkentin
По лламе3 - уже доступны модельки поменьше, не знаю у кого есть кластер, чтоб гонять 400б Опенсорс обычно дообучают на ней, 7б версия впихивается в ноутбук По музыке есть ещё Udio и Music AI box от Гугла (недоступна широкому кругу)
Андрей - спасибо за наводку на Udio - это фантастика!))) Сделаю отдельный пост с примерами
Присоединиться к обсуждению →

Читайте так же