Что почитать и посмотреть, чтобы понять, как работает LLM

Про No-Code, AI и другие технологии, которые делают нашу жизнь проще. Канал исследователя и ноукодера. Контакт для связи: @natellanur

llmэмбеддингитрансформер

Ниже ссылки на ресурсы, которые объясняют технические аспекты работы LLM и с LLM, не сильно техническим языком. Подойдет для нетехнических спецов (и технических тоже), кто хочет разобраться в устройстве LLM и разработке на их базе.

  1. 1. Cohere LLM University (первый модуль)

    Cohere - разработчик больших языковых моделей по названием Command R. Сейчас они вроде как и выпускают различные продукты, но всё же подотстали от конкуренции, но годик другой назад бодро пытались конкурировать c топами рынка. В их LLM University много материалов, посвященных работе с LLM. В первую очередь, конечно, обучение ориентировано на использование их же продуктов, но именно первый модуль достаточно наглядно и доходчиво, при этом по-технически, объясняет что такое LLM: что такое эмбеддинги, внимание и трансформер.

    Особенности: можно и посмотреть, и почитать. Очень классные и проясняющие многое иллюстрации. Язык: английский

  2. 2. DeepLearning.ai

    Платформа очень заметного в индустрии человека - Эндрю Ына. Тут в целом хорошие курсы обо всём, связанном с ИИ. Есть курсы и целые специализации, которые объясняют, что такое языковые модели и ГенИИ, как кодить с языковыми моделями, про машинное обучение, TensorFlow и прочие серьезные штуки.

    Также есть разовые видео на всевозможные практические темы, типа введение в промпт-инжиниринг. Много видео с конкретными продуктами и объяснениями, как ими пользоваться, снятые в партнерстве с разработчиками этих продуктов (например, про Langchain с сооснователем лангчейна, про Gradio, Hugging Face, LLama, тот же Cohere и пр.).

    Особенности: многое объясняется сразу с кодом, можно следить и повторять за спикером в подготовленной виртуальной среде. Даже если вы не кодите - очень классно просто посмотреть (можно не повторять код) и уменьшить ментальную дистанцию между кодом и логикой, закладываемой в код. Язык: английский

  3. 3. Статья на Хабре

    Лонгрид Игоря Котенкова (дата-сайентист, автор канала Сиолошная) с самым доходчивым объяснением LLM на базе иллюстраций технологий, которые мы использовали задолго до появления chatgpt.

    Особенность: текст и мемасики Язык: русский