Ollama предоставила бесплатный API для веб-поиска

Мы — AI for Devs: разбираем модели, ИИ‑агентов и инструменты для разработчиков. Делаем практичные гайды, бенчмарки и выкладываем рабочие паттерны — всё, что помогает быстрее строить продукты с LLM. Меньше шума, больше пользы и кода. Подписывайтесь — будет чем прокачать ваш стек.

ollamaвеб-поискapi

Ollama официально запустила встроенную поддержку веб-поиска через REST API. Это не просто внешний плагин — это часть экосистемы: API интегрирован в Python и JavaScript SDK, а также доступен через MCP (Model Control Protocol) сервер. Цель — снизить галлюцинации и дать моделям доступ к свежим данным без ручного RAG-пайплайна.

Факты по делу:

  • Поиск возвращает контент объёмом до нескольких тысяч токенов, поэтому рекомендуемое контекстное окно — минимум 32K токенов.
  • Поддержка есть для любых моделей, включая open-weight, например Qwen 3 (4B) — в официальном примере как раз на нём строится простой search agent.
  • Интеграция возможна через:
    • Прямой вызов REST API
    • Python/JS библиотеки Ollama
    • OpenAI-совместимый endpoint (полезно для gpt-oss и подобных)
    • MCP-сервер — для совместимости с Cline, Goose, Codex и другими инструментами.

Важный нюанс: в документации нет информации о rate limits. Неясно, сколько запросов в минуту/день разрешено, особенно для self-hosted или cloud-версий. Пока предполагаем, что лимиты мягкие — но это нужно тестировать. Как сказано в официальном блог-посте:

Ollama provides a generous free tier of web searches for individuals to use, and higher rate limits are available via Ollama’s cloud.

Если что, стоимость Ollama Cloud – 20$ в месяц, и пока что сервис находится в preview.

Блог-пост Документация

@ai_for_devs

Скриншот заметок и страницы блога Ollama: окно с текстом и кодовыми фрагментами, показывающими нововведения web-search API.
Скриншот заметок и фрагментов из блога Ollama о web-search API.
Тёмное окно терминала с инструкцией и примерами команд для интеграции web-search через Ollama, демонстрация конфигурации и логов.
Терминал с примерами команд и конфигурации интеграции web-search через Ollama.

Читайте так же