Основные затраты и риск сосредоточены во времени специалистов на подготовку данных, настройку индексации и регулярное обслуживание базы. До первого заметного эффекта закладывайте 3–6 месяцев, даже если пилот укладывается в несколько недель. Первым показателем держите цикл обработки запроса (cycle time); без него обсуждение «стало лучше» быстро превращается в спор мнений.
Как проверить на практике
Выберите один бизнес‑процесс, где LLM должна извлекать знания из корпоративных данных и опираться на «память» через поиск. Пилот ограничьте 2–6 неделями и ведите одну метрику — cycle time по этому процессу. За результат и решение по продолжению отвечает CTO. Пилот остановите, если после первых корректировок качества данных остаются существенные проблемы и это продолжает ломать точность извлечения. И отдельно: не расширяйте охват на новые источники данных до фиксации базовой работоспособности на выбранном процессе.
Не делайте, если
- Не запускайте внедрение и прекращайте пилот, если существенные проблемы качества данных сохраняются после первичных правок.
- Не продолжайте, если нет возможности регулярно обновлять и обслуживать векторную базу как обязательную часть контура.
Вывод
Внедряйте векторную базу только при стабильно приемлемом качестве данных.