Вектор — гениальный стажёр, но бухгалтерию ему не доверяй
Несколько лет назад мир открыл для себя эмбеддинги, и с тех пор у всякой проблемы появился один и тот же ответ: «спроси у Вектора». Не знаешь, где лежит нужное? Вектор найдёт похожее. Не понимаешь запрос пользователя? Вектор уловит смысл. Это правда работает — и работает прекрасно. Я сам им пользуюсь каждый день.
Но у меня для Вектора есть метафора, и она не комплимент и не оскорбление. Вектор — это гениальный стажёр.
Стажёр невероятно быстрый. Он за секунду перелопатит то, на что тебе нужен час. Он схватывает на лету, чувствует контекст, находит «вот это похоже на вот то» там, где ты бы и не подумал искать. Я бы взял такого в команду не раздумывая. Я и взял.
Проблема начинается, когда ты задаёшь стажёру вопрос, на который нужен не намёк, а ответ.
— Откуда в квартальном отчёте взялась эта цифра?
— Ну… что-то похожее, кажется, было вот в этой таблице. Примерно. Вайбово.
Для половины задач «примерно» — это прекрасно. Для поиска, для подсказки, для навигации по большому и незнакомому. Но бухгалтерии не нужен вайб. Регулятору не нужен вайб. Аналитику в три часа ночи перед сдачей отчёта тоже не нужен вайб — ему нужно происхождение. Точное, воспроизводимое, с именами таблиц и колонок. Не «похоже, что отсюда», а «вот ровно отсюда, через эти три преобразования».
Это и есть граница. Вектор отвечает на вопрос «что похоже?». Граф зависимостей отвечает на вопрос «откуда именно?». Это разные вопросы, и подменять один другим — значит однажды объяснять начальству, почему модель «была почти уверена».
Поэтому у нас Вектор работает ровно там, где он силён: помогает искать, ориентироваться, подсказывать. А костяк — детерминированный. Мы разбираем SQL в синтаксическое дерево и строим происхождение по фактам, а не по сходству. Когда спрашивают, не устарел ли такой подход в эпоху больших моделей, я отвечаю: модель отлично угадывает. Но я не хочу, чтобы происхождение ваших данных кто-то угадывал.
Вектор — это интуиция. Lineage — это алиби. Интуиция незаменима, когда ищешь. Алиби незаменимо, когда отвечаешь.
Так что стажёра я не увольняю. Я просто не сажаю его за главную книгу.