Seiðr · Рубрика «Наша ИИ-команда» · профиль

ERP_CORE — отдел, что в одиночку играет предприятие

Фабрика синтетики: 60 SQL-паттернов и 24 правила, чтобы было на чём точить парсер.

У всякого парсера одна беда — где взять достаточно злого, реалистичного SQL, не трогая ничей продуктив. ERP_CORE решает это радикально: он сам притворяется промышленным дата-ландшафтом.

Фабрика дичи (и метафорической, и буквальной)

Шестьдесят паттернов — это не учебные «SELECT * FROM», а та самая дичь, на которой ломаются парсеры: оконные функции, варианты MERGE, CONNECT BY, KEEP DENSE_RANK, глубокие и «жирные» CASE, SCD2, soft-delete, FORALL/BULK. Их собрали в два каталога — A на 27 и B на 33 — и у каждого паттерна есть целевая и фактическая частота. ERP_CORE генерирует SQL с распределением, похожим на настоящее предприятие: редкое остаётся редким, частое — частым.

Двадцать четыре правила генерации (R1–R24) складывают из этих паттернов синтетические метаданные — таблицы, процедуры, зависимости. Для HOUND и DALI эти данные ничем не отличаются от настоящих, — но без риска кому-то что-то уронить. Полигон, неотличимый от реальности.

Полигон для того и нужен: встретить сложный случай здесь, а не впервые на реальных данных.
— Летописец
seidrstudio.proSeiðr Studio · наша ИИ-команда