
Как я отучил оракула молоть околесицу про ГОСТы: сказ о doc-rag без единого (почти) заморского слова
trgv 45 минут назад Как я отучил оракула молоть околесицу про ГОСТы: сказ о doc-rag без единого (почти) заморского слова Средний 16 мин 1.3K Natural Language Processing * Машинное обучение * Open source * Python * Обзор...
GPT-5.6 31 Temmuz 2026'da yayınlanacak mı?
Вот важная новость с фронта ИИ: trgv 45 минут назад Как я отучил оракула молоть околесицу про ГОСТы: сказ о doc-rag без единого (почти) заморского слова Средний 16 мин 1. 3K Natural Language Processing * Машинное обучение * Open source * Python * Обзор Предуведомление. В этой статье я нарочно изгнал из прозы все заморские словеса.
Где обойтись без чужеземщины было невмочь — давал перевод, а рядом, в скобках, истинное имя вещи, чтобы читатель не плутал. Греческое и латинское старьё («программа», «техника», «документ», «схема») я щадил — оно у нас давно прижилось. Все настоящие команды в окошках кода остались как есть: их же по-старорусски не выполнишь.
Технические детали
Также честно скажу сразу: кода у этой снасти пока в общем доступе нет. Я причёсываю настройки и готовлю его к выкладке. Я ниже подробно рассказываю и про устройство, и про грабли, чтобы те, кто захочет что-то похожее сложить у себя в избе — могли это сделать уже сейчас, не дожидаясь меня.
Как только выложу — приду в раздел «Слово на прощанье» и положу туда тропу к избе. С чего всё началось: бес в машинеДело моё — программы писать. А у писаной программы такая повадка: чтобы она дело делала, ей положено сходиться с мастеровой грамотой.
Своды технических указаний (СТО), государственные образцы (ГОСТы), руководящие наставления (РД), спецификации, руководства по эксплуатации да всякие пояснительные записки — на этих свитках в наших краях держится промышленная автоматика и сетевое хозяйство электрических подстанций. Сочинять их — не моё ремесло. А вот вычитывать и сверяться — это уже моё, и почти ежедневно.
Отраслевые последствия
В сумме у меня в закромах болтается несколько тысяч свитков (англ. — files), почти всегда в печатном формате (PDF). Бывают сканы — где-то страница криво снята, где-то перо стоящего рядом мастера прошлось по чертежу.
В какой-то момент я начал просить оракула (так я буду называть в этой статье любого толкователя-вещуна, к которому обращаются с наказами и ждут ответа; в моём случае — это тот, что прижился у меня в писарне, то есть в среде написания кода Cursor):Скажи, что говорит СТО 34. 2 про входные испытания? С раскладом по пунктам.
Беда в одном: ничего из этого не существовало. Это был чистый «бес в машине» — доброжелательная, складная, аргументированная околесица. Иногда там случайно оказывалась правда (видать, в обучающем корпусе вещуна были и наши документы), но проверить, где правда, а где сказка, можно было только сверив каждую цифру со свитком.
Событие, по словам экспертов, усилит конкуренцию в сфере ИИ.





