
Извлечение параметров из 2D-чертежей: 6 YOLO-моделей, кастомный OCR и стрелочная логика
NeuroKirKorov 12 минут назад Извлечение параметров из 2D-чертежей: 6 YOLO-моделей, кастомный OCR и стрелочная логика Средний 8 мин 273 Машинное обучение * Искусственный интеллект CAD/CAM * Кейс Из песочницы На...
Anthropic — What company has the best second artificial intelligence model at the end of June?
В сфере искусственного интеллекта произошло заметное событие. NeuroKirKorov 12 минут назад Извлечение параметров из 2D-чертежей: 6 YOLO-моделей, кастомный OCR и стрелочная логика Средний 8 мин 273 Машинное обучение * Искусственный интеллект CAD/CAM * Кейс Из песочницы На машиностроительном производстве расчет стоимости детали начинается с чертежа. Входящий запрос выглядит так: PDF и строчка «нужно 50 штук». Чтобы назвать цену, технолог открывает чертеж и вручную снимает параметры: тип детали, габариты, квалитеты, шероховатости, резьбы, материал, массу.
Один чертеж — от 5 до 15 минут. При потоке в несколько десятков запросов в день это основная нагрузка на технолога. Кейс извлечения параметров из чертежей для расчета стоимостиСистема распознавания 2D чертежейМы разобрали, из чего эта нагрузка состоит.
Технические детали
Технолог последовательно делает девять операций:Определяет тип детали — тело вращения (вал, втулка) или призматика (плита, корпус): от этого зависит, токарный нужен станок или фрезерный;Снимает габаритные размеры — они определяют заготовку и оборудование;Считает общее число размеров — влияет на трудоёмкость;Находит квалитет самого точного размера: IT6 — шлифовка, IT14 — черновое фрезерование, разница в цене может быть пятикратной;Определяет минимальную шероховатость: Ra 0. 5 требуют разных операций;Считает резьбы — каждая резьба это отдельный переход;Извлекает материал из штампа — сталь 45 и титан ВТ-6 обрабатываются по‑разному;Берёт массу детали;Фиксирует наличие и количество сечений — по ним судят о внутренней геометрии. Все эти параметры нужны расчётной системе на входе.
Задача была автоматизировать их извлечение из PDF‑чертежа. Как устроен пайплайнНа вход система получает PDF с чертежом — это может быть экспорт из CAD или скан бумажного оригинала. Дальше: растеризация, детекция областей, размеров и символов, контуров, OCR, технический анализ — на выходе JSON.
Схема выглядит линейно, но за каждым шагом своя механика. Детекция — это шесть отдельных YOLO‑моделей, не одна. OCR кастомный, обученный на инженерных шрифтах по ГОСТ.
Отраслевые последствия
Контуры извлекаются через разделение линий по толщине. Габариты определяются через стрелочную логику, а не прямым чтением чисел. Постобработка — несколько слоёв регулярных выражений.
Регулярки в итоге заняли примерно столько же кода, сколько вся детекция. Это не план — так получилось, когда начали разбирать реальные чертежи. Проблема масштаба: чертеж А1 не влезает в YOLOЧертеж А1 при растеризации в 288 DPI даёт картинку 5000×7000 пикселей.
YOLO обучена на 640×640 пикселях. Простое уменьшение убивает мелкие размеры и символы. Нарезка на фрагменты — стандартный путь, но объекты на границах фрагментов детектируются плохо.
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.





