
Внедрение ИИ-агента глазами QA: полгода от скепсиса до 1600 тестов за сутки
Egor1301 13 минут назад Внедрение ИИ-агента глазами QA: полгода от скепсиса до 1600 тестов за сутки Простой 5 мин 368 Блог компании SENSE Искусственный интеллект Машинное обучение * Программирование * Тестирование...
Anthropic — What company has the best second artificial intelligence model at the end of June?
Вот важная новость с фронта ИИ: Egor1301 13 минут назад Внедрение ИИ-агента глазами QA: полгода от скепсиса до 1600 тестов за сутки Простой 5 мин 368 Блог компании SENSE Искусственный интеллект Машинное обучение * Программирование * Тестирование IT-систем * Мнение Привет, Хабр. Меня зовут Егор, я QA Fullstack Java в SENSE на проекте российского банка. Год назад я был уверен, что ИИ-агент в QA — это либо маркетинг, либо повод искать новую профессию.
Сегодня он у меня в проекте разбирает упавшие тесты, актуализирует локаторы и пишет шаблонные кейсы по спецификациям. Расскажу, как мы прошли путь от «он не справляется с добавлением поля в класс» до 1600 рабочих тестов за сутки на хакатоне. А еще расскажу, что в итоге агент так и не научился делать.
Технические детали
Первые шаги и первые разочарованияВ рамках корпоративного проекта мне предложили изучить возможности ИИ-агента и понять, можно ли его встроить в процессы тестирования. Подход был спокойный: не «внедряем сверху», а «посмотрите и обоснуйте». Если бы не сработало, то отказались без вопросов.
Ключевые требования к агенту были такие:— соответствие строгим требованиям безопасности энтерпрайз-разработки; — способность изучать проект и обучаться на его основе; — разумное потребление ресурсов (серверы у нас не резиновые особенно РОСА). Первые версии разочаровали. Агент не справлялся с элементарным.
Например, не мог корректно добавить поле в класс. На этом этапе мой скепсис только укрепился: я не верил, что инструмент может оказаться полезным хоть для чего-то. Поворотный момент: работа «коллективным разумом»Разработчики понимали, что они не погружены во все нюансы «QA-кухни».
Отраслевые последствия
Поэтому нам, тестировщикам из фокус-группы, дали возможность самим настраивать агент: добавлять промты, корректировать существующие, подгружать документацию. В следующие месяцы мы постепенно «обучали» агента, загружая релевантную для наших повседневных задач документацию:по Selenium (автоматизация веб‑тестов);по PlaywrightCLI для анализа DOM-дерева;документацию по Gradle (да, да, у нас GRADLE);внутренние гайды и стандарты тестирования, принятые в банке. Параллельно дописывали функционал: агент стал подключаться к проекту через консоль и анализировать код напрямую — то есть наконец увидел реальную структуру, а не работал в отрыве от контекста.
Готовый промпт по анализу Allure отчётов оставил здесь. Надеюсь, будет полезно. Тут вылезла новая проблема — нехватка ресурсов.
Агент тормозил, терял соединение с сервером и кричал нам: «Эй, ребята, мне нужно больше памяти, или я сейчас усну! Команда уменьшила размер контекста, ограничила глубину анализа и добавила кэширование промежуточных результатов. После этого агент перестал «засыпать» и начал отвечать стабильно.
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.




