
ИИ-агенты в автоматизации тестирования: собираем воркфлоу из скиллов, MCP и разных LLM
svoi_tech 5 минут назад ИИ-агенты в автоматизации тестирования: собираем воркфлоу из скиллов, MCP и разных LLM Сложный 6 мин 0 Блог компании Финтех-группа «Свой» Тестирование веб-сервисов * Тестирование мобильных...
Anthropic — What company has the best second artificial intelligence model at the end of June?
В сфере искусственного интеллекта произошло заметное событие. svoi_tech 5 минут назад ИИ-агенты в автоматизации тестирования: собираем воркфлоу из скиллов, MCP и разных LLM Сложный 6 мин 0 Блог компании Финтех-группа «Свой» Тестирование веб-сервисов * Тестирование мобильных приложений * Туториал Recovery Mode Привет! На связи команда QA Automation СВОЙ Тех. Сегодня мы хотим поднять тему, которая за последний год превратилась из хайпового «вайб-кодинга» в суровую инженерную реальность.
Мы поговорим об агентной разработке (AI Agents) в автоматизации тестирования. Когда речь заходит об ИИ в QA, многие представляют себе банальный чат-интерфейс, куда копируют логи падающего теста в надежде получить готовое решение. Но это вчерашний день.
Технические детали
Настоящая эффективность начинается тогда, когда ИИ превращается из умного собеседника в автономного агента, интегрированного во фреймворк, систему контроля версий, таск-трекер и CI/CD. Технологии ИИ летят вперед со скоростью экспресса. Тот функционал, который вы освоили вчера, сегодня уже может стать легаси.
Тем не менее подходы, которые мы внедрили и обкатали в нашей команде автоматизации, прямо сейчас приносят ощутимую пользу в рабочих процессах. И мы готовы поделиться этой практической концепцией, которую вы сможете применить на своем проекте. Архитектурный базис: выбор инструментов и интерфейсовКогда мы проектировали наше решение и оценивали доступные инструменты основными критериями были автономность, гибкость и глубина интеграции.
Мы остановились на Codex (в качестве базового ИИ-агента для написания кода на основе моделей OpenAI) и позже, по инициативе компании и здравого смысла, добавили полноценную поддержку Claude. По своей сути это два максимально близких по возможностям инструмента. Мы изначально выстраивали архитектуру так, чтобы они оставались взаимозаменяемыми.
Отраслевые последствия
Эффективность LLM постоянно колеблется от релиза к релизу. Если в какой-то момент новая версия Codex лучше справляется с рефакторингом или у вас банально закончились токены в одном из сервисов, вы можете бесшовно «свайпнуть» агента прямо в процессе выполнения задачи и продолжить работу. Что касается интерфейсов взаимодействия, то для реальной разработки доступны три варианта:Веб-интерфейсы (ChatGPT / Claude Web) Полезны для быстрых вопросов, анализа локальных проблем.
В вебе нет специализированного мода агента, там вы общаетесь со стандартным чатом. Desktop-версииВариант разработки с менее удобным форматом работы с агентом чем CLI (терминал) – слишком много ручной работы. CLI (терминал) и плагины для IDE – наш выборСамый производительный и удобный вариант – плагин для IDE, работающий под капотом на базе терминального CLI (claude-code для Claude и соответствующий интерфейс для Codex).
Агент получает прямой санкционированный доступ к файловой системе проекта. Как устроен наш тестовый проект: анатомия папок и навыковЧтобы автономный агент мог эффективно «понимать» контекст и фреймворк автоматизации, сам проект должен соответствовать жестким структурным требованиям.
Событие, по словам экспертов, усилит конкуренцию в сфере ИИ.





