
Как я устал от фейковых скидок на Wildberries и написал парсер для аналитики цен на спортпит
dskoloskov 38 минут назад Как я устал от фейковых скидок на Wildberries и написал парсер для аналитики цен на спортпит Средний 4 мин 1.3K Интернет-маркетинг * Анализ и проектирование систем * Кейс Из песочницы...
Anthropic — What company has the best second artificial intelligence model at the end of June?
В сфере искусственного интеллекта произошло заметное событие. dskoloskov 38 минут назад Как я устал от фейковых скидок на Wildberries и написал парсер для аналитики цен на спортпит Средний 4 мин 1. 3K Интернет-маркетинг * Анализ и проектирование систем * Кейс Из песочницы ВведениеХабр, Привет! Пожать заветную сотку, добрать белка, закрыть углеводное окно и просто попозировать после тяжелой потной тренировки — всё это не пустые значимые вещи для любого посетителя зала, который старается держать режим.
Спортпит сейчас — это какая‑то генеративная машина по случайным наборам цифр (могут меняться в день по несколько раз). Уже устаёшь мониторить не только то, что показывает на весах, но и на маркетплейсах! Мне как человеку имеющему базовые знания в дате хочется понять почему и как этот беспредел работает.
Технические детали
Есть ли в этих акциях хоть что‑то отдаленно походящее на правду и смысл в мониторинге? Постараюсь выяснить пошагово и понять как это всё безобразие работает и работает ли. Занимаемся API WBНе хочу заниматься парсингом через BeautifulSoup или Selenium.
Такая себе затея в нынешних реалиях. С версткой там так себе, скорость не очень, селекторы не держатся долго. План довольно простой: ищем под капотом внутреннюю API‑шку и получаем стерильный JSON.
Нам нужны endpoints, у которых в урле есть слово catalog. Для этого прожимаем F12, далее вкладка Network. После клацаем строку поиска на самом сайте и видим нужные нам запросы.
Отраслевые последствия
Дальше всё чуть проще: создаем скрипт по requests, чтобы зайти в гости именно по данному адресу. Если всё сделали правильно, мы увидим большущий массив со всей инфой по товарам: ID, бренды, names и рейтинги, а также самое важное среди этого всего — ценник. Есть важные моменты во всём этом.
Первое, базовый ценник и скидка находятся в разных секциях. Когда мы будем чистить данные, будем использовать метод. Это один из наиболее безопасных методов.
Так‑как скрипт может полететь, условно из‑за какого‑нибудь отсутствующего ключа. Второе, сам WB насколько мы знаем отдает цены в копейках. Мы просто делим итог на 100 и на выходе — привычные рубли.
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.





