Реализация RSS-генератора на «коленке» или наш ответ Чемберлену
ziptraser только что Реализация RSS-генератора на «коленке» или наш ответ Чемберлену Простой 5 мин 0 CMS * DIY или Сделай сам PHP * Веб-разработка * Искусственный интеллект Мнение Всё началось с банальной задачи — я и...
Anthropic — What company has the best second artificial intelligence model at the end of June?
Вот важная новость с фронта ИИ: ziptraser только что Реализация RSS-генератора на «коленке» или наш ответ Чемберлену Простой 5 мин 0 CMS * DIY или Сделай сам PHP * Веб-разработка * Искусственный интеллект Мнение Всё началось с банальной задачи — я и моя напарница нейросеть Асси задумались над SEO-продвижением и адаптацией нашего сайта под современные реалии генеративного поиска (GEO / RAG) и краулеры языковых моделей (GPTBot, ClaudeBot, Perplexity). По старой привычке решили поглядеть, как эту задачу решают другие «взрослые дяди», открыли исходники популярных решений для синдикации в современных CMS… и, мягко говоря, офигели. То, что в корпоративном BigTech считается стандартом генерации банальной XML-ленты, на поверку оказалось кромешным инфраструктурным адом.
Анатомия корпоративного ада: Битрикс и остальные монстры. Когда краулер стучится за RSS к типичному энтерпрайз-движку, на сервере начинается сущий кошмар, судите сами:Bitrix (Король тормозов): Это вообще отдельный котел для мазохистов. Чтобы отдать к примеру 15 новостей, Битрикс поднимает всё своё монструозное ядро, подключает prolog_before.
Технические детали
php, инициализирует тысячи констант и лезет в базу через ORM, которая генерирует SQL-запросы длиной в километр. Если у вас «Композитный сайт» — готовьтесь к тому, что кэш будет инвалидироваться дольше, чем бот ждет ответа. Итог: сервак потеет, память жрётся, а краулер получает ответ через 500–800 мс.
За это время можно было бы запустить ракету в космос. WordPress: Тут просыпается «прожорливое чудовище». WP_Query делает каскадные запросы к неоптимизированной базе, вытягивая метаданные и мусор.
Потом это всё прогоняется через ад из сотен хуков и фильтров. Если стоят плагины типа Yoast — они перелопачивают строки в ОЗУ по кругу. Результат: 200–300 мс на ровном месте.
Отраслевые последствия
Magento / Drupal: Тут вообще тушите свет. Чтобы выплюнуть тег , система оборачивает файл в десяток объектов, проверяет права доступа через три слоя абстракций и тратит прорву ресурсов на сериализацию. Unix-way или наш ответ Чемберлену.
Мы выкинули на мороз все зависимости. Наша логика простая как выстрел: один прямой UNION-запрос (собираем данные сразу из нескольких таблиц за один заход), кристально чистая потоковая буферизация в XML-строку и жёсткий роутинг. Никакого мусора, только чистые такты процессора.
Чтобы не дёргать базу при каждом чихе ИИ-краулера, мы используем стратегию дефрагментации на диск. Скрипт отрабатывает и сохраняет статический rss. try { // Путь к файлу и конфигурация $rss_file = ROOT_DIR .
Событие, по словам экспертов, усилит конкуренцию в сфере ИИ.





