Разбираю «Qwen3.5-21B-Claude-4.6-Opus-Heretic-Uncensored»: что на самом деле внутри файнтюна с громким именем
nlaik 23 минуты назад Разбираю «Qwen3.5-21B-Claude-4.6-Opus-Heretic-Uncensored»: что на самом деле внутри файнтюна с громким именем Сложный 9 мин 465 Искусственный интеллект Open source * Машинное обучение * Аналитика...
Anthropic — What company has the best second artificial intelligence model at the end of June?
В сфере искусственного интеллекта произошло заметное событие. nlaik 23 минуты назад Разбираю «Qwen3. 6-Opus-Heretic-Uncensored»: что на самом деле внутри файнтюна с громким именем Сложный 9 мин 465 Искусственный интеллект Open source * Машинное обучение * Аналитика Технический разбор модели, которую в телеграме продают как «Claude без цензуры»В моей ленте недавно завирусился пост: якобы кто-то «дообучил Qwen 3. 5 до уровня Claude 4.
6 Opus, убрал цензуру через Heretic и получил настоящего монстра». Я зашёл на HuggingFace, открыл карточку модели и провёл вечер, разбираясь, что там реально под капотом. Спойлер: внутри много интересной техники, но к Claude эта модель имеет такое же отношение, как кроссовки с надписью «Adibas» к Adidas.
Технические детали
Ниже расскажу, что действительно сделал автор, что такое abliteration и Heretic с инженерной точки зрения, и как читать названия файнтюнов на HuggingFace, чтобы не вестись на маркетинг. Что заявлено и что на самом делеПолное имя модели: Qwen3. 6-Opus-Deckard-Heretic-Uncensored-Thinking.
Автор — DavidAU, известный в сообществе мерджер моделей. Пройдусь по каждой части имени и переведу её на технический язык. 5 — базовая модель от Alibaba Cloud.
Это open-weights LLM, всё честно. 21B — заявленное число параметров. Но базовый Qwen3 идёт в размерах 0.
Отраслевые последствия
7B, 4B, 8B, 14B, 32B, 235B. Размер 21B — это не оригинальный размер семейства. Получают его через depth upscaling: берут модель меньшего размера (обычно 14B) и склеивают слои так, чтобы общее число параметров выросло.
Метод известный, описан в статье SOLAR 10. Работает, но никаких «новых знаний» добавить не может — это просто архитектурная манипуляция с весами, которые уже есть. 6-Opus — а вот это самая интересная часть имени.
К Claude отношения никакого нет. Веса Claude закрытые, Anthropic их не публикует. Что реально стоит за этой надписью: автор файнтюнил Qwen на синтетическом датасете, который сгенерирован запросами к Claude.
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.





