
Сказ о том, как нейросеть занялась reward hacking прямо у меня на кухне
inkedsymon 46 минут назад Сказ о том, как нейросеть занялась reward hacking прямо у меня на кухне Средний 8 мин 1.8K Блог компании Selectel Python * Машинное обучение * Алгоритмы * Искусственный интеллект С чего все...
Anthropic — What company has the best second artificial intelligence model at the end of June?
В сфере искусственного интеллекта произошло заметное событие. inkedsymon 46 минут назад Сказ о том, как нейросеть занялась reward hacking прямо у меня на кухне Средний 8 мин 1. 8K Блог компании Selectel Python * Машинное обучение * Алгоритмы * Искусственный интеллект С чего все началосьЯ хотел просто пожарить кесадилью. В холодильнике лежали зеленые оливки (солено-кислые), сулугуни и фарш, а на полке — консервированная кукуруза.
И вот стою я над сковородкой и думаю: а оливки с кукурузой вообще сочетаются? А сулугуни не пересолит блюдо вместе с оливками? Сколько чего вообще класть?
Технические детали
В любой другой ситуации я бы загуглил рецепт. Но не тут-то было, я же великий комбинатор оптимизатор, и у меня в голове сразу всплыло: «это же задача оптимизации». Тем же вечером у меня был ноутбук с обученной нейросетью вместо ужина.
Рассказываю, как дошел до жизни такой, и как из этого внезапно получился реально вкусный рецепт. Вкус — это векторБазовая идея простая. Любой вкус раскладывается на оси.
Я взял семь: соль, кислота, сладость, горечь, умами, острота, жир. Тогда каждый ингредиент — это точка в 7-мерном пространстве. Я закодировал свою кладовую руками (да, по ощущениям и кулинарному имхо, это самая субъективная часть):Ингредиентсолькислотасладкоегоречьумамиостротажирфарш гов.
Отраслевые последствия
3010807сулугуни6210506зел. оливки8502403кукуруза0071201карамел. лук1181202помидор1430300лайм0912000То есть вкус готового блюда — это просто взвешенная сумма векторов ингредиентов:import numpy as np # оси: соль, кислота, сладость, горечь, умами, острота, жир ING = { "фарш": np.
array(), "сулугуни": np. array(), "оливки": np. array(), "кукуруза": np.
array(), "помидор": np. values())) def profile(amounts): # amounts — сколько каждого кладем return amounts @ VКаталог готовых ИИ-моделейСервис для запуска и управления LLM в облаке Selectel. Выберите модель, конфигурацию и получите готовый эндпоинт для работы с ней.
Событие, по словам экспертов, усилит конкуренцию в сфере ИИ.




