
LLM на iPhone: от llama.cpp до Foundation Models
Viktoriaios 12 минут назад LLM на iPhone: от llama.cpp до Foundation Models Простой 7 мин 347 iOS * Swift * Обзор 2026: год, когда on-device стал нормойВ 2025 году вместе с iOS 26 компания Apple представила...
Anthropic — What company has the best second artificial intelligence model at the end of June?
В сфере искусственного интеллекта произошло заметное событие. Viktoriaios 12 минут назад LLM на iPhone: от llama. cpp до Foundation Models Простой 7 мин 347 iOS * Swift * Обзор 2026: год, когда on-device стал нормойВ 2025 году вместе с iOS 26 компания Apple представила разработчикам Apple Foundation Models. Теперь порог входа для on-device AI упал до нескольких строк, и далее в статье мы рассмотрим как он выглядит.
А в январе 2026 года Apple заключила сделку с Google в рамках которой следующее поколение Apple foudation models будет основано на технологии Google Gemini. По данным Bloomberg стоимость этой сделки составляет 1 млрд долларов в год. Apple по-прежнему держит контроль над пользовательскими данными, запросы будут выполняться локально, что-то сложное, с чем не может справиться локальная модель - будет отправляться в облако Apple Private Cloud Compute.
Технические детали
Зачем выносить модель на устройствоЗабегая вперед хочу сказать, что цель этого сравнения не донести мысль, что, с учетом таких минусов, нужно только локально модели запускать, нет. Дело в том, что облачные модели, несмотря на свои преимущества, все же имеют ряд недостатков, и некоторые из них хорошо могут быть компенсированы моделями локальными. Рассмотрим несколько причин: Privacy и compliance.
Ни для кого не секрет, что при использовании облачных моделей, таких как ChatGPT, Gemini и др. данные отправляются на сервер и могут использоваться для дообучения модели, и в целом - данные уходят на сервер и дальше мы не можем быть уверены как и для какой цели они могут быть использованы. Это становится проблемой, если речь идет о юридических, финансовых, документах или медицинских данных.
В свою очередь, у Local LLM такая проблема отсутствует - данные не только не уходят на сервер, они не распространяются за рамки одного устройства (что в свою очередь отчасти и недостаток). Бесплатный inference. Тут все понятно, чем больше токенов или возможностей мы используем, тем больше стоимость нашей подписки.
Отраслевые последствия
С Local LLM такой проблемы нет, стоимость on-device инференса равна 0. Несмотря на корректные, развернутые, четкие ответы облачной модели, от нее нет никакого смысла, при отсутствии доступа к сети. Эту проблему хорошо решает Local LLM - допустим, я хочу что-то «погуглить» при отсутствующей связи, если я например нахожусь в самолете/метро/в горах.
Для наглядного сравнения предлагаю посмотреть на таблицу, где сравниваем параметры облачных моделей (Gemini 1. 2T, GPT-4o) и локальную (Apple FM ~3B):ПараметрОблако (Gemini 1.
Этот прогресс даёт важные сигналы о будущем отрасли, и технологический мир внимательно наблюдает.



