
Google представила ИИ-курсор, Googlebook и пакет Gemini Intelligence
Google DeepMind разрабатывает курсор компьютерной мыши с искусственным интеллектом на базе Gemini — компания намерена переосмыслить технологию, которая не менялась более полувека. «Мы исследуем новые возможности на базе...
Bitcoin 1 Minute
Заметное событие всколыхнуло криптовалютные рынки. Google DeepMind разрабатывает курсор компьютерной мыши с искусственным интеллектом на базе Gemini — компания намерена переосмыслить технологию, которая не менялась более полувека. «Мы исследуем новые возможности на базе ИИ, которые помогут курсору не только понимать, на что он указывает, но и почему это важно для пользователя», — говорится в блоге компании. Проект решает распространенную проблему: стандартный ИИ-инструмент работает в отдельном окне, и пользователю приходится перетаскивать туда свой контент.
«Мы стремимся к обратному: интуитивному искусственному интеллекту, который взаимодействует с пользователями во всех используемых ими инструментах, не прерывая рабочий процесс», — заявили в компании. Четыре принципа ИИ-курсора В Google DeepMind разработали четыре принципа, которые перекладывают передачу контекста и намерений с пользователя на компьютер и заменяют текстовые промпты более интуитивными способами взаимодействия. Сохранение рабочего потока ИИ-функции должны работать во всех приложениях, поэтому прототип курсора от Google DeepMind доступен везде, где осуществляет операции пользователь.
Динамика рынка
Например, можно навести мышь на PDF-файл и запросить краткое саммари в виде списка, чтобы вставить его в письмо. Другой пример — навести курсор на таблицу со статистическими данными и попросить построить круговую диаграмму. Покажи и расскажи Современные нейросети требуют точных инструкций, и для получения качественного ответа пользователю нужно составлять подробный промпт.
ИИ-курсор упрощает этот процесс: он фиксирует визуальный и семантический контекст, позволяя модели «увидеть» и понять, что именно важно. В экспериментальной системе Google DeepMind достаточно указать на абзац, фрагмент изображения или блок кода и LLM поймет, с чем нужна помощь. Сила слов «это» и «то» В повседневном общении люди редко прибегают к длинным и подробным фразам.
Они говорят: «Почини это», «Перенеси это сюда» или «Что это значит», параллельно полагаясь на жесты и общий контекст. «ИИ-система, способная понимать это сочетание контекста, жестов и речи, позволит юзерам формулировать сложные запросы естественным и лаконичным образом без применения сложных промптов», — говорится в блоге Google DeepMind. Пиксели для взаимодействия На протяжении десятилетий компьютеры отслеживали лишь направление взгляда.
Влияние на рынки
Искусственный интеллект способен понять, на что именно указывает пользователь, и преобразовать пиксели в структурные объекты для мгновенного взаимодействия. «Фотография с набросками превращается в интерактивный список дел, стоп-кадр из видео о путешествии — в ссылку для бронирования столика в том симпатичном ресторане», — отметили в Google DeepMind. Реализация Google DeepMind внедряет эти принципы в Chrome и новом интерфейсе для ноутбуков Googlebook.
«С сегодняшнего дня вместо ввода сложных запросов вы можете использовать курсор, чтобы спросить Gemini в Chrome о той части веб-страницы, которая вас интересует», — говорится в блоге. Например, можно выбрать несколько товаров на странице и попросить сравнить их или указать место, где нужно визуализировать новый диван в гостинной. В ближайшее время компания запустит Magic Pointer в Googlebook.
Функция позволит применять Gemini одним движением пальца. Googlebook Google представила «новую категорию ноутбуков» на базе возможностей Gemini, объединяющую Android и ChromeOS. «Более 15 лет назад мы представили Chromebook — ноутбук, созданный для мира, в котором приоритет отдается облачным технологиям.
Криптовалютные рынки внимательно следят за этим событием, а инвесторы оценивают его возможное влияние на цены.




