
Голосовой КПТ-дневник с распознаванием речи на устройстве: Flutter и on-device Whisper
mentalium 14 минут назад Голосовой КПТ-дневник с распознаванием речи на устройстве: Flutter и on-device Whisper 7 мин 678 Flutter * Dart * iOS * Разработка мобильных приложений * Медгаджеты Кейс Из песочницы Я не пишу...
GPT-5.6 31 Temmuz 2026'da yayınlanacak mı?
В сфере искусственного интеллекта произошло заметное событие. mentalium 14 минут назад Голосовой КПТ-дневник с распознаванием речи на устройстве: Flutter и on-device Whisper 7 мин 678 Flutter * Dart * iOS * Разработка мобильных приложений * Медгаджеты Кейс Из песочницы Я не пишу код каждый день уже много лет, последний продакшен на PHP отгрузил году в 2009. Но за последние годы инструменты дошли до состояния, когда сольный pet‑проект с распознаванием речи на устройстве собирается силами одного человека. Эта статья про то, как я сделал голосовой дневник мыслей для когнитивно‑поведенческой терапии (КПТ), почему распознавание речи у меня крутится прямо на телефоне, и какие на этом пути были технические развилки.
Кода почти не будет, будет архитектура и обоснование решений. Сразу дисклеймер про мотивацию, потому что без него непонятно, зачем вообще городить on‑device. Я сам прошёл через тревожные расстройства, панические атаки и несколько депрессивных периодов.
Технические детали
Из всего, что мне помогало, переломной стала КПТ, и у неё есть домашняя часть, дневник мыслей, который нужно вести между сессиями. Вести его текстом в момент тревоги у меня не получалось годами, и в какой‑то момент я понял, что хочу диктовать его голосом. Так появился проект, который я тут и разбираю.
Почему текстовый дневник мыслей — это трениеДневник мыслей, или thought record, это короткая структурированная запись: ситуация, автоматическая мысль, эмоция и её сила, реакция, альтернативная мысль. На бумаге или в заметке это выглядит безобидно, но заполнять пять текстовых полей нужно в тот момент, когда вас накрывает, в очереди, в транспорте, ночью. Именно тогда, когда меньше всего хочется доставать клавиатуру и формулировать.
С точки зрения разработчика это классическая задача про снижение трения во вводе. Любая форма из пяти полей с клавиатурным вводом в стрессовом состоянии имеет конверсию близкую к нулю. Я это проверил на себе, заводил таблицы и заметки, и почти не заполнял их.
Отраслевые последствия
А ценность КПТ‑дневника прямо пропорциональна тому, насколько регулярно вы его ведёте, так что пустой дневник обнуляет половину пользы терапии. Очевидный способ убрать трение во вводе это голос. Проговорить ситуацию и мысль вслух занимает секунд двадцать и не требует собранности.
Дальше нужно только распознать речь и разложить её по полям дневника. Вот тут и начинается интересное. Почему распознавание должно быть на устройствеСамый простой путь это взять облачное API распознавания речи.
Отправил аудио на сервер, получил текст, дёшево и быстро. Для большинства приложений это правильный выбор. Для дневника мыслей в КПТ, на мой взгляд, нет.
Событие, по словам экспертов, усилит конкуренцию в сфере ИИ.





