речи

Скрытые Марковские модели в распознавании речи

ИИ›Распознавание›речи

Самое быстрое и эффективное взаимодействие между людьми происходит посредством устной речи. С помощью речи могут быть переданы различные чувства и эмоции, а главное — полезная информация. Необходимость создания компьютерных интерфейсов звукового ввода-вывода не вызывает сомнений, поскольку их эффективность основана на практически неограниченных возможностях формулировки в самых различных областях человеческой деятельности.

Подробнее о Скрытые Марковские модели в распознавании речи

Скрытые марковские модели (СММ), статистическая модель. В области распознавания речи.

ИИ›Распознавание›речи

В этом руководстве мы рассмотрим скрытые марковские модели и их применение в отдельных аспектах распознавания речи.

Происходящие явления можно описывать как сигналы. Сигналы могут быть дискретными, как письменная речь, или непрерывными, как фонограмма или кардиограмма. Сигналы с постоянными статистическими свойствами называются стабильными (стационарными), а с меняющимися — нестабильными (нестационарными). Сигнал может быть чистым, а может и искаженным, с помехами или посторонними сигналами.

Подробнее о Скрытые марковские модели (СММ), статистическая модель. В области распознавания речи.

Система распознавания речевых команд в Linux при помощи ПО julius

ИИ›Распознавание›речи›Julius

Для декодирования речевых команд можно использовать открытый проект Julius.

Пользователи Ubuntu могут установить готовые пакеты:

sudo apt-get install julius julius-voxforge

Так как последний стабильный релиз Julius 4.2.1 некорректно работает с
подсистемой ALSA, при использовании ALSA может потребоваться пересобрать код из cvs-репозитория:

   cvs -z3 -d:pserver:anonymous@cvs.sourceforge.jp:/cvsroot/julius co julius4
   cd julius4
   ./configure --with-mictype=alsa
   make

Подробнее о Система распознавания речевых команд в Linux при помощи ПО julius

Шумоподавление в CMU Sphinx

ИИ›Распознавание›речи›Sphinx

Можно смело заявить, что на сегодня CMU Sphinx стал лидером среди открытого софта для распознавания речи. Pocketsphinx поставляется вместе с Ubuntu, многообещающий проект Simon построен с широким его использованием, а структура корпуса Voxforge как бы намекает, что создан он для sphinxtrain.

Подробнее о Шумоподавление в CMU Sphinx

Pocketsphinx. Распознавание речи и голосовое управление в Linux

ИИ›Распознавание›речи›Sphinx

http://habrahabr.ru/post/167479/

Введение

Подробнее о Pocketsphinx. Распознавание речи и голосовое управление в Linux

Сверхбыстрое распознавание речи без серверов на реальном примере

ИИ›Распознавание›речи

В этой статье я подробно расскажу и покажу, как правильно и быстро прикрутить распознавание русской речи на движке Pocketsphinx (для iOS порт OpenEars) на реальном ~~Hello World~~ примере управления домашней техникой.

Подробнее о Сверхбыстрое распознавание речи без серверов на реальном примере

Восприятие речи

ИИ›Распознавание›речи

Восприятие речи состоит в ее распознавании. Причем речь воспринимается лишь в обязательной совокупности двух аспектов: как слухового раздражителя и как источника смыслового содержания воспринятых звуков. Первый аспект реализуется слуховой или зрительной системой (в зависимости от формы речи - голосовая или письменная).

Подробнее о Восприятие речи

HTK, Julius, Audacity

ИИ›Распознавание›речи›Julius

http://www.voxforge.org/home/dev/acousticmodels/linux/create/htkjulius/h...

http://www.voxforge.org/home/dev/acousticmodels/linux/adapt/htkjulius

http://yandex.ru/search/?text=Julius%20AcousticModels&lr=10987&wordforms...

Подробнее о HTK, Julius, Audacity

Управляем Linux-десктопом с помощью голосовых команд

ИИ›Распознавание›речи›Julius

Вчера я рассказывал о том, как научить свой Linux-десктоп проговаривать различную информацию, сегодня я хочу несколько расширить начатую тему и рассказать о системах распознования речи, с помощью которых можно научить машину понимать простые голосовые команды.