Создан первостепеннный аудиопоисковик
"Центр речевых технологий" объявил о завершении работ над технологией Voice Digger - поиском "ключевых" слов в фонограммах русской речи. Это первая в России коммерческая разработка в области audio data mining - одного из самых перспективных направлений цифрового компьютерного рынка в мире.
Разработанный «Центром речевых технологий» Voice Digger - основополагающий нашенский розыск по ключевым словам в звукозаписях русской речи. Voice Digger позволяет автоматически выделять ключевые слова и словосочетания в потоке слитной речи без предварительного прослушивания. Разработка основана на непрерывном распознавании речи, реализуемом с использованием теории скрытых марковских процессов (НММ). Ключевые слова задаются в виде обычного текста, по которому организация сооружаетСпециалист по компьютерной лингвистике Виктор Бочаров рассказал, что свойство системы поиска ключевых слов определяется двумя показателями: вероятностью обнаружения ключевого слова и вероятностью ложного срабатывания при заданной длине искомого слова. Обычно пользователь может регулировать чувствительность системы в зависимости от того, что для него хуже: пропустить произнесение слова или заполучить немало ложных срабатываний. В «Центре речевых технологий» сообщили, что порядок ошибки системы составляет порядка 8%.
Участники рынка сулят новой разработке серьезные перспективы. Андрей Терехов, генеральный управляющий «
Для просмотра изображения кликните по этой ссылке.
Хотя в «Яндексе» называют аудиопоиск преждевременным, разработчики уверены, что
В ЦРТ считают, что новая методика будет пользоваться спросом в крупных системах обработки, хранения и анализа данных. Модули, созданные на базе Voice Digger, позволят оперативно обработать не только текстовые, но и
В качестве примера аналогичной западной разработки позволительно привести компанию TVEyes. Фирма создала поиск по содержимому аудио- и видеопотоков. TVEyes предоставляет своим клиентам возможность делать поиск по ключевым словам посреди содержимого ведущих телеканалов и радиостанций США, Канады, Великобритании и Австралии. Для отдельного пользователя пользование услугами TVEyes в зависимости от предоставляемых возможностей составляет от $0 до $5000 в месяц.
Огромное число аудио- и видеофайлов, выложенное в интернете, даёт большое поле для расширения сферы поиска традиционных поисковиков. Ранее Google сообщал о том, что в 2006 г. будет запущен
Тем не менее, генеральный босс «Центра речевых технологий» Михаил Хитров уверен, что у разработки его компании есть большие перспективы: «В связи со все больше активным использованием естественного интерфейса и, в частности, голоса для общения с техникой возросло и важность аудиозаписи как единицы носителя информации. Появилась надобность в системах, способных скоро и действенно обслуживать
Опубликовано: 15 февраля 2008
