WWW.LIB.KNIGI-X.RU
БЕСПЛАТНАЯ  ИНТЕРНЕТ  БИБЛИОТЕКА - Электронные матриалы
 

«4 Измерение. Мониторинг. Управление. Контроль ИНФОРМАЦИОННО-ИЗМЕРИТЕЛЬНЫЕ И УПРАВЛЯЮЩИЕ СИСТЕМЫ УДК 004.934 А. К. Алимурадов, П. П. Чураков ПРИМЕНЕНИЕ МЕТОДОВ ...»

4 Измерение. Мониторинг. Управление. Контроль

ИНФОРМАЦИОННО-ИЗМЕРИТЕЛЬНЫЕ

И УПРАВЛЯЮЩИЕ СИСТЕМЫ

УДК 004.934

А. К. Алимурадов, П. П. Чураков

ПРИМЕНЕНИЕ МЕТОДОВ ДЕКОМПОЗИЦИИ

НА ЭМПИРИЧЕСКИЕ МОДЫ В ЗАДАЧЕ

ФИЛЬТРАЦИИ РЕЧЕВЫХ СИГНАЛОВ

В УСЛОВИЯХ ИНТЕНСИВНЫХ ПОМЕХ

A. K. Alimuradov, P. P. Churakov

APPLICATION OF EMPIRICALMODE DECOMPOSITION

METHODS FOR SPEECH SIGNALS FILTERING

UNDER INTENSIVE INTERFERENCE ENVIRONMENT

А н н о т а ц и я. Актуальность и цели. Существующие алгоритмы и узлы фильтрации речевых сигналов при наличии интенсивных помех не удовлетворяют предъявляемым требованиям, поэтому разработка методов повышения помехоустойчивости при фильтрации речевых сигналов является актуальной задачей. Материалы и методы. Для повышения эффективности фильтрации интенсивных помех предложена модификация преобразования Гильберта – Хуанга, состоящего из декомпозиции на эмпирические моды (ДЭМ). Результаты. Представлен обзор существующих алгоритмов фильтрации речевых сигналов. На основе модификаций ДЭМ разработан алгоритм фильтрации, существенно расширяющий диапазон изменения отношения сигнал/шум управляющего зашумленного речевого сигнала. Проведен сравнительный анализ характеристик разработанного алгоритма для трех модификаций ДЭМ. Выводы. Наиболее адаптивным методом декомпозиции речевых сигналов является метод комплементарной множественной декомпозиции на эмпирические моды, который рекомендуется для практического использования в системах голосового управления, функционирующих в условиях интенсивных помех.

A b s t r a c t. Background. The existing algorithms and filter nodes of speech signals in the presence of intense noise do not meet the requirements, so the development of methods for improving noise-robust filtering of speech signals is an urgent task. Materials and methods. To increase the effectiveness of intense noise filtering modification of the Hilbert-Huang transform is proposed, comprising the Empirical Mode Decomposition (EMD). Results. A review of the existing filtering algorithms of speech signals is given. Filtering algorithms are developed on the basis of the EMD modifications, significantly extending the range of signal-to-noise ratio of the control noisy speech signal. A comparative analysis of the developed algorithms characteristics is conducted. Conclusions. The Complementary Ensemble Empirical Mode Decomposition (CEEMD) method is the most adaptive method for speech signals decomposition, which is recommended for practical use in voice control systems (VCS), operating under intense interference environment.

2016, № 1 (15) К л ю ч е в ы е с л о в а: фильтрация речевых сигналов, декомпозиция на эмпирические моды, отношение сигнал/шум, интенсивные помехи, независимый компонентный анализ.

K e y w o r d s: speech signals filtering, Empirical Mode Decomposition, signal-to-noise ratio, intense interference, independent component analysis.

Введение В настоящее время быстро расширяется область применения систем голосового управления (СГУ). Однако существующие системы мало приспособлены к работе в условиях интенсивных помех. Наиболее характерными помехами, оказывающими негативное воздействие на работоспособность СГУ, являются фоновые шумы. Фоновые шумы ухудшают разборчивость речевых команд и могут привести к большой погрешности между поступающими в систему зашумленными речевыми сигналами и шаблонами, полученными в ходе обучения СГУ.

Большие погрешности являются основной причиной некорректного распознавания, поэтому все существующие алгоритмы фильтрации направлены на уменьшение этой погрешности.

Проведенный обзорный анализ литературы и собственные исследования [1] показали, что существует много различных подходов к фильтрации зашумленных речевых сигналов. Их разнообразие обусловлено как важностью проблемы, так и отсутствием достаточно эффективных методов ее решения. Важно отметить, что для определенных задач эффективность фильтрации оценивается по-разному. Для СГУ критерием эффективности фильтрации является уровень остаточного шума.

В настоящее время наиболее популярными алгоритмами фильтрации, обеспечивающими минимальное значение остаточного шума, являются:

алгоритмы на основе адаптивной компенсации помех;

алгоритмы на основе математических моделей речевых сигналов во временной области;

алгоритмы на основе математических моделей речевых сигналов в частотной области;

алгоритмы на основе спектральных характеристик шума;

алгоритмы на основе моделей искусственных нейронных сетей;

алгоритмы на основе модели восприятия речи человеком.

Широкое практическое применение получили алгоритмы, программная реализация которых имеется в открытом доступе: алгоритм на основе дискретного косинусного преобразования (Discrete Cosine Transform, DCT) с мягкой пороговой обработкой (SDCT) [2]; алгоритм на основе двухэтапного повышения разборчивости речи (Two-Stage Speech Enhancement, TSSE) [3]; алгоритм на основе взвешенного вычитания шума и слепого разделения сигнала (Weighted Noise Subtraction and Blind Signal Separation, WNS + BSS) [4].

Представленные алгоритмы фильтрации все же не решают полностью проблему удовлетворительного подавления шума. Следствием этого является неспособность СГУ корректно анализировать нестационарные речевые сигналы сложной формы. Более глубокие поисковые исследования методов [5] выявили перспективность использования в обработке речевых сигналов адаптивных методов декомпозиции на эмпирические моды (ДЭМ) [6–8].

В данной статье рассматривается вопрос применения методов ДЭМ в алгоритме фильтрации речевых сигналов, позволяющем существенно повысить порог работоспособности СГУ, функционирующих в условиях интенсивных помех (при отношении сигнал/шум от 5 до –5 дБ). Статья является развитием ранее опубликованных трудов [9, 10].

Краткое описание методов декомпозиции на эмпирические моды ДЭМ представляет собой адаптивную технологию разложения сигнала на внутренние функции, называемые эмпирическими модами (ЭМ). Особенность заключается в том, что базисные функции, используемые для разложения, извлекаются непосредственно из исходного сигнала. При разложении модель сигнала не задается заранее, ЭМ вычисляются с учетом внутренней структуры и локальных особенностей (таких как экстремумы и нули сигнала) каждого конкретного сигнала.

Сигналы ЭМ не имеют строгого аналитического описания, но должны удовлетворять двум условиям, гарантирующим определенную симметрию и узкополосность базисных функций [6]:

общее число экстремумов равняется общему числу нулей с точностью до единицы;

среднее значение двух огибающих – верхней, интерполирующей локальные максимумы, и нижней, интерполирующей локальные минимумы, – должно быть приближенно равно нулю.

6 Измерение. Мониторинг. Управление. Контроль

Кроме адаптивности, метод ДЭМ обладает и другими важными свойствами:

локальность – возможность учета локальных особенностей сигнала;

ортогональность – обеспечение восстановления сигнала с определенной точностью;

полнота – гарантия конечного числа базисных функций при конечной длительности сигнала.

Аналитическое выражение ДЭМ имеет следующий вид:

I x (t ) IMFi (t ) rI (t ), i 1

–  –  –

Алгоритм фильтрации речевых сигналов на основе методов декомпозиции В настоящее время технология обработки сигналов на основе методов ДЭМ широко используется в различных научных приложениях [11, 12], в том числе и при решении задач обработки речевых сигналов [13, 14].

2016, № 1 (15) На основе анализа известных алгоритмов и собственных исследований предложен алгоритм фильтрации речевых сигналов, обеспечивающий работоспособность СГУ в условиях интенсивных помех и основанный на декомпозиции (рис. 1). Суть алгоритма заключается в адаптивном разложении зашумленного речевого сигнала на ЭМ (блок 3), из которых посредством специальной методики оценки весовых энергетических и шумовых коэффициентов определяется мода, содержащая основной шум (блоки 4–10). Далее используется метод независимого компонентного анализа (НКА) для исходного зашумленного речевого сигнала и ЭМ с основным шумом, в результате которого выделяется отфильтрованный речевой сигнал с минимальным уровнем остаточного шума (блок 11). Рассмотрим подробнее основные этапы работы предложенного алгоритма.

Рис. 1. Блок-схема алгоритма фильтрации на основе декомпозиции

Регистрация зашумленного речевого сигнала (блок 2). При анализе алгоритма задавался входной зашумленный речевой сигнал x(n ) со следующими параметрами: длительность записи не более 5000 мс, частота дискретизации 8000 Гц, разрядность квантования 16 бит, где n – дискретный отсчет времени, 0 n N, N – количество дискретных отсчетов в сигнале.

8 Измерение. Мониторинг. Управление. Контроль Декомпозиция (блок 3). Особенностью предложенного алгоритма является возможность использования различных методов декомпозиции для разложения (ДЭМ, МДЭМ и КМДЭМ). Результатом декомпозиции зашумленного речевого сигнала будет конечное число ЭМ IMFi ( n ) и результирующий остаток rI (n), где i – номер ЭМ, I – количество ЭМ.

Сегментация на фрагменты (блок 5). Сегментация в обработке речевых сигналов – это деление на составляющие отрезки, называемые фрагментами. Речевые сигналы являются нестационарными сигналами сложной формы, параметры и характеристики которых быстро меняются в течение времени. В предложенном алгоритме предполагается, что свойства речевого сигнала с течением времени изменяются медленно. Это предположение приводит к анализу, в котором фрагменты ЭМ выделяются и обрабатываются как короткие участки речевых сигналов с отличающимися свойствами.

Сегментация ЭМ на фрагменты осуществляется по следующим формулам:

IMFi ( n ) S, L где S – количество фрагментов в ЭМ; L – количество дискретных отсчетов в одном фрагменте;

IMFi, s 1 ( n ) IMFi ( s L) 1; ( s 1) L,

–  –  –

Исследование алгоритма фильтрации речевых сигналов на основе декомпозиции Проведено исследование алгоритма фильтрации, реализованного на основе трех методов декомпозиции: ДЭМ, МДЭМ и КМДЭМ. Исследования проводились в программном экспериментально-исследовательском комплексе в пакете прикладных программ для решения технических и математических задач MATLAB 7.0.1.

На рис. 2 представлена схема исследования алгоритма фильтрации. Методика исследования предполагает выполнение трех этапов: формирование входного зашумленного речевого сигнала, непосредственная фильтрация с помощью предложенного алгоритма и сравнение результата с исходным речевым сигналом. В схеме предусмотрена возможность регулировки амплитуды фонового шума при формировании входного зашумленного речевого сигнала и параметров математических аппаратов декомпозиции (для трех методов ДЭЛЛ, МДЭМ и КМДЭМ: амплитуда добавляемого белого шума и количество циклов декомпозиции).

10 Измерение. Мониторинг. Управление. Контроль

–  –  –

Рис. 4. Осциллограммы, иллюстрирующие работу алгоритма фильтрации при SNRIN = 0 дБ:

а – результат фильтрации с использованием метода ДЭМ; б – результат фильтрации с использованием метода МДЭМ; в – результат фильтрации с использованием метода КМДЭМ

–  –  –

Рис. 6. Результаты фильтрации разработанного алгоритма и SDCT, TSSE, WNS + BSS Сравнительный анализ позволяет сделать вывод, что разработанный алгоримт на основе метода КМДЭМ обеспечивает наилучший результат фильтрации по сравнению с реализациями алгоритма на основе методов ДЭМ, МДЭМ и алгоритмами SDCT, TSSE, WNS + BSS. Это достигается за счет отсутствия явления смешивания ЭМ и взаимного подавления остаточного шума. Из полученных результатов следует, что наиболее адаптивным методом разложения речевых сигналов является метод КМДЭМ, который рекомендуется для применения в СГУ, функционирующих в условиях интенсивных помех.

Заключение В статье рассмотрена проблема эффективной фильтрации интенсивных помех, оказывающих негативное воздействие на работоспособность СГУ. Проведен обзор алгоритмов фильтрации речевых сигналов, получивших широкое распространение. На основе технологии адаптивного разложения – декомпозиции на эмпирические моды – разработан алгоритм, позволяющий существенно повысить порог работоспособности СГУ, функционирующий в условиях интенсивных помех. Проведено исследование алгоритма, результаты которого выявили, что наиболее адаптивным методом разложения является КМДЭМ, который может найти практическое применение в задачах фильтрации речевых сигналов в условиях интенсивных помех.

Список литературы

1. Алимурадов, А. К. Адаптивная компенсация помех речевых сигналов с использованием комплементарной множественной декомпозиция на эмпирические моды / А. К. Алимурадов // Молодежь и XXI век – 2015 : материалы V Междунар. молодежной науч. конф.

(26–27 февраля 2015 г.) : в 3-х т. / Юго-Зап. гос. ун-т. ; ЗАО «Университетская книга», Курск, 2015. – Т. 2. – С. 96–99.

2016, № 1 (15)

2. Warped Discrete Cosine Transform-Based Noisy Speech Enhancement / Joon-Hyuk Chang // IEEE Transactions on circuits and systems – II: express briefs. – 2005. – Vol. 52, № 9. – P. 535–539.

3. Spectral subtraction based on two-stage spectral estimation and modified cepstrum thresholding / Jie Wang, Hao Liu, Chengshi Zheng, Xiaodong Lib // Applied Acoustics. – 2013. – № 74. – P. 450–453.

4. Hamid, M. E. Improved single-channel noise reduction method of speech by blind source separation / Mohammad Ekramul Hamid, Keita Ogawa, Takeshi Fukabayashi // Acoustical Science and Technology. – 2007. – Vol. 28, № 3, Special Issue on «Applied Systems». – P. 153 – 164.

5. Алимурадов, А. К. Обзор и классификация методов обработки речевых сигналов в системах распознавания речи / А. К. Алимурадов, П. П. Чураков // Измерение. Мониторинг. Управление. Контроль. – 2015. – № 2 (12). – С. 27–35.

6. Huang, N. E. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis / N. E. Huang, Shen Zheng, R. L. Steven // Proceedings of the Royal Society of London A. – 1998. – Vol. 454. – P. 903–995.

7. Zhaohua, Wu. Ensemble empirical mode decomposition: A noise – assisted data analysis method / Wu Zhaohua, N. E. Huang // Advances in Adaptive Data Analysis. – 2009. – Vol. 1 (1). – P. 1–41.

8. Yeh, J.-R. Complementary ensemble empirical mode decomposition: A novel noise enhanced data analysis method / J.-R. Yeh, J.-S. Shieh, N. E. Huang // Advances in Adaptive Data Analysis. – 2010. – Vol. 2 (2). – P. 135–156.

9. Алимурадов, А. К. Интеллектуальная обработка речевых сигналов в системах автоматического управления / А. К. Алимурадов, А. Ю. Тычков // Известия кабардинобалкарского государственного университета. – 2012. – Т. II, № 4. – С. 66–67.

10. Алимурадов А. К. Обработка речевых команд в системах голосового управления / А. К. Алимурадов // Измерение. Мониторинг. Управление. Контроль. – 2014. – № 1 (7). – С. 50–57.

11. Huang, N. E. The Hilbert-Huang transform and its applications / N. E. Huang. – Singapore :

World Scientific Publishing Co. Pte. Ltd. 5, 2005. – 526 p.

12. Huang, N. E. An Introduction to Hilbert-Huang Transform: A Plea for Adaptive Data Analysis / N. E. Huang // Research Center for Adaptive Data Analysis. – Singapore : National Central University, 2007. – 257 p.

13. Speech Endpoint Detection in Noisy Environment Based on the Ensemble Empirical Mode Decomposition / Jingjiao Li, Dong An, Jiao Wang, Chaoqun Rong // Advanced Engineering Forum. – 2012. – Vol. 2–3. – P. 135–139.

14. Noise-robust speech feature processing with empirical mode decomposition / Kuo-Hau Wu, Chia-Ping Chen, Bing-Feng Yeh // EURASIP Journal on Audio, Speech, and Music Processing. – 2011. – 9 p.

15. Saha, G. A New Silence Removal and Endpoint Detection Algorithm for Speech and Speaker Recognition Applications / G. Saha, Chakroborty Sandipan, Senapat Suman // Proceedings of the NCC. – 2005, Jan. – Р. 5.

16. Hyvarinen, A. Independent component analysis: algorithms and applications / A. Hyvarinen, E. Oja // J. Neural Networks. – 2000. – № 13. – P. 411–430.

17. Разработка верифицированной базы данных речевых сигналов для диагностики состояния органов дыхания / А. К. Алимурадов, А. Ю. Тычков, П. П. Чураков, Ю. С. Квитка, Д. А. Ярославцева // Перспективные информационные технологии (ПИТ 2013) : тр. Междунар. науч.-техн. конф. – Самара : Изд-во Самар. науч. центра РАН, 2013. – С. 147–150.

_________________________________________________

Похожие работы:

«Московский государственный университет им. М.В.Ломоносова М ежвузовский научно-координационный совет по проблеме эрозионных, русловых и устьевых процессов ЭРОЗИОННЫЕ РУСЛОВЫЕ ПРОЦЕССЫ Выпуск 6 ЙМ№ УДК 6.31.4:35.3 Э74 Эрозионные и русловые процессы. Сборник трудов...»

«Dune HD медиа-плееры Руководство пользователя Содержание Приступая к работе Связь o Подключение ТВ / монитора / проектора через HDMI / DVI вход 3 o Подключение телевизора / мон...»

«Альбина Нурисламова Катился апельсин пьеса в трёх действиях Действующие лица: А л е к с е й П е т р о в и ч – ветеран Великой Отечественной войны, 88 лет Га л и н а А л е к с е е в н а – его дочь И в а н Д а н и л о в и ч – её второй муж Е л е н а – дочь Галины Алексеевны А л ь б е р т – её муж Л ё л и к – и...»

«Образовательная программа высшего образования – ординатуры (далее ОП ВО ординатуры) по специальности "Психиатрия-наркология" разработана ФГБОУ ВО УГМУ Минздрава России в соответствии с Федеральным государственным образовательным стандартом по специальности: 31.08.21"Психиатрия-наркологи...»

«УДК 943.08 ОРГАНИЗАЦИОННАЯ СТРУКТУРА НЕМЕЦКОЙ КАТОЛИЧЕСКОЙ ПАРТИИ "ЦЕНТР" И ЕЕ РУКОВОДСТВО О.В. Ольховская Партия "Центр" опиралась в своей деятельности на различные органы, облегчавшие воздействие на население. Связь с немецким электоратом под...»

«Иосиф Виссарионович Сталин Том 18 Полное собрание сочинений – 18 Иосиф Виссарионович Сталин Полное собрание сочинений Том 18 Р.И. Косолапов. Предисловие Первичная нагрузка этого тома состояла в том, чтобы завершить, наконец, публикацию произведений согласно исходному плану Собрания сочинений И. В. Сталина, намеченном...»

«Корпоративный договор ООО "Солнечный Крым" Д О Г О В О Р № на организацию предоставления туристических услуг г. Симферополь "_" _ 201_ г. Общество с ограниченной ответственностью "Солнечный Крым", Крым, г. Симферополь, именуемое в дальнейшем "Турагент", "Туроператор"...»

«УДК 159.9 МЕТОД ИНТЕНТ-АНАЛИЗА В ИЗУЧЕНИИ ДИСКУРСА Наталия Павлова (Москва) Розглядаються напрями досліджень дискурсу, що розвиваються, пов'язані з інтенціональними аспектами його організац...»

«Дианов Алексей Григорьевич СИБИРСКАЯ РАБОЧЕ-КРЕСТЬЯНСКАЯ ИНСПЕКЦИЯ О СОСТОЯНИИ СРЕДНЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ В ОМСКОЙ ГУБЕРНИИ В НАЧАЛЕ 20-Х ГГ. ХХ В. (НА ПРИМЕРЕ ОМСКОГО ПОЛИТЕХНИКУМА) В статье на основе документов Сибирской...»









 
2017 www.lib.knigi-x.ru - «Бесплатная электронная библиотека - электронные матриалы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.