или
Заказать новую работу(фрагменты работы)
Учебное заведение: | Другие города > ДРУГОЕ |
Тип работы: | Рефераты |
Категория: | Инженерные сети и оборудование |
Год сдачи: | 2017 |
Количество страниц: | 25 |
Оценка: | 5 |
Дата публикации: | 04.02.2018 |
Количество просмотров: | 714 |
Рейтинг работы: |
Алгоритмы объективной оценки качества речевых сигналов в телекоммуникационных системах.
Над рефератом проводилась долгая и тщательная работа. В основном использовались иностранные статьи. Уникальность высокая.
(фрагменты работы)
Одной из важнейших проблем при проектировании и эксплуатации систем
кодирования РС, наряду с надежностью, является обеспечение высокого качества передачи РС (КПРС).
Современные системы передачи обеспечивают при достаточной громкости до 89 % слоговую и до 100 % фразовую разборчивость РС, зачастую за счет потери узнаваемости. Поэтому в настоящее время к КПРС по каналам связи предъявляются требования как по разборчивости, так и по узнаваемости.[1]
Разборчивость есть объективная количественная мера, характеризующая способность тракта передавать содержащуюся в РС смысловую информацию в данных конкретных акустических условиях окружающей среды. Под мерой разборчивости понимается выраженное в процентах или долях единицы отношение числа правильно принятых элементов речи (звуков, слогов, слов и фраз) к достаточно большому объему числа переданных. Разборчивость представляет собой семантическое содержание РС. Узнаваемость отражает информацию о говорящем абоненте, т.е. его индивидуальных особенностях речи и т.д.[1]
Объективные оценки качества РС получают с помощью технических средств, что обеспечивает лучшую повторяемость результатов по сравнению с субъективными оценками. Однако объективные методы позволяют только предсказать ожидаемое КПРС, но не способны оцени- вать качество речи так, как это делает человек. При этом объективные методы оценки КПРС, позволяющие оперативно определить качество речи на выходе декодеров, в большинстве своем менее надежны, чем субъективные процедуры. Цель инструментального подхода к предсказанию КПРС - достижение высокой корреляции между предсказанными оценками качества и субъективной оценкой, полученной путем тестирования группой экспертов. Большинство инструментальных методов оценки КПРС сравнивают РС источника (исходный сигнал) и выходной РС системы передачи (декодированный сигнал)[1]
2. Алгоритмы оценки качества сигналов.
2.1 АЛГОРИТМ ОЦЕНКИ ОТНОШЕНИЯ СИГНАЛ/ШУМ РЕЧЕВЫХ СИГНАЛОВ.[2]
Предварительная оценка качества речевого материала является важной в задаче идентификации личностей по голосу (идентификации диктора). Одним из основных показателей, влияющих на качество идентификации диктора, является отношение уровня исходного речевого сигнала к уровню присутствующего в фонограмме шума. Данное отношение может меняться на протяжении фонограммы вследствие вариаций уровня фонового шума и параметров речи диктора. В качестве интегральной меры качества фонограммы целесообразно использовать среднее по фонограмме отношение сигнал/шум (ОСШ).
Средняя величина ОСШ может использоваться для оценки тестовых и обучающих данных, идентификации канала записи фонограммы, выбора рабочего диапазона частот и т.д. Для решения данных задач могут быть использованы оценки ОСШ в частотных полосах или интегральное по частотам значение ОСШ. Мерой качества речевого сигнала в фонограмме является средняя по всем речевым фрагментам фонограммы оценка ОСШ – так называемое сегментное ОСШ.
Закрепленные в стандартах алгоритмы оценки ОСШ предполагают, что известны как шум, так и полезный сигнал. Однако эти алгоритмы не могут быть использованы в ситуации, когда имеется единственная фонограмма с зашумленным речевым сигналом. В этом случае необходимо решить задачу слепой оценки ОСШ. Предложено несколько групп методов слепой оценки ОСШ:
1. .Распознавание участков речевого сигнала и шума с применением детектора речи, по которым вычисляются оценки спектра шума и речи;
2. Оценка гистограммы амплитуд огибающих спектра, из которой отдельно определяются распределения речи и шум;
3. Оценка текущих спектров шума (например, на основе отслеживания минимумов огибающих спектра сигнала);
4. Оценка статистических параметров распределений спектральных амплитуд (например, статистик высокого порядка)
5.
Последние два направления получили к настоящему моменту наибольшее распространение. Однако задача слепой оценки ОСШ по-прежнему далека от своего решения. Непосредственное использование алгоритмов сторонних разработчиков представляется затруднительным по ряду причин разнообразие требований к алгоритмам в зависимости от области их практического применения; использование в алгоритмах параметров, зависящих от типа сигнала (частота дискретизации и пр.),которые в конечном итоге подбираются эмпирически; отсутствие общей методики сравнения различных алгоритмов (базы данных, критерии оценки и пр.).
Перечисленные обстоятельства обусловили разработку собственного алгоритма оценки ОСШ, удовлетворяющего следующим требованиям:
робастность оценки ОСШ для шумов различных типов (в том числе нестационарных); работоспособность в интервале значений ОСШ (динамическом диапазоне) фонограмм от 6 до 24 дБ; возможность оценки ОСШ на коротких фонограммах (длительностью не более 10 с); возможность вычисления оценки ОСШ в режиме реального времени; устойчивость работы алгоритма к различным типам помех;инвариантность к нормировке и частоте дискретизации речевого сигнала; низкие вычислительные затраты.
Похожие работы
Работы автора