Извличане на височина и откриване на тона

В последната част на раздела за каналните вокодери трябва да споменем проблемите с извличането на височината на основния тон и откриването на тон-шум, т.е. разграничаване между гласни и негласни звуци. Има много алгоритми за измерване на периода на височина. За да илюстрираме, помислете за много ефективен алгоритъм, базиран на обработка във времева област и използване на паралелна обработка. И двете разглеждани задачи са по същество комбинация от обработка на сигнали и разпознаване на образи. Но тъй като селекторите за височина са включени в много системи за обработка на реч, си струва да ги разгледаме тук. В сек. 12.12, във връзка с хомоморфната обработка на речта се разглежда напълно различен алгоритъм за извличане на височина.

откриване

Фиг. 12.23. Блокова схема на алгоритъма за оценка на периода на височина.

тона

Фиг. 12.24. Измервания, използвани за определяне на периода на стъпката.

Блокова диаграма на алгоритъма за оценка на стъпката е показана на ФИГ. 12.23. Алгоритъмът може удобно да бъде разделен на четири операции, свързани с обработка или вземане на решения:

1) нискочестотно филтриране на речевия сигнал;

2) формирането на шест функции въз основа на екстремумите на филтрирания сигнал;

3) получаване, въз основа на стойностите на горните функции, шест оценки на стъпката в шест еднакви метра;

4) вземане на окончателно решение въз основа на оценки на елементарни метри на стъпка.

Основната цел на LPF е да потиска висшите хармоници на говорния сигнал. Нискочестотните филтри с гранична честота около 600 Hz се справят добре с тази задача.

При извършване на втората операция за всички екстремуми на филтрираното трептене се формират импулси с различна амплитуда (фиг. 12.24). За всеки максимум се формират импулси с амплитуди , а импулси самплитуди за всеки минимум. Амплитудите съвпадат съответно с максималните и минималните стойности, се измерват от максимума до минимума и от минимума до максимума, а — от максимума до предишния максимум и от минимума до предишния минимум. Униполярните последователности се формират от получените импулси и ако разглежданият максимум (или минимум) е по-малък от предходния, тогава (или ) се приема за равно на нула. Нека обясним причината за използването на точно такъв набор от импулси, като използваме примера за разглеждане на два ограничаващи случая (фиг. 12.25). Ако в сигнала присъства само основната честота (графиките отляво), тогава измерванията са неправилни, но измерванията осигуряват измерване на периода. Ако сигналът съдържа силен втори хармоник и по-слаб първи (фиг. 12.25 вдясно), тогава измерванията са правилни, а всички останали са грешни. И въпреки че в този случай четири от шестте измервания съдържат грешка, в окончателното изчисление, както ще бъде показано, с голяма вероятност се получава правилният резултат.

Шест импулсни последователности се подават към входовете на шест броячи с еднакъв период. Работата на измервателния уред е илюстрирана на фиг. 15.26. По същество всеки измервателен уред е пиков детектор с контролирана разрядна верига. Всеки импулс е последван от интервал на заглушаване (по време на който детекторът не получава импулси), последван от експоненциален интервал на разреждане за детектора. Ако в този втори интервал пристигне импулс, който надвишава напрежението в разрядната верига, тогава той се открива и процесът на блокиране и разреждане се повтаря. Времевата константа на разреждане и времето за изключване на детектора варират в зависимост от изгладената оценка на периода на основния тон , получена от същия детектор. Стойността се определя чрез итерация

(12.30)

тона

Фиг. 12.25. Оценка на периода на основния тон в два гранични случая.

Тук е най-новата (текуща) оценка за период, е текущата изгладена оценка за период и е предишната изгладена оценка. При всяко откриване се намира нова оценка съгласно формула (12.30). За да се избегнат екстремните стойности на времето на блокиране и времеконстантата на разреждане, стойността е ограничена до 4 до 10 ms. В рамките на тези граници, зависимостите на времето на блокиране t и времеконстантата на разреждане от се дават от отношенията

(12.31)

извличане

Фиг. 12.26. Работата на елементарни метри на периода на основния тон.

Накрая периодът на основния тон се определя в блок 4 (фиг. 12.23), който може да се разглежда като специализиран компютър с памет, аритметично устройство и устройство за управление на всички входящи сигнали. Във всяка времева точка периодът на стъпка се оценява, както следва:

1. Формира се матрица от оценки на периода (с размер елемента). Колоните на матрицата съответстват на индивидуалните измервателни уреди, а редовете съответстват на оценките за периода. Първите три реда съдържат прогнозите за последните три периода. Четвъртият ред е сборът от първия и втория ред, петият е сборът от втория и третия ред, а шестият е сборът от трите първи реда. Формирането на матрица е илюстрирано на ФИГ. 12.27.

Структурата на последните три реда се определя от факта, че понякога периодът] на втория или третия хармоник на основния тон се определя в отделни метри и оценките, съдържащи се в последните три реда, се оказват правилни, а не последните три измервания на периода, разположени в първите редове.

2. Всеки елемент от първия ред се сравнява с всички останали 35 елемента на матрицата иброят на съвпаденията се прочита (точната дефиниция на съвпадение е дадена по-долу). Резултат с най-голям брой съвпадения се избира като краен резултат.

Сега трябва да дефинираме съвпадението. Първо, когато се взема решение за съвпадението на две оценки, изглежда по-подходящо да се вземе предвид тяхното съотношение, а не разликата. В този случай съотношението може да се измери доста приблизително, което позволява да се избегне операцията за разделяне. Второ, последователните измервания често се различават значително, така че е полезно да се въведат няколко прага за определяне на съвпаденията и, когато се изчислява прогнозата за периода, да се избере този, който дава най-разумния отговор. С оглед на гореизложеното, сега описваме операциите, извършвани в блок 4 (фиг. 12.23).

На фиг. 12.28 показва ширините на шестнадесет съвпадащи прозореца. Както е показано на фиг. 12.27, крайната оценка на периода на терена се избира само от последните оценки, дадени от шест метра. За да се определи, всяка от последните шест оценки се сравнява с останалите 35 числа, съдържащи се в матрицата. Това сравнение се повтаря четири пъти за всяка колона от таблицата на ФИГ. 12.28. От всяка колона, в съответствие със стойността на анализираната оценка, се избира ширината на прозореца. Например, ако тази оценка е 4 ms, тогава възниква съвпадение, ако разликата между сравняваните интервали не надвишава 200 µs (при честота на дискретизация от 10 kHz). Когато се преброи броят на съвпаденията, отместването от 1 се изважда от него.

тона

Фиг. 12.27. Методика за формиране на матрица от оценки на периода на основния тон.

откриване

Фиг. 12.28. Таблица за съвпадение на ширината на прозореца.

Измерването се повтаря за втората колона на таблицата. В този случай ширината на прозореца е по-голяма и вероятността за съвпадениесе увеличава, но за компенсация от броя на съвпаденията се изважда отместване, равно на 2 и т. н. След извършване на тези действия се получават четири числа за всичките четири колони на таблицата, най-голямото от които се приема като брой съвпадения за дадена оценка на периода на терена. Цялата процедура се повтаря за всяка от петте оставащи текущи оценки и крайната оценка се взема от тази от шестте, която има най-голям брой съвпадения след изваждане на отклонението. По време на тези изчисления е необходимо да се извършват ( ) проверки на съответствието (сравнения на модула на разликата с фиксирано число). Повтарянето на целия процес на всеки 5 ms ви позволява да проследявате дори бързи промени в периода на височина.

откриване

Фиг. 12.29. Сравняване на честотата на тона на синтезираната реч с оценки, получени с помощта на алгоритъма за откриване на тона.

За да се покажат типични резултати, предоставени от обсъждания алгоритъм, на ФИГ. 12.29, заедно с оценките на периода на терена, са показани неговите истински стойности, които са използвани при синтеза на твърдението, избрано като пример. Ясно е, че в този случай алгоритъмът дава много добри резултати.