Digitální zpracování signálu

A A A

Systém variabilního zpracování řeči

SVP – Speech Variable Processing

Variabilní zpracování řeči (SVP) je technologie, používaná v rámci digitálního zpracování signálů, která umožňuje velmi rychle rozměřit příchozí zvukový signál a dle potřeb jej proměnně zesilovat. Napodobováním analýzy a přizpůsobení zvuků, jak k tomu dochází u zdravého lidského ucha, SVP umožňuje zachovat zvuky zpracované sluchadlem přirozené a řeč při poslechu čistou.

Klíčem k věrné reprezentaci zvuků je rychlost zpracování

Vnitřní struktura ucha – nazývaná hlemýžď neboli kochlea – je klíčem k vnímání hlasitosti zvuku a jeho srozumitelnosti. Nejenže hlemýžď zvuk přijímá, ale také jej zesiluje, pokud je zdravý. Digitální systém, který chce napodobit tohle chování co nejpřirozeněji, musí pracovat stejně rychle jako hlemýžď u zdravého ucha.

SVP představuje systém na bázi komprese WDRC (Wide Dynamic Range Compression), speciálně navržený pro velmi rychlé zpracování signálu. Analyzuje příchozí signál a upravuje jeho zisk nebo zesílení v rychlosti až tisíckrát za sekundu. Tato schopnost rychle identifikovat příchozí zvukový signál a aplikovat zesílení (tzv. doba „nástupu“) a potom upravovat zisk měnícího se signálu (tzv. doba „uvolnění“) je to, co umožňuje systému SVP zvýšit srozumitelnost řeči a prezentovat zvuky přirozeně.

Příklad pro vysvětlení principu SVP:

Dobrým příkladem, jak rychle se zvuk může v čase měnit, je když řeknete anglickou větu „Everyday sounds better“. Počáteční písmeno ve slově „better“ „b“ je daleko hlasitější než koncovka „s“ ve slově „sounds“. Zdravý hlemýžď automaticky detekuje a upravuje zvuky, aby byly slyšitelné stejně. Systém SVP také velmi rychle (řádově v milisekundách) dokáže analyzovat změny amplitud v řečovém signálu s cílem zajistit odpovídající zesílení.

Bližší vysvětlení tohoto principu je následujícím videu.

Systémy s rychlým nástupem a pomalým uvolněním (oranžová barva) nemohou reagovat dostatečně rychle na změny v akustickém tlaku – aplikují tak příliš málo zesílení na měkké „s“ a příliš mnoho zesílení na tvrdé „b“. Naproti tomu, systém SVP (modrá barva) tak díky velmi rychlé odezvě umožňuje přesně změřit a kompenzovat náhlé změny ve zvukovém signálu – hlásky „s“ a „b“ jsou úměrně zesilovány, aby ve výsledku zněly přirozeně.

 

Srozumitelnost zvuků vyžaduje frekvenční kontrast

Dostatečný kontrast mezi frekvencemi je klíčem k srozumitelnosti zvuku. Řečový signál se skládá z různých frekvenčních složek. Čím je kontrast mezi frekvencemi vyšší, tím je vyšší i srozumitelnost řeči.

Zdravý hlemýžď udržuje tento kontrast zesilováním zvuků, ale s percepční ztrátou sluchu není hlemýžď schopen dostatečně dobře různé frekvence zesilovat. Systém SVP pomáhá překonat tuto ztrátu kontrastu pomocí analýzy příchozího signálu a následnou aplikací zesílení na celý širokopásmový zvukový signál.

Jiné používané přístupy rozdělují vstupní signál na samostatné kanály, v nichž provedou zesílení, a potom tyto kanály spojí zpátky dohromady. To vytváří tzv. „sumační“ efekt – všechna zesílení jsou použita rovnoměrně a výsledkem je ztráta kontrastu.

Naproti tomu, systém SVP analyzuje a upravuje frekvenční oblasti jednotlivě. Použitím zesílení na příslušné rozsahy tento systém zachovává frekvenční kontrast přirozeného zvuku.

Znázornění frekvenčního kontrastu pro hlásku „e“. Systém SVP (modře) úzce sleduje a nemění kontrast příchozího signálu v rozsahu od nejnižší po maximální hodnoty. Naproti tomu, vícekanálové systémy (oranžově) signál „zplošťují“. Udržení původního kontrastu ve zvukovém signálu hraje důležitou roli při zachování srozumitelnosti řeči.