|
ISSN 1214-9675 Server vznikl za podpory Grantové agentury ČR. 21. ročník |
Témata
Doporučujeme
Kontakt
|
Hodnotenie kvality prenosu rečiVydáno dne 04. 05. 2006 (15671 přečtení)
Tento príspevok zhrňuje metódy na hodnotenie kvality prenosu reči, ktorá je základným parametrom pri vývoji
zariadení VoIP (Voice over Internet Protokol), rečových kódekoch, nastavovaní a prevádzke pevných a
mobilných sietí.
Quality evaluation of voice transmissionAbstractThis article summarizes methods for quality evaluation of voice transmission, which is basic parameter for development of VoIP devices (Voice over Internet Protokol), voice codes, setting and operating fix and mobile networks.Testovanie QoS (Quality of Service) je jednou z kľúčových úloh v moderných telekomunikačných sieťach a význam týchto testovaní rastie so zvyšujúcou sa komplikovanosťou a komplexnosťou telekomunikačných sietí, kde prenosový reťazec zahŕňa stále viac prenosových technológií (tzv. konvergencia sietí) [1]. Na hodnotenie kvality reči po prenose telekomunikačnou sieťou, resp. po spracovaní rečovým kódekom, sa používajú dve základné hodnotenia, a to objektívne a subjektívne. Takýto parameter sa stáva jedným z mála obecne merateľných, pre porovnanie odlišných prenosových zariadení, ktorý je vo svojej podstate najbližší z pohľadu jednotlivých koncových užívateľov. [1] Faktory ovplyvňujúce kvalitu rečiPrenosový reťazec v súčasných tel. sieťach môže pozostávať z kombinácie rôznych typov sietí (PSTN, GSM, VoIP), ako aj rôznych typov kódovania. V nasledujúcich riadkoch stručne popíšeme faktory ovplyvňujúce kvalitu prenosu reči v jednotlivých častiach prenosového reťazca. Klasické siete: V sieti PSTN vplýva na kvalitu prenosu reči hlavne kvalita telefónneho prístroja, hlasitosť telefónu, akustické echo generované medzi slúchadlom a mikrofónom a tiež interferencie medzi jednotlivými linkami. Parametre, ktorými môžeme charakterizovať takúto prevádzku, sú: hlasitosť, oneskorenie, ozvena, šum a presluchy. Väčšinu týchto parametrov môžeme popísať tradičným meraním SNR, nelineárnym skreslením atd. Digitálna kompresia rečových signálov: Kvalita prenosu reči digitalizovaného signálu je primárne funkcia dostupnej bitovej rýchlosti. Moderné komprimačné metódy umožňujú prenos hovoru s prenosovou rýchlosťou 8 kb/s a nižšou. Takúto bitovú rýchlosť v porovnaní so širokopásmovými audiokódekmi možno dosiahnuť zameraním sa na modelovanie ľudského vokálného traktu. Obr. 1 ukazuje niekoľko závislostí výstupnej kvality prenosu reči základných kódovacích techník od bitovej rýchlosti. Dig. kompresiu rečových signálov môžeme rozdeliť do troch základných skupín [2]:
Obr. 1 Kvalita prenosu reči pre rôzne kódovacie techniky. Mobilné prenosy: Obmedzenou šírkou pásma v moderných komunikačných systémoch sa kódovanie reči stáva kľúčovým parametrom. Zakódované dáta sa posielajú cez rádiové frekvencie a sú vystavované citlivým prenosovým linkám, ktoré sú náchylné na chyby. Tieto chyby spôsobujú zložitosť, resp. nemožnosť rekonštruovať rečový signál, nakoľko dáta prenášané linkami obsahujú len veľmi málo redundancie. Pôsobením adaptívneho kódovania reči a prenosu, chyby v mobilných prenosových systémoch môžu pôsobiť veľmi rušivo. Rušenie je dosť rozdielne v porovnaní s tradičným analógovým rušením, a preto tento vplyv nemôže byt popísaný tradičným meraním. Typické chyby vyskytujúce sa pri mobilných prenosoch sú: impulzný šum, krátkodobé výpadky, orezávanie signálu a nelineárne skreslenie použitím stratových kódekov. Paketovo orientovaný prenos: Prenos hlasových služieb internetovým protokolom (VoIP) je dnes aktuálna téma. Kvalita prenosu reči cez IP sa stretáva s problémami ako stratovosť paketov, prehodenie paketov po prechode cez vyrovnávaciu pamäť, oneskorenie paketov, echo, atd. Pre VoIP sú typicky využívané nasledujúce kódeky: G.711 (64 kb/s), G.723 (5,4 a 6,3 kb/s), G.728 (8 kb/s), ako aj GSM Full-Rate. Metódy merania kvality prenosu rečiOhodnotenie všetkých faktorov, ktoré spôsobujú degradáciu rečového signálu, je len prvým krokom, nakoľko nasleduje nevyhnutný krok, ktorý má za úlohu váhovať vplyv jednotlivých faktorov na výsledné ohodnotenie kvality. Výsledkom tohto váhovania je jeden index MOS (Mean Opinion Score), ktorý podľa doporučenia ITU-T má pätstupňovú stupnicu (Excellent -5, Good – 4, Fair – 3, Poor -2, Bad-1) [3]. Meracie metódy určujúce kvalitu môžeme rozdeliť na dve základné skupiny: Subjektívne meranie – kvalita degradovanej rečovej vzorky sa vyhodnocuje štatisticky pomocou ohodnotenia dostatočné rozsiahlej skupiny osôb, ktoré odpovedajú na dotazník uvedený v odporúčaní ITU-T P.82 a vyjadrujú sa k danej rečovej vzorke. Toto meranie je časovo a finančné veľmi náročné, ale výsledná hodnota je skutočná hodnota kvality prenosu reči MOS-LQS (Mean Opinion Score – Listening Quality Subjective). Pri nahrávaní musia byť splnené špecifické požiadavky podľa ITU-T Rec. P.800, ako sú: špecifická nahrávacia miestnosť (štúdio), kvalita nahrávacieho zariadenia, vlastnosti mikrofónu, vzdialenosť mikrofónu od hovoriaceho, použitie protiveterného krytu, hladina šumu pri nahrávaní, vety majú byť jednoduché a nahovorené plynulo, ale nie expresívne, ďalej sa kladie dôraz na hlasitosť nahrávky, vzorky musia byť nahovorené mužmi aj ženami, a je potrebné zohľadniť aj dĺžku nahrávania a unavenosť hovoriacich atď. Taktiež pri posluhu musia byť splnené požiadavky ako: špecifická posluchová miestnosť (s rovnakými vlastnosťami ako pri nahrávaní), vlastnosti reproduktorov, poslucháči musia byť vybraní náhodne z tel. užívateľov, nesmú byť znalí problematiky, nerobili takýto test najmenej 6 mesiacov a nepočuli tieto nahovorené vety atď. Objektívne meranie – kvalita degradovanej vzorky sa vyhodnocuje štatisticky z matematických modelov, ktoré viac alebo menej modelujú ľudský sluchový aparát. Tieto merania nie sú tak časovo a finančné náročné, ale výsledná kvalita prenosu reči je len odhadom MOS-LQO (Mean Opinion Score – Listening Quality Objective) a záleží na presnosti matematického modelu. Tieto metódy rozoberieme ďalej v tomto texte. Pozn.: Pri návrhu tel. sieti zohráva dôležitú úlohu estimácia hodnôt kvality prenosu reči MOS-LQE (Mean Opinion Score – Listening Quality Estimated). Príkladom takejto metódy je doporučenie ITU-T Rec. G.107 z roku 2000 (Pozn.: v roku 2003 reevidovaný) tzv. E-model popísaný v článku: Hodnocení kvality telefonního přenosu pomocí E-modelu. Kvalitu prenosu reči môžeme testovať dvoma diametrálne odlišnými spôsobmi [1]:
Nasledujúca bloková schéma Obr. 2 určuje vzájomný vzťah medzi jednotlivými typmi meraní. Pričom doporučenie ITU-T Rec. P.834 určuje metodológiu získania faktora zhoršenia Ie z objektívnych meraní a doporučenie ITU-T Rec. P.833 zo subjektívnych meraní. Ďalej doplnok I k doporučeniu ITU-T Rec. G.113 z roku 2002 eviduje databázu faktorov zhoršenia Ie a odolnosti kódeku proti strate paketov Bpl pre rôzne typy kódekov. Prevod prenosového činiteľa R na hodnotu MOS je určený prevodovou krivkou určenou experimentálne. Obr. 2 Vzájomný vzťah medzi jednotlivými hodnoteniami MOS [4]. Intruzívne meranieNávrh objektívnych metód merania založenej na ľudskom vnímaní začal v 80-tych rokoch a medzi najlepšie algoritmy, ktoré boli navrhnuté patria PAQM, PSQM, NMR, PERCEVAL, DIV, OASE, POM [9]. S výnimkou PSQM (Perceptual Speech Quality Measure) všetky tieto algoritmy boli navrhované pre odhad kvality širokopásmových kódekoch, a preto boli určené skôr pre televízne a rozhlasové vysielanie. V roku 1996 bol štandardizovaný algoritmus PSQM ako odporúčanie ITU-T Rec. P.861 pre meranie kvality prenosu reči. Tento algoritmus najlepšie koreloval so subjektívnymi testami. S postupným vývojom rečového kódovania, a to hlavne pre hlasové prenosy cez IP, museli byt vyvinuté nové algoritmy testovania kvality prenosu reči, nakoľko PSQM nepokrýval celú oblasť rušenia. Testy robené pod dohľadom ITU ukazovali, že najlepšie algoritmy boli PSQM99 a PAMS, ale tieto algoritmy neboli natoľko dobré, aby sa štandard reevidoval. V roku 2000 bol štandardizovaný algoritmus PESQ (Perceptual Estimation of Speech Quality) ako ITU-T Rec. P.862, ktorý bol v podstate algoritmus PSQM99 s aplikovanou kompenzáciou oneskorenia. Všetky relevantné meracie algoritmy môžeme popísať blokovou schémou (obr. 3). Jednotlivé algoritmy sú podstatne rozličné v napodobňovaní modelu ľudského vnímania, ale sú podobné v ich základnej štruktúre, ktorá pozostáva z dvoch vstupov, kde prvý je referenčná rečová vzorka a druhý je testovaný signál. V prvom kroku je modelované vonkajšie ucho, tzv. vnemový model (perceptual model). Implementovanie tohto kroku v jednotlivých algoritmoch je značné rozdielne a vo všeobecnosti môžeme povedať, že pre širokopásmové audiosignály je táto časť algoritmu dôležitejšia ako pre meranie kvality prenosu rečových signálov. V nasledujúcom kroku algoritmus modeluje akustické skreslenie v testovanom signáli a porovnáva ho s výstupom z vnemového modelu. Informácie získané takýmto procesom sú nazývané MOVs (Model Output Variables) a sú vstupom pre detailnejšiu analýzu signálu. Výsledné vyjadrenie kvality pozostáva z jedného čísla, ktoré reprezentuje akustické skreslenie testovaného signálu. Na dosiahnutie toho je potrebné simulovať kognitívnu časť ľudského vnímania reči. Rozsah implementácie tohto kroku je od algoritmického popisu (napr. PESQ) až po popis umelými neurónovými sieťami (napr. PEAQ). Obr. 3 Všeobecná štruktúra objektívnych metód merania kvality.
PSQM (Perceptual Speech Quality Measure) [5], [9].
PSQM+
PESQ (Perceptual Estimation of Speech Quality) [6],[9] Z PSQM a PESQ teraz sú dva štandardy, ktoré pokrývajú problematiku merania kvality prenosu reči. Obr. 4 uvádza prehľad štruktúry PESQ algoritmu a taktiež ukazuje nové bloky, ktoré boli pridané ku algoritmu PSQM. Referenčná a degradovaná rečová vzorka sú individuálne úrovňovo zarovnávané a filtrované. Tieto signály vstupujú do bloku časového zarovnávania, kde sa kompenzujú malé časové posuny, zapríčinené oneskorením a časovou nestabilitou v systémoch VoIP. Časové reprezentácie oboch vstupných signálov sú transformované do frekvenčnej oblasti. Ďalej sú rečové vzorky rozdelené do blokov, ktoré sú vstupom do FFT použitím Hannového okna. Ďalej sa (lineárna) frekvenčná stupnica prevedie na frekvenčnú stupnicu udávanú v barkoch, založenú na kritických frekvenčných pásmach, ktoré korešpondujú so šírkami pásem, tzv. kochleárnej banky filtrov. Obe signály, referenčný a degradovaný, sú potom filtrované s prenosovými charakteristikami prijímacieho zariadenia (telefónu). Následne je pridaný Hothov šum (Hoth noise) na simulovanie šumu pozadia typického pre kancelárie s cieľom vyjadriť maskovací efekt v reálnom šumovom prostredí a určenie maskovacieho prahu. Potom nasleduje úprava intenzity, ktorá vedie k vyjadreniu komprimovanej hlasitosti ako funkcie výšky tónu a času, a pomocou tejto funkcie sa odvodí odhad počuteľných chýb. Obr. 4 Bloková schéma algoritmu PESQ (PSQM). Štandardy na kódovanie rečových signálovŠtandardy na kódovanie rečových signálov prešli dlhodobým dynamickým rozvojom a možno ich rozdeliť na dve hlavné skupiny, a to [7]:
ITU štandardy sú určené na prenos rečových signálov v telekomunikačných sieťach, pričom prvý štandard G.711 bol finalizovaný v roku 1992 a bol určený pre siete PSTN. V súčasnosti sa počet ITU štandardov v súvislosti s rozvojom telekomunikačných sietí značné zvýšil. Štandardy pre mobilné komunikácie vznikli z dôvodu značného rozšírenia mobilných sietí a potreby realizovať prenos rečových signálov v podmienkach týchto sietí. (Pozn.: k jednotlivým kódekom boli experimentálne určené hodnoty parametra Ie vid. tabuľka: Parametr Ie pro různé typy kodeku a přenosové rychlosti )
ITU štandardy: ZáverHodnotenie kvality prenosu reči nie je jednoduchým problémom, nakoľko je potrebné pochopiť a popísať fenomén ľudského sluchového „prístroja“. Tento problém hraničí s neuroanatómiou (prenos neurových vzruchov do mozgu) a interpretáciou reči v mozgu (kognitívny model). Len dokonalé pochopenie tohto systému dovedie matematický model k správnemu hodnoteniu kvality prenosu reči a taktiež prispeje k efektívnejšiemu kódovaniu rečových signálov. Vzniklo v rámci projektu: Specifikace kvalitativních kritérií a optimalizace prostředků pro vysokorychlostní přístupové sítě, NPV 1ET300750402. Literatúra
[1] HOLUB, J. – ŠMÍD, R. – KOLOMAZNÍK, J. Hodnocení hlasových přenosů v telekomunikačních sítích,
Sdělovací technika, červen 2001.
Související články:
Rozšíření pásma pro telefonní přenos (12.04.2007) Současný provoz telefonní přípojky a SHDSL (23.10.2006) Vliv radiového rušení na přípojky xDSL (11.10.2006) Metody dynamické správy spektra v metalické přístupové síti (20.06.2006) Modely metalické přístupové sítě (20.06.2006) Varianty přípojek VDSL2 (25.05.2006) Použití redukce vysílacího výkonu u přípojek ADSL2 / 2+ (22.05.2006) Plán přenosových parametrů veřejných telefonních sítí (10.05.2006) Modely symetrických vedení založené na fyzikálních vlastnostech a geometrii kabelu (23.04.2006) Popis programu pro simulaci přípojek xDSL (31.03.2006) Kendallova klasifikace obsluhových systémů (29.12.2005) Střední hodnota doby zdržení požadavku v obsluhovém systému s čekáním (16.12.2005) Hodnocení kvality telefonního přenosu pomocí E-modelu (01.12.2004) Specifikace kvalitativních kritérií a optimalizace prostředků pro vysokorychlostní přístupové sítě (04.09.2004) Autor: M. Nemčík Pracoviště: České vysoké učení technické v Praze, FEL |
Zprávy
UPOZORNĚNÍ
Činnost serveru byla ukončena.
|
Tento web site byl vytvořen prostřednictvím phpRS - redakčního systému napsaného v PHP jazyce.
Na této stránce použité názvy programových produktů, firem apod. mohou být ochrannými známkami
nebo registrovanými ochrannými známkami příslušných vlastníků.