|
ISSN 1214-9675 Server vznikl za podpory Grantové agentury ČR. 21. ročník |
Témata
Doporučujeme
Kontakt
|
Modifikace E-modelu pro hodnocení přenosu VoIPVydáno dne 07. 12. 2009 (10945 přečtení)Cílem článku je zhodnotit možnosti použití současné metodiky posuzování kvality úzkopásmových kanálů (∆F = 3,1 kHz) pro přenos řeči i pro kanály širokopásmové (∆F = 7 kHz), navrhnout možná rozšíření existujících modelů a posoudit přínos širokopásmových kodeků na subjektivní kvalitu hovoru. Hlavní pozornost je pak
věnována vlivu ztrátovosti paketů při IP přenosu na celkovou kvalitu hovorové
komunikace. Modification of E-model for VoIP Transfer AssessmentThe primary objective of this paper is to deepen the methodology for objective quantification of the quality of transmission through the impairment factors closely associated with the utilization of wideband speech codecs in telecommunication networks. This methodology is based on subjective auditory listening-only tests, but the resulting impairment factors may be used for predicting speech quality in an instrumental way, e.g., for network planning purposes. Auditory test results are firstly transformed to an overall quality rating scale and then adjusted to rule out test-specific effect. The derived impairment factors fit into the common framework which is defined in recommendations by the E-model for narrowband telephone networks, and which is hereby extended towards wideband speech transmission. Index Terms: E-model, R-factor, MOS parameter, speech codec, one-dimensional rating scale, impairment factor, wideband speech transmission. ÚvodŠirokopásmový přenos hovoru realizovaný ve frekvenčním pásmu 50 až 7000 Hz je dnes široce diskutovanou problematikou v oblasti moderních telekomunikačních sítí. Tento vývoj souvisí především s přechodem od sítí založených na principu přepojování okruhů k sítím pracujícím na principu přepojování paketů. Dnes je tento princip nejčastěji realizován v rámci síťové architektury využívající protokolu IP (TCP/IP), která umožňuje využít širší frekvenční hovorové pásmo než konvenční telefonní systémy. Nasazením širokopásmových hovorových kodeků pak můžeme docílit lepší kvality přenosu v porovnání s doposud používanými kodeky úzkopásmovými, které využívají frekvenčního pásma v rozsahu od 300 až 3400 Hz. Pro širokopásmový přenos hovorového signálu bylo nezbytné definovat určitý okruh použitelných kodeků. Mezinárodní telekomunikační unie ITU-T standardizovala pro širokopásmový přenos zejména kodeky využívající principu ADPCM dle [1], kódování typu MLTC dle [2] a kódování typu AMR-WB založeném na principu CELP dle [3]. V závislosti na přenosové rychlosti a typu kódování je možné zavést pro tyto širokopásmové kodeky ukazatele zhoršení, které mohou v konečném důsledku vést k degradaci kvality přenosu ve srovnání se standardními úzkopásmovými telefonními kanály využívajícími principu modulace PCM s kompresí podle A-zákona (resp. µ-zákona) [4]. Náš přístup v hodnocení kvality přenosu je založen na principu tzv. faktorů zhoršení, který jsou úspěšně využívány pro popis kvality u úzkopásmových hovorových přenosů a ve spojitosti s návrhem a dimenzováním konvenčních telefonních sítí [5] a [6]. Na základě této myšlenky, je pak možné zahrnout všechny příslušné mechanismy zhoršení do stupnice hodnocení realizované prostřednictvím tzv. R-faktoru, který vyjadřuje celkovou míru kvality komunikace, přičemž je třeba vzít v úvahu celý přenosový řetězec začínající ústy mluvčího na jedné straně a končící uchem posluchače na straně druhé a naopak. Pro úzkopásmový provoz je hodnotící stupnice R-faktoru definována od hodnoty R = 0 (nejnižší možná kvalita přenosu) až do hodnoty R = 100 (optimální kvalita přenosu). Z hlediska posuzování kvality, každý faktor zhoršení představuje určitou míru degradace signálu vyplývající z konkrétních charakteristik přenosového kanálu, jako je šířka přenášeného frekvenčního pásma, vztažný útlum, zbytkový útlum, útlumové zkreslení, skupinové zpoždění (resp. doba šíření), zkreslení skupinového zpoždění, nelineární zkreslení, dynamika přenosového kanálu, úroveň šumů, srozumitelný přeslech, stabilita, ozvěna a další. U použitých přenosových zařízení musí být všechny uvedené parametry v předepsaných limitech, aby daný přenosový kanál vyhovoval všem kvalitativním požadavkům. Celková kvalita spojení pak může být vypočtena odečtením příslušných faktorů zhoršení od optimální hodnoty R-faktoru daného přenosového kanálu. Proto lze říci, že faktory zhoršení jsou pouze přídavnými parametry v rámci stupnice hodnocení kvality přenosu. Princip výpočtu faktorů zhoršení je popsán podrobněji v rámci projektu E-modelu v doporučení ITU-T G.107 [6]. Možnosti rozšíření stávající metodiky hodnocení kvality přenosu hovorového signáluPro rozšíření stávající metodiky hodnocení kvality přenosu hovorového signálu rozšířeným frekvenčním pásmem telefonního kanálu do 7 kHz realizované prostřednictvím E-modelu, existují v zásadě dvě následující možnosti. První možností je ponechat stávající interval parametru MOS (Mean Opinion Score) v rozmezí 1 až 4,5 a upravit rozsah R-faktoru, který z hlediska již uskutečněných testů uvedených v [7] koresponduje s hodnotou navýšení stávajícího rozsahu úzkopásmového R-faktoru o 29%. To znamená, že tímto způsobem upravená stupnice R-faktoru, zahrnující takto i hodnocení pro širokopásmový provoz, by byla v rozmezí od 0 do 129. V souvislosti s tímto rozšířením stupnice R-faktoru je pak nutné vůči ní přepočítat i hodnoty všech dílčích faktorů zhoršení. Druhou možností je vytvoření nové metodiky tak, že původní rozsah hodnot R-faktoru zůstane zachován, to znamená, bude v rozmezí od 0 do 100. Takto definovaný R-faktor by tak potom měl být R-faktorem univerzálním, který popisuje kvalitu přenosu hovorového signálu jak úzkopásmovým, tak širokopásmovým telefonním kanálem. Vlivy dílčích faktorů zhoršení by zůstaly zachovány vyjma vlivu dílčího faktoru zhoršení Ie, který bude nutno stanovit i pro nově implementované širokopásmové hovorové kodeky (Ie,WB). Ve spojitosti s tím je také nutno stanovit přepočetní vztah mezi úzkopásmovým dílčím faktorem zhoršení Ie a širokopásmovým dílčím faktorem zhoršení Ie,WB. Pro obě výše zmíněné možnosti je jako výchozí sofistikovaný systém, který umožňuje kvalifikovanější hodnocení kvality přenosu hovorového signálu, zvolen tzv. E-model [6]. Rozšíření stupnice úzkopásmového R-faktoru nad hodnotu 100V souvislosti s implementací původního striktně úzkopásmového E-modelu do praxe byly stanoveny empirické vztahy pro přepočet hodnot R-faktoru na parametr MOS, ale také naopak. Vztahy ovšem platí pouze pro interval R-faktoru od 0 do 100 a u parametru MOS v rozsahu od 1 do 4,5. Pro vyšší hodnoty R-faktoru, např. ve spojení s hovorovými kodeky využívajících frekvenčního pásma do 7 kHz, byly navrženy lineární a exponenciální extrapolace [7]. Pro účely odvození byla vybrána z několika možných extrapolací extrapolace exponenciální, a to z toho důvodu, že vykazuje pesimističtější variantu transformace mezi hodnotami úzkopásmového a širokopásmového hodnocení dle R-faktoru. Výpočet hodnot Ie,ext z empirických hodnot Ie,WB Pro ověření možnosti využití stupnice R-faktoru od 0 do 100 shodně pro obě šířky pásma kodeků byl navržen přepočet dílčího faktoru zhoršení Ie,WB. Empirické hodnoty dílčího faktoru zhoršení Ie,WB reflektují rozsah možných hodnot R-faktoru v intervalu od 0 do 129. Pro výpočet hodnoty dílčího faktoru zhoršení Ie,ext tak vycházíme z výše zmíněné exponenciální extrapolace hodnot R-faktoru na rozsahu 0 až 100 a rovnic, umožňující výpočet hodnoty R-faktoru pro kodeky využívající šířku frekvenčního pásma 7 kHz a 3,1 kHz (viz (1), (2) a (3)).
Úpravou a dosazením do zmíněných rovnic získáme přepočetní vztah mezi extrapolovanou hodnotou dílčího faktoru zhoršení Ie,ext a empirickou hodnotou širokopásmového dílčího faktoru zhoršení Ie,WB pro R-faktor v intervalu hodnot 0 až 100, kde parametry a a b jsou a = 169,38 a b = 176,32:
Tohoto odvozeného vztahu (4) lze pak využít pro výpočet hodnot extrapolovaného dílčího faktoru zhoršení Ie,ext, který tak reprezentuje univerzální hodnotu dílčího faktoru zhoršení Ie pro úzkopásmové i širokopásmové hovorové kodeky. Výpočet hodnot R-faktoru přepočtem z empirických hodnot Ie Empirické hodnoty parametru Ie vychází vesměs záporně pro širokopásmové hovorové kodeky a vedou tak ke zvýšení hodnot původního úzkopásmového R-faktoru nad hodnotu 100. Této skutečnosti tak můžeme využít pro normování hodnot obecného R-faktoru odvozené od exponenciální extrapolace, tzn. úpravu vztahu (1) do tvaru dle rovnice (5). Dosažené výsledky pak lze porovnat s předchozí metodikou výpočtu Ie,ext.
kde parametry a a b jsou stejné jako v předchozím metodickém případě, to znamená, že a = 169,38 a b = 176,32. Rozšíření použitého rozsahu hodnot stupnice hodnocení MOSI když je rozsah stupnice MOS od 1 do 5, původní metodika předpokládá při subjektivním hodnocení zprůměrňování výsledků od hodnotitelů tak, že nebude překročena hodnota 4,5. V dostupné literatuře [7] kupodivu přetrvává tento názor i pro případ, kdy jsou uvažovány širokopásmové kodeky, u nichž se předpokládá vyšší kvalita (nižší faktor zhoršení). Přijmeme-li hypotézu, která se posléze potvrdila provedenými testy, že širokopásmové kodeky budou lépe subjektivně hodnoceny, je třeba rozšířit aktivní rozsah stupnice MOS nad 4,5. Na základě rovnice (5) můžeme provést normování hodnoty úzkopásmového R-faktoru na hodnotu univerzálního R-faktoru s tím, že bude nutné pro hodnoty, které přesáhnou původně stanovenou hranici parametru MOS, nalézt příslušnou extrapolaci. Pro původní rozsah parametru MOS, to znamená v intervalu od 1 do 4,5, dosahuje hodnota širokopásmového R-faktoru své maximální hodnoty dle použitého přepočtu pouze 82. Použitím extrapolace získáme průběh dle obr.1. Obr.1 Extrapolace úzkopásmového R-faktoru na obecný R-faktor se změnou ohodnocení dle MOS S ohledem na úpravu závislosti parametru MOS a hodnot R-faktoru vyjděme v úvahy, že se zvýší o 50% počet posluchačů, kteří se přikloní k hodnocení dle parametru MOS k nejvyššímu ohodnocení, tzn. 5. Z toho pak plyne, že maximální hodnotě R-faktoru (R = 100) bude odpovídat hodnocení dle parametru MOS hodnotou 4,75. Následně lze provést úpravu vztahu mezi parametrem MOS a hodnotou normovaného univerzálního R-faktoru dle rovnice (5) na následující tvar přepočtu:
Porovnání různých způsobů přepočtu mezi parametrem MOS a R je možné učinit pomocí on-line programu Přepočet hodnoty MOS na R – faktor. Hodnocení navržených úprav v posuzování kvality přenosu hovorového signáluNa následujícím obrázku (viz obr. 2) jsou souhrnně graficky znázorněny výsledky dle jednotlivých výše navržených přístupů hodnocení kvality přenosu hovorového signálu, a to pro ztrátovost paketů (MOS = f(Ppl)). Modrou barvou jsou vyznačeny průběhy kodeku ACELP (GSM-EFR) s přenosovou rychlostí 12,2 kbit/s, konkrétně plnou čarou pro metodiku rozšíření použitého rozsahu hodnot stupnice hodnocení MOS, čárkovanou čarou pro metodiku výpočtu hodnot R-faktoru přepočtem z empirických hodnot Ie a tečkovanou čarou pro metodiku výpočtu hodnot Ie,ext z empirických hodnot Ie,WB. Totožným způsobem lze rozlišit ostatní průběhy, kdy oranžovou barvou jsou znázorněny průběhy závislostí pro úzkopásmový telefonní kodek PCM (dle ITU-T G.711) s přenosovou rychlostí 64 kbit/s a červenou barvou jsou znázorněny průběhy závislostí pro širokopásmový kodek ADPCM (dle ITU-T G.722) s přenosovou rychlostí 64 kbit/s. Obr.2 Porovnání závislostí MOS = f(Ppl) dle navržených metodik hodnocení Pokud provedeme shrnutí poznatků, pak nejoptimističtějšího hodnocení je dosaženo pro model, kdy je rozšířen rozsah hodnot stupnice hodnocení MOS nad původní hodnotu 4,5. Tento závěr platí pro všechny testované kodeky. Toto hodnocení však již neplatí pro průběh charakteristik MOS = f(Ppl), kde je výsledné ohodnocení ovlivněno na základě faktoru odolnost kodeku proti ztrátám paketů Bpl, který může v určité míře vylepšit hodnocení hovorové komunikace u IP provozu v případě, že vykazuje určitou ztrátovost paketů Ppl. Konkrétně do hodnot cca 15%. Dále je nutno konstatovat, že by oddělené hodnocení širokopásmového provozu (rozsah R 0 až 130) dle extrapolované křivky vedlo ke stejné hodnotě MOS jako v případě odděleného hodnocení úzkopásmového provozu (rozsah R 0 až 100). Při snaze vytvořit univerzálně použitelnou stupnici pro širokopásmový, úzkopásmový nebo případně kombinovaný provoz, lze použít stupnici 0 až 100 nebo 0 až 130. Považujeme za správné a logické ponechat rozsah do 100. Hodnocení dle 100 bodové škály se rovná 100%. Takto byl R-faktor původně koncipován a bylo by nevhodné tuto koncepci měnit. Tento přístup vede k jedné z metodik, porovnaných na obr.2. Porovnání různých způsobů výpočtu parametrů MOS a R je možné učinit pomocí on-line programu Odhad R-faktoru pro klasickou i širokopásmovou telefonii. Společným znakem všech těchto metodik je, že kvalitnější kodek je zdánlivě schopen kompenzovat svým nižším R-faktorem zhoršení pokles kvality v důsledku dalších nezávislých vlivů (zpoždění, ztrátovost paketů, echo). Provedené testy jsou však v rozporu s tímto zjištěním. Návrh modelu na základě provedených testůNavržené modely znázorněné na obr.4 a obr.5 čárkovanou čarou vycházejí z hodnot vypočtených na základě výsledků realizovaných subjektivních testů (viz obr.3). Z těchto hodnot je následným výpočtem stanoven faktor odolnosti proti ztrátě paketů Bpl pro oba typy kanálů. Pro úzkopásmový telefonní kanál je faktor Bpl = 8,5, resp. pro širokopásmový telefonní kanál je faktor Bpl = 6,5 a dále faktor zhoršení Ie,ext pro telefonní kanál se šířkou frekvenčního pásma 3,1 kHz je roven hodnotě 4 a pro telefonní kanál se šířkou frekvenčního pásma 7 kHz je roven hodnotě 0. Obr.3 Subjektivní hodnocení kvality hovoru pro 3,1 kHz a 7 kHz hovorové kanály
Z hlediska dosažených výsledků bych především rád poukázal na nepříliš výrazné rozdíly v posuzování kvality hovoru získaných na základě realizovaných testů pro hovorové kanály se šířkou frekvenčního pásma 3,1 kHz a 7 kHz (názorněji viz obr.3). Obr.4 Model závislosti efektivního faktoru zhoršení na úrovni ztráty paketů pro kanál 3,1 kHz Obr.5 Model závislosti efektivního faktoru zhoršení na úrovni ztráty paketů pro kanál 7 kHz Odvozením ze vztahů (5) a (7) pak získáme rovnici pro model normovaného efektivního faktoru zhoršení vlivem kodeků Ie-eff,ext ve tvaru:
Závěrem lze konstatovat, že zjištěné výsledky odpovídají předpokladu. To znamená, že rozšíření šířky frekvenčního pásma nad 3,1 kHz nepřinese již podstatné zvýšení srozumitelnosti a z toho plyne, že kvalitnější kodek nedokáže kompenzovat jiné nezávislé negativní vlivy (např. zde ztrátovost paketů). Dle našich zjištění je hodnota faktoru zhoršení Ie pro telefonní kanál se šířkou frekvenčního pásma 3,1 kHz jen o 4 vyšší než hodnota pro telefonní kanál se šířkou frekvenčního pásma 7 kHz. ZávěrZ realizovaných testů vyplývá, že rozšiřování frekvenčního pásma nad hranici 4 kHz nepřinese výrazné zvýšení srozumitelnosti. Lze však předpokládat věrnější interpretaci zabarvení hlasu mluvčího a možnost přenosu i nehovorových, resp. „audio“ signálů obecně. To může přinést více než jen praktický efekt, ale i konkurenční výhodu provozovatelům sítí, implementujících širokopásmové kodeky, kteří mohou této skutečnost marketingově využít. Při snaze vytvořit univerzálně použitelnou stupnici pro širokopásmový, úzkopásmový nebo případně kombinovaný provoz, lze použít stupnici 0 až 100 nebo 0 až 130. Považujeme za správné a logické ponechat rozsah do 100. Hodnocení dle 100 bodové škály se rovná 100%. Takto byl R-faktor původně koncipován a bylo by nevhodné tuto koncepci měnit. Z provedených testů vycházejí nepříliš významné rozdíly v subjektivním hodnocení kvality obou typů kodeků, tím pádem nelze průkazně říci, že zvyk na kvalitnější kodek povede k relativně horšímu hodnocení klasického kodeku. Na základě uskutečněných testů a jejich výsledků lze také konstatovat, že je možné překročit původní maximální hodnotu parametru MOS = 4,5 a je to i z hlediska posuzování kvality hovorové komunikace realizované širokopásmovými hovorovými kodeky nezbytné. Navržená korekce původní křivky přepočtu mezi R-faktorem a parametrem MOS je uvedena vztahem (6). Tento příspěvek vznikl za podpory grantového projektu "Pokročilá optimalizace návrhu komunikačních systémů pomocí neuronových sítí" Grantové agentury ČR pod registračním číslem GA102/07/1503 . Literatura
[1] "7 kHz audio-coding within 64 kbit/s", doporučení ITU-T
G.722 (11/1988), dostupné z:
http://www.itu.int/rec/T-REC-G.722. Autor: I. Pravda Pracoviště: České vysoké učení technické v Praze, FEL |
Zprávy
UPOZORNĚNÍ
Činnost serveru byla ukončena.
|
Tento web site byl vytvořen prostřednictvím phpRS - redakčního systému napsaného v PHP jazyce.
Na této stránce použité názvy programových produktů, firem apod. mohou být ochrannými známkami
nebo registrovanými ochrannými známkami příslušných vlastníků.