Systémy pro přenos hovorových signálů založené na technologii zdrojového kódování řeči a následného paketového přenosu přes datové sítě se v dnešní době začínají rozvíjet a uplatňovat v čím dál větší míře. Jejich hlavní výhodou je úspora přenosové kapacity a výrazně nižší provozní i pořizovací cena. S tím úzce souvisí i úspora prostředků vynaložených na přenos hovorových signálů telekomunikační sítí a konečná cena hovoru. Při použití těchto zařízení je díky kódování snížena celková přenosová kapacita na cca jednu třetinu až čtvrtinu, při zachování únosné kvality signálu. Pomocí paketovacího mechanismu lze zase dosáhnout efektivního využití jednotných prostředků pro přenos dat i hovoru.
Je pochopitelné, že tyto výhody s sebou nesou i nevýhody. Těmi je hlavně zhoršení kvality přeneseného hovorového signálu a jeho zpoždění – obzvlášť při opakovaném kódování (kompresi) a rekonstrukci. Pro testování kvality přenosu řečového signálu telekomunikačními zařízeními a systémy byly vyvinuty dvě základní metody, subjektivní a objektivní. Metody jsou detailně popsány v doporučeních ITU-T řady P [1], [2], [3] a [4].
Metody subjektivního ohodnocení kvality jsou určeny pro obecné použití. Jsou nezávislé na typu degradace hovorového signálu, ať se jedná o ztrátu rámců, šum, chybovost přenosu, ozvěny nebo nelineární zkreslení při použití kodeků s nízkými přenosovými rychlostmi. K subjektivnímu posouzení kvality telekomunikačních zařízení a systémů lze použít dva typy metod - poslechové a konverzační.
Konverzační testy jsou určeny k laboratorní simulaci situací, se kterými se setkávají uživatelé telekomunikačních koncových zařízení. Při použití konverzačních testů je nutné zvolit vhodné podmínky a testovací subjekty, stejně důležité je i korektní vedení testu.
Princip testu je následující: dva testovací subjekty (osoby) jsou umístěny do dvou zvukotěsných místností, které jsou blízko kontrolní místnosti. Objem místností nesmí být menší než 20 m3. Šum v obou místnostech musí být udržován na nejnižší možné míře. Oba testovací subjekty vedou normální telefonní rozhovor a hodnotí kvalitu přenosu hovorového signálu, zatímco obsluha v kontrolní místnosti mění podmínky testu.
Škála pro ohodnocení kvality přeneseného hovorového signálu
je v případě konverzačních testů pětistupňová:
5 - výborně (Excellent)
4 - dobře (Good)
3 - průměrně (Fair)
2 - špatně (Poor)
1 - nedostatečně (Bad)
Výsledky poslechových testů nejsou stejně realistické, jako testy konverzační. Omezení testovacích podmínek jsou proto v určitých aspektech méně přísná. Umělost tohoto testu znamená, že je nutné sledovat, kontrolovat a specifikovat mnoho parametrů, které jsou při konverzačních testech automaticky v rovnováze. Proces testování je však jednodušší, než u testů konverzačních. Princip testu je následující: testovací subjekt je umístěn do zvukotěsné místnosti, která má objem v rozmezí 30 - 120 m3. Šum musí být opět udržován na co nejnižší možné míře. Testovacímu subjektu jsou do sluchátka přehrávány testované hovorové signály a subjekt hodnotí jejich kvalitu pomocí jedné z metod uvedených dále.
Při testu založeném na metodě ACR (Absolute Category Rating) jsou hodnoceny skupiny 2 - 5 na sobě nezávislých vět po přenosu telekomunikačním zařízením. Testované vzorky se hodnotí z různých hledisek. Následující škály ohodnocení jsou nejpoužívanější a také mají nejvyšší vypovídací hodnotu:
Škála poslechové kvality (Listening-quality scale) je stejná jako v případě konverzačních testů. Výsledkem ohodnocení testovaných vzorků je hodnota MOS (Mean Opinium Score).
Škála úsilí pro
porozumění (Listening-effort scale) je opět pětistupňová a její hodnoty
jsou:
5 - není nutné žádné
úsilí (Complete relaxation possible; no effort required)
4 - není nutné značné
úsilí (Attention necessary; no appreciable effort required)
3 - nutné určité úsilí
(Moderate effort required)
2 - nutné značné úsilí
(Considerable effort required)
1 - srozumitelné s maximálním úsilím (No meaning understood
with any feasible effort)
Výsledkem ohodnocení testovaných vzorků je hodnota MOSLE.
Škála ohodnocení hlasitosti (Loudness-preference scale)
- hodnoty této škály jsou:
5 - příliš hlasité (Much louder then preferred)
4 - hlasitější (Louder than preferred)
3 - přiměřená hlasitost (Preferred)
2 - tišší (Quieter than preferred)
1 - příliš tiché (Much quieter than preferred)
Výsledkem ohodnocení testovaných vzorků je hodnota MOSLP.
Tato metoda je
ideální pro získávání informací o přítomnosti či nepřítomnosti některých rušivých
vlivů (například ozvěny), které se mohou vyskytnout v hovorovém signálu. Škála
ohodnocení je v případě testů vytvořených na základě této metody většinou třístupňová,
obsahuje stupně:
A - slyšitelné - rušící (Objectionable)
B - slyšitelné - nerušící (Detectable)
C - nerušící (Not Detectable)
Metoda ACR není vhodná pro testování kvalitních hovorových signálů, neboť není dostatečně citlivá. Citlivější metodou pro tyto signály je metoda ohodnocení degradace DCR (Degradation Category Rating). Metody tohoto typu jsou založeny na porovnávání testovaného signálu se signálem referenčním. Hovorové signály jsou testovacímu subjektu předkládány po dvojicích (A-B) nebo po opakovaných dvojicích (A-B-A-B), kde A je signál testovaný a B referenční.
Škála ohodnocení je pětistupňová a obsahuje body:
5 - degradace je neslyšitelná (Degradation is inaudiable)
4 - degradace je slyšitelná, ale neruší (Degradation is
audiable but not annoying)
3 - degradace příliš neruší (Degradation is slightly
annoying)
2 - degradace je rušící (Degradation is annoying)
1 - degradace je velmi rušící (Degradation is very annoying)
Výsledkem ohodnocení testovaných vzorků je hodnota DMOS.
Metoda CCR (Comparison Category Rating) je velmi podobná metodě DCR. Testovacím subjektům jsou opět předkládány dvojice signálů, pořadí signálů se náhodně mění. Subjekt tedy nemá informaci o tom, který ze signálů je testovaný a který je referenční. Subjekty tedy o dvojici signálů podávají dvě informace: Který ze signálů byl kvalitnější? a o kolik?
Škála ohodnocení je sedmistupňová a obsahuje stupně:
3 - o mnoho lepší (Much better)
2 - lepší (Better)
1 - o málo lepší (Slightly better)
0 - přibližně stejné (About the same)
-1 - o málo horší (Slightly worse)
-2 - horší (Worse)
-3 - o mnoho horší (Much worse)
Výsledkem ohodnocení testovaných vzorků je hodnota CMOS.
Na základě empirických zkušeností získaných z testů subjektivního hodnocení bylo zjištěno, že se výsledky jednotlivých hodnotitelů se mohou i výrazně lišit v závislosti na okolním šumu, na stavu sluchových orgánů hodnotitelů, na únavě hodnotitelů, na místě konání testu atd.
Okolní šumJestliže je hladina okolního šum nižší o méně než 12 dB, stává se hovorový signál naprosto nesrozumitelným [6]. Doporučení požaduje, aby hladina šumu byla co nejnižší, ideálně by měla být nižší o více než 60 dB než je hodnocený vzorek.
Stav sluchových orgánůStárnutím dochází k různým poruchám a poškozením sluchových orgánů. Např. velmi významnou poruchou sluchu je chronické akustické trauma [7]. Při této poruše dochází k trvalé sluchové ztrátě typicky na frekvencích 3 až 6 kHz, ačkoliv se postižený pohyboval v prostředí se širokopásmovým hlukem.
Místo konání testuDoporučení vyžadují konání testu ve zvukotěsné místnosti větší než 20 (30) m3. Tato místnost by měla být také bezodrazová. V menších místnostech může dojít ke zkreslení zvuku vlivem odrazu.
Subjektivní hodnocení kvality řeči může být dobrou pomůckou při testování telekomunikačních zařízení, avšak je velmi náročné na čas, podmínky testu a prostředky použité pro test. Pro dosažení nezávislého výsledku je třeba několik desítek (spíše stovek) hodnotitelů. Proto jsou pro určitá vývojová hodnocení lepší objektivní metody, byť v některých případech nejsou vždy věrné. Objektivními metodami se zabývá další článek.
Tento článek vznikl v rámci grantu FRVŠ G1 2006 - 2830.
[1] Doporučení ITU-T P.800: Methods for subjective
determination of transmission quality.
[2] Doporučení ITU-T P.862: Perceptual evaluation of speech
quality (PESQ), an objective method for end-to-end speech quality assessment of
narrowband telephone networks and speech codecs.
[3] Doporučení ITU-T P.862 Amendment 1: Revised Annex A: Source
code for the reference implementation and conformance tests.
[4] Doporučení ITU-T P.830: Subjective performance assessment
of telephone-band and wideband digital codecs.
[5] BENSON, B. K. Audio Engineering Handbook.
McGRAW-HILL BOOK, New York, 1998.
[6] GAN, R. Z. – FENG, B. – SUN, Q. Three-Dimensional
Finite Element Modelling of Human Ear for Sound Transmission. Annals of
Biomedical Engineering., 2004, vol. 32, no. 2, s. 847–859.
[7] LÍK, J. – PELLANT, A. – CHROBOK, V. Vztah
akustiky zevního zvukovodu a chronického akustického traumatu. Pardubice,
2002. Závěrečná zpráva o řešení projektu podpořeného Interní grantovou
agenturou Ministerstva zdravotnictví ČR, reg. č. NK 6179-3.