Tradiční způsob přenosu hovorového signálu v digitální formě využívá pulsně kódové modulace PCM podle doporučení ITU-T G.711. Jednomu telefonnímu kanálu s kmitočtovým pásmem 300 Hz až 3,4 kHz odpovídá přenosová rychlost 64 kbit/s při vzorkování kmitočtem 8 kHz s 8 bity na vzorek (komprese používaná pro Evropu podle A-zákona).
Horní mezní frekvence telefonního pásma (voice) 3,4 kHz byla stanovena s ohledem na srozumitelnost. Vyšlo se z požadavku průměrné 80% slabikové srozumitelnosti hovorové komunikace.
Dolní mezní frekvence telefonního pásma 300 Hz byla stanovena s ohledem na přenášený výkon. Maximum výkonu se totiž přenáší na nejnižších frekvencích a příliš razantním kmitočtovým omezením bychom redukovali úroveň přenášeného signálu. Frekvence, na které pokles výkonu dosahuje 80% výkonu celého hovorového spektra, byla stanovena jako dolní mezní frekvence telefonního kanálu.
Vedle PCM modulace se používají i další metody kódování hovorového signálu, úspornější z hlediska přenosové rychlosti. Např. poloviční rychlost 32 kbit/s lze získat s metodou adaptivní diferenciální PCM (ADPCM) podle doporučení ITU-T G.721 (původní verze z roku 1988, nyní G.726, G.727). Další snahy vedly k ještě výraznějšímu snížení přenosových rychlostí metodami zdrojového kódování (vokodéry). Úsporu (až 60%) přináší i vypouštění tichých intervalů v hovoru s obvody VAD (Voice Aktivity Detection). U všech těchto metod se zachovává původní šířka pásma telefonního kanálu.
Dnešní metody kódování dokáží na jedné straně značně redukovat přenosovou rychlost digitalizovaného telefonního signálu, na druhé straně jsou v dnešní době provozované sítě s dostatečnou přenosovou kapacitou. To umožní přenášet telefonní signály s větší šířkou pásma.
Lze využít kódování podle doporučení ITU-T G.722 (SB-ADPCM), pro které je stanovena šířka pásma 50 Hz až 7 kHz pro pokles na okrajích pásma 3 dB. Prakticky dvojnásobná horní mezní frekvence oproti telefonnímu kanálu je možná díky vzorkovací frekvenci 16 kHz. Zvýšená šířka pásma je vyhovující nejen pro přenos hovorového signálu, ale zvukového signálu obecně (audio), např. hudby, a to i díky podstatně nižší dolní mezní frekvenci pásma. Pro analogové rozhraní se připouští přebuditelnost 9 dBm0 a klidový šum v celém pásmu by neměl překročit hodnotu -66 dBm0.
Podstatné je, že díky metodě ADPCM vystačíme i při šířce pásma 7 kHz s přenosovou rychlostí 64 kbit/s, takže je možné využít standardních digitálních okruhů, stačí výměna kodeků v koncových zařízeních. Je možné využít i nižší přenosové rychlosti, ovšem za cenu poklesu kvality. Jak ukazuje tab. 1, je možné použít i jiné typy kodeků (viz též přehled na konci článku), např. CELP, které jsou ovšem optimalizované pro přenos hovorového signálu a mohou zkreslovat jiné typy zvukových signálů, a to úměrně snižování přenosové rychlosti.
Kódování |
Standard |
Přenosová rychlost [kbit/s] |
Iewb |
Ie |
ADPCM |
ITU-T G.722 |
64 |
13 |
-23 |
56 |
20 |
-16 |
||
48 |
31 |
-5 |
||
MLTC |
ITU-T G.722.1 |
32 |
13 |
-23 |
24 |
19 |
-17 |
||
CELP |
ITU-T G.722.2 |
23,05 |
1 |
-35 |
19,85 |
3 |
-33 |
||
18,25 |
5 |
-31 |
||
15,85 |
7 |
-29 |
||
14,25 |
10 |
-26 |
||
12,65 |
13 |
-23 |
||
8,85 |
26 |
-10 |
||
6,6 |
41 |
5 |
Tab. 1 Kodeky se šířkou pásma 7 kHz a odpovídající faktory zhoršení
Kvalita hovorové komunikace se posuzuje pomocí parametru MOS (viz např. článek Metody subjektivního hodnocení kvality hovorových signálů) a pro plánování sítí se používá tzv. E-model a R-faktor (viz článek Hodnocení kvality telefonního přenosu pomocí E-modelu). Pro klasické telefonní kodeky je stanovena škála faktoru R od 0 do 100 a jeho hodnotu lze získat po odečtení jednotlivých faktorů zhoršení I (Impairment factor) takto:
R = 100 + A – Io – Iq – Idte – Idd – Ie (1)
Referenčním je kodek PCM, pro který vychází hodnota R = 93 pro optimálně nastavené parametry klasické telefonní sítě. Nízkorychlostní kodeky sice snižují potřebnou přenosovou rychlost, ale za cenu ztráty kvality, což vyjadřuje kladná hodnota faktoru zhoršeni Ie (Equipment Impairment factor) uvedená pro různé typy kodeků v tab. 2.
Pro kodeky se šířkou pásma 7 kHz je možné použít vztah (1) s parametry Ie, který vychází vesměs záporně a povede tak ke zvýšení faktoru R nad hodnotu 100 nebo parametr Iewb, pro který pak lze přepsat vztah do tvaru:
R = 136 + A – Io – Iq – Idte – Idd – Iewb (2)
Hodnoty obou parametrů jsou uvedeny pro různé typy kodeků v tab. 1 a tab. 2.
Kódování |
Standard |
Přenosová rychlost [kbit/s] |
Iewb |
Ie |
PCM |
ITU-T G.711 |
64 |
36 |
0 |
ADPCM |
ITU-T G.726, G.727 |
40 |
38 |
2 |
ITU-T G.721 (1988), G.726,7 |
32 |
43 |
7 |
|
ITU-T G.726, G.727 |
24 |
61 |
25 |
|
ITU-T G.726, G.727 |
16 |
86 |
50 |
|
LD-CELP |
ITU-T G.728 |
16 |
43 |
7 |
12,8 |
56 |
20 |
||
CS-ACELP |
ITU-T G.729 |
8 |
46 |
10 |
G.729-A + VAD |
8 |
47 |
11 |
|
VSELP |
IS-54 |
8 |
56 |
20 |
ACELP |
IS-641 |
7,4 |
46 |
10 |
QCELP |
IS-96a |
8 |
57 |
21 |
RCELP |
IS-127 |
8 |
42 |
6 |
VSELP |
PDC |
6,7 |
60 |
24 |
RPE-LTP |
GSM 06.10, Full-rate |
13 |
56 |
20 |
VSELP |
GSM 06.20, Half-rate |
5,6 |
59 |
23 |
ACELP |
GSM 06.60, Enhanced |
12,2 |
41 |
5 |
ACELP |
ITU-T G.723.1 |
5,3 |
55 |
19 |
MP-MLQ |
ITU-T G.723.1 |
6,3 |
51 |
15 |
Tab. 2 Telefonní kodeky se šířkou pásma 3,1 kHz a odpovídající faktory zhoršení
Znamená to tedy, že při šířce pásma 7 kHz lze dosáhnout lepší celkové kvality hovorové komunikace a lze předpokládat, že kvalitnějšími kodeky lze kompenzovat ostatní faktory zhoršení. Možnost kompenzace však bude mít svá omezení, protože např. extrémní zpoždění v síti či extrémní ozvěny zcela nevyváží kvalitní kodek.
V souvislosti se zavedením E-modelu byly stanoveny empirické vztahy pro přepočet z R na MOS a naopak. Vztahy ovšem platí pro interval R od 0 do 100. Pro vyšší R při použití kodeků s pásmem 7 kHz je třeba provést extrapolaci, jak ukazuje obr. 1. Aproximace byla provedena polynomem stupně 5 s koeficienty [4,3342.10-10; -9,8923.10-8; 6,4876.10-7; 8,8886.10-4; -4,6905.10-3; 0,99637].
Obr. 1 Možnost extrapolace při převodu z R na MOS při použití kodeků 7 kHz
Je zřejmé, že rozšíření pásma při přenosu nepřinese podstatný nárůst srozumitelnosti, která již bude blízká 100%, nicméně celkový subjektivní dojem bude lepší, protože bude lépe přenášeno zabarvení hlasu mluvčího. Otázkou je, zda praktické rozšíření kodeků se šířkou pásma 7 kHz neposune vnímání kvality směrem k vyšším nárokům na telefonní komunikaci, kdy při zachování pětistupňové škály MOS budou následně klasické kodeky subjektivně hodnoceny hůře než dosud.
IS-54 – první generace mobilních sítí TDMA v USA používající kodek VSELP (Vector Sum Excited Linear Prediction) – 7,95 kbit/s (plus 5,05 kbit/s zabezpečení FEC)
IS-96a – první generace mobilních sítí CDMA v USA používající kodek QCELP (Qualcomm Code‑Excited Linear Prediction) – 8, 4, nebo 2 kbit/s
IS-127 – druhá generace mobilních sítí CDMA v USA používající kodek RCELP (Residual Code‑Excited Linear Prediction) – 8, 4, nebo 2 kbit/s
IS-641 – druhá generace mobilních sítí TDMA v USA používající kodek ACELP (Algebraic Code-Excited Linear Prediction) – 7,4 kbit/s (plus 5,6 kbit/s zabezpečení FEC)
GSM-FR – první generace kodeku RPE-LTP (Regular Pulse Excitation Long Term Prediction) pro mobilní sítě GSM (ETSI GSM 06.10) – 13 kbit/s (plus 9,8 kbit/s zabezpečení FEC)
GSM-HR – kodek s poloviční rychlostí VSELP (Vector Sum Excited Linear Prediction) pro sítě GSM (ETSI GSM 06.20) – 5,6 kbit/s
GSM-EFR – druhá generace kodeku ACELP (Algebraic Code-Excited Linear Prediction) pro sítě GSM (ETSI GSM 06.60) – 12,2 kbit/s (plus 10,6 kbit/s zabezpečení FEC)
PDC – první generace japonského mobilního systému (Personal Digital Communication) s kodekem JVSELP (Japanese version of Vector Sum Excited Linear Prediction) – 6,7 kbit/s (plus 4,5 kbit/s zabezpečení FEC)
G.722 – doporučení ITU-T pro šířku pásma 7 kHz s kodekem 64 kbit/s SB-ADPCM (Sub-band Adaptive Differential Pulse Code Modulation).
G.722.1 – doporučení ITU-T pro kodeky s nízkou složitostí 24 a 32 kbit/s MLTC (Modifies Lapped Transform Coding)
G.722.2 – doporučení ITU-T pro kodeky 16 kbit/s AMR-WB (Adaptive Multi-Rate Wideband) s větší šířkou pásma
G.723.1 – doporučení ITU-T pro kodek ACELP (Algebraic Code‑Excited Linear Prediction) – 5,3 kbit/s a MP-MLQ (Multipulse Maximum Likelihood Quantization) – 6.3 kbit/s s použitím ve videotelefonech v klasických telefonních sítích
G.726 – doporučení ITU-T pro kodek ADPCM (Adaptive Differential Pulse Code Modulation) – 40, 32, 24, a 16 kbit/s
G.728 – doporučení ITU-T pro kodek LD-CELP (Low-Delay Code-Excited Linear Prediction) – 16 kbit/s s rozšířením pro 12,8 a 9,6 kbit/s
G.729 – doporučení ITU-T pro kodek CS-ACELP (Conjugate Structure Algebraic Code-Excited Linear Prediction) – 8 kbit/s
Příspěvek vznikl za podpory NPV 1ET300750402.
[1] ITU-T Recommendation G.107 (2005) – Amendment 1. The
E-model, a computational model for use in transmission planning. New Appendix
II – Provisional impairment factor framework for wideband speech transmission.
[2] ITU-T Recommendation G.113 (2001) – Amendment 1.
Transmission impairments due to speech processing. New Appendix IV –
Provisional planning values for the wideband equipment impairment factor Ie,wb.
[3] BARRIAC (V.), LE SAOUT (J.-Y.), LOCKWOOD (C.):
Discussion on Unified Methodologies for the Comparison of Voice Quality of
Narrowband and Wideband Scenarios, In Proc. ETSI Workshop on Wideband Speech
Quality in Terminals and Networks: Assessment and Prediction, DE-Mainz, 2004.