GSM Audio kodek / Vokodér
GSM tutoriál obsahuje:
- GSM tutoriál/ úvod
- Sieťová architektúra
- Rozhrania
- Radio access network
- Frames
- Frekvenčné pásma a alokácie
- Energetická trieda, kontrola a zosilňovače
- Fyzikálne a logické kanály
- Codecs/ vocoders
- Handover/ handoff
Audio kodeky alebo vokodéry sú univerzálne používané v systéme GSM.
Znižujú bitovú rýchlosť reči, ktorá bola konvertovaná z analógového prehrávača do digitálneho formátu, aby sa mohla prenášať v rámci dostupnej šírky pásma kanálu.
Bez použitia kodeku reči by digitalizovaná reč zaberala oveľa širšiu šírku pásma, ktorá by bola k dispozícii. Podľa toho sú kodeky GSM obzvlášť dôležitým prvkom v celom systéme.
Pre všeobecné použitie je k dispozícii množstvo rôznych foriem zvukových kodekov alebo vokodérov a systém GSM podporuje množstvo špecifických zvukových kodekov.
Patria sem RPE-LPC, polovičná rýchlosť (half rate) a AMR kodeky.
Výkonnosť každého hlasového kodeka je iná a môže sa použiť za rôznych podmienok, aj keď kodek AMR je teraz najrozšírenejší.
Taktiež novší AMR-WB kodek sa zavádza do mnohých oblastí vrátane GSM.
Technológia hlasových kodekov v posledných rokoch pokročila v značných stupňoch vďaka zvyšujúcemu sa spracovateľskému výkonu.
To znamená, že hlasové kodeky používané v systéme GSM majú veľké vylepšenia od zavedenia prvých GSM telefónov.
Vokodér / základy kodeku
Vokodéry (Voice encoder) alebo kodeky reči sú používané v mnohých oblastiach hlasovej komunikácie.
Samozrejme, ohniskom záujmu sú zvukové kodeky alebo vokodéry GSM, ale rovnaké princípy sa vzťahujú aj na akúkoľvek formu kodeku.
Ak by bola reč digitalizovaná lineárne, bola by potrebná vysoká dátová rýchlosť, ktorá by zaberala veľmi širokú šírku pásma.
Keďže šírka pásma je bežne obmedzená v akomkoľvek komunikačnom systéme, je potrebné údaje komprimovať a odoslať cez dostupný kanál.
Len raz môže prejsť cez kanál, potom bude rozšírený na obnovený zvuk spôsobom, ktorý je čo najbližšie k originálnemu.
Aby sa vyhovelo požiadavkám systému kodekov, musí byť reč zachytená s dostatočne vysokou vzorkovacou frekvenciou a rozlíšením, aby sa umožnila jasná reprodukcia pôvodného zvuku.
Musí sa potom skomprimovať takým spôsobom, aby sa zachovala vernosť zvuku cez obmedzený prenosový kanál, ktorý je chybný.
Audio kodeky alebo vokodéry môžu využívať rôzne techniky, ale mnohé moderné zvukové kodeky používajú techniku známu ako lineárna predpoveď.
V mnohých ohľadoch to možno prirovnať k matematickému modelovaniu ľudského vokálneho orgánu.
Aby sa to dosiahlo, spektrálna obálka signálu sa odhaduje pomocou filtračnej techniky.
Dokonca aj tam, kde sa používajú signály s mnohými neharmonicky súvisiacimi signálmi, hlasové kodeky môžu poskytovať veľmi veľké úrovne kompresie.
{googleads left}
Na kodeky GSM sa používajú rôzne metódy kodekov:
- CELP: Kodek CELP alebo Code Excited Linear Prediction je vokodekový algoritmus, ktorý bol pôvodne navrhnutý v roku 1985 a výrazne sa zlepšil oproti ostatným hlasovým kodekom v tom čase.
Základný princíp kodéra CELP bol vyvinutý a použitý ako základ pre iné hlasové kodeky vrátane ACELP, RCELP, VSELP atď.
Ako taký je dnes metodológia kodekov CELP najpoužívanejším algoritmom kódovania reči.
Preto sa CELP teraz používa ako všeobecný pojem pre určitú triedu vokodérov alebo kodekov reči, a nie konkrétny kodek.
Hlavným princípom kodéra CELP je, že používa princíp známy ako “Analýza syntézou”.
V tomto procese sa kódovanie uskutočňuje perceptuálne optimalizáciou dekódovaného signálu v systéme uzavretej slučky.
Jedným zo spôsobov, ako sa to dá dosiahnuť, je porovnať rôzne generované toky bitov a vybrať ten, ktorý produkuje najlepší zvukový signál.
- Kodek ACELP: Kodek ACELP alebo Algebraic Code Excited Linear Prediction codec (Algebraický kód excitovaný lineárnou prognózou kodek).
Kodek ACELP alebo algoritmus vokodéra je vývojom modelu CELP.
Kodekové knižky kodekov ACELP však majú špecifickú algebraickú štruktúru, ako je naznačené menom. - VSELP kodek: Kodek VSELP alebo Vector Sum Excitation Linear Predictor (Vektorový súčet excitovaný lineárnou prognózou kodek).
Jedným z hlavných nedostatkov kodeku VSELP je jeho obmedzená schopnosť kódovať nereprodukčné zvuky.
To znamená, že v zlom stave za prítomnosti hluku.
Výsledkom toho je, že tento hlasový kodek nie je teraz tak široko používaný a že sú preferované iné novšie kodeky reči a ponúkajú oveľa lepší výkon.
Zvukové kodeky GSM / vokodéry
Podporuje sa množstvo zvukových kodekov/ vokodérov GSM.
Tieto boli zavedené v rôznych časoch a majú odlišné úrovne výkonu.
Aj keď niektoré skoré zvukové kodeky nie sú v dnešných dňoch tak široko používané, sú tu stále popísané, pretože tvoria súčasť GSM systému.
Kodek GSM Full Rate/ RPE-LPC
RPE-LPC alebo Regular Pulse Excited – Linear Predictive Code (normálny impulzom excitovaný – lineárne prediktívny kodér).
Táto forma hlasového kodeku bola prvým hlasovým kodekom používaným s GSM a vybrala sa po vykonaní testov na porovnanie s inými kodekovými schémami.
Kodek reči je založený na pravidelnom impulznom budení LPC s dlhodobou predikciou.
Základná schéma súvisí s dvomi predchádzajúcimi kodekmi reči, a to: RELP, Residual Excited Linear Prediction a MPE-LPC, Multi Pulse Excited LPC.
Výhody RELP sú relatívne nízka zložitosť vyplývajúca z použitia kódovania základného pásma, ale jeho výkon je obmedzený tónovým hlukom, ktorý systém vytvára.
MPE-LPC je komplexnejšia, ale poskytuje vyššiu úroveň výkonu.
Kodek RPE-LPC poskytol kompromis medzi týmito dvoma, vyrovnávacím výkonom a zložitosťou technológie tej doby.
Napriek práci, ktorá bola vykonaná s cieľom zabezpečiť optimálny výkon, keďže sa technológia ďalej rozvíjala, kodek RPE-LPC bol považovaný za produkt s nízkou úrovňou hlasovej kvality.
Ako boli k dispozícii ďalšie kodeky s plnou rýchlosťou, tieto boli začlenené do systému.
GSM EFR (Enhanced Full Rate codec)- rozšírený kodek Full Rate
Neskôr bol pridaný ďalší vokodér, nazvaný Vokodor Enhanced Full Rate (EFR), v reakcii na nekvalitnú kvalitu vnímanú používateľmi pôvodného kodéra RPE-LPC.
Tento nový kodek priniesol oveľa lepšiu kvalitu zvuku a bol prijatý GSM.
Použitím technológie kompresie ACELP došlo k významnému zlepšeniu kvality oproti pôvodnému kodéru LPC-RPE
Stalo sa to možné, pretože v mobilných telefónoch sa zvýšila výkonnosť, ktorá bola k dispozícii, v dôsledku vyššej úrovne spracovateľského výkonu v kombinácii s ich nižšou spotrebou prúdu.
Kodek Half Rate
Štandard GSM umožňuje rozdelenie jediného hlasového kanálu s plnou rýchlosťou na dva subkanály, ktoré môžu udržiavať oddelené hovory.
Týmto spôsobom môžu operátori siete zdvojnásobiť počet hlasových hovorov, ktoré môže sieť spravovať s veľmi malými dodatočnými investíciami.
Aby bolo možné použiť toto zariadenie, musí sa použiť polovičný kodek.
Polovičný kodek bol zavedený v prvých rokoch GSM, ale v porovnaní s inými kodekmi reči priniesol oveľa nižšiu kvalitu hlasu.
Napriek tomu prinieslo výhody, keď bol dopyt vysoký a sieťová kapacita bola vysoká.
Kodek GSM Half Rate používa algoritmus kodeku VSELP.
Kóduje údaje okolo rámcov s rozlíšením 20 ms, z ktorých každá má 112 bitov, aby získala dátovú rýchlosť 5,6 kbps.
Zahŕňa to dátovú rýchlosť 100 b/s pre indikátor režimu, ktorý podrobne opisuje, či sa systém domnieva, že rámce obsahujú hlasové údaje alebo nie.
To umožňuje, aby kodek reči fungoval spôsobom, ktorý poskytuje optimálnu kvalitu.
Kodekový systém Half Rate bol zavedený v deväťdesiatych rokoch, ale vzhľadom na vnímanú nekvalitnú kvalitu nebol široko používaný.
{googleads left}
Kodér GSM AMR
Kodek AMR, Adaptive Multi-Rate je teraz najpoužívanejším kodekom GSM.
Kodek AMR bol prijatý spoločnosťou 3GPP v októbri 1988 a používa sa pre obe GSM a okruhom prepínané hlasové volania UMTS/ WCDMA.
Kodek AMR poskytuje rôzne možnosti pre jednu z ôsmich rôznych bitových rýchlostí, ako je uvedené v nasledujúcej tabuľke.
Bitové rýchlosti sú založené na rámcoch, ktoré sú dlhé 20 milisekúnd a obsahujú 160 vzoriek.
Kodek AMR využíva na zabezpečenie kompresie dát rôzne techniky.
Kodek ACELP sa používa ako základ pre celkový kodek reči, ale okrem toho sa používajú aj iné techniky.
Prerušený prenos je použitý tak, že keď nie je žiadna rečová aktivita, nastane prerušenie prenosu.
Okrem toho sa používa funkcia detekcie hlasovej aktivity (VAD), ktorá indikuje, že je prítomný len šum v pozadí a žiadna reč.
Navýše k tomu, aby používateľovi poskytla spätnú väzbu, že pripojenie je stále prítomné, slúži komfortný generátor šumu (a Comfort Noise Generator – CNG).
Používa na zabezpečenie určitého šumu na pozadí, a to aj vtedy, keď nie sú prenášané žiadne údaje reči.
Toto sa pridáva lokálne na prijímači.
Použitie AMR kodeku tiež vyžaduje, aby sa optimalizované prispôsobenie spojenia používalo tak, že optimálna dátová rýchlosť bude zvolená tak, aby spĺňala požiadavky súčasných podmienok rádiového kanála vrátane jeho pomeru signálu k šumu a kapacity.
To sa dosiahne znížením kódovania zdroja a zvýšením kódovania kanálov.
Hoci dochádza k zníženiu jasu hlasu, sieťové pripojenie je robustnejšie a linka sa udržuje bez výpadku.
Môžu sa vyskytnúť úrovne zlepšenia od 4 do 6 dB.
Prevádzkovatelia sietí však môžu stanoviť prioritu každej stanice pre kvalitu alebo kapacitu.
Kodek AMR má celkovo osem frekvencií: osem je k dispozícii v plnej miere (FR), kým šesť je k dispozícii v polovičnej rýchlosti (HR).
Toto dáva celkom štrnásť rôznych režimov.
AMR kodek dátovej rýchlosti
Kodek AMR-WB
AMR-WB kodek (Adaptívne viacnásobné širokopásmové pripojenie (Adaptive Multi-Rate Wideband)), známy aj pod jeho označením ITU G.722.2, je založený na skoršom populárnom kodeku AMP, Adaptive Multi-Rate.
AMR-WB tiež používa základňu ACELP pre svoju prevádzku, ale tá bola ďalej rozvinutá a AMR-WB poskytuje zlepšenú kvalitu reči v dôsledku širšej šírky pásma, ktorú kóduje.
AMR-WB má šírku pásma od 50 – 7000 Hz, ktorá je výrazne širšia ako šírky pásma 300 – 3400 Hz, ktoré používajú štandardné telefóny.
To však stojí za cenu ďalšieho spracovania, ale s pokrokom v technológii IC v posledných rokoch je to úplne prijateľné.
Kodek AMR-WB obsahuje niekoľko funkčných oblastí: obsahuje predovšetkým sadu režimov rečovej rýchlosti a kanálového kodeku s pevnou rýchlosťou.
Zahŕňa aj ďalšie funkcie kodekov vrátane: detektora hlasovej aktivity (VAD- a Voice Activity Detector); Funkcia diskontinuálneho prenosu (DTX-Discontinuous Transmission functionality) pre GSM; a funkcia SCR (Source Controlled Rate functionality- zdrojovo riadená rýchlosť funkcie, Controlled Rate) pre aplikácie UMTS.
Ďalšia funkcia zahŕňa signalizáciu v pásme pre prenos kodekového režimu a adaptáciu prepojenia na riadenie výberu režimu.
Kodek AMR-WB má vzorkovaciu frekvenciu 16 kHz a kódovanie sa vykonáva v blokoch 20 ms.
Existujú dva frekvenčné pásma, ktoré sa používajú: 50- 6400 Hz a 6400- 7000 Hz.
Tieto sú kódované oddelene, aby sa znížila zložitosť kodekov.
Toto rozdelenie tiež slúži na zaostrenie priradenia bitov do subjektívne najdôležitejšieho frekvenčného rozsahu.
Nižšie kmitočtové pásmo používa algoritmus kodérov ACELP, aj keď boli pridané viaceré ďalšie funkcie na zlepšenie subjektívnej kvality zvuku.
Analýza lineárnych predpovedí sa vykoná raz za 20 ms rámec.
Tiež sa vyhľadávajú pevné a adaptačné kódové knihy budenia každých 5 ms pre optimálne hodnoty parametrov kodekov.
Vyššie frekvenčné pásmo pridáva k hlasu niektoré vlastnosti prirodzenosti a osobnosti.
Zvuk sa rekonštruuje pomocou parametrov z dolného pásma, ako aj pomocou náhodného budenia.
Keďže úroveň výkonu v tomto pásme je menšia ako úroveň nižšieho pásma, zisk sa upraví vzhľadom na spodný pás, ale na základe vyjadrenia informácií.
Obsah signálu vo vyššom pásme sa rekonštruuje použitím lineárneho prediktívneho filtra, ktorý generuje informácie z dolného pásma filtra.
Nie všetky telefóny vybavené zariadením AMR-WB budú mať prístup ku všetkým dátovým sadzbám – rôzne funkcie telefónu nemusia vyžadovať, aby boli všetci napríklad aktívni.
V dôsledku toho je potrebné informovať sieť o tom, aké sadzby sú k dispozícii, a tým zjednodušiť rokovanie medzi slúchadlom a sieťou.
Na dosiahnutie tohto cieľa sú k dispozícii tri odlišné konfigurácie AMR-WB:
Konfigurácia A: 6,6, 8,85 a 12,65 kbit/ s
Konfigurácia B: 6,6, 8,85, 12,65 a 15,85 kbit/ s
Konfigurácia C: 6,6, 8,85, 12,65 a 23,85 kbit/ s
Je zrejmé, že sa používajú iba režimy 23.85, 15.85, 12.65, 8.85 a 6.60 kbit/ s.
Na základe testov počúvania sa usúdilo, že týchto päť režimov bolo dostatočných pre vysokokvalitnú službu hlasovej telefónie.
Ostatné rýchlosti prenosu údajov boli zachované a môžu sa použiť na iné účely vrátane multimediálnych správ, streamovania zvuku atď.