Digitaalne heli

Digitaalne heli saadakse pidevast audiosignaalist selle analoog-digitaalmuundamise teel. Enamasti kasutatakse selleks impulsskoodmodulatsiooni (PCM).

Digitaalne heli on järk-järgult asendanud analoogheli mitmetes helivaldkondades, sh heli salvestamine, tootmine, telekommunikatsioon ja helitehnika. Mikrofon teisendab heli analoogsignaaliks ning seejärel teisendatakse analoogsignaal analoog-digitaalmuunduri (ADC) abil digitaalsignaaliks. Enamasti kasutatakse selleks impulss-koodmodulatsiooni (PCM). Seda digitaalset signaali on seejärel võimalik digitaalseid helitöötlusprogramme kasutades lindistada, töödelda ja muuta.

Kui helitehnik soovib lindistust kuulata kõlaritest või kõrvaklappidest (või kui tarbija soovib kuulata muusikat digitaalsel kujul), siis tehakse läbi vastupidine protsess digitaal-analoogmuunduri abil, kus teisendatakse digitaalsignaal tagasi analoogsignaaliks, mida võimendatakse ja saadetakse kõlaritesse.

Digitaalsed helisüsteemid võimaldavad andmeid pakkida, salvestada, töödelda ja üle kanda.

Digitaalsele kujule teisendamine võimaldab helisignaali mugavat muutmist, salvestamist, edastamist ja vastuvõtmist.

Analoogheli kopeerimisega käib kaasas signaali kvaliteedi langus, kuid digitaalheli on võimalik lõputult ilma signaali kvaliteedi languseta kopeerida.

Ülevaade

Digitaalset helitehnoloogiat kasutatakse tänapäeval heli, sh muusika, raadiosaadete, heliefektide ja muu lindistamiseks, töötlemiseks, masstootmiseks, levitamiseks ja salvestamiseks. Kaasaegne internetipõhine muusika levitamine toimib digitaalsalvestiste ja andmete pakkimise põhjal.

Muusika kättesaadavus failidena on märkimisväärselt vähendanud muusika levitamise kulusid. Enne digitaalset heli levitati ja müüdi muusikat füüsilisel kujul, kassettide ja plaatide näol.

Tänu digitaalsele helile ja võrgus levitamise süsteemidele nagu iTunes, müüvad ettevõtted tarbijatele digitaalseid helifaile, mis saadakse kätte interneti vahendusel. Digitaalse heli interneti vahendusel levitamine on palju odavam kui füüsilise koopia salvestamine, pakendamine ja poodidesse saatmine^[1].

Analoog helisüsteem salvestab helisid ja kujutab nende laineid elektriliselt, kasutades selleks muundurit, näiteks mikrofoni. Seejärel heli kas salvestatakse, nagu ka füüsilisel kujul, või edastatakse. Heli mängimise jaoks on protsess vastupidine: signaali võimendatakse ja siis teisendatakse tagasi füüsilisteks laineteks valjuhääldi kaudu.

Analoogheli säilitab oma laineomadused kogu salvestamise, muundamise, kopeerimise ja võimendamise käigus. Analoogheli on elektriskeemide ja sellega seotud seadmete omaduste tõttu müratundlik.

Digitaalse süsteemi häired ei lõppe märgatava veana, välja arvatud juhul, kui häire on nii suur, et sümbolit loetakse mingi teise sümbolina, või sümbolite järjekorda häiritakse. Seetõttu on üldiselt võimalik täiesti veatu digitaalne helisüsteem, kus ei esine heli teisendamisel müra ega moonutusi.

Digitaalset helisignaali on võimalik kodeerida, parandamaks vigu, mis võivad tekkida signaali salvestamisel või edastamisel, kuid see ei ole otseselt digitaalse heli tekitamise protsessi osa. Seda tehnikat nimetatakse "kanalikodeerimiseks" ning see on hädavajalik bittide täpsuse säilitamiseks digitaalse heli salvestamisel.

Ajalugu

Impulss-koodmodulatsioon leiutati umbes 80 aastat tagasi^[2], kui Alec Reeves, töötades ITT (International Telephone and Telegraph) heaks tegi ettepaneku, et selle asemel, et esitada heli sujuvalt muutuva elektrisignaalina (originaalheli "analoogina"), oleks võimalik võtta pingest perioodilisi hetkväärtusi ja salvestada neid kui binaarnumbrite jada. Reeves mõistis, et neid hetkväärtusi oleks võimalik ainult teatud täpsusega mõõta, kuid ta arvas, et mõõtevigade amplituudid oleksid vähem märgatavad kui analoogsignaali puhul elektrimüra ja tolleaegsete seadmete kvaliteedi poolt tekitatavad vead.

Mida Reeves ei kaalunud (ja mille jaoks puudusid katsetamismeetodid) oli see, et kas need väiksemad vead oleks rohkem või vähem häirivad, kui suhteliselt healoomuline sahin, mis käis kaasas analoogsignaaliga. Sellest hoolimata oli tema ideede ulatus muljetavaldav ja kui ta need 1937. aastal patenteeris, siis ta väitis, et kui hetkväärtuste peal ei rakendata ühtegi matemaatilist tehet, siis sõltub digitiseeritud heli kvaliteet vaid kasutatavatest A-D ja D-A muunduritest. See oli sel ajal väga julge väide, kuid on osutunud õigeks.

Reevesi ideed põhinesid, oli ta sellest teadlik või mitte, tublisti suhteliselt uuel matemaatika harul, milleks oli diskreetajastusega signaali töötlus, mille kõige olulisemaks väljundiks on diskreetimisteoreem. Diskreetimisteoreem püstitati esmaselt juba 1915. aastal ning väidab, et kui signaal ei sisalda kõrgemaid sagedusi kui "B" (ribalaius), siis on võimalik seda signaali täielikult kindlaks teha regulaarsete vahedega diskreetide abil, juhul, kui diskreetimissagedus on kõrgem kui 2 × B. See tähendab, et kui on tarvis diskreetida helisignaali, mille kõrgeim sagedus on 20 kHz, siis on mis tahes sagedus üle 40 kHz selle jaoks piisav.

Siis, kui Reeves oma ideed patenteeris, ei olnud võimalik diskreete piisavalt kiiresti salvestada, et katta ära kogu inimeste kuuldavate sageduste vahemikku, milleks peetakse üldiselt 20 Hz - 20 kHz. See muutus aastal 1947, kui leiutati transistor. Kuigi esimesed transistorid olid liiga aeglased, siis veerand sajandit tehnoloogilist arengut viisid transistorid kiirusteni, millega olid võimalikud digitaalsed heliseadmed.

Esimene kaubanduslik digitaalne diktofon, Soundstream, ilmus 1975. aastal ja kasutas kahte seadet, et lindistada: PCM konverterit, mis diskreetis sisendsignaali ja seejärel muundas numbrid video tüüpi signaaliks ning videosalvesti piisava ribalaiusega (üle 1 MHz), mis oli vajalik nende andmete salvestamiseks.

Digitaalseks diskreetimine

Kõik helid, mida me kuuleme, on õhus liikuvad rõhulained. Alates Thomas Edisoni tutvustatud esimesest fonograafist 1877. aastal, on võimalik neid rõhulaineid jäädvustada füüsilisel kandjal ning seejärel neid taasluua, neid samu rõhulaineid hiljem uuesti genereerides.

Pilt 1. Helilaine (punane) esitatud digitaalselt (sinine)

Analoogsalvestusseadmed nagu fonograaf kujutavad lainekuju otse, kasutades soone sügavust plaadil või magneetumuse ulatust lindi puhul. Analoogsalvestised suudavad taastekitada märkimisväärseid erinevaid helisid, kuid ta kannatab ka müraprobleemide all. Iga kord, kui analoogsalvestist kopeeritakse, tekib sinna rohkem müra, mis vähendab salvestise kvaliteeti. Seda müra saab vähendada, kuid mitte täielikult kõrvaldada.

Digitaalsalvestus toimib erinevalt: lainekujust võetakse perioodiliselt hetkväärtused, millele seatakse vastavusse täpsed arvud. Digitaalsalvestiste kvaliteet, olgu need kompaktkettal (CD), digitaalhelikassetil (DAT) või arvutis, ei lange aja jooksul ning neid salvestisi on võimalik täiuslikult kopeerida, ilma kopeerimise käigus uut müra tekitamata.

Lisaks on võimalik digitaalheli korral kasutada mitmeid digitaalseid efekte, näiteks simuleerida kaja, tuua esile teatud sagedusi või muuta helikõrgust.

Digitaalse heli kvaliteet

Digitaalse helisalvestise kvaliteet sõltub suuresti kahest tegurist: diskreetimissagedusest ja bitisügavusest. Diskreetimissageduse suurendamine parandab salvestise kvaliteeti, kuid suurendab ühtlasi kasutatavat andmemahtu.

Diskreetimissagedused

Diskreetimissagedusi mõõdetakse hertsides (Hz), või tsüklites sekundis. See väärtus tähistab lainekuju esitamisel sekundis talletatud hetkväärtuste arvu. Kõrgemad diskreetimissagedused võimaldavad esitada kõrgemaid helisagedusi. Tingimusel, et diskreetimissagedus on enam kui kaks korda suurem kõrgeimast helisagedusest, on võimalik lainekuju digitaalsete diskreetide põhjal täpselt taastada.

Sagedusi, mis on alla poole diskreetimissageduse ei ole võimalik digitaalselt diskreetidena täpselt esitada. Sellised sagedused tuleb olemasolu korral enne heli digitaalseks teisendamist eemaldada. "Pool diskreetimissagedust" kujutab endast seega ülempiiri, mida nimetatakse Nyquisti sageduseks ja analoog lainekuju sagedus peab olema täielikult allpool seda piiri, et seda oleks võimalik korrektselt digitaalselt esitada. Analoogsignaalid, mille sagedused on selle piiriga võrdsed või kõrgemad, ei ole diskreetides esitatavad ning tekitavad moonutust, mida nimetatakse sakilisuseks.

Inimkõrv on tundlik helidele vahemikus umbes 20 – 20 000 Hz. Helid väljaspool neid piire ei ole kuuldavad. Seetõttu on diskreetimissagedus 40 000 Hz absoluutne miinimum, esitamaks kõiki inimesele kuuldavaid helisid. Kõrgemaid sagedusi kasutatakse tavaliselt Nyquisti sageduse ümber tekkiva sakilisuse filtreerimiseks. Seda nimetatakse ülediskreetimiseks.

Heli kandvad CD-plaadid kasutavad diskreetimissagedust 44 100 Hz. Inimkõne on arusaadav isegi siis, kui kõik sagedused üle 4000 Hz eemaldada. Telefonid edastavad ainult sagedusi vahemikus 200–4000 Hz. Seetõttu on levinud diskreetimissageduseks 8000 Hz, mida nimetatakse vahepeal kõnekvaliteediks. Tasub märkimist, et Nyquisti sagedusel on tarvis väga järsku filtreerimist, et signaale sellest piirist kõrgemal ei teisendataks tagasi kuuldavale sagedusele ja ei tekiks sakilisusest tulenevaid moonutusi.

Kõige tavalisemateks diskreetimissagedusteks hertsides on 8000, 16 000, 22 050, 44 100, 48 000, 96 000 ja 192 000. Diskreetimissagedustest räägitakse ka kilohertsides. Niisiis ühikutes kHz on levinumad sagedused 8 kHz, 16 kHz, 22,05 kHz, 44,1 kHz, 48 kHz, 96 kHz ja 192 kHz.

Kõige levinum diskreetimissagedus on 44100 Hz.

Paremal oleval joonisel (Pilt 2) on vasakul madal diskreetimissagedus ja paremal kõrge diskreetimissagedus (st suure eraldusvõimega):

Bitisügavus

Teine helikvaliteedi mõõdis on bitisügavus, mida mõõdetakse tavaliselt ühe diskreedi kujutamiseks kasutatavate arvutibittide arvuna. Mida rohkem bitte diskreedi kohta, seda täpsem on iga diskreedi esitus. Bittide arvu suurendamine suurendab ühtlasi lindistuse dünaamilist diapasooni, ehk teisisõnu, kõige valjema ja vaiksema helitugevuse suhet.

Dünaamilist diapasooni mõõdetakse detsibellides. Inimkõrv tajub helisid, mille dünaamiline diapasoon on vähemalt 90 dB, kuid kui vähegi võimalik, siis on hea mõte salvestada digitaalset heli dünaamilise diapasooniga, mis on palju suurem kui 90 dB, et oleks võimalik liiga vaikseid helisid võimendada. Tasub märkimist, et kuigi üldiselt on võimalik madalatel helitugevustel salvestatud signaale kogu olemasoleva dünaamilise diapasooni ära kasutamiseks võimendada, ei kasutata madalate signaalide salvestamisel ära kogu saadavat bitisügavust. Seda resolutsiooni kaotust ei ole võimalik lihtsalt digitaalse lainekuju normaliseerimisega tasa teha.

Levinud bitisügavused ja nende vastavad dünaamilised diapasoonid:

8-bitine täisarv: 48 dB

16-bitine täisarv: 96 dB

24-bitine täisarv: 145 dB

32-bitine ujukomaarv: praktiliselt lõpmatu dB

Tasub märkimist, et riistvara ja sisend-väljundmuundurite suutlikkuse tõttu on dünaamilisel diapasoonil praktilised piirangud. Nende tõttu on 16-bitise sügavuse korral on praktiline piir pigem 90 dB kandis. Mõned vormingud, nagu näiteks ADPCM, kasutavad kokkusurutud 4-bitiseid diskreete, imiteerimaks 16-bitist heli. Audio-CD plaadid ja enamik helivorminguid kasutab 16-bitiseid täisarve. Kõrval oleval pildil (Pilt 3) vasakul pool on väikese bitisügavusega vorming ja paremal on vorming rohkemate bittidega. Kui mõelda diskreetimissagedusest kui vahest vertikaalsete joonte vahel graafikul, siis bitisügavus on vahe horisontaalsete joonte vahel.

Maksimumide kärpimine

Üheks digitaalse heli piiranguks on, et see ei suuda käsitleda helilaineid, mis ületavad ülempiirid, millega töötamiseks on antud helivorming mõeldud. Kui lindistatakse signaal, mis ületab maksimumväärtust, siis diskreedid väljaspool ülem- või alampiire kärbitakse vastava piirväärtuseni, nagu on näidatud paremal oleva pildi peal (Pilt 4).

Nõnda kärbitud heli kõlab moonutatult ja rohmakalt. Kuigi on olemas mõned meetodid, mis suudavad kõrvaldada osa kärpimisest tekkinud müra, on alati eelistatav kärpimist lindistamise ajal vältida.

Helifailide maht

Helifailid on väga suured. Pakkimata helifaili suuruse määramiseks tuleb korrutada diskreetimissagedus (nt 44 100 Hz) bitisügavusega (nt 16 bitti), audiokanalite arvuga (stereo puhul 2) ja sekundite arvuga. Täielikult täis kirjutatud 74 minutiline stereo audio CD kasutab üle 6 miljardi biti. Jagades selle arvu kaheksaga, jõuame baitide arvuni. Audio CD plaat mahutab natuke alla 800 megabaidi (MB).

Tihendatud heli

Kuna digitaalsed helifailid on nii suured, kasutati tüüpiliselt kus vähegi võimalik vähendatud diskreetimissagedusega helifaile. See muutus aastal 1991, kui tuli välja MP3 (MPEG I, layer 3) standard. MP3 on kadudega pakkimismeetod, mis võib oluliselt vähendada helifaili mahtu üllatavalt väikese mõjuga heli kvaliteedile. Üks sekund CD-kvaliteediga heli võtab enda alla 1,4 megabitti, samas kui levinud bitikiirus MP3 failide jaoks on 128 kbit/s, mis on üle 10x väiksem! MP3 "viskab ära" lainekuju puudutavaid detaile, millele inimesed ei ole eriti tundlikud. Kõik MP3-failid ei ole samasugused; erinevad psühhoakustilised mudelid inimestest viivad erinevate tajutavate moondusteni.

Heade kõlaritega suudab enamik inimesi teha vahet 128 kbit/s MP3-vormingul ja tihendamata CD kvaliteediga helifailil. 256 kbit/s ja 320 kbit/s MP3-failid on populaarsemad audiofiilide seas, kes soovivad kõrgemat helikvaliteeti.

Tihendatud kadudega helivorminguid on teisigi. Näiteks Ogg Vorbise vorming, mis sarnaneb MP3-vorminguga, kuid on täiesti patendivaba standard. Aegamisi on Ogg Vorbise vormingu kvaliteet MP3 kvaliteedi ületanud ning vorming ise on paindlikum, mis tähendab, et seda on võimalik veelgi parendada. OGG Vorbis on suurepärane valik oma heli jaoks, aga reaalsus on see, et paljud seadmed nagu iPodid ja muud kaasaskantavad helimängijad toetavad MP3-vormingut, kuid mitte Ogg Vorbist.

Teiste tuntud pakkimismeetodite hulka kuuluvad Sony MiniDisc salvestite kasutatav ATRAC, Windows Media Audio (WMA) ja AAC.

Kadudeta tihendus

Kadudeta tihendus vähendab faili mahtu ilma kvaliteeti kaotamata. Seda näiliselt maagilist meetodit failimahu vähendamiseks on võimalik rakendada ka helifailidele. Kui MP3 kasutab kadudega pakkimist, siis on uuemad pakkimisalgoritmid nagu näiteks FLAC ja Apple Lossless compression suutelised looma kadudeta tihendatud helifaile.

Selline pakkimine põhimõtteliselt kirjutab algse faili andmed efektiivsemalt ümber. Kuid kuna kvaliteet ei lange on nende meetoditega pakitud helifailid tüüpiliselt palju suuremad kui helifailid, mida on pakitud kadudega pakkimisega. Näiteks kadudega tihendatud helifail võib olla originaalist 10x väiksem, samas kui kadudeta tihendamisel on ebatõenäoline saavutada originaalfailist enam kui poole väiksem fail.

Kadudeta helivorminguid kasutatakse enamasti kas tootmiseks või arhiveerimiseks, samas kui väiksemaid kadudega helifaile kasutatakse tavaliselt kaasaskantavates mängijates, kus on salvestusruum piiratud või on ebavajalik heli täpselt esitada.^[3]

Vaata ka

Viited

↑ Janssens, Jelle; Stijn Vandaele; Tom Vander Beken (2009). "The Music Industry on (the) Line? Surviving Music Piracy in a Digital Era". European Journal of Crime. 77 (96).
↑ Gordon Reid. "The Digital Myth".
↑ "Digital Audio Fundamentals".

[1] Janssens, Jelle; Stijn Vandaele; Tom Vander Beken (2009). "The Music Industry on (the) Line? Surviving Music Piracy in a Digital Era". European Journal of Crime. 77 (96).

[2] Gordon Reid. "The Digital Myth".

[3] "Digital Audio Fundamentals".

[1]

[2]

[3]