Geluid of audio is simpelweg het vibreren van lucht zoals een ieder wel op school heeft geleerd. Deze vibraties worden weer opgevangen door de botjes in onze oren waarna het geregistreerd word door onze hersenen als geluid.
Snelle vibraties worden geregistreerd als hoge frequenties, en langzame vibraties als lage frequenties (golflengte.) Deze vibraties worden ook wel pitch genoemd. Daarnaast heb je nog de kracht/sterkte van het geluid, hoe krachtiger hoe harder we het geluid ervaren(Amplitude.)
Deze vibraties kunnen we laten zien in een geluidsgolf of waveform:
De amplitude van het geluid word weergegeven op de vertikale Y-as en de golflengte op de horizontale X-as. Dit voorbeeld laat een duidelijke solide golf zien zoals van een stem vork.
Een hoger geluid zal meer pieken en dalen laten zien in eenzelfde tijdsduur. Een zachter geluid zal een lagere hoogte van de piek laten zien.
Digitaal audio.
Terwijl het oor in principe het geluid voor ons opneemt en daarbij de amplitude en golflengte oneindig zijn, zal er bij het digitaliseren van geluid apparatuur moeten zijn die deze functie overneemt. Vroeger werd dat voornamelijk op tape gedaan, echter tegenwoordig gebeurd dit al meer in digitale vorm.
Bij het digitaliseren van geluid zal de amplitude van het geluid eerst omgezet worden in voltage verschillen. Deze voltage verschillen dienen op hun beurt weer omgezet worden in binaire waardes waarmee een computer kan werken.
In principe krijg je wederom een zelfde golfvorm als hierboven, echter de Y-as zal deze verschillende voltages bevatten. Wanneer geluid word gedigitaliseerd, zal de golf gereconstrueerd worden door de verschillende voltages te meten en deze waardes op te slaan in binaire computer waardes. Een computer kan immers niet werken met oneindige 'analoge' voltageverschillen, dus zal het omgezet dienen te worden in voor de computer 'begrijpbare' taal, in dit geval binaire ééntjes en nulletjes.
Audio voor computers heeft twee eigenschappen:
Bitrate en Samplerate. De meest gebruikte op dit moment is 16Bit/44Khz, voornamelijk voor CD's. 16Bit is de bitrate en 44Khz de samplerate.
Het aantal bits is het makkelijkst te begrijpen als we het vergelijken met video. De video instellingen van een computerscherm kunnen op verschillende bitwaardes ingesteld worden. Hoe hoger deze bitwaarde, des te meer kleuren je verkrijgt op je scherm. Met audio is het ongeveer hetzelfde, hoe hoger de bitwaarde, des te meer voltageniveaus er gemeten kunnen worden om uiteindelijk te samplen:
Video 8bits=256 kleuren, Audio 8bits=256 voltages welke er gesampled kunnen worden.
Hiervoor kan je een simpel rekensommetje gebruiken door 2 tot de macht (aantal bits) te nemen. 2 is, vanwege het binaire stelsel welke tweetallig is, in dit geval het grondtal en het aantal bits de exponent.
2^8 = 256
Indien we naar 16 bits gaan krijgen we 2^16 = 65536 verschillende voltageniveaus. Dit scheelt nogal met 8 bits.
Onderstaand een visualisatie van de bitrate bij een golfvorm:
Je begrijpt dat bij een hogere bitrate de golfvorm gladder zal worden en meer richting de originele analoge golfvorm, echter oneindig zoals de originele analoge golf zal het nimmer kunnen worden maar dat is tot op een bepaalde hoogte ook niet meer nodig. Momenteel zijn er computers die een 24 bits bitrate aankunnen oftewel 2^24 = 16777216 voltageniveaus! Je zal hierbij de waveform sterk moeten uitvergroten om dit nog te kunnen zien. Computer beeldschermen werken al enige tijd met deze 24 bits ofwel ruim 16 miljoen kleuren. Tegenwoordig is 32 Bits ook al standaard aanwezig op een computer voor het beeldscherm. Maar goed, terug naar het digitaliseren van geluid.
Niet alleen heeft men bij het digitaliseren van geluid de Bitrate nodig, maar tevens de samplerate ook wel bemonsteringsfrequentie genoemd. Bij de samplerate word de golfvorm in brokken 'gehakt' zoals hieronder aangegeven:
De samplerate word aangegeven in Khz. Een audio CD is altijd opgenomen op 16/44.1 ofwel 16 Bits, 44.1Khz samplerate.
Samplerate ie het aantal keer per seconde dat een stukje audio word gesampled of een binair nummer word gegeven. In dit geval 44.100 keer per seconde. Dat lijkt veel maar is in vergelijking met captured video nog maar weinig.
Volgens de stelling van Nyquist kunnen er bij een bemonsteringsfrequentie van 44.100hz geen hogere frequenties opgenomen worden dan 22.050hz. Aangezien ons gehoor maximaal tot 20.000hz kan horen, waarvan het gemiddelde iets lager ligt, denken velen dat men met 22.050hz genoeg heeft. Dit is echter niet geheel waar daar er instrumenten zijn die frequenties genereren met vele harmonische welke vele malen hoger liggen dan die 22.050hz.
Harmonische, grond en boventonen.
Een Harmonische is de term waarmee in signaalanalyse gehele veelvouden van een frequentiecomponent (grondtoon) worden aangeduid. Ieder periodiek en harmonisch (zuiver) geluid bestaat uit een grondtoon en een aantal boventonen. De grondtoon wordt de 1e harmonische genoemd en bepaalt wat de frequentie van de gehele toon is. De frequentie van de tweede harmonische (eerste boventoon) is 2 keer groter dan die van de grondtoon en die van de derde harmonische is 3 keer groter dan de grondtoon, etc.
Een boventoon is een geluidscomponent waarvan de frequentie hoger ligt dan de door het oor waargenomen grondtoon van dat geluid. Voor het oor zijn het vooral de relatieve sterktes van de boventonen en de verhouding tot de grondtoon die een instrument bij lange tonen het karakteristieke timbre geven. De aanzet van een toon is van belang aangezien je daarmee het instrument direct herkent.
Bij vrijwel alle muziekinstrumenten spelen boventonen een zeer belangrijke rol. Er kunnen boventonen wegvallen bij een samplerate van 44.100hz aangezien het maximale frequentiebereik hiervan maar 22.050hz is. Dit is waarom mensen bepaalde instrumenten op een CD opname koud en kil vinden klinken. Het heeft niet de warmte van het instrument zelf.
Bij het digitaliseren van geluid op 44.1Khz bestaat er niet zoiets als 22.051Hz. Alles boven de 22.050 is simpelweg niet aanwezig, ook niet een beetje. Dit is weer de makke van digitaal, het is er of het is er niet. Geen middenweg. In vergelijking: een analoog tv of radio signaal zal ruis of sneeuw veroorzaken indien je net buiten het bereik valt. Bij een digitaal signaal stopt het simpelweg, of ingeval van televisie zie je opeens allerlei blokjes die 'vastlopen'.
Er bestaan tegenwoordig computers en opname apparaten (Digital Audio Workstations, D.A.W's) welke samplerates van 96Khz kunnen hanteren. Dit zal, volgens diezelfde stelling van Nyquist, resulteren in een frequentie van ten hoogste 48.000 hz. Je begrijpt dat men daarmee een groot aantal boventonen kan meenemen in de opname waardoor het originele analoge geluid alleen maar nog meer word benaderd. Indien je dit in combinatie doet met een bitrate van 24bits, zal dit het uiteindelijke resutaat alleen maar sterk verbeteren t.o.v CD kwaliteit.
Oftewel 16777216 voltageniveaus / 96000 keer per seconde.
Aangezien een hogere bit en samplerate veel meer opslag vergt op een D.A.W. en meer rekenkracht van de computer, is het zaak van te voren te bepalen WAT je op wilt nemen. Bij wat minder ideale instrumenten (bijvoorbeeld een klokkenspel of een pauk, maar ook de laagste snaren van een piano) zijn boventonen niet harmonisch.
Dynamisch bereik.
Ook belangrijk bij de bitrate is dat het dynamisch bereik sterk vergroot word naarmate de bitrate hoger is. Het dynamische bereik is , ingeval van een menselijke stem, het verschil tussen fluisteren en schreeuwen.
Ter vergelijking: een cassette tape had een dynamisch bereik van gemiddeld tussen 40 en 70Db. Een 16bit (CD) opname heeft een dynamisch bereik van +/-96Db en een opname op 24Bits niveau heeft een bereik van +/-130db. Nogal een verschil!
| Advertenties | Zoeken | Categorieën | Te volgen advertenties | Mijn advertenties |


