Uppgift 4c: Lågnivå-reprenseterat ljudformat

Lågnivå ljud

Ljudtyper

Det finns två typer av ljud som kan användas på webbsidor: ljudfiler och flödande ljud.

Fördelen med ljudfiler är att de är väldigt enkla. Hela filen laddas ner av användaragenten innan den börjar spela upp ljudet, dvs ljudet skickas till användarens dator som en komplett fil (allt på en gång). Nackdelen är att om ljudfilen är stor och användarens anslutning långsam, kan det ta lite tid innan användaren får höra något.

Flödande (stömmad) ljud är betydligt mer anvancerad. Fördelen är att om ljudfilen är stor behöver användaragenten endast ladda ner en del av ljudet innan man får höra den, dvs ljudet skickas till användarens dator i små segment (man kan börja lyssna medan mer innehåll "stömmar" till datorn).
För att man ska kunna höra strömmad ljud och se strömmade filmer så måste man installera något lämpligt instickningsprogram (plug-in program). En av de medst använda är Real Player, som kan hämtas hos företaget RealNetworks.

Ljudinsamling

Ljud är förändringar i lufttryck, som kan avbildas som vågor i analoga elektriska signaler. Ljud i datorn är digitalt, vilket innebär att ljudet avbildas med ettor och nollor i form av elektriska signaler och spänningar. För att kunna spela in ljud måste man omvandla analoga signaler till digitala, och för det behöver man en AD-omvandlare (Analog-Digital). Sådana sitter i datorernas ljudkort, och i cd-inspelningsutrustning.

Analog ljudvåg
Exempel på en analog ljudvåg

För att digitalisera ljud (läsa till datorn) måste man sampla. Det innebär att man utför mätningar av ljudvågens amplitud (höjden på den analoga ljudvågen) ett bestämt antal gånger per sekund. Antalet mätningar som görs per tidsenhet anger samplingsfrekvensen och anges i Hz. Ju tätare avläsning (sampling), desto bättre ljud, men också mer data att överföra.

Samplad ljudvåg
Bilden visar vågen under en millisekund. Med 8 samplingar blir samplingsfrekvensen 8kHz.

Efter samplingen måste varje mätvärde avrundas till närmaste kvantiseringsnivå. Ju fler nivåer desto större precision och därmed bättre ljud (mindre kvantiseringsfel), men också mer data att överföra, och fler beräkningar att göra.

Kvantisering
04324652
000100011010100110101010

Siffran under varje mätning anger det kvantiserade värdet (antal ifyllda ytor). Värdet anges både med vanliga siffror och med binära siffror. Varje sampling i bilden ovan motsvaras av tre bitar. Tre bitar räcker till åtta kvantiseringsnivåer. Normalt använder man åtta eller sexton bitar per sampling - detta motsvarar 28 = 256 respektive 216 = 65000 nivåer.
Raden med ettor och nollor är en digital representation av den samplade ljudvågen. Eftersom man kan göra digitaliseringen på olika sätt så är det inte självklart att alla ljudprogram kan tolka denna bitström. En grundförutsättning är att den som vill lyssna känner till om samplingsfrekvensen och antal bitar per sampling. I praktiken är det ytterligare några val som måste göras likadant vid inspelning som vid uppspelning för att det ska fungera.
Ur kvalitet synpunkt är bitdjupet viktigare än frekvensen. Ljudet kan lagras på disketter och hårddisk i magnetisk form eller på CD-skiva. För att kunna lyssna på ljudet måste det omvandlas från digital form till analog form i en DA-omvandlare (Digital-Analog). I vilken form dessa ettor och nollor paketeras varierar med olika system.

Bithastighet i förhållande till kompression

Tabellen nedan visar hur mycket kompression som en viss bithastighet kräver för stereoljud. Den vanligaste kompressionen för MP3 är 1:12. En wav-fil på 60 MB, ca 6 minuter musik i stereo, blir då efter kompression endast 5 MB stor.

KompressionBithastighet
1:1 (wave)1536
1:4384
1:6256
1:8192
1:12128
1:1696
1:2464
1:3248
1:4832
1:6424
1:9616
1:12812
1:1928

Ljudfiler

Denna .wav-fil startas automatiskt och hörs vid öppnande av denna sida.

Länk till en .aif-fil och en .au-fil som innehåller prat.

Nedan följer olika musik-filer inbäddade i <object>-elementet, samt separata länkar till samma ljudfiler:

.aif-fil

.au-fil

.mp3-fil

.wav-fil

länk till .rm-fil (strömmad)

Olika ljudformat

FILTYPER FÖR DIGITALT LJUD
SAMPLAT LJUD
NamnFiländelseKommentar
Sun/NeXT Audio.au
.snd
Utvecklades för Sun (.au) och NeXTstep arbetsstationer (.snd), och är tämligen vanligt på nätet. 8-bit, mono/stereo, linjär/ulaw/alaw-kodning, ett flertal kompressionsmetoder. Detta ljudformat använder sig av dators inbyggda ljudspelare så man behöver inte ha något extra program för att lyssna. Har ganska dålig ljudkvalitet, eftersom detta format använder bara 8 bitar för att beskriva ljudet (även kallad 8-bitars sampling).
MS Waveform.wav Även kallat RIFF WAVE. Standardformat i MS Windows, utvecklat av Microsoft och IBM. 8/16-bit, mono/stereo, linjär/ulaw/alaw-kodning, ett flertal kompressionsmetoder. Är det vanligaste ljudformatet för Windows och ljudfiler skapade med PC-datorer.
AIFF.aiff
.aif
(Audio Interchange File Format) Utvecklat av Apple och Silicon Graphics. 8/16 bit, mono/stereo. Vanligt för lagring av ljud med hög kvalitet (t.o.m. högre än CD). Är det vanligaste ljudformatet för Macintosh. Används främst på Mac men fungerar även för överföring av ljud mellan PC och Mac.
IFF/8SVX.iff Standardformat på Amiga. Endast 8 bits mono. Kompression 2:1 möjlig.
SoundBlaster VOC.voc Standardformat för Creative Voices SoundBlaster-ljudkort, vanliga i Intel-datorer. 8-bits mono (röstkvalitet).
Mac System Sound(.snd) Används för systemljud på Macintosh. Finns i en snarlik variant för HyperCard. 8/16 bit, mono. Samma kompression som AIFF-C. Ibland ges dessa filer namntillägget .snd, vilket förvirrande nog är samma som för Sun ulaw-ljud!
QuickTime Audio.moov
.mov
.qt
Videoformatet QuickTime har ett eget ljudformat. Det går att spara en QT-fil med enbart ljud-komponent.
MPEG Layer 2 Audio.mp2 Videoformatet MPEG har eget ljudformat. Det går att spara en MPEG-fil med enbart ljud-komponent. Mono/stereo. Endast 33, 44.1, 48 kHz. Mycket god kompression, upp till 10:1. Ljudkvaliteten sjunker dock vid ökad kompressionsgrad.
MPEG Layer 3 Audio.mp3 Ett ljudformat som används för att komprimera musik med bibehållen hög kvalité. MPEG 1 Layer 3, ger komrimering upp till ca 12 gånger utan att märkbart försämra ljudkvalitet. Vidareutveckling av MPEG Audio med mycket god ljudkvalitet trots hård komprimering. Mest känt som ljudformat, men kan faktiskt också visa bilder. Med MP3 - formatet kan man få lika bra ljud som på en vanlig musik-CD. För att lyssna på MP3-filer måste man hämta hem en speciell MP3-spelare från Internet. Den vanligaste heter Winamp och är gratis.
STREAMING
NamnFiländelseKommentar
RealAudio.ra
.ram
.rmp
Den mest spridda streaming-tekniken, från Real Networks (tidigare Progressive Networks). Komprimerat ljudformat anpassat för "streamad" överföring av ljud via nätverk. Sampling vid 22 kHz, 16 bit. Teknikerna RealAudio och RealVideo har fogats samman, och användaren behöver inte längre separata spelare (t.ex RealAudio Player för ljud) utan enbart Real Player. Användaren måste ha programmet Real Player installerat. Real Player finns gratis att hämta på Internet. Ljudfiler i real audio-format laddas till datorn medan man lyssnar. Det gör att det går fortare och det går att skicka ljud i direktsändning.
Streamworks.xdm Ett ljudformat från Xing Technologies.
Shockwave Audio.dcr
.swa
Ett ljudformat från Macromedia. Ljudkomponenten i multimedia-tekniken Shockwave.
Internet Wave.vmd
.vmf
Ett ljudformat från Vocaltec, som också producerar ljudchaten Internet Phone.
Toolvox.vox Ett ljudformat från Voxware. Optimerat för tal. Sampling vid 8 kHz, komprimering 53:1.
Truespeech.tsp Ett ljudformat från DSP Group. Optimerat för tal.
Echospeech.vox Ett ljudformat från Echospeech. Optimerat för tal. Sampling vid 11 kHz, komprimering 18,5:1.
MIDI-LJUD
NamnFiländelseKommentar
MIDI.mid
.midi
(Musical Instrument Digital Interface) Bygger på att man skiljer beskrivningen av musikinstrumentens klangfärg från beskrivningen av vilket instrument som ska spela vilka toner, i vilken ordningsföljd och längd. Musikinstrumentens individuella toner genereras hos den som spelar upp ljudet m.h.a en synthesizer. Ljudformatet lagrar noter istället för ljud, som datorn senare kan spela upp. Detta ljudformat kräver minimalt med utrymme, eftersom MIDI-filer är oftast extremt små. Bra till melodier.
MOD.mod
.s3m
.xm
(Module) Skiljer sig från MIDI i att MOD-filer också innehåller informationen om de samplade ljuden. Filerna blir därför större än rena MIDI-filer.
Bildlänk Bildlänk Bildlänk
.wav-fil (660 kB) .rm-fil (128 kB) .mid-fil (38 kB)

Valid CSS! Valid XHTML 1.1! Valid CSS!