Kako MP3 audio format smanjuje veličinu podataka?
1. Psihoakustični model: Ovo je jezgra kompresije MP3. Temelji se na tome kako ljudsko uho doživljava zvuk. Encoder analizira audio signal i identificira frekvencije i zvukove koji će vjerojatno biti maskirani glasnijim zvukovima ili su manje opaženi za naš sluh. Ove maskirane frekvencije tada se u potpunosti komprimiraju ili odbacuju u potpunosti. Na primjer, tihi visokofrekventni zvuk reproduciran istovremeno s glasnim niskofrekventnim zvukom možda je potpuno nečujan, pa se ukloni.
2. Frekvencijska transformacija: Audio signal se transformira iz vremenske domene (amplituda tijekom vremena) u frekvencijsku domenu (amplituda različitih frekvencija). To se obično radi pomoću modificirane diskretne kosinusne transformacije (MDCT). Ovaj prikaz omogućava lakšu identifikaciju i manipulaciju pojedinačnim frekvencijama.
3. Kvantizacija: Nakon analize frekvencije kvantiziraju se vrijednosti amplitude svake frekvencijske komponente. To znači da su zaokruženi na ograničeni broj vrijednosti. To uvodi određeni gubitak informacija, ali budući da su manje važne frekvencije identificirane i potencijalno uklonjene ili snažno komprimirane, zvučni utjecaj je minimiziran.
4. Huffman kodiranje: Konačno, kvantizirani podaci kodiraju se pomoću koda promjenjive duljine nazvane Huffman Coding. To dodjeljuje kraće kodove češćim podacima i duljim kodovima rjeđim podacima, što dovodi do daljnjeg smanjenja podataka.
U osnovi, mp3 iskorištava nesavršenosti i ograničenja ljudskog sluha kako bi značajno smanjio količinu podataka potrebnih za predstavljanje zvuka, a istovremeno ima za cilj održavanje prihvatljive kvalitete zvuka. Razina kompresije (a time i smanjenje veličine) može se prilagoditi, što rezultira različitim veličinama datoteka i različitim razinama kvalitete zvuka. Veći omjeri kompresije dovode do manjih datoteka, ali potencijalno vidljiviji artefakti ili gubitak vjernosti.