Sažimanje podataka
Sažimanje podataka[1] u računarstvu (još i stlačivanje podataka, kompresija podataka[2]) je proces smanjivanja potrebnog fizičkog prostora za pohranu podataka kroz korištenje određenih metoda za zabilježavanje podataka. Osnovna jedinica obrade je datoteka i ovisno o tipu datoteke unutar datoteke se pojavljuju određena ponavljanja koja je moguće na medij za pohranu zapisati samo jednom i onda samo zabilježiti gdje se ponavljanje još javlja. Na taj način moguće je znatno smanjiti potreban prostor za pohranu što ovisi o strukturi i vrsti datoteke. Dobitak u prostoru je najmanji kod sažimanja zvučno-slikovnih datoteka jer zvuk i pokretne slike su vrlo kaotične prirode i klasične metode sažimanja podataka (sažimanje bez gubitka informacija) ovdje ne funkcioniraju, te se koriste metode u kojima se tolerira određena količina gubitka izvornih podataka.
Postoje dva osnovna načina sažimanja: s gubitcima i bez gubitaka. Prvi obično rezultira manjom datotekom, ali i sadržajem manje kvalitete, što ga čini idealnim za multimediju, a drugi nema gubitaka informacija, ali je i datoteka veća. Taj se način obično koristi kod kompresiranja ne-multimedijalnih podataka (npr. binarnih datoteka, tekstualnih i ostalih vrsta). Pri tome se služimo pomoćnim programima.
Kad sažimamo podatke tipa pisanih dokumenata gubitci nisu dozvoljeni, no s druge strane, obično je omjer sažimanja takvih datoteka vrlo dobar (2-10 puta), tako da pisane dokumente sažimamo samo bez gubitaka. Najpoznatiji formati su:
Ono što često ostaje iza zavjese jest da većina programa za sažimanje podržava više metoda sažimanja, od spremanja datoteka u nesažetom obliku (arhiviranje), do sažimanja različitim algoritmima s različitim brzinama i omjerima sažimanja. Tako su zip i rar datoteke obično sažete Deflate algoritmom, izvedenicom Lempel-Ziv LZ77 algoritma koji je nastao 1977. godine. S druge strane bzip2 se oslanja na svoju varijantu Burrows-Wheeler transformacije.
Sažimanje bez gubitaka:
Sažimanje s gubitcima:
Kod sažimanja audio zapisa omjer je obično vrlo loš (maksimalno 2), te za njihovo sažimanje postoje algoritmi sažimanja bez gubitaka:
i algoritmi sažimanja s gubitcima:
Formati:
Algoritmi:
Dijeljenu biblioteku (ili biblioteke - *.so ili *.dll) koje implementiraju određeni algoritam sažimanja audio ili video zapisa zovemo codec.
- ↑ Geodetski fakultet u Zagrebu Miljenko Lapaine, Nada Vučetić, Ana Kuveždić Divjak, Martina Triplat Horvat: Hrvatski jezik u geodeziji i geoinformatici, 2. prosinca 2011.
- ↑ Kiš, Miroslav: Englesko-hrvatski i hrvatsko-engleski informatički rječnik, Zagreb, Naklada Ljevak, 2000., str. 268
- Sažimanje bez gubitaka (na engleskom) Arhivirana inačica izvorne stranice od 30. prosinca 2005. (Wayback Machine)
- Program za sažimanje fajlova 7z rar zip Arhivirana inačica izvorne stranice od 7. prosinca 2008. (Wayback Machine) (sl)