Datenkompression
Inhalt
Dateikompression (allgemein)
Unter "Dateikompression" werden Verfahren verstanden, mit denen es möglich ist (mehrere) Dateien verlustfrei in ihrer Größe zu reduzieren und wiederherzustellen.Folgende Verfahren sind bekannt:
Verfahren | Suffix (typisch) | Kommando | AIX | HP-UX | SunOS | Linux | MS-DOS | Windows 95 | Windows NT | Quelltext |
ZIP/PKZIP | .zip | zip, unzip | hera (nur unzip) | ? | ? | unzip | zip, unzip, pkzip, pkunzip | siehe DOS, winzip | siehe Win95 | ? |
GZIP | .gz | + | + | + | + | + | gzip.exe | gzip.exe | gzip.exe | |
BZ2 | .bz, .bz2 | bzip2, bunzip2 | - | - | - | bzip2, bunzip2 | - | - | - | ? |
ARJ | .arj | arj, unarj | - | - | - | unarj | arj241.exe | arj241.exe | arj241.exe | - |
ARC | .arc | - | - | - | - | ARCE.COM | ARCE.COM | ARCE.COM | - | |
LHARC | .lha | lha124 | - | - | - | lha | lha213.exe | lha213.exe | lha213.exe | - |
RAR | .rar | rar.exe | - | - | - | - | RAR.EXE | RAR.EXE | RAR.EXE | - |
Ohne Kompression, aber zur Archivierung: TAR
Bilddatenkompression
Zur Kompression von Bilddaten (Punktinformationen = Bitmaps) werden zwei grundsätzlich verschiedene Verfahren angewandt:Verlustfreie Kompression
Diese Verfahren suchen i.A. nach sich wiederholenden Mustern in einer Zeile und legen Informationen über diese und die Anzahl Ihres Auftretens ab (siehe Beispiel PCX). Generell können aus den komprimierten Daten die Originaldaten verlustfrei rekonstruiert werden.Einige bekannte Verfahren/Formate:
- PCX: originales Format von Paint-Brush, wird kaum noch verwendet
- BMP: Microsoft Windows Standard Format (RunLength-Encoding)
- GIF: CompuServe Format, (LZW; Lempel-Ziv-Welch)
- PNG: Portable Network Graphics, gilt als Nachfolger von GIF jedoch ohne Animation (Lizenzfrei)
- Tiff: Tag Image File (Aldus, HP, Microsoft)
Alle genannten Formate können z.B. mit GIMP gelesen und geschrieben werden. BMP kann mit dem, zu MS Windows mitgelieferten "Malprogramm" Paint gelesen und geschrieben werden.
GIMP ist ein kostenlosen OpenSource Bildbearbeitungsprogramm für alle gängigen Betriebssysteme.
Verlustbehaftete Kompression
Grundlage ist die Annahme, daß nicht alle Informationen eines Bildes wirklich nötig sind. Die verlustbehafteten Verfahren führen im Wesentlichen eine Analyse der originalen Bilddaten im Frequenzraum aus, eliminieren marginale Anteile und erzielen somit Verdichtungsverhätnisse zwischen 1:10 .. 1:200. Je nach Kompressionsverhältnis treten im rekosntruierten Bild insbesondere bei größeren, gleichartigen Bildbereichen Artefakte auf.Bekannte Verfahren/Formate:
- JPEG: Verdichtung 1:10 .. 1:70, Cosinustransformation (häufigstes Bilddateiformat mit v. Kompression)
- Waveletkompression: Verdichtung bis 1:200, Funktionenraum aus Wavelets
- Fraktale Kompression: Suche nach selbstähnlichen Strukturen, damit Elimination redundanter Daten
JPEG Dateien können mit allen gängigen Bildbearbeitungsprogrammen gelesen und weiterverarbeitet werden.
Für die Nutzung von JPEG in selbstgeschriebenen Anwendungen steht die JPEG Bibliothek bereit.
Videokompression
Grundlage der Videokompressionstechniken sind i.A. verlustbehaftete Kompressionsverfahren. Wie auch bei der Bildkompression werden Analysen in geeigneten Frequenz/Funktionenräumen durchgeführt.- Komprimierung von Frames: die einzelnen Frames werden für sich komprimiert und dann aneinander gekettet
- Differenzdatenbildung: beginnend mit einem Referenzframe werden im "Vorwärtsschnitt" die Differenzen zu den folgenden Frames gebildet und nur diese im Datenstrom abgelegt
-
Motion JPEG basierte Fomrate:
- AVI (.avi)
- Apple Quicktime (.mov)
-
MPEG ist zur Zeit in zwei Video-Versionen üblich
- MPEG-I (.mpg): Standardformat für Video CD (Hinweis: DVD bezeichnet lediglich das Aufzeichnungsverfahren mir zwei Spuren)
- MPEG-II (.mpg, .mp2): Standardformat für das digitale Fernsehen