Hier werden die Unterschiede zwischen zwei Versionen der Seite angezeigt.
Beide Seiten, vorherige Überarbeitung Vorherige Überarbeitung Nächste Überarbeitung | Vorherige Überarbeitung |
faecher:informatik:oberstufe:codierung:lzw:start [14.01.2025 09:08] – Frank Schiebel | faecher:informatik:oberstufe:codierung:lzw:start [14.01.2025 09:36] (aktuell) – [Codierung] Frank Schiebel |
---|
Die Codes ab 100<sub>16</sub> stehen dann für Wörterbucheinträge zur Verfügung - der erste Wörterbucheintrag bekommt den Code 100<sub>16</sub>, der zweite 101<sub>16</sub> u.s.w. So kann jedes Zeichen/Zeichenkombination des Wörterbuchs mit 12Bit codiert werden. | Die Codes ab 100<sub>16</sub> stehen dann für Wörterbucheinträge zur Verfügung - der erste Wörterbucheintrag bekommt den Code 100<sub>16</sub>, der zweite 101<sub>16</sub> u.s.w. So kann jedes Zeichen/Zeichenkombination des Wörterbuchs mit 12Bit codiert werden. |
| |
^ Noch zu bearbeitende Zeichenkette ^ Gefundener Eintrag ^ Ausgabe (12Bit) ^ Neuer Wörterbucheintrag ^ | {{ :faecher:informatik:oberstufe:codierung:lzw:lzw-codierung-beispiel.png?nolink |}} |
| **B**ABAABBAA | B ← 042<sub>16</sub> | 042<sub>16</sub> | BA → 100<sub>16</sub> | | |
| **A**BAABBAA | A ← 041<sub>16</sub> | 041<sub>16</sub> | AB → 101<sub>16</sub> | | |
| **BA**ABBAA | BA ← 100<sub>16</sub> | 100<sub>16</sub> | BAA → 102<sub>16</sub> | | |
| **AB**BAA | AB ← 101<sub>16</sub> | 101<sub>16</sub> | ABB → 103<sub>16</sub> | | |
| **BAA** | BAA ←102<sub>16</sub> | 102<sub>16</sub> | | | |
| |
Die Zeichenfolge wird also folgendermaßen codiert: **042041100101102<sub>16</sub>**. Das sind 7,5 Bytes ((wenn man mit ganzen Bytes arbeiten möchte, wird das mit Nullen zu 8 Byte aufgefüllt)). Die Kompression ist also bei solch kurzen Zeichenketten noch nicht drastisch - wenn man sich jedoch vorstellt, dass das Wörterbuch stets längere Zeichenketten mit einem einzigen 12Bit Code zugreifbar macht, kann die Kompression unter Umständen bei längeren Texten deutlich stärker ins Gewicht fallen. | Die Zeichenfolge wird also folgendermaßen codiert: **042041100101102<sub>16</sub>**. Das sind 7,5 Bytes ((wenn man mit ganzen Bytes arbeiten möchte, wird das mit Nullen zu 8 Byte aufgefüllt)). Die Kompression ist also bei solch kurzen Zeichenketten noch nicht drastisch - wenn man sich jedoch vorstellt, dass das Wörterbuch stets längere Zeichenketten mit einem einzigen 12Bit Code zugreifbar macht, kann die Kompression unter Umständen bei längeren Texten deutlich stärker ins Gewicht fallen. |