Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen der Seite angezeigt.
Nächste Überarbeitung | Vorherige Überarbeitung | ||
faecher:informatik:oberstufe:codierung:zeichencodierung:unicode:start [28.11.2023 10:51] – angelegt Frank Schiebel | faecher:informatik:oberstufe:codierung:zeichencodierung:unicode:start [05.12.2024 12:55] (aktuell) – [Beispiele:] Frank Schiebel | ||
---|---|---|---|
Zeile 49: | Zeile 49: | ||
* Das erste Byte beginnt mit einer ' | * Das erste Byte beginnt mit einer ' | ||
- | Das führt zu folgender Codierung der Unicode Codepunkte: | + | |
==== Beispiele: ==== | ==== Beispiele: ==== | ||
Zeile 55: | Zeile 55: | ||
**(1)** | **(1)** | ||
- | '' | + | '' |
Beginnt mit einer Null und ist nicht länger als ein Byte -> die letzten 7Bit werden verwendet, um zu codieren, also ein "ASCII k" in UTF-8 | Beginnt mit einer Null und ist nicht länger als ein Byte -> die letzten 7Bit werden verwendet, um zu codieren, also ein "ASCII k" in UTF-8 | ||
Zeile 71: | Zeile 71: | ||
* Das zweite Byte beginnt nach den Regeln mit '' | * Das zweite Byte beginnt nach den Regeln mit '' | ||
- | * Das erste Byte beginnt mit '' | + | * Das erste Byte beginnt mit '' |
Die UTF-8 Codierung des Unicode-ä ist also '' | Die UTF-8 Codierung des Unicode-ä ist also '' | ||
Zeile 91: | Zeile 91: | ||
---- | ---- | ||
{{: | {{: | ||
- | === (A3) === | + | === (A1) === |
Wandle die nachfolgenden Zeichen des Unicode Zeichensatzen in die UTF-8-Codierung um. Der Hexadezimalcode des Unicode Zeichens ist jeweils angegeben. | Wandle die nachfolgenden Zeichen des Unicode Zeichensatzen in die UTF-8-Codierung um. Der Hexadezimalcode des Unicode Zeichens ist jeweils angegeben. | ||
Zeile 114: | Zeile 114: | ||
++++ | ++++ | ||
++++ Lösung 4 | | ++++ Lösung 4 | | ||
- | 1111**0000** 10**011111** 10**011000** 10**001010** | + | 11110**000** 10**011111** 10**011000** 10**001010** |
++++ | ++++ | ||
Zeile 120: | Zeile 120: | ||
---- | ---- | ||
{{: | {{: | ||
- | === (A4) === | + | === (A2) === |
Wie viele unterschiedliche Unicode-Zeichen lassen sich theoretisch mit 1 Byte, 2 Bytes, 3 Bytes und 4 Bytes unter Beachtung der UTF-8-Regeln darstellen? | Wie viele unterschiedliche Unicode-Zeichen lassen sich theoretisch mit 1 Byte, 2 Bytes, 3 Bytes und 4 Bytes unter Beachtung der UTF-8-Regeln darstellen? | ||
Zeile 130: | Zeile 130: | ||
* 4 Bytes: 3+6+6+6 = 21 nutzbare Bits -> 2< | * 4 Bytes: 3+6+6+6 = 21 nutzbare Bits -> 2< | ||
++++ | ++++ | ||
+ | |||
+ | ---- | ||
+ | {{: | ||
+ | === (A3) === | ||
+ | Öffne einen Texteditor, z.B. '' | ||
+ | |||
+ | Das sollte etwas so aussehen: | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Interpretiere die Ausgaben und notiere dir die Ergebnisse. | ||
+ | |||
+ | Wiederhole den Versuch mit einem '' | ||
+ | |||
+ | ---- | ||
+ | {{: | ||
+ | === (A4) === | ||
+ | Untersuche nun den Teufelssmiley 😈 | ||
+ | Kopiere das Zeichen für den Smiley aus der Wikiseite in Bluefish und wiederhole die Überprüfungen aus Aufgabe 3. | ||
+ | |||
+ | Weitere Informationen findest du dort. https:// | ||
+ | ===== Modellvorstellung: | ||
+ | |||
+ | {{ : | ||
==== Material ==== | ==== Material ==== |