Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen der Seite angezeigt.

--- faecher:informatik:oberstufe:codierung:zeichencodierung:unicode:start [28.11.2023 10:51] – angelegt Frank Schiebel
+++ faecher:informatik:oberstufe:codierung:zeichencodierung:unicode:start [05.12.2024 12:55] (aktuell) – [Beispiele:] Frank Schiebel
@@ Zeile 49: / Zeile 49: @@
     * Das erste Byte beginnt mit einer '1' für jedes Byte, das verwendet wird. Benötigt man also 3 Byte, um ein Zeichen in UTF-8 darzustellen, beginnt das erste Byte mit '111'. Bevor die Nutzdaten im ersten Byte beginnen, muss nach der Markierung der Anzahl der nötigen Bytes noch eine Null eingefügt werden ((Warum?))
-Das führt zu folgender Codierung der Unicode Codepunkte:
 ==== Beispiele: ====
@@ Zeile 55: / Zeile 55: @@
 **(1)**
-''y = 79<sub>16</sub> = 0111 100<sub>2</sub>''
+''k = 6B<sub>16</sub> = 0110 1011<sub>2</sub>''
 Beginnt mit einer Null und ist nicht länger als ein Byte -> die letzten 7Bit werden verwendet, um zu codieren, also ein "ASCII k" in UTF-8
@@ Zeile 71: / Zeile 71: @@
   * Das zweite Byte beginnt nach den Regeln mit ''10'', daran schließen die Nutzdaten an: ''10 100100''
-  * Das erste Byte beginnt mit ''11'' (weil man zwei Byte benötigt) dann wird mit ''0''en aufgefüllt, dann kommen die Nutzedaten: ''11 000011''
+  * Das erste Byte beginnt mit ''11'' (weil man zwei Byte benötigt) dann wird mit ''0''en aufgefüllt, dann kommen die Nutzdaten: ''11 000011''
 Die UTF-8 Codierung des Unicode-ä ist also ''1100 0011 1010 0100''. Die Nutzdaten, die den Code des Unicode Zeichens transportieren sind in jeden Byte nur die jeweils letzten 6 Bit.
@@ Zeile 91: / Zeile 91: @@
 ----
 {{:aufgabe.png?nolink  |}}
-=== (A3) ===
+=== (A1) ===
 Wandle die nachfolgenden Zeichen des Unicode Zeichensatzen in die UTF-8-Codierung um. Der Hexadezimalcode des Unicode Zeichens ist jeweils angegeben.
@@ Zeile 114: / Zeile 114: @@
 ++++
 ++++ Lösung 4 |
-**0000** 10**011111** 10**011000** 10**001010**
+**000** 10**011111** 10**011000** 10**001010**
 ++++
@@ Zeile 120: / Zeile 120: @@
 ----
 {{:aufgabe.png?nolink  |}}
-=== (A4) ===
+=== (A2) ===
 Wie viele unterschiedliche Unicode-Zeichen lassen sich theoretisch mit 1 Byte, 2 Bytes, 3 Bytes und 4 Bytes unter Beachtung der UTF-8-Regeln darstellen?
@@ Zeile 130: / Zeile 130: @@
   * 4 Bytes: 3+6+6+6 = 21 nutzbare Bits ->  2<sup>21</sup> = 2 097 152 Zeichen
 ++++
+----
+{{:aufgabe.png?nolink  |}}
+=== (A3) ===
+Öffne einen Texteditor, z.B. ''Bluefish''. Schreibe den Buchstaben ''a'' in den Editor. Speichere die Datei. Finde heraus wie groß die Datei ist. Betrachte den binären Inhalt der Datei mit einem Hex-Editor oder einem passenden Anzeigeprogramm, z.B. ''hexyl''.
+Das sollte etwas so aussehen:
+{{ :faecher:informatik:oberstufe:codierung:zeichencodierung:unicode:a.png |}}
+Interpretiere die Ausgaben und notiere dir die Ergebnisse.
+Wiederhole den Versuch mit einem ''ä''.
+----
+{{:aufgabe.png?nolink  |}}
+=== (A4) ===
+Untersuche nun den Teufelssmiley 😈
+Kopiere das Zeichen für den Smiley aus der Wikiseite in Bluefish und wiederhole die Überprüfungen aus Aufgabe 3.
+Weitere Informationen findest du dort. https://www.compart.com/de/unicode/U+1F608
+===== Modellvorstellung: Der UTF-8-Zug =====
+{{ :faecher:informatik:oberstufe:codierung:zeichencodierung:unicode:zug.png?700 |}}
 ==== Material ====