Ein Codierung ist eine eindeutige und umkehrbare Abbildung: Jedem Zeichen der Ursprungsmenge wird genau ein Zeichen der Zielmenge zugeordnet.
Aufgabe
Welche Codierungen aus dem Alltag kennst du? Überlege zu zweit.
# ASCII
Der American Standard Code for Information Interchange oder kurz ASCII ist eine ursprünglich 7-bit-lange Zeichencodierung, die 1963 definiert wurde. Sie umfasst 95 normale Zeichen und 33 Steuerzeichen. Heute werden die 7-bit-Folgen in einem Byte abgespeichert, wobei das höchste Bit (ganz links) immer
Steuerzeichen sind spezielle Zeichen, welche beispielsweise einen Zeilen- oder Seitenumbruch darstellen.
ASCII ist ein sehr weit verbreiteter Standard, um Text zu codieren.
Die normalen Zeichen sind in der folgenden Tabelle aufgeführt:
Zeichen | Code | Zeichen | Code | Zeichen | Code |
---|---|---|---|---|---|
(leer) | 00100000 | @ | 01000000 | ` | 01100000 |
! | 00100001 | A | 01000001 | a | 01100001 |
" | 00100010 | B | 01000010 | b | 01100010 |
# | 00100011 | C | 01000011 | c | 01100011 |
$ | 00100100 | D | 01000100 | d | 01100100 |
% | 00100101 | E | 01000101 | e | 01100101 |
& | 00100110 | F | 01000110 | f | 01100110 |
’ | 00100111 | G | 01000111 | g | 01100111 |
( | 00101000 | H | 01001000 | h | 01101000 |
) | 00101001 | I | 01001001 | i | 01101001 |
* | 00101010 | J | 01001010 | j | 01101010 |
+ | 00101011 | K | 01001011 | k | 01101011 |
, | 00101100 | L | 01001100 | l | 01101100 |
- | 00101101 | M | 01001101 | m | 01101101 |
. | 00101110 | N | 01001110 | n | 01101110 |
/ | 00101111 | O | 01001111 | o | 01101111 |
0 | 00110000 | P | 01010000 | p | 01110000 |
1 | 00110001 | Q | 01010001 | q | 01110001 |
2 | 00110010 | R | 01010010 | r | 01110010 |
3 | 00110011 | S | 01010011 | s | 01110011 |
4 | 00110100 | T | 01010100 | t | 01110100 |
5 | 00110101 | U | 01010101 | u | 01110101 |
6 | 00110110 | V | 01010110 | v | 01110110 |
7 | 00110111 | Q | 01010111 | w | 01110111 |
8 | 00111000 | X | 01011000 | x | 01111000 |
9 | 00111001 | Y | 01011001 | y | 01111001 |
: | 00111010 | Z | 01011010 | z | 01111010 |
; | 00111011 | [ | 01011011 | { | 01111011 |
< | 00111100 | \ | 01011100 | | | 01111100 |
= | 00111101 | ] | 01011101 | } | 01111101 |
> | 00111110 | ^ | 01011110 | ~ | 01111110 |
? | 00111111 | _ | 01011111 |
# Unicode
Unicode (opens new window) ist ein internationaler Standard für Schriftzeichen. Das Unicode-Konsortium erstellt einen Katalog von allen bekannten Schriftzeichen. Die Version 12.1, welche im Mai 2019 veröffentlicht wurde, umfasst 137’929 Zeichen.
Aufgabe
Welche Zeichen kann dein Computer/Browser darstellen? Öffne die untenstehende Webseite und finde Zeichen, die nicht korrekt dargestellt werden.
https://www.ltg.ed.ac.uk/~richard/unicode-sample-3-2.html (opens new window)
Wieso können gewisse Zeichen nicht dargestellt werden?
Aufgabe
Vielleicht hast du schon mal, z.B. auf Instagram, so 𝓴𝓸𝓶𝓲𝓼𝓬𝓱 geschriebene Profilnamen angetroffen. Wie kann das funktionieren? Teste es hier aus:
https://qaz.wtf/u/convert.cgi?text=komisch (opens new window)