Benutzer-Werkzeuge

Webseiten-Werkzeuge


dev:all:examples:gtk-charset

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen RevisionVorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
dev:all:examples:gtk-charset [27.06.2018 07:49] – [BOM vs. PHP] Manuela v.d.Deckendev:all:examples:gtk-charset [14.04.2023 15:33] (aktuell) – [UTF8mb4] Manuela v.d.Decken
Zeile 11: Zeile 11:
 Der ASCII-Standard basiert auf einem 7-Bit Code und definiert 128 Zeichen, bestehend aus 33 nicht druckbaren sowie 95 druckbaren Zeichen.\\ Der ASCII-Standard basiert auf einem 7-Bit Code und definiert 128 Zeichen, bestehend aus 33 nicht druckbaren sowie 95 druckbaren Zeichen.\\
 Die druckbaren Zeichen umfassen das lateinische Alphabet in Groß- und Kleinschreibung, die zehn arabischen Ziffern sowie einige Interpunktionszeichen (Satzzeichen, Wortzeichen) und andere Sonderzeichen. Der Zeichenvorrat entspricht weitgehend dem einer Tastatur oder Schreibmaschine für die englische Sprache. Die nicht druckbaren Steuerzeichen enthalten Ausgabezeichen wie Zeilenvorschub oder Tabulatorzeichen, Protokollzeichen wie Übertragungsende oder Bestätigung und Trennzeichen wie Datensatztrennzeichen. Die genauen Spezifikationen dazu sind hier zu finden: [[https://de.wikipedia.org/wiki/American_Standard_Code_for_Information_Interchange#Kompatible_Zeichenkodierungen|American Standard Code for Information Interchange]]\\ Die druckbaren Zeichen umfassen das lateinische Alphabet in Groß- und Kleinschreibung, die zehn arabischen Ziffern sowie einige Interpunktionszeichen (Satzzeichen, Wortzeichen) und andere Sonderzeichen. Der Zeichenvorrat entspricht weitgehend dem einer Tastatur oder Schreibmaschine für die englische Sprache. Die nicht druckbaren Steuerzeichen enthalten Ausgabezeichen wie Zeilenvorschub oder Tabulatorzeichen, Protokollzeichen wie Übertragungsende oder Bestätigung und Trennzeichen wie Datensatztrennzeichen. Die genauen Spezifikationen dazu sind hier zu finden: [[https://de.wikipedia.org/wiki/American_Standard_Code_for_Information_Interchange#Kompatible_Zeichenkodierungen|American Standard Code for Information Interchange]]\\
-Fast alle später definierten Standards basieren noch heute, 55 Jahre später, auf diesem 7-Bit ASCII-Code. E-Mails werden z.B. grundsätzlich als 7-Bit Code übertragen.+Fast alle später definierten Standards basieren noch heute, 60 Jahre später, auf diesem 7-Bit ASCII-Code. E-Mails werden z.B. grundsätzlich als 7-Bit Code übertragen.
 Mit der fortschreitenden Internationalisierung genügten die verfügbaren 95 Zeichen nicht mehr. Auf Grund dessen wurde der Code um 1 Bit auf 8-Bit erweitert. Das bedeutete, dass 128 zusätzliche Zeichen verfügbar waren. Um jetzt den Unterschiedlichsten Sprachen und Schriften gerecht zu werden, wurde für jede Sprache/Schrift eine eigene Codepage und/oder ISO 8859 entworfen. All diese waren in den ersten 128 Zeichen identisch und in den oberen 128 Zeichen (128-255) wurden die Sprachspezifischen Zeichen abgelegt. Recht schnell genügten auch diese zusätzlichen Zeichen nicht mehr aus. Zumal sich auch das Problem ergab, dass keine 2 Schriften gleichzeitig eingesetzt werden konnten. Mit der fortschreitenden Internationalisierung genügten die verfügbaren 95 Zeichen nicht mehr. Auf Grund dessen wurde der Code um 1 Bit auf 8-Bit erweitert. Das bedeutete, dass 128 zusätzliche Zeichen verfügbar waren. Um jetzt den Unterschiedlichsten Sprachen und Schriften gerecht zu werden, wurde für jede Sprache/Schrift eine eigene Codepage und/oder ISO 8859 entworfen. All diese waren in den ersten 128 Zeichen identisch und in den oberen 128 Zeichen (128-255) wurden die Sprachspezifischen Zeichen abgelegt. Recht schnell genügten auch diese zusätzlichen Zeichen nicht mehr aus. Zumal sich auch das Problem ergab, dass keine 2 Schriften gleichzeitig eingesetzt werden konnten.
 ==== Unicode / UTF ==== ==== Unicode / UTF ====
Zeile 34: Zeile 34:
 mySQL hat damals, als UTF-8 noch nicht so verbreitet war, dieses implementiert. Um Platz zu sparen wurde jedoch nur eine 1-3 Byte große Codierung benutzt. mySQL hat damals, als UTF-8 noch nicht so verbreitet war, dieses implementiert. Um Platz zu sparen wurde jedoch nur eine 1-3 Byte große Codierung benutzt.
 Nach ein paar Jahren erkannte man, dass man doch den vollen Umfang von UTF-8 benötigt. Eine Anpassung auf 4 Byte war jedoch aus verschiedenen Gründen nicht möglich. Deshalb wurde ein zweites UTF-8 Format, nämlich das UTF8mb4 definiert, das in der Lage ist den vollen UTF-8 Umfang mit 1-4 Bytes aufzunehmen.\\ Nach ein paar Jahren erkannte man, dass man doch den vollen Umfang von UTF-8 benötigt. Eine Anpassung auf 4 Byte war jedoch aus verschiedenen Gründen nicht möglich. Deshalb wurde ein zweites UTF-8 Format, nämlich das UTF8mb4 definiert, das in der Lage ist den vollen UTF-8 Umfang mit 1-4 Bytes aufzunehmen.\\
-//**__Für uns ist es nur wichtig zu wissen, dass das UTF8 von PHP absolut identisch ist zu dem UTF8mb4 von mySQL.__**//+//**__Für uns ist es nur wichtig zu wissen, dass das UTF8 von PHP absolut kompatibel ist zu dem UTF8mb4 von mySQL.__**//
  
  
  
dev/all/examples/gtk-charset.1530085783.txt.gz · Zuletzt geändert: 27.06.2018 07:49 von Manuela v.d.Decken