Benutzer-Werkzeuge

Webseiten-Werkzeuge


dev:284:charsets

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen RevisionVorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
dev:284:charsets [28.12.2018 23:58] – [Zeichensätze] Manuela v.d.Deckendev:284:charsets [29.11.2020 05:03] (aktuell) – [UTF-8 und HTML] Manuela v.d.Decken
Zeile 3: Zeile 3:
 Zuallererst müssen wir festhalten, dass wir bei **PHP** strikt die Multibyte-Codierung von UTF-8 verwenden. Zuallererst müssen wir festhalten, dass wir bei **PHP** strikt die Multibyte-Codierung von UTF-8 verwenden.
 Um mehr über die Internas von UTF-8 zu erfahren, besuche einfach **[[https://en.wikipedia.org/wiki/UTF-8|Wikipedia - UTF-8]]** Um mehr über die Internas von UTF-8 zu erfahren, besuche einfach **[[https://en.wikipedia.org/wiki/UTF-8|Wikipedia - UTF-8]]**
-<div info>\\ Beides, UTF-8 und UTF-8MB4 aus mySQL ist 100% kompatibel zu UTF-8 aus PHP.+<div info>\\ Beides, UTF-8 und UTF-8MB4 aus mySQL ist 100% kompatibel zu UTF-8 aus PHP.\\
 In diesem Dokument sind die Schreibweisen  **utf8**||**utf-8** sowie **utf8mb4**||**utf-8mb4** gleichbedeutend.</div> In diesem Dokument sind die Schreibweisen  **utf8**||**utf-8** sowie **utf8mb4**||**utf-8mb4** gleichbedeutend.</div>
 Aber keine Sorge, das ganze Kapitel mit Zeichensätzen, Sortierungen und so weiter ist eigentlich nur halb so kompliziert, wie es auf den ersten Blick aussehen mag.\\ Aber keine Sorge, das ganze Kapitel mit Zeichensätzen, Sortierungen und so weiter ist eigentlich nur halb so kompliziert, wie es auf den ersten Blick aussehen mag.\\
Zeile 9: Zeile 9:
 Für Programmierer ist es wichtiger, den Umgang mit den Multibyte-Stringfunktionen von PHP zu beherrschen. Denn wenn man diese nicht richtig verstanden hat, kann es durchaus in schweren Fehlern enden. Für Programmierer ist es wichtiger, den Umgang mit den Multibyte-Stringfunktionen von PHP zu beherrschen. Denn wenn man diese nicht richtig verstanden hat, kann es durchaus in schweren Fehlern enden.
  
-===== UTF-8 and PHP =====+===== UTF-8 und PHP =====
 PHP selbst kennt weder 'Kollationen' noch 'UTF-8MB4' noch ähnliches! Diese Dinge können bei PHP vergessen werden! PHP selbst kennt weder 'Kollationen' noch 'UTF-8MB4' noch ähnliches! Diese Dinge können bei PHP vergessen werden!
 PHP kennt jedoch UTF-8. Und zwar jenes, das exakt den Definitionen in **[[https://tools.ietf.org/html/rfc3629|RFC 3629]]** / **ISO/IEC 10646-1:2000 Annex D** entspricht und welches aus 1 bis 4 Bytes für jedes Zeichen besteht. UTF-8 (wie auch alle Latin_xxx Zeichensätze) ist in den ersten 128 Zeichen identisch zu der originalen ASCII Zeichentabelle. PHP kennt jedoch UTF-8. Und zwar jenes, das exakt den Definitionen in **[[https://tools.ietf.org/html/rfc3629|RFC 3629]]** / **ISO/IEC 10646-1:2000 Annex D** entspricht und welches aus 1 bis 4 Bytes für jedes Zeichen besteht. UTF-8 (wie auch alle Latin_xxx Zeichensätze) ist in den ersten 128 Zeichen identisch zu der originalen ASCII Zeichentabelle.
Zeile 51: Zeile 51:
 oops, Dein Text ist um die 200.000 Zeichen groß? Du hast viele solcher Texte? oops, Dein Text ist um die 200.000 Zeichen groß? Du hast viele solcher Texte?
 ===== UTF-8 und HTML ===== ===== UTF-8 und HTML =====
-Heutzutage sind alle modernen Browser in der Lage, UTF-8 codierte Zeichen darzustellen. Es gibt keinen Grund mehr, Sonderzeichen im HTML-Entity-Format auszugeben.+Heutzutage sind alle modernen Browser in der Lage, UTF-8 codierte Zeichen darzustellen. Es gibt -fast- keinen Grund mehr, Sonderzeichen im HTML-Entity-Format auszugeben. Die wichtigste Ausnahme sind hier direkt anzeigbare Benutzereingaben,bei denen aus Sicherheitsgründen bestimmte Zeichen/Zeichenfolgen maskiert (escaped) werden sollten, damit hier kein Schadcode eingeschleust werden kann.
  
 Auf jeden Fall ist es für den Browser hilfreich, wenigstens eins der folgenden Metatags im Head-Abschnitt eines HTML-Dokumentes auszugeben. Auf jeden Fall ist es für den Browser hilfreich, wenigstens eins der folgenden Metatags im Head-Abschnitt eines HTML-Dokumentes auszugeben.
dev/284/charsets.1546041501.txt.gz · Zuletzt geändert: 28.12.2018 23:58 von Manuela v.d.Decken