PHP Blogger

Startseite Schreib mir ne Mail! RSS Abo Webnews

htmlentities und UTF-8

Sergej hat festgestellt, was sicherlich schon mehreren Entwicklern (mir eingeschlossen) aufgefallen ist: Sowohl htmlentities als auch html_entity_decode unterstützen kein UTF-8. Das ist aus meiner Sicht zwar kein Bug, aber auf jeden Fall ein fehlendes Feature.

Statt eine Applikation von UTF-8 auf ISO downzugraden, ist es ratsam den selben Weg wie Sergej einzuschlagen - mit Workarrounds. So erhält man eine konsistente mehrsprachige Applikation und kann sich auch über japanische und kyrillische Besuche und Kommentare freuen! ;)

Kleine Ergänzung übrigens zur Umsetzung seines Workarrounds: Gut ist, dass er nicht die Zeichen an sich einbettet, sondern auf die Ascii-Notation zurückgreift. Dadurch kann er prima in Nicht-UTF-8 Code UTF-8 Zeichen darstellen - die Sourcen sind eben meistens doch ISO…

Und noch ein Update: Als dritten Parameter kann man für die Funktion htmlentities seit PHP 4.1 auch die Kodierung des String übergeben - z.B. “UTF-8″ das verspricht auf jeden Fall Besserung!

Teile und genieße Diese Icons verzweigen auf soziale Netzwerke bei denen Nutzer neue Inhalte finden und mit anderen teilen können.
  • MisterWong
  • del.icio.us
  • Technorati
  • Digg
  • Slashdot
  • YahooMyWeb
  • Furl
  • Ma.gnolia
  • Spurl
  • Netscape
  • StumbleUpon
  • MyShare
  • blogmarks

Schreib Deine Meinung