Sergej hat festgestellt, was sicherlich schon mehreren Entwicklern (mir eingeschlossen) aufgefallen ist: Sowohl htmlentities als auch html_entity_decode unterstützen kein UTF-8. Das ist aus meiner Sicht zwar kein Bug, aber auf jeden Fall ein fehlendes Feature.
Statt eine Applikation von UTF-8 auf ISO downzugraden, ist es ratsam den selben Weg wie Sergej einzuschlagen - mit Workarrounds. So erhält man eine konsistente mehrsprachige Applikation und kann sich auch über japanische und kyrillische Besuche und Kommentare freuen! ;)
Kleine Ergänzung übrigens zur Umsetzung seines Workarrounds: Gut ist, dass er nicht die Zeichen an sich einbettet, sondern auf die Ascii-Notation zurückgreift. Dadurch kann er prima in Nicht-UTF-8 Code UTF-8 Zeichen darstellen - die Sourcen sind eben meistens doch ISO…
Und noch ein Update: Als dritten Parameter kann man für die Funktion htmlentities seit PHP 4.1 auch die Kodierung des String übergeben - z.B. “UTF-8″ das verspricht auf jeden Fall Besserung!


















