BOM (Byte Order Mark) enthalten in XML-Dateien

Hallo Zusammen,

vermutlich ist diese Beschreibung für alle Techies überflüssig, aber möglicherweise hilfreich für Finance-Kollegen mit wenig bis keinen technischen Kenntnissen.

Importieren von XML-Dateien

XML lautet die Abkürzung für ‚Extensible Markup Language/erweiterbare Auszeichnungssprache‘ und ist eine Auszeichnungssprache zur Darstellung hierarchisch strukturierter Daten in Form von Textdateien. XML wird u. a. für den plattform- und implementationsunabhängigen Austausch von Daten zwischen Computersystemen eingesetzt, insbesondere über das Internet.

UTF-8 ist die Zeichenkodierung im Internet. Manche Editoren speichern Dokumente in UTF-8, aber mit einem BOM (Byte Order Mark), was zu erheblichen Problemen führen kann, wenn die Datei in eine andere eingebunden werden soll.

Ob eine Datei überhaupt ein BOM hat, kann man feststellen, indem man sie sich mit einem Hex-Editor ansieht. Ein BOM sieht darin so aus: ef bb ef.

Wer sich zum Betrachten keine zusätzliche Software installieren möchte, kann die Datei auch im Browser öffnen und die Zeichenkodierung der Ausgabe manuell auf ISO-8859-1 festsetzen. Steht ganz oben , haben wir ein BOM entdeckt.

Spätestens jetzt sollte ein zusätzlicher Editor eingesetzt werden, beispielsweise Notepad++:

  • Öffnen der XML-Datei

  • Unter ‚Encoding‘ Format »UTF-8 ohne BOM« einstellen

  • Speichern der Datei

  •  Für dieses Programm gibt es auch ein Hex-Editor-Plugin; damit kann geprüft werden, ob die Sonderzeichen (BOM) beseitigt wurden.

Eine weitere Möglichkeit ist, die Datei mit dem Editor zu öffnen und erneut im ‘Encoding: ANSI’ abzuspeichern.

Viele Grüße

Ihr Microsoft Support Team Deutschland

Dieses Dokument dient nur zu Informationszwecken. MICROSOFT SCHLIESST FÜR DIE INFORMATIONEN IN DIESEM DOKUMENT JEDE GEWÄHRLEISTUNG AUS, SEI SIE AUSDRÜCKLICH ODER KONKLUDENT.