Merkwürdige HTML-Ausgabe from Christian Weerts on 2010-09-27 (Oldenburger GNU/Linux-Stammtisch)

From: Christian Weerts <chw_at_ffis.de>
Date: Mon, 27 Sep 2010 14:59:00 +0200

Moin,

ich habe hier eine HTML-Datei welche von einem prop. Programm erzeugt
wurde. Der Code sieht äußerst merkwürdig aus - für mich kein HTML:

<^@P^@ ^@a^@l^@i^@g^@n^@=^@c^@e^@n^@t^@e^@r^@>^@<^@S^@T^@R^@O^@N^@G^@>

Öffne ich die Datei im VI erhalte ich das obige Bild. Mit gedit wird mir
korrektes HTML angezeigt. Allerdings sind die Tags dort in Uppercase.

Ich möchte die "HTML-Dateien" von allem unnützen befreien und nur reinen
Text erhalten. Auf der Kommandozeile habe ich mir für reinen HTML-Code
den folgenden kleinen Einzeiler zur Nutze gemacht:

perl -p -i.bak -e 's/\<.+>//gi' 1.html

Doch leider funktioniert es nicht mit dem obigen "Code". Auch wenn ich
versuche nur die ^@ mit folgender Zeile zu löschen, klappt es nicht:

perl -p -i.bak -e 's/\^@//gi' 1.html

Kann mir einer erklären, warum der Einzeiler das ^@ nicht löscht?

Gruß,
Christian

-- 
www.ffis.de

Received on Mon Sep 27 2010 - 14:59:00 CEST

This archive was generated by hypermail 2.2.0 : Mon Sep 27 2010 - 14:59:06 CEST