Moin,
ich habe hier eine HTML-Datei welche von einem prop. Programm erzeugt
wurde. Der Code sieht äußerst merkwürdig aus - für mich kein HTML:
<^@P^@ ^@a^@l^@i^@g^@n^@=^@c^@e^@n^@t^@e^@r^@>^@<^@S^@T^@R^@O^@N^@G^@>
Öffne ich die Datei im VI erhalte ich das obige Bild. Mit gedit wird mir
korrektes HTML angezeigt. Allerdings sind die Tags dort in Uppercase.
Ich möchte die "HTML-Dateien" von allem unnützen befreien und nur reinen
Text erhalten. Auf der Kommandozeile habe ich mir für reinen HTML-Code
den folgenden kleinen Einzeiler zur Nutze gemacht:
perl -p -i.bak -e 's/\<.+>//gi' 1.html
Doch leider funktioniert es nicht mit dem obigen "Code". Auch wenn ich
versuche nur die ^@ mit folgender Zeile zu löschen, klappt es nicht:
perl -p -i.bak -e 's/\^@//gi' 1.html
Kann mir einer erklären, warum der Einzeiler das ^@ nicht löscht?
Gruß,
Christian
-- www.ffis.deReceived on Mon Sep 27 2010 - 14:59:00 CEST
This archive was generated by hypermail 2.2.0 : Mon Sep 27 2010 - 14:59:06 CEST