Re: Merkw�rdige HTML-Ausgabe from Oliver Gerlich on 2010-09-27 (Oldenburger GNU/Linux-Stammtisch)

From: Oliver Gerlich <olig9_at_gmx.de>
Date: Mon, 27 Sep 2010 22:02:47 +0200

Das scheint ein Text in einem 16-Bit-Encoding zu sein (die ^@-Zeichen
stehen für Nullbytes). In kwrite kann man so eine Datei erzeugen, wenn
man beim Speichern UTF-16 als Encoding angibt. Gedit zeigt das Encoding
übrigens im Tooltip für den Dateitab an.

Grüße,
Oliver

Am Montag, den 27.09.2010, 14:59 +0200 schrieb Christian Weerts:
> Moin,
>
> ich habe hier eine HTML-Datei welche von einem prop. Programm erzeugt
> wurde. Der Code sieht äußerst merkwürdig aus - für mich kein HTML:
>
> <^@P^@ ^@a^@l^@i^@g^@n^@=^@c^@e^@n^@t^@e^@r^@>^@<^@S^@T^@R^@O^@N^@G^@>
>
> Öffne ich die Datei im VI erhalte ich das obige Bild. Mit gedit wird mir
> korrektes HTML angezeigt. Allerdings sind die Tags dort in Uppercase.
>
> Ich möchte die "HTML-Dateien" von allem unnützen befreien und nur reinen
> Text erhalten. Auf der Kommandozeile habe ich mir für reinen HTML-Code
> den folgenden kleinen Einzeiler zur Nutze gemacht:
>
> perl -p -i.bak -e 's/\<.+>//gi' 1.html
>
> Doch leider funktioniert es nicht mit dem obigen "Code". Auch wenn ich
> versuche nur die ^@ mit folgender Zeile zu löschen, klappt es nicht:
>
> perl -p -i.bak -e 's/\^@//gi' 1.html
>
> Kann mir einer erklären, warum der Einzeiler das ^@ nicht löscht?
>
> Gruß,
> Christian
>
> --
> www.ffis.de
>
>
Received on Mon Sep 27 2010 - 22:02:47 CEST

This archive was generated by hypermail 2.2.0 : Mon Sep 27 2010 - 22:02:57 CEST