Re: MerkwŘrdige HTML-Ausgabe

From: Oliver Gerlich <olig9_at_gmx.de>
Date: Mon, 27 Sep 2010 22:02:47 +0200

Das scheint ein Text in einem 16-Bit-Encoding zu sein (die ^@-Zeichen
stehen f├╝r Nullbytes). In kwrite kann man so eine Datei erzeugen, wenn
man beim Speichern UTF-16 als Encoding angibt. Gedit zeigt das Encoding
├╝brigens im Tooltip f├╝r den Dateitab an.

Gr├╝├če,
Oliver

Am Montag, den 27.09.2010, 14:59 +0200 schrieb Christian Weerts:
> Moin,
>
> ich habe hier eine HTML-Datei welche von einem prop. Programm erzeugt
> wurde. Der Code sieht ├Ąu├čerst merkw├╝rdig aus - f├╝r mich kein HTML:
>
> <^@P^@ ^@a^@l^@i^@g^@n^@=^@c^@e^@n^@t^@e^@r^@>^@<^@S^@T^@R^@O^@N^@G^@>
>
> ├ľffne ich die Datei im VI erhalte ich das obige Bild. Mit gedit wird mir
> korrektes HTML angezeigt. Allerdings sind die Tags dort in Uppercase.
>
> Ich m├Âchte die "HTML-Dateien" von allem unn├╝tzen befreien und nur reinen
> Text erhalten. Auf der Kommandozeile habe ich mir f├╝r reinen HTML-Code
> den folgenden kleinen Einzeiler zur Nutze gemacht:
>
> perl -p -i.bak -e 's/\<.+>//gi' 1.html
>
> Doch leider funktioniert es nicht mit dem obigen "Code". Auch wenn ich
> versuche nur die ^@ mit folgender Zeile zu l├Âschen, klappt es nicht:
>
> perl -p -i.bak -e 's/\^@//gi' 1.html
>
> Kann mir einer erkl├Ąren, warum der Einzeiler das ^@ nicht l├Âscht?
>
> Gru├č,
> Christian
>
> --
> www.ffis.de
>
>
Received on Mon Sep 27 2010 - 22:02:47 CEST

This archive was generated by hypermail 2.2.0 : Mon Sep 27 2010 - 22:02:57 CEST