Am Samstag, 23. Januar 2010 18:01:24 schrieb Martin Schulze:
> Moin!
>
> Christoph Sandhaus wrote:
> > Ich möchte mit einem ANSI-C Programm eine RSS-Feed von www.tagesschau.de saugen, was mir nicht gelingt.
> >
> > Leider scheitert das schon beim telnet.
> >
> > Wenn ich per telnet z.B. von Heise eine Seite anfordere
> > telnet heise.de 80
> > GET /index.hmlt HTTP/1.0
> >
> > kommt ne passende Antwort.
> > Wenn ich im Browser
> > http://www.tagesschau.de/xml/tagesschau-meldungen/
> >
> > kommt schön ne XML Datei, welche FF auch schön anzeigt.
> > Per Telnet gelingt es mir aber nicht:
> > telnet www.tagesschau.de 80
> > GET /xml/tagesschau-meldungen/ HTTP/1.0
>
> Du musst HTTP 1.1 nehmen:
>
> telnet www.tagesschau.de 80
> GET /xml/tagesschau-meldungen/ HTTP/1.1
> Host: www.tagesschau.de
> Connection: close
> [zweimal Enter]
Öhm, es scheint eher an der Eingabe "Host: www.tagesschau.de" zu liegen, da akzeptiert er sowol 1.1 als auch 1.0.
> > bekomme ich eine "Invalid URL" Antwort.
> > Nun weiß ich leider nicht, welche Datei ich an den Pfad anhängen könnte, oder welche weiteren Header-Informationen vom Browser gesendet werden.
> > "/xml/tagesschau-meldungen/index.html" tut's auch nicht.
>
> Du kannst auch
>
> GET http://www.tagesschau.de/xml/tagesschau-meldungen/ HTTP/1.0
Und auch da ist der Host drin.
Ist ja verrückt. Ich habe immer gedacht, wenn man schon per telnet verbunden ist, ist der host ja bekannt.
Aber wenn ein Webserver per URL diverste Domains bedient, wird dieser Server wohl im GET immer die Domain benötigen.
Danke! Das hilft. :D
>
> schreiben.
>
> Gruesse,
>
> Joey
>
>
Auch viele Grüße,
Christoph
Received on Sat Jan 23 2010 - 18:19:33 CET
This archive was generated by hypermail 2.2.0 : Sat Jan 23 2010 - 18:19:35 CET