16.04.2024, 20:56 UhrDeutsch | English
Hallo Gast [ Registrierung | Anmelden ]

Neues Thema eröffnen   Neue Antwort erstellen
Vorheriges Thema anzeigen Druckerfreundliche Version Einloggen, um private Nachrichten zu lesen Nächstes Thema anzeigen
Autor Nachricht
Dannyboy
Titel: HTML-Links via Perl auslesen?  BeitragVerfasst am: 08.11.2006, 13:05 Uhr



Anmeldung: 30. Jun 2005
Beiträge: 449

Hallo Linux-Freunde,
ein Freund von mir sucht eine Möglichkeit HTML-Links mit Perl auszulesen. Dazu greift er via Perl auf den Online-Sourcecode zu, speichert ihn in einer String-Variable und nun benötigt er noch die Möglichkeit sich die Inhalte von allen
Code:
<a href> DAS BRAUCHEN WIR </a href>
auszugeben. Im Prinzip möchte er einfach alle auf einer HTML-Seite verfügbaren Downloads und Links auflisten und das Ganze _muss_ mit regulären Ausdrücken passieren

Ich würd' ihm gern helfen, aber habe offen gestanden bisher keine Ahnung von Perl. Wäre super, wenn jemand eine Idee hätte.

Greetz
DANNYBOY
 
 Benutzer-Profile anzeigen Private Nachricht senden  
Antworten mit Zitat Nach oben
Geier0815
Titel: RE: HTML-Links via Perl auslesen?  BeitragVerfasst am: 08.11.2006, 13:38 Uhr



Anmeldung: 20. Jul 2004
Beiträge: 316

Er soll nicht in einen String speichern, sondern in ein Array (die Dinger mit dem @ am Anfang). Dann jagt er eine Suche drüber und speichert für jede Zeile in der der entsprechende Tag vorkommt eine neue Variable.

_________________
Wenn Windows die Lösung ist...
kann ich dann bitte das Problem zurück haben?
 
 Benutzer-Profile anzeigen Private Nachricht senden  
Antworten mit Zitat Nach oben
Hack-o-Master
Titel:   BeitragVerfasst am: 10.11.2006, 16:02 Uhr



Anmeldung: 05. Apr 2005
Beiträge: 499
Wohnort: Bielefeld <:-P
Ein apt-cache search html|grep perl|more fördert u.a. diese Perl-Module zu Tage (neben vielen anderen die sich mit HTML beschäftigen):
    libhtml-linkextractor-perl - Perl module used to extract links from HTML documents
    libhtml-parser-perl - A collection of modules that parse HTML text documents

was wohl für die Aufgabenstellung Arbeit abnehmen könnte.

Bei installierten perl-doc Paket kann dann die Doku dazu per
perldoc HTML::LinkExtractor & perldoc HTML::LinkExtor eingesehen werden.
(siehe auch /usr/share/doc/libhtml-linkextractor-perl/README)

mfg. Hack-o-Master

_________________
sidux2007-02 64Bit, Kernel 2.6.23rc..(Crypto-root), X.org 7.3, KDE 3.5.7
http://bernd-das-brot.de.be | Gästebuch , certified B.O.F.H.


Zuletzt bearbeitet von Hack-o-Master am 10.11.2006, 16:17 Uhr, insgesamt ein Mal bearbeitet
 
 Benutzer-Profile anzeigen Private Nachricht senden E-Mail senden Website dieses Benutzers besuchen  
Antworten mit Zitat Nach oben
gummibaerchen
Titel:   BeitragVerfasst am: 10.11.2006, 16:15 Uhr



Anmeldung: 01. Nov 2006
Beiträge: 32

Mein bester Freund hatte so komplizierte Hausaufgaben.

Also alpha=40° und jetzt brauche ich a, muss aber mit dem Satz des Pythagoras gemacht werden Smilie

Ja ne, schon klar.
 
 Benutzer-Profile anzeigen Private Nachricht senden  
Antworten mit Zitat Nach oben
p500xl
Titel: Re: HTML-Links via Perl auslesen?  BeitragVerfasst am: 10.11.2006, 18:04 Uhr



Anmeldung: 05. Jul 2006
Beiträge: 127

Dannyboy hat folgendes geschrieben::
Im Prinzip möchte er einfach alle auf einer HTML-Seite verfügbaren Downloads und Links auflisten und das Ganze _muss_ mit regulären Ausdrücken passieren


dein freund muss dafür nicht perl können Sehr glücklich
dieses hier für die console

Code:
lynx -dump http://kanotix.com/index.html | sed '1,/^References/d' | grep http | awk '{print $NF}'
 
 Benutzer-Profile anzeigen Private Nachricht senden  
Antworten mit Zitat Nach oben
Beiträge vom vorherigen Thema anzeigen:     
Gehe zu:  
Alle Zeiten sind GMT + 1 Stunde
Neues Thema eröffnen   Neue Antwort erstellen
Vorheriges Thema anzeigen Druckerfreundliche Version Einloggen, um private Nachrichten zu lesen Nächstes Thema anzeigen
PNphpBB2 © 2003-2007 
 
Deutsch | English
Logos and trademarks are the property of their respective owners, comments are property of their posters, the rest is © 2004 - 2006 by Jörg Schirottke (Kano).
Consult Impressum and Legal Terms for details. Kanotix is Free Software released under the GNU/GPL license.
This CMS is powered by PostNuke, all themes used at this site are released under the GNU/GPL license. designed and hosted by w3you. Our web server is running on Kanotix64-2006.