C # Daten Scraping von Websites

c# html-agility-pack

Frage

HI Ich bin ziemlich neu in C # Sphäre. Seit Anfang dieses Jahres in PHP und JavaScript. Ich möchte Beiträge und Kommentare aus einem Blog löschen. Die Seite ist http://www.somewhereinblog.net

Was ich tun möchte, ist 1. Ich möchte mit einer Software einloggen 2. Dann laden Sie die HTML 3. Verwenden Sie dann reguläre Ausdrücke, Xpath was auch immer praktisch ist, um den Inhalt der Beiträge und Kommentare zu trennen

Ich habe überall gesucht. Sehr wenig verstanden. Obwohl ich mir ziemlich sicher bin, dass ich "htmlagilitypack" verwenden muss. Ich weiß nicht, wie man eine Bibliothek zur c # Konsole hinzufügt oder Anwendung formt. Kann mir jemand helfen? Ich brauche das dringend. Und ich bin nicht nur in C # nur eine Woche. Wäre also dankbar, wenn es detaillierte Informationen gibt. Warten gespannt.

Danke im voraus Brüder.

Akzeptierte Antwort

  1. Mit dem Webclient können Sie sich einloggen und herunterladen
  2. Stattdessen html- agility -pack Ich mag CsQuery, weil Sie jQuery-Syntax innerhalb einer Zeichenfolge in C # -Code verwenden können, so können Sie in eine Zeichenfolge das HTML herunterladen, und suchen und tun Dinge darin wie mit jQuery und HTML-Seite.


Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum
Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum