Extraction de données C # de sites Web

c# html-agility-pack

Question

Salut, je suis assez nouveau dans la sphère C #. Été en php et JavaScript depuis le début de cette année. Je veux supprimer les messages et les commentaires d'un blog. Le site est http://www.somewhereinblog.net

Ce que je veux faire, c'est 1. Je veux me connecter à l'aide d'un logiciel 2. Ensuite, téléchargez le code HTML 3. Utilisez ensuite des expressions régulières, xpath comme vous le souhaitez, pour séparer le contenu des publications et des commentaires.

J'ai cherché partout. Compris très peu. Bien que je sois certain d’avoir besoin d’utiliser 'htmlagilitypack'. Je ne sais pas comment ajouter une bibliothèque à la console c # ou à l'application de formulaire. Est-ce que quelqu'un peut m'aider? J'ai terriblement besoin de ça. Et je ne suis pas trop dans C # juste une semaine. Nous vous serions donc reconnaissants d’avoir des informations détaillées. Attendre avec impatience.

Merci d'avance frères.

Réponse acceptée

  1. En utilisant Webclient, vous pouvez vous connecter et télécharger
  2. J'aime plutôt CsQuery car html-agility-pack me permet d’utiliser la syntaxe jQuery dans une chaîne en code C # pour pouvoir télécharger le html dans une chaîne et y effectuer des recherches comme avec jQuery et une page HTML.


Related

Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi