Analyser HTML avec C #

c# html html-agility-pack windows-phone

Question

Je voudrais analyser la page html en utilisant C #. Il y a des pages HTML qui contiennent beaucoup de balises HTML, en voici un exemple:

<span class=text14 id="article_content"><!-- RELEVANTI_ARTICLE_START --><span ></b>The 
     most important component for <a
     class=bluelink href="http://www.ynetnews.com/articles/0,7340,L-
     3284752,00.html%20"' onmouseover='this.href=unescape(this.href)' 
     target=_blank>Israel</a>'s
     security is its special relations with the American administration, and especially with its generous purse. When the Netanyahu government launches a great outcry against the <a  ...

mais j'aimerais seulement que le contenu soit enveloppé par la <span class=text14 id="article_content"> . Au début, j'ai pensé à utiliser preg match, mais ensuite j'ai réalisé que ce n'était pas efficace du tout. J'ai lu plus tard des articles sur Html Agility Pack et FizzlerEx - j'aimerais savoir s'il est possible de faire en sorte que le texte soit enveloppé par la balise spécifique que j'ai mentionnée à l'aide de ces outils, et je serais reconnaissant si quelqu'un pouvait me dire comment. rapide cette tâche pourrait être effectuée.

Réponse acceptée

C'est assez simple d'utiliser Html Agility Pack :

var markup = @"<span class=text14 id=""article_content""><!-- RELEVANTI_ARTICLE_START --><span ></b>The most important component for <a class=bluelink href=""http://www.ynetnews.com/articles/0,7340,L-3284752,00.html%20""' onmouseover='this.href=unescape(this.href)' target=_blank>Israel</a>'s security is its special relations with the American administration, and especially with its generous purse. When the Netanyahu government launches a great outcry against the</span>";

var doc = new HtmlDocument();
doc.LoadHtml(markup);

var content = doc.GetElementbyId("article_content").InnerText;

Console.WriteLine(content);


Related

Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi