Analizar HTML con C #

c# html html-agility-pack windows-phone

Pregunta

Me gustaría analizar la página html usando C #. Hay páginas html que contienen muchas etiquetas html, aquí hay una muestra de una de ellas:

<span class=text14 id="article_content"><!-- RELEVANTI_ARTICLE_START --><span ></b>The 
     most important component for <a
     class=bluelink href="http://www.ynetnews.com/articles/0,7340,L-
     3284752,00.html%20"' onmouseover='this.href=unescape(this.href)' 
     target=_blank>Israel</a>'s
     security is its special relations with the American administration, and especially with its generous purse. When the Netanyahu government launches a great outcry against the <a  ...

pero solo me gustaría obtener el contenido envuelto por la etiqueta <span class=text14 id="article_content"> . Al principio, pensé en usar el partido de preg, pero luego me di cuenta de que no era eficiente en absoluto. Más tarde leí sobre Html Agility Pack y FizzlerEx . Me gustaría saber si es posible envolver el texto con la etiqueta específica que mencioné usando estas herramientas, y agradecería que alguien me dijera cómo. Rápido esta tarea podría ser realizada.

Respuesta aceptada

Es bastante sencillo usar Html Agility Pack :

var markup = @"<span class=text14 id=""article_content""><!-- RELEVANTI_ARTICLE_START --><span ></b>The most important component for <a class=bluelink href=""http://www.ynetnews.com/articles/0,7340,L-3284752,00.html%20""' onmouseover='this.href=unescape(this.href)' target=_blank>Israel</a>'s security is its special relations with the American administration, and especially with its generous purse. When the Netanyahu government launches a great outcry against the</span>";

var doc = new HtmlDocument();
doc.LoadHtml(markup);

var content = doc.GetElementbyId("article_content").InnerText;

Console.WriteLine(content);


Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué
Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué