이 샘플에서는 htmlagilitypack을 사용하여 HTML에서 텍스트를 추출하는 방법은 무엇입니까?

c# html-agility-pack html-content-extraction linq xpath

문제

HTML 원본에서 텍스트를 추출하고 싶습니다. 나는 C # 및 htmlagilitypack dll로 시도하고있다.

근원은 :

<table>
  <tr>
    <td class="title">
      <a onclick="func1">Here 2</a>
    </td>
    <td class="arrow">
      <img src="src1" width="9" height="8" alt="Down">
    </td>
    <td class="percent">
      <span>39%</span>
    </td>
    <td class="title">
      <a onclick="func2">Here 1</a>
    </td>
    <td class="arrow">
      <img src="func3" width="9" height="8" alt="Up">
    </td>
    <td class="percent">
      <span>263%</span>
    </td>
  </tr>
</table>

테이블에서 Here 1과 Here 2 텍스트를 어떻게 얻을 수 있습니까?

인기 답변

HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml("web page string");
var xyz = from x in htmlDoc.DocumentNode.DescendantNodes()
                     where x.Name == "td" && x.Attributes.Contains("class")
                     where x.Attributes["class"].Value == "title"
                     select x.InnerText;

그렇게 예쁘지는 않지만 일해야한다.




아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.