ID 또는 클래스 이름없이 요소에서 텍스트 가져 오기

c# html-agility-pack

문제

html 애자 팩을 사용하여 HTML 코드를 구문 분석하려고합니다. 사용 가능한 튜토리얼이 있습니까, 아니면 누군가가 Id가없고 클래스가없는 <td> 텍스트를 어떻게 얻을 수 있는지 말해 줄 수 있습니까?

    <table id="results-table">
    <tr class="row1">
    <td>Diode Zener Single 12V 5% 1W 2-Pin DO-41 Bulk</td> 
    ...

각 행에는 10 개의 서로 다른 <td> 있습니다. 감사!

인기 답변

XPATH 를 사용하여 id="results-table" 갖는 table 내의 모든 td 를 쿼리 해 볼 수 있습니다.

//table[@id='results-table']/tr/td

파이어 폭스 용 파이어 패스 (Firepath for Firefox)는 XPATH를 공식화하는 데 도움을 줄 수 있으며 XPath를 조작 할 수 있습니다.

아래 샘플 코드

HtmlDocument doc = new HtmlDocument();
var fileName = @"..\..\..\docs\10960189.htm";
doc.Load(fileName);

var nodes = doc.DocumentNode.SelectNodes("//table[@id='results-table']/tr/td");

foreach (var node in nodes)
{
    Debug.WriteLine(node.InnerText);
}

HTH



아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.