在单个HtmlNodeCollection中获取所有表tr数据c#

c# html-agility-pack web-scraping

我需要使用HTML Agility Pack从所有表中检索所有tr

HTML:

<section class="content-section" id="more">
    <div class="row">
        <div class="col-xs-6"></div>
        <div class="col-xs-6">
            <h2>Specs</h2>
            <div>
                <div>
                    <table>
                        <thead>
                            <tr><th colspan="2"> test</th></tr>
                        </thead>
                        <tbody>                         
                            <tr><td>2</td><td>b</td></tr>
                            <tr><td>1</td><td>a</td></tr>
                        </tbody>
                    </table>                                    
                    <table>
                        <tbody>
                            <tr><td>3</td><td>c</td></tr>
                            <tr><td>4</td><td>d</td></tr>               
                        </tbody>
                    </table>
                </div>              
            </div>
        </div>      
    </div>  
</section>

C#:

<section class="content-section" id="more">
    <div class="row">
        <div class="col-xs-6"></div>
        <div class="col-xs-6">
            <h2>Specs</h2>
            <div>
                <div>
                    <table>
                        <thead>
                            <tr><th colspan="2"> test</th></tr>
                        </thead>
                        <tbody>                         
                            <tr><td>2</td><td>b</td></tr>
                            <tr><td>1</td><td>a</td></tr>
                        </tbody>
                    </table>                                    
                    <table>
                        <tbody>
                            <tr><td>3</td><td>c</td></tr>
                            <tr><td>4</td><td>d</td></tr>               
                        </tbody>
                    </table>
                </div>              
            </div>
        </div>      
    </div>  
</section>

我只能得到第一个表tr但没有得到HtmlNodeCollection所有两个表tr

一般承认的答案

要获取包含thead所有节点的所有tr节点,请将XPath更新为:

"//*[@id='more']/div/div[2]/div/div[1]/table//tr"

这个简化的XPath也应该有效:

"//*[@id='more']/div/div[2]/div/div[1]/table//tr"

如果你只想要来自tbodytr ,请使用:

"//*[@id='more']/div/div[2]/div/div[1]/table//tr"

或者从thead排除tr ,使用:

"//*[@id='more']/div/div[2]/div/div[1]/table//tr"



许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow
这个KB合法吗? 是的,了解原因
许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow
这个KB合法吗? 是的,了解原因