html agility packを使用してdivクラスの下でul li項目を取得する

.net c# html html-agility-pack

質問

<div class="outer">
    <div class="divOne"></div>
    <div class="divContent">
       <h3>SomeTitle</h3>
       <h4>SomeSubtitle</h4>
       <ul>
          <li><a href="/someUrlx.htm">SomeUrl</a>
               <span> Nr of records under this url </span>
          </li>
       </ul>
       <h4>Some Other Subtitle</h4>
       <ul>
          <li><a href="/someUrlx.htm">SomeUrl</a>
              <span> Nr of records under this url </span>
          </li>
       </ul>
     </div>
</div>

もう一度、上記のhtml構造体の下にあるすべての順序付けられていないリスト項目を取得したい

divContentクラスのコンテンツを取得するには

var regs = htmlDoc.DocumentNode.SelectSingleNode(@"//div[@class='outer']");

var descendant = regs.Descendants()
                    .Where(x => x.Name == "div" && x.Attributes["class"].Value == "divContent")
                    .Select(x => x.OuterHtml);

今私はul liのアイテムを取得する表現が必要です。

受け入れられた回答

これはうまくいくはずです:

IEnumerable<string> listItemHtml = htmlDoc.DocumentNode.SelectNodes(
    @"//div[@class='outer']/div[@class='divContent']/ul/li")
    .Select(li => li.OuterHtml);

例: https : //dotnetfiddle.net/fnDPLB


下記のコメントに基づいて更新してください:

値が "SomeSubtitle"の<h4>要素の直接の兄弟である<h4> <ul> <li>要素に属する<li>要素のみを検索する場合は、次に示すXPath式が必要です。

//div[@class='outer']      // Get div.outer
/div[@class='divContent']  // under that div, find div.divContent
/h4[text()='SomeSubtitle'] // under div.divContent, find an h4 with the value 'SomeSubtitle'
/following::ul[1]/li       // Get the first ul following the h4 and then get its li elements.

例: https : //dotnetfiddle.net/AfinpV



Related

ライセンスを受けた: CC-BY-SA with attribution
所属していない Stack Overflow
ライセンスを受けた: CC-BY-SA with attribution
所属していない Stack Overflow