일부 텍스트가 포함 된 div
요소의 클래스를 식별해야합니다. 예를 들어이 HTML 페이지가 있습니다.
<html>
...
<div class='x'>
<p>this is the text I have.</p>
<p>Another part of text.</p>
</div>
...
</html>
그래서 저는이 텍스트가 제가 알고있는 텍스트임을 압니다 this is the text I have. Another part of text.
그리고 div 클래스 이름을 식별해야합니다. C #을 사용하여이 작업을 수행 할 수 있습니까?
diiN_의 답을 바탕으로 구축하십시오. 이것은 약간 장황하지만 필요한 것을 얻을 수 있어야합니다. 코드는 HTML 민첩성 팩 에 따라 다릅니다. 너겟을 사용하여 얻을 수 있습니다.
var sb = new StringBuilder();
sb.AppendFormat("<html>");
sb.AppendFormat("<div class='x'>");
sb.AppendFormat("<p>this is the text I have.</p>");
sb.AppendFormat("<p>Another part of text.</p>");
sb.AppendFormat("</div>");
sb.AppendFormat("</html>");
const string stringToSearch = "<p>this is the text I have.</p><p>Another part of text.</p>";
var document = new HtmlDocument();
document.LoadHtml(sb.ToString());
var divsWithText = document
.DocumentNode
.Descendants("div")
.Where(node => node.Descendants()
.Any(des => des.NodeType == HtmlNodeType.Text))
.ToList();
var divsWithInnerHtmlMatching =
divsWithText
.Where(div => div.InnerHtml.Equals(stringToSearch))
.ToList();
var innerHtmlAndClass =
divsWithInnerHtmlMatching
.Select(div =>
new
{
InnerHtml = div.InnerHtml,
Class = div.Attributes["class"].Value
});
foreach (var item in innerHtmlAndClass)
{
Console.WriteLine("class='{0}' innerHtml='{1}'", item.Class, item.InnerHtml);
}
이 시도:
string stringToSearch = "<p>this is the text I have.</p><p>Another part of text.</p>";
HtmlDocument document = new HtmlDocument();
document.LoadHtml(sb.ToString());
var classOfDiv = document.DocumentNode.Descendants("div").Select(x => new
{
ClassOfDiv = x.Attributes["class"].Value
}).Where(x => x.InnerHtml = stringToSearch);
이제 classOfDiv
변수에 원하는 div
의 class
이름이 포함됩니다.