아래의 코드에서 특정 문자열을 포함하는 모든 HTML 태그를 가져 오는 중입니다.
<meta name="DCSext.oo_market" content="en-us">
<a href="http://office.microsoft.com/en-us/support/" title="Find help for Word">
<a href="http://windows.microsoft.com/en-us/windows-live/microsoft-account-help#microsoft-account=tab1" title="Microsoft Account">
속성에 "en-us"가 포함 된 모든 태그를 원한다면 위의 HTML 태그를 모두 출력해야합니다. 누구든지 HTML 민첩성 팩을 사용하여 얻는 방법을 알려주십시오.
문자열 en-us
가 포함 된 모든 특성을 가진 요소를 선택하는 다음 XPath //*[@*[contains(., 'en-us')]]
를 사용할 수 있습니다.
HtmlDocument doc = new HtmlDocument();
doc.Load(path_to_html_file);
var nodes = doc.DocumentNode.SelectNodes("//*[@*[contains(., 'en-us')]]");
또는 LINQ 방법 :
var nodes = doc.DocumentNode.Descendants()
.Where(n => n.Attributes.Any(a => a.Value.Contains("en-us")));