Htmlagilitypack中的GetElementsByTagName

c# getelementsbytagname html-agility-pack webbrowser-control

如果我不知道它的ID,如何为文本框选择一个元素?

如果我知道它的id,那么我可以简单地写:

HtmlAgilityPack.HtmlNode node = doc.GetElementbyId(id);

但是我不知道textbox的ID,我在HtmlagilityPack中找不到GetElementsByTagName方法,它在webbrowser控件中可用。在Web浏览器控件中,我可以简单地写:

HtmlElementCollection elements = browser[i].Document.GetElementsByTagName("form");
foreach (HtmlElement currentElement in elements)
{

}

编辑

这是我正在谈论的HTML表单

<form id="searchform" method="get" action="/test.php">
<input name="sometext" type="text">
</form>

请注意我不知道表格的ID。并且在同一页面上可以有多种形式。我唯一知道的是“sometext”,我想用这个名字来获取这个元素。所以我想我必须逐个解析所有表格,然后找到这个名字“sometext”,但我该怎么做?

一般承认的答案

如果你正在寻找它的标记名的标签(如form<form name="someForm">那么你可以使用:

var forms = document.DocumentNode.Descendants("form");

如果您正在通过其name属性查找标记(例如someForm for <form name="someForm"> ,那么您可以使用:

var forms = document.DocumentNode.Descendants().Where(node => node.Name == "formName");

对于最后一个,您可以创建一个简单的扩展方法:

public static class HtmlNodeExtensions
{
    public static IEnumerable<HtmlNode> GetElementsByName(this HtmlNode parent, string name)
    {
        return parent.Descendants().Where(node => node.Name == name);
    }

    public static IEnumerable<HtmlNode> GetElementsByTagName(this HtmlNode parent, string name)
    {
        return parent.Descendants(name);
    }
}

注意:您还可以使用SelectNodes和XPath来查询文档:

var nodes = doc.DocumentNode.SelectNodes("//form//input");

会在页面上为您提供表单标记中的所有输入。

var nodes = doc.DocumentNode.SelectNodes("//form[1]//input");

将为您提供页面上第一个表单的所有输入


热门答案

任何节点名称:

doc.DocumentNode.SelectNodes("//*[@name='name']")

按名称输入节点:

doc.DocumentNode.SelectNodes("//input[@name='name']")


许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow
这个KB合法吗? 是的,了解原因
许可下: CC-BY-SA with attribution
不隶属于 Stack Overflow
这个KB合法吗? 是的,了解原因