Ich habe die folgenden und ähnliche Links auf SO und Google untersucht, um aspx-Seite mit HTMLAgilityPack zu analysieren
HTML-Dokument mit HtmlAgilityPack analysieren
Aber ich weiß nicht, wie man eine LINQ-Anweisung schreibt, so dass ich Button- und Label-Kontrollnamen in meiner aspx-Seite identifizieren kann.
Hier ist meine aspx Seite.
<%@ Page Language="C#" AutoEventWireup="true" CodeBehind="WebForm4.aspx.cs" Inherits="WebApplication1.WebForm4" %>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head runat="server">
<title></title>
</head>
<body>
<form id="form1" runat="server">
<div>
<asp:Button ID="Button1" runat="server" Text="Button on page4" />
<br />
<br />
<asp:Label ID="Label1" runat="server" Text="Label on page 4"></asp:Label>
<br />
<br />
<asp:Button ID="Button2" runat="server" Text="second button page 4" />
<br />
<asp:Button ID="Button3" runat="server" Text="second button page 4" />
</div>
</form>
</body>
</html>
Ich möchte LINQ mit dem HTML Agility-Paket schreiben, sodass ich die folgende Ausgabe auflisten kann:
Steuerelemente auf dieser Seite sind Button1, Label1, Button2, Button3
Ich habe Probleme beim Schreiben von LINQ zum Parsen der aspx-Seite. Bitte helfen Sie.
Hier ist, was ich bisher geschrieben habe und es funktioniert nicht.
HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();
htmlDoc.OptionFixNestedTags = true;
string filePath = @"C:\WebApplication1\webform4.aspx";
htmlDoc.Load(filePath);
htmlDoc.Load(filePath);
var pagecontrols = from links in htmlDoc.DocumentNode.Descendants("div")
where links.Attributes.Contains("runat")
select links.Attributes["ID"].Value;
foreach (var pagecontrol in pagecontrols)
{
Response.Write(pagecontrol);
}
Wenn ich Ihr Problem richtig verstanden habe, müssen Sie Folgendes tun:
var pagecontrols = from links in htmlDoc.DocumentNode.Descendants("div")
where links.Attributes.Contains("runat")
select links.Attributes["ID"].Value;
Ich weiß nicht, ob Sie schon die Antwort dafür gefunden haben, aber hier ist die Lösung, die funktioniert.
HtmlAgilityPack.HtmlDocument doc = new HtmlDocument();
HtmlNode.ElementsFlags.Remove("form");
doc.LoadHtml(aspPage);
var elements = doc.DocumentNode.Descendants("div");
var pageControls = from z in elements.ChildNodes
where z.Attributes.Contains("runat") //server controls
select z.Attributes["ID"].Value;