Übergeben Sie die Zeichenfolge der HTML-Seite und scrappen Sie mit HtmlAgilityPack

c# html-agility-pack vb.net

Frage

Warum bekomme ich diesen Fehler?

" htmlDoc.Load(pageSource) Zeichen in Pfad" in htmlDoc.Load(pageSource)

pageSource ist eine Zeichenfolgenvariable der HTML-Seite. Ich muss die Seitenquelle als Zeichenfolge übergeben, nicht als Datei und nicht als URL. Wie mache ich das?

Dim ids As New List(Of String)()
Dim pageSource = getHtml(url)

Dim htmlDoc As HtmlDocument = New HtmlDocument()

htmlDoc.OptionFixNestedTags = True


htmlDoc.Load(pageSource)


Dim s As HtmlNodeCollection = htmlDoc.DocumentNode.SelectNodes("//div/@id")

For Each div As HtmlNode In s
    ids.Add(div.Id)
Next

Akzeptierte Antwort

Verwenden Sie LoadHtml anstelle von Load :

htmlDoc.LoadHtml(pageSource)

Siehe auch die Quelle.



Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum
Lizenziert unter: CC-BY-SA with attribution
Nicht verbunden mit Stack Overflow
Ist diese KB legal? Ja, lerne warum