Passa una stringa di pagine HTML e raschia con HtmlAgilityPack

c# html-agility-pack vb.net

Domanda

Perché ottengo questo errore?

"Caratteri non htmlDoc.Load(pageSource) nel percorso" in htmlDoc.Load(pageSource)

pageSource è una variabile stringa della pagina HTML. Ho bisogno di passare l'origine della pagina come una stringa, non come un file e non come un URL. Come faccio a fare questo?

Dim ids As New List(Of String)()
Dim pageSource = getHtml(url)

Dim htmlDoc As HtmlDocument = New HtmlDocument()

htmlDoc.OptionFixNestedTags = True


htmlDoc.Load(pageSource)


Dim s As HtmlNodeCollection = htmlDoc.DocumentNode.SelectNodes("//div/@id")

For Each div As HtmlNode In s
    ids.Add(div.Id)
Next

Risposta accettata

Usa LoadHtml anziché Load :

htmlDoc.LoadHtml(pageSource)

Vedi anche la fonte.




Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché
Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché