Pase la cadena de la página HTML y raspe con HtmlAgilityPack

c# html-agility-pack vb.net

Pregunta

¿Por qué me sale este error?

"Caracteres ilegales en la ruta" en htmlDoc.Load(pageSource)

pageSource es una variable de cadena de la página HTML. Necesito pasar la fuente de la página como una cadena, no como un archivo y no como una URL. ¿Cómo hago esto?

Dim ids As New List(Of String)()
Dim pageSource = getHtml(url)

Dim htmlDoc As HtmlDocument = New HtmlDocument()

htmlDoc.OptionFixNestedTags = True


htmlDoc.Load(pageSource)


Dim s As HtmlNodeCollection = htmlDoc.DocumentNode.SelectNodes("//div/@id")

For Each div As HtmlNode In s
    ids.Add(div.Id)
Next

Respuesta aceptada

Use LoadHtml lugar de Load :

htmlDoc.LoadHtml(pageSource)

Véase también la fuente.



Related

Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué
Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué