Analyse du tableau HTML dans PowerShell V3

html-agility-pack powershell

Question

J'ai le tableau HTML suivant Lien vers le HTML

Je veux l'analyser et le convertir en objet XML / CSV / PS, j'ai essayé de le faire avec HtmlAgilityPack.dll mais sans succès. Quelqu'un peut-il me donner des instructions pour le faire?


Je veux convertir la table en PSObject et l'exporter en csv. Je n'ai que le début du code et l'accès aux lignes, mais je ne peux pas accéder aux valeurs des lignes.

Add-Type -Path C:\Windows\system32\HtmlAgilityPack.dll
$HTML = New-Object HtmlAgilityPack.HtmlDocument
$res = $HTML.Load("C:\Test\Test.html")
$table = $HTML.DocumentNode.SelectNodes("//table/tr/td/nobr")

quand j'accède à $ table [0..47] .InnerHtml, je n'obtiens que la première ** colonne ** du fichier, je ne peux pas accéder à la 2e et etc.

Merci Ohad

Réponse acceptée

Vous pouvez essayer ceci pour obtenir tout le code HTML dans les balises <nobr> . Je vous laisse trouver la logique pour sortir ce que vous voulez ...

$ie = new-object -com "InternetExplorer.Application"
$ie.navigate("http://urltoyourfile.html")
$doc = $ie.Document
($doc.getElementsByTagName("nobr"))|%{$_.innerHTML}

Sortie:

$ie = new-object -com "InternetExplorer.Application"
$ie.navigate("http://urltoyourfile.html")
$doc = $ie.Document
($doc.getElementsByTagName("nobr"))|%{$_.innerHTML}

une façon de l'analyser:

$ie = new-object -com "InternetExplorer.Application"
$ie.navigate("http://urltoyourfile.html")
$doc = $ie.Document
($doc.getElementsByTagName("nobr"))|%{$_.innerHTML}



Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi