Analizzare la tabella HTML in PowerShell V3

html-agility-pack powershell

Domanda

Ho la seguente tabella HTML Link al codice HTML

Voglio analizzarlo e convertirlo in XML / CSV / PS Object, ho provato a fare con HtmlAgilityPack.dll ma non ha avuto successo. Qualcuno può darmi qualche indicazione per farlo?


Voglio convertire la tabella in PSObject ed esportarla in csv, attualmente ho solo l'inizio del codice e accesso alle linee ma non riesco ad accedere ai valori nelle righe

Add-Type -Path C:\Windows\system32\HtmlAgilityPack.dll
$HTML = New-Object HtmlAgilityPack.HtmlDocument
$res = $HTML.Load("C:\Test\Test.html")
$table = $HTML.DocumentNode.SelectNodes("//table/tr/td/nobr")

quando accedo a $ table [0..47] .InnerHtml ottengo solo la prima ** colonna ** del file, non riesco ad accedere alla seconda ed ecc.

Grazie Ohad

Risposta accettata

puoi provare questo per ottenere tutto il <nobr> HTML nei tag <nobr> . Ti lascio trovare la logica per produrre ciò che vuoi ...

$ie = new-object -com "InternetExplorer.Application"
$ie.navigate("http://urltoyourfile.html")
$doc = $ie.Document
($doc.getElementsByTagName("nobr"))|%{$_.innerHTML}

Produzione :

$ie = new-object -com "InternetExplorer.Application"
$ie.navigate("http://urltoyourfile.html")
$doc = $ie.Document
($doc.getElementsByTagName("nobr"))|%{$_.innerHTML}

un modo per analizzarlo:

$ie = new-object -com "InternetExplorer.Application"
$ie.navigate("http://urltoyourfile.html")
$doc = $ie.Document
($doc.getElementsByTagName("nobr"))|%{$_.innerHTML}



Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché
Autorizzato sotto: CC-BY-SA with attribution
Non affiliato con Stack Overflow
È legale questo KB? Sì, impara il perché