Разбор HTML-кода HTML с помощью HTMLAgilityPack

c# html html-agility-pack parsing

Вопрос

У меня есть следующий HTML, который я пытаюсь проанализировать с помощью пакета Agility Pack.

Это фрагмент кода HTML:

<body id="station_page" class="">
...
<div>....</div>
<script type="text/javascript"> 
if (Blablabla == undefined) { var Blablabla = {}; }
Blablabla .Data1= "I want this data";
Blablabla .BlablablaData = 
{  "Data2":"I want this data",
"Blablabla":"",
"Blablabla":0   }
{   "Blablabla":123,
"Data3":"I want this data",
"Blablabla":123}
    Blablabla .Data4= I want this data;
</script>...

Я пытаюсь получить эти 4 переменные данных (Data1, Data2, Data3, Data4). во-первых, я попытался найти javascript:

doc.DocumentNode.SelectSingleNode("//script[@type='text/javascript']").InnerHtml

Как я могу проверить, действительно ли это правильный javascript? После нахождения соответствующего javascript, как я могу получить эти 4 переменные данных (Data1, Data2, Data3, Data4)?

Популярные ответы

Вы не можете анализировать javascript с помощью HTML Agility Pack, он поддерживает только парсинг HTML. Вы можете получить скрипт, который вам нужен, с XPATH следующим образом:

doc.DocumentNode.SelectSingleNode("//script[contains(text(), 'Blablabla')]").InnerHtml

Но вам нужно проанализировать javascript с помощью другого метода (regex, js grammar и т. Д.),



Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Является ли этот КБ законным? Да, узнайте, почему
Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Является ли этот КБ законным? Да, узнайте, почему