Пакет HTML Agility Parsing с верхними и нижними тегами?

c# html html-agility-pack html-parsing

Вопрос

Я использую HTML Agility Pack с большим эффектом, и я действительно впечатлен им. Однако я выбираю контент таким образом

doc.DocumentNode.SelectSingleNode("//body").InnerHtml

Как я могу справиться со следующей ситуацией, с разными документами?

<body>
<Body>
<BODY>

Будет ли мой код выше получить только версии с нижним регистром?

Принятый ответ

Html Agility Pack обрабатывает HTML нечувствительным к регистру образом. Это означает, что он будет анализировать тело, тело и тело одинаково. Это по дизайну, поскольку HTML не чувствителен к регистру (XHTML есть).

Тем не менее, когда вы используете свою функцию XPATH, вы должны использовать теги, написанные в нижнем регистре. Это означает, что выражение "//body" будет соответствовать BODY, Body и body, а «// BODY» ничего не будет соответствовать.



Related

Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow