Я пытаюсь проанализировать HTML, используя HtmlAgilityPack, используя простой метод doc.load, передав URL-адрес, но он имеет следующий результат: как я могу решить эту проблему?
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<meta http-equiv="Content-Script-Type" content="text/javascript">
<script type="text/javascript">
function setCookie(c_name, value, expiredays) {
var exdate = new Date();
exdate.setDate(exdate.getDate()+expiredays);
document.cookie = c_name + "=" + escape(value) + ((expiredays==null) ? "" : ";
expires=" + exdate.toGMTString()) + ";path=/"; }
function getHostUri()
{ var loc = document.location; return loc.toString(); }
setCookie('YPF8827340282Jdskjhfiw_928937459182JAX666', '202.142.170.42', 10);
setCookie('DOAReferrer', document.referrer, 10); location.href = getHostUri();
</script>
</head>
<body>
<noscript>This site requires JavaScript and Cookies to be enabled. Please change your browser settings or upgrade your browser.</noscript>
</body></html>
Для этого сайта необходимо включить JavaScript и Cookies. Измените настройки своего браузера или обновите браузер.
В этом сообщении говорится все, на стороне нужен javascript для загрузки, а HtmlAgilityPack - не JavascriptEngine!
Метод Load HtmlDocument не может интерпретировать и выполнять Javascript-код, это просто «Загрузить» -функцию для статических HTML-сайтов.
То, что вы могли бы попытаться сделать, - с Firebug (или что-то еще ) проверить, какие HttpRequest сделаны для получения контента, и этот запрос вам нужно воссоздать на C #, чтобы получить HTML-код, который вы хотите!
Вот несколько похожих вопросов:
Запуск скриптов в HtmlAgilityPack
C # - Получить значение переменной JavaScript с помощью HTMLAgilityPack