無法通過HtmlAgilityPack加載HTML

html-agility-pack

我嘗試通過傳遞URL使用簡單的doc.load方法使用HtmlAgilityPack解析HTML,但是它帶有以下結果如何解決此問題?

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<meta http-equiv="Content-Script-Type" content="text/javascript">
<script type="text/javascript">
function setCookie(c_name, value, expiredays) { 
  var exdate = new Date(); 
  exdate.setDate(exdate.getDate()+expiredays); 
  document.cookie = c_name + "=" + escape(value) + ((expiredays==null) ? "" : ";
  expires=" + exdate.toGMTString()) + ";path=/"; } 
  function getHostUri() 
  { var loc = document.location; return loc.toString(); }
  setCookie('YPF8827340282Jdskjhfiw_928937459182JAX666', '202.142.170.42', 10); 
  setCookie('DOAReferrer', document.referrer, 10); location.href = getHostUri();
</script>
</head>
<body>
<noscript>This site requires JavaScript and Cookies to be enabled. Please change your   browser settings or upgrade your browser.</noscript>
</body></html>

熱門答案

此站點需要啟用JavaScript和Cookie。請更改您的瀏覽器設置或升級您的瀏覽器。

這條消息說明了一切,方需要加載javascript,而HtmlAgilityPack則不是JavascriptEngine!

HtmlDocument的加載方法不能解釋和執行Javascript-Code它只是一個簡單的“下載” - 靜態HTML站點的功能。

您可以嘗試做的是,使用Firebug (或其他 )檢查哪些HttpRequest用於獲取內容,此請求必須在C#中重新創建以獲取您想要的HTML!

以下是一些類似的問題:

在HtmlAgilityPack中運行腳本

C# - 使用HTMLAgilityPack獲取JavaScript變量值

從HtmlAgilityPack調用javascript函數




許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因
許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因