我是来自python背景的C#的新手。我很难搞清楚这一点。在python中我可以使用beautifulsoup来做到这一点:
from bs4 import BeautifulSoup
import requests
r = requests.get('http://stackoverflow.com').content
soup = BeautifulSoup(r).prettify
print soup
这将获取stackoverflow.com的源内容,并将其打印到控制台。我无法弄清楚如何在C#中做到这一点。
var webGet = new HtmlWeb();
var document = webGet.Load("http://stackoverflow.com");
Console.WriteLine(document);
这不起作用,它只打印var文档的类型。有谁知道如何做到这一点?我将非常感激 - 我正在尝试通过转换我的一个python程序来学习C#,只是fyi。
使用DocumentNode
的OuterHtml
属性:
var webGet = new HtmlWeb();
var document = webGet.Load("http://stackoverflow.com");
Console.WriteLine(document.DocumentNode.OuterHtml);