來自網站的C#數據抓取

c# html-agility-pack

嗨我在C#領域很新。自今年年初開始使用php和JavaScript。我想從博客中刪除帖子和評論。該網站是http://www.somewhereinblog.net

我想要做的是1.我想使用軟件登錄2.然後下載html 3.然後使用正則表達式,xpath任何方便分離帖子和評論的內容

我一直在尋找。理解得很少。雖然我很確定我需要使用'htmlagilitypack'。我不知道如何將庫添加到c#控制台或表單應用程序。有人可以給我一些幫助嗎?我非常需要這個。而且我不會在一周內進入C#。如果有一些詳細的信息,將不勝感激。急切地等待。

先謝謝兄弟們。

一般承認的答案

  1. 使用Webclient,您可以登錄和下載
  2. 相反,html-agility-pack我更喜歡CsQuery,因為你可以在C#代碼中的字符串中使用jQuery語法,這樣你就可以將字符串下載到html中,並像jQuery和HTML頁面一樣搜索和處理它。



許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因
許可下: CC-BY-SA with attribution
不隸屬於 Stack Overflow
這個KB合法嗎? 是的,了解原因