HtmlAgilityPack을 사용하여 HTML에서 이메일 추출

c# html-agility-pack selectnodes

문제

이 HTML 코드에서 HtmlAgilityPack을 사용하여 이메일 및 웹 사이트 주소를 추출하려면 어떻게해야합니까?

<a class="email" href="mailto:babaie@irandoc.ac.ir">

<a class="" href="http://www.babaie.ir" target="_blank">www.babaie.ir</a>

나는이 코드를 시도했지만 이메일에는 작동하지 않는다 :

<a class="email" href="mailto:babaie@irandoc.ac.ir">

<a class="" href="http://www.babaie.ir" target="_blank">www.babaie.ir</a>

인기 답변

이메일 받기 :

var a = doc.DocumentNode.SelectSingleNode("//a[@class='email']");
if (a != null)
{
    string href = a.Attributes["href"].Value; // TODO: Check if href exists
    string email = href.Replace("mailto:", "");
}

웹 사이트 주소가 다른 앵커 태그 (여기에 특정 클래스 나 ID가 없음)와 다른 점은 분명하지 않으므로 다음 코드는 html의 모든 앵커에서 모든 href 링크를 반환합니다.

var a = doc.DocumentNode.SelectSingleNode("//a[@class='email']");
if (a != null)
{
    string href = a.Attributes["href"].Value; // TODO: Check if href exists
    string email = href.Replace("mailto:", "");
}



아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.
아래 라이선스: CC-BY-SA with attribution
와 제휴하지 않음 Stack Overflow
이 KB는 합법적입니까? 예, 이유를 알아보십시오.