Получение атрибута meta tag с помощью пакета Agility Pack с помощью XPATH

html html-agility-pack xpath

Вопрос

META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1" />
TITLE>Microsoft Corporation
META http-equiv="PICS-Label" content="(PICS-1.1 "http://www.rsac.org/ratingsv01.html" l gen true r (n 0 s 0 v 0 l 0))" />
META NAME="KEYWORDS" CONTENT="products; headlines; downloads; news; Web site; what's new; solutions; services; software; contests; corporate news;" />
META NAME="DESCRIPTION" CONTENT="The entry page to Microsoft's Web site. Find software, solutions, answers, support, and Microsoft news." />
META NAME="MS.LOCALE" CONTENT="EN-US" />
META NAME="CATEGORY" CONTENT="home page" />

Я хотел бы знать, какой XPATH мне понадобится, чтобы получить значение атрибута Content метатегов Category с помощью пакета Agility Pack. (Я удалил первую <каждую строку в html-коде, чтобы она опубликовала).

Принятый ответ

В течение длительного времени у HtmlAgilityPack не было возможности напрямую запрашивать значение атрибута . Вам пришлось перебирать список мета узлов. Вот один из способов -

var doc = new HtmlDocument();
doc.LoadHtml(htmlString);

var list = doc.DocumentNode.SelectNodes("//meta"); 
foreach (var node in list)
{
    string content = node.GetAttributeValue("content", "");
}

Но похоже, что есть экспериментальный релиз xpath , который позволит вам это сделать.

doc.Document.SelectNodes("//meta/@content") 

вернет список объектов HtmlAttribute.


Популярные ответы

Если вы хотите, чтобы метатег отображал заголовок, описание и ключевые слова, используйте

 if (metaTags != null)
        {
            foreach (var tag in metaTags)
            {
                if ((tag.Attributes["name"] != null) & (tag.Attributes["content"] != null))
                {
                       Panel divPage = new Panel();                        
                       divPage.InnerHtml = divPage.InnerHtml + "<br /> " +
                        "<b> Page " + tag.Attributes["name"].Value + " </b>: " +
                            tag.Attributes["content"].Value + "<br />";
                }
            }
        }

Если вы хотите получить og:tags из ссылки, добавьте этот код после этого.

            if ((tag.Attributes["property"] != null) & (tag.Attributes["content"] != null))
            {
                if (tag.Attributes["property"].Value == "og:image")
                {
                    img.ImageUrl = tag.Attributes["content"].Value;
                }

            }

это отличный опыт ... Мне нравится :) этот код когда-либо



Related

Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow
Лицензировано согласно: CC-BY-SA with attribution
Не связан с Stack Overflow