¿Por qué mi xpath es nula? ¿Por qué no está encontrando los nodos?

.net c# html-agility-pack xml xpath

Pregunta

Me estoy iniciando en el desplazamiento a través de documentos XML para aprender a usar xpath.

Me he topado con un problema. Cada vez que intento ejecutar mi xpath, devuelve un null como si no hubiera encontrado nada. He probado el xpath en XMLQuire y funcionó allí.

class Program
    {
        private static string URL = "https://www.kijiji.ca/b-renovation-contracting-handyman/ontario/home-renovations/k0c753l9004";
        private static HtmlWeb client = new HtmlWeb();
        static void Main(string[] args)
        {
            var DOM = client.Load(URL); // //table/tbody/tr/td[@class = 'description']/p
            var Featured = DOM.DocumentNode.SelectNodes("//table[contains(@class,'top-feature')]/tbody/tr/td/a");
            foreach (var Listing in Featured)
            {

            }
        }
    }

Comenté el otro xpath que probé, probé esos dos y ambos están volviendo null ¿por qué?

Aquí hay una imagen que muestra la parte del DOM al que quiero acceder. introduzca la descripción de la imagen aquí

<table class="top-feature          js-hover" data-ad-id="1299717863" data-vip-url="/v-renovation-contracting-handyman/sudbury/c-l-contracting-any-job-big-or-small/1299717863">
    <tbody><tr>
        <td class="watchlist">
            <div class="watch js-hover p-vap-lnk-actn-addwtch" data-action="add" data-adid="1299717863" title="Click to add to My Favourites"><div class="icon"></div></div>
                    <input id="watchlistXsrf" name="ca.kijiji.xsrf.token" value="1527418405414.9b71d1309fdd8a315258ea5a3dac1a09e4a99ec7f32041df88307c46e26a5b1b" type="hidden">
</td>

        <td class="image">
            <div class="multiple-images"><img src="https://i.ebayimg.com/00/s/NjAwWDgwMA==/z/fXEAAOSwaZdZxTv~/$_2.JPG" alt="C.L. Contracting. Any job big or small."></div>
                        </td>
        <td class="description">
            <a href="/v-renovation-contracting-handyman/sudbury/c-l-contracting-any-job-big-or-small/1299717863" class="title ">
                C.L. Contracting. Any job big or small.</a>

            <p>
                Contractor handyman home renovations and repairs. Contractor for Dollarama, Rexall, LaSenza and more. Fully licensed and insured. Able to do drywall, decks, framing, plumbing, flooring windows, ...</p>

            <p class="details">
                </p>
        </td>
        <td class="posted">
            </td>
    </tr>
    </tbody></table>

Mi solución (necesito ayuda para convertir mi xpath en 1 línea en lugar de atravesar con un montón de bucles).

private static string URL = "https://www.kijiji.ca/b-renovation-contracting-handyman/ontario/home-renovations/k0c753l9004";
        private static HtmlWeb client = new HtmlWeb();
        static void Main(string[] args)
        {
            var DOM = client.Load(URL); // //table/tbody/tr/td[@class = 'description']/p
            var Featured = DOM.DocumentNode.SelectNodes("//table[contains(@class,'top-feature')]/tbody/tr/td/a");
            foreach (var table in DOM.DocumentNode.SelectNodes("//table[contains(@class, 'top-feature')]"))
            {
                Console.WriteLine($"Found: {table}");
                foreach (var rows in table.SelectNodes("tr"))
                {
                    Console.WriteLine(rows);

                    foreach (var cell in rows.SelectNodes("td[@class='description']/a"))
                    {
                    Console.WriteLine(cell.InnerText.Trim());

                    }
                }
            }

            Console.ReadKey();

Me las arreglé para arreglarlo, pero tengo curiosidad por saber por qué funciona este xpath

//table[contains(@class, 'top-feature')]/tr/td[@class='description']/a

Y este no lo hace. //table[contains(@class,'top-feature')]/tbody/tr/td/a

Respuesta popular

Como se mencionó en el comentario, el elemento <tbody> es generado por una herramienta de desarrollo del navegador.

Si observa su objeto var DOM durante el tiempo de ejecución con el depurador, puede ver la propiedad InnerHtml .

<table class="regular-ad js-hover" data-ad-id=".." data-vip-url="..">
    <tr>
        <td class="watchlist">
            ...
        </td>    
        <td class="image">
            ...
        </td>
        ...
    </tr>
 </table>

No hay ningún elemento <tbody> , por lo que tu XPath tiene que verse así:

DOM.DocumentNode.SelectNodes("//table[contains(@class,'top-feature')]/tr/td/a");


Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué
Licencia bajo: CC-BY-SA with attribution
No afiliado con Stack Overflow
¿Es esto KB legal? Sí, aprende por qué