Le code d'application de la console C # ne s'exécute pas après une attente

async-await c# html-agility-pack html-parsing

Question

J'essaye de faire un webscraper où j'obtiens tous les liens de téléchargement pour le css / js / images depuis un fichier html.

Problème

Le premier point d'arrêt frappe, mais le second pas après avoir cliqué sur "Continuer".

Image dans Visual Studio

Code dont je parle:

  private static async void GetHtml(string url, string downloadDir)
    {

        //Get html data, create and load htmldocument 
        HttpClient httpClient = new HttpClient();

        //This code gets executed
        var html = await httpClient.GetStringAsync(url);

        //This code not
        Console.ReadLine();
        var htmlDocument = new HtmlDocument();
        htmlDocument.LoadHtml(html);

        //Get all css download urls
        var linkUrl = htmlDocument.DocumentNode.Descendants("link")
            .Where(node => node.GetAttributeValue("type", "")
            .Equals("text/css"))
            .Select(node=>node.GetAttributeValue("href",""))
            .ToList();

        //Downloading css, js, images and source code
        using (var client = new WebClient())
        {
            for (var i = 0; i <scriptUrl.Count; i++)
            {

                    Uri uri = new Uri(scriptUrl[i]);
                    client.DownloadFile(uri,
                    downloadDir + @"\js\" + uri.Segments.Last());

            }
        }

modifier

J'appelle la méthode getHtml à partir d'ici:

    private static void Start()
    {
        //Create a list that will hold the names of all the subpages
        List<string> subpagesList = new List<string>();

        //Ask user for url and asign that to var url, also add the url to the url list
        Console.WriteLine("Geef url van de website:");
        string url = "https://www.hethwc.nl";


        //Ask user for download directory and assign that to var downloadDir
        Console.WriteLine("Geef locatie voor download:");
        var downloadDir = @"C:\Users\Daniel\Google Drive\Almere\C# II\Download tests\hethwc\";

        //Download and save the index file
        var htmlSource = new System.Net.WebClient().DownloadString(url);
        System.IO.File.WriteAllText(@"C:\Users\Daniel\Google Drive\Almere\C# II\Download tests\hethwc\index.html", htmlSource);

        // Creating directories 
        string jsDirectory = System.IO.Path.Combine(downloadDir, "js");
        string cssDirectory = System.IO.Path.Combine(downloadDir, "css");
        string imagesDirectory = System.IO.Path.Combine(downloadDir, "images");

        System.IO.Directory.CreateDirectory(jsDirectory);
        System.IO.Directory.CreateDirectory(cssDirectory);
        System.IO.Directory.CreateDirectory(imagesDirectory);

        GetHtml("https://www.hethwc.nu", downloadDir);
    }

Réponse d'expert

Comment appelez-vous GetHtml ? Cela provient vraisemblablement d'une méthode Main sync, et vous n'avez aucun autre thread non ouvrier en jeu (car votre thread principal est quitté): le processus se terminera. Quelque chose comme:

static void Main() {
    GetHtml();
}

La procédure ci-dessus met fin au processus immédiatement après le retour de GetHtml et la fin de la méthode Main , qui sera au premier point d' await incomplet.

Dans les versions C # actuelles (à partir de la version 7.1), vous pouvez créer une méthode async Task Main() , qui vous permettra d' await correctement votre méthode GetHtml , tant que vous modifiez GetHtml pour renvoyer Task :

async static Task Main() {
    await GetHtml();
}


Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi