Obtention de la position du site dans les résultats de recherche Google

.net c# google-search html-agility-pack parsing

Question

Je veux coder un algorithme ou un analyseur qui devrait obtenir la position du site dans les résultats de recherche Google. Le problème est que chaque fois que la mise en page google changera, je devrais corriger / changer l'algorithme. Comment pensez-vous que les gars vont vraiment changer souvent? Existe-t-il des techniques / conseils / astuces pour déterminer la position du site de Google?

Comment puis-je créer un algorithme de détection de position robuste?

Je veux utiliser C #, .NET 2.0 et HtmlAgilityPack à cette fin. Tout conseil ou proposition sera très apprécié. Merci d'avance, les gars!


MISE À JOUR POSTALE

Je sais que Google montrera captcha pour empêcher les requêtes de la machine. J'ai un service spécial pour ça, qui reconnaîtra tout captcha. Pourriez-vous me parler de votre expérience des résultats de grattage exact?

Réponse acceptée

J'ai posé la question à ce sujet il y a un an et j'ai obtenu de bonnes réponses. Décidément, le pack d'agilité est la solution.

En fin de compte, nous avons fait un grattoir coder rugueux qui a fait le travail et a couru sans aucun problème. Nous frappions Google relativement légèrement (environ 25 requêtes par jour). Nous avons pris la précaution de randomiser 1) l'ordre et 2) l'heure de la journée et 3) l'heure de pause entre les requêtes. Je ne sais pas si cela a aidé, mais nous n'avons jamais été touchés par un captcha.

Nous ne nous en préoccupons plus beaucoup maintenant.

Ses principales faiblesses étaient / sont:

  • nous avons seulement pris la peine de vérifier la première page (nous aurions peut-être pu coder une version améliorée qui examinait les premières pages X, mais le risque serait peut-être plus grand - en termes de détection par Google).

  • ses résultats étaient peu fiables et ont sauté. Vous pouvez être 8ème tous les jours pendant des semaines, à l'exception d'un seul jour au hasard où vous étiez 3ème. Peut-être… l'idée de prendre avec soin une lecture quotidienne ou hebdomadaire et d'enregistrer notre classement est trop imparfaite

Pour répondre à votre question sur la violation du code par Google: Google n'a pas apporté de changement fondamental au cours des mois écoulés, mais il a modifié quelque chose qui a cassé "l'instantané" du résultat (peut-être un changement de CSS?) n'a rien fait pour améliorer la crédibilité des résultats.


Réponse populaire

Google offre une multitude d' API pour accéder à leurs services. Pour la recherche, il y a l' API de recherche personnalisée .




Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi
Sous licence: CC-BY-SA with attribution
Non affilié à Stack Overflow
Est-ce KB légal? Oui, apprenez pourquoi