Comment récupérer les PAA (People Also Ask) dans Google via R

Après avoir vu ce que sont les PAA (People Also Ask) et comment les scraper sans coder je vous propose une solution plus adaptée pour ceux / celles qui souhaitent effectuer cette opération sur des dizaines, voire des centaines de mots clés. Pour cela, je vous propose un petit script R qui devrait répondre à votre besoin.

Script R pour récupérer les questions PAA dans Google

setwd(insert your working directory)
# Je charge dans une variable la liste des librairies que je vais utiliser
packages < c("dplyr","httr","Rcurl")

# J'installe automatiquement les librairies necessaires & non installees
if (length(setdiff(packages, rownames(installed.packages()))) > 0) {
  install.packages(setdiff(packages, rownames(installed.packages())))  
}

library(dplyr)
library(httr)
library(RCurl)

mykeywords = c("yourKW","yourKW","yourKW","yourKW") my_user_agent <- "Mozilla/5.0 (Macintosh; Intel Mac OS X 10.13; rv:59.0) Gecko/20100101 Firefox/59.0"

PAA = vector(mode="list", length(mykeywords))

for (i in 1: length(mykeywords))
{ url_to_check <- paste0("https://www.google.com/search?q=",mykeywords[i],"&ie=utf-8&oe=utf-8&client=firefox-b")

PAA[[i]] = GET(url_to_check, user_agent(my_user_agent)) %>%
htmlParse(encoding = "UTF-8") %>%
xpathSApply('//div[/*]/g-accordion-expander/div/div', xmlValue) }

PAA = dplyr::bind_cols(PAA)

PAA = PAA[!apply(is.na(PAA) | PAA == "", 1, all),]
names(PAA) = c("yourKW","yourKW","yourKW","yourKW") write.csv(PAA, file = "paa_google_topic.csv")

à vous de jouer 😉

0 commentaires

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Découvrez aussi …

Chute du trafic ? 11 raisons possibles

La cause la plus fréquente d'une baisse soudaine du trafic sur un site Web est une récente mise à jour de l'algorithme de recherche. Les pénalités, les redirections, les règles incorrectes du fichier robots.txt et les pertes de classement sont toutes d'autres...

Qu’est-ce le SEO et comment fonctionne t-il ?

Qu’est-ce le SEO et comment fonctionne t-il ?

Vous souhaitez comprendre ce qu'est le SEO et son fonctionnement ? Bonne nouvelle, vous êtes au bon endroit. Nous vous avons concocté un guide simple, concis et efficace pour mieux appréhender le SEO et ses enjeux.L'une des questions les plus fréquentes parmi nos...

Comment pousser Google à crawler vos sitemaps ?

Comment pousser Google à crawler vos sitemaps ?

Si vous êtes SEO, vous savez que les sitemaps XML sont importants pour le crawl et l'indexation de vos pages. Il existe plusieurs enjeux majeurs à travers les sitemaps XML : Les urls poussées dans les sitemaps doivent regroupées vos pages importantes d'un point de vue...

10 principes UX à connaître

10 principes UX à connaître

L'UX au service de votre site web Créer un site web n'est pas chose aisée. Cela exige un parfaite compréhension et analyse de la cible. Selon vous serez amener à adapter la navigation, le style ou encore le wording de votre site. Cependant, certaines règles restent...