Comment récupérer les PAA (People Also Ask) dans Google via R

Après avoir vu ce que sont les PAA (People Also Ask) et comment les scraper sans coder je vous propose une solution plus adaptée pour ceux / celles qui souhaitent effectuer cette opération sur des dizaines, voire des centaines de mots clés. Pour cela, je vous propose un petit script R qui devrait répondre à votre besoin.

Script R pour récupérer les questions PAA dans Google

setwd(insert your working directory)
# Je charge dans une variable la liste des librairies que je vais utiliser
packages < c("dplyr","httr","Rcurl")

# J'installe automatiquement les librairies necessaires &amp; non installees
if (length(setdiff(packages, rownames(installed.packages()))) > 0) {
  install.packages(setdiff(packages, rownames(installed.packages())))  
}

library(dplyr)
library(httr)
library(RCurl)

mykeywords = c("yourKW","yourKW","yourKW","yourKW") my_user_agent <- "Mozilla/5.0 (Macintosh; Intel Mac OS X 10.13; rv:59.0) Gecko/20100101 Firefox/59.0"

PAA = vector(mode="list", length(mykeywords))

for (i in 1: length(mykeywords))
{ url_to_check <- paste0("https://www.google.com/search?q=",mykeywords[i],"&amp;ie=utf-8&amp;oe=utf-8&amp;client=firefox-b")

PAA[[i]] = GET(url_to_check, user_agent(my_user_agent)) %>%
htmlParse(encoding = "UTF-8") %>%
xpathSApply('//div[/*]/g-accordion-expander/div/div', xmlValue) }

PAA = dplyr::bind_cols(PAA)

PAA = PAA[!apply(is.na(PAA) | PAA == "", 1, all),]
names(PAA) = c("yourKW","yourKW","yourKW","yourKW") write.csv(PAA, file = "paa_google_topic.csv")

à vous de jouer 😉

0 commentaires

Soumettre un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Découvrez aussi …

Qu’est-ce le SEO et comment fonctionne t-il ?

Qu’est-ce le SEO et comment fonctionne t-il ?

Vous souhaitez comprendre ce qu'est le SEO et son fonctionnement ? Bonne nouvelle, vous êtes au bon endroit. Nous vous avons concocté un guide simple, concis et efficace pour mieux appréhender le SEO et ses enjeux.L'une des questions les plus fréquentes parmi nos...

Comment pousser Google à crawler vos sitemaps ?

Comment pousser Google à crawler vos sitemaps ?

Si vous êtes SEO, vous savez que les sitemaps XML sont importants pour le crawl et l'indexation de vos pages. Il existe plusieurs enjeux majeurs à travers les sitemaps XML : Les urls poussées dans les sitemaps doivent regroupées vos pages importantes d'un point de vue...

10 principes UX à connaître

10 principes UX à connaître

L'UX au service de votre site web Créer un site web n'est pas chose aisée. Cela exige un parfaite compréhension et analyse de la cible. Selon vous serez amener à adapter la navigation, le style ou encore le wording de votre site. Cependant, certaines règles restent...

How to create XML Sitemap with R

How to create XML Sitemap with R

XML sitemaps are must have when you want to make sure Google crawl your pages. To create XML sitemaps, it exists multiple free and paid solutions. Well, this article will show you how to create XML sitemaps for free with a simple R script. This method does not need to...

Créer un sitemap XML avec Python

Créer un sitemap XML avec Python

Qu'est-ce qu'un sitemap XML ? Un sitemap XML est un fichier qui vise à lister l'ensemble de vos urls importantes pour le SEO. Vous pouvez en créer plusieurs par thématique ou type de pages. Il existe certaines limitations concernant les sitemaps XML. Pour rappel, les...