Skip to main content
Extraire liens hypertextes dans Excel

Extraire les liens hypertextes dans Excel

Extraction liens Google vers Excel

Dans cet article, je vous vous expliquer comment extraire les liens hypertextes dans Excel.

Pourquoi extraire les liens hypertextes dans Excel ?

Eh bien, les applications sont multiples. Il s’agit entre autres, de pouvoir :

  1. extraire tous les liens d’une recherche Google
  2. extraire tous les liens internes d’un site web
  3. extraire tous les liens (produits, articles, images…) d’une page web
  4. extraire tous les backlinks (ou rétroliens) d’un site, etc.

Il y a bien d’autres applications mais nous allons nous limiter dans cet article à détailler les 2 premiers cas de figure, qui me semblent être les plus adaptés à notre démonstration.

Passons tout de suite à la mise en oeuvre de cette technique ;

1. Extraire tous les liens d’une recherche Google

Au lieu d’afficher une dizaine de résultats par page, ce qui correspond au réglage par défaut de Google, je vais vous donner une astuce pour afficher une centaine de résultats de recherche (voire davantage) en une seule requête !

Cela peut s’avérer très utile par exemple, pour répertorier vos concurrents sur internet.

Nous allons utiliser la structure suivante d’URL:

https://www.google.com/search?q=keyword&num=100

keyword étant le mot clé à rechercher et 100 étant le nombre de résultats que l’on souhaite afficher d’une seule traite, grâce à cette requête.

Pour des questions d’encodage, pensez à bien séparer par un signe + et idéalement par un %20pour les espaces, chacun de vos mots-clés, comme dans cet exemple :
https://www.google.com/search?q=vente%20de%20jouets+pas%20cher+promotion&num=100

“Pas mal”, n’est-ce pas ?

Voyons maintenant comment extraire toutes les URL internes d’un site web.

2. Extraire toutes les URL internes d’un site web

L’intérêt ici réside dans le fait de savoir par exemple, s’il existe des pages qui ont été mal référencées par Google (les fameuses erreurs 404 ou autres), afin de les rediriger, grâce à votre fichier .htaccess.
NB: La configuration du fichier .htaccess fera l’objet d’un prochain article.

Comment ça marche ?

Google propose la fonction site: pour effectuer des recherches sur un nom de domaine spécifique.

Exemple : la requête site:www.lemonde.fr. va renvoyer l’ensemble des pages référencées sur le domaine lemonde.fr.

C’est aussi simple que ça.

OK, c’est parfait, je sais maintenant comment extraire les liens issus des résultats de recherche Google, mais comment exporter ces données pour pouvoir les traiter, voire les archiver ?

C’est ce que nous allons voir maintenant :

Comment exporter ces résultats de recherche sous Excel ?

Copiez tout le texte affiché sur la page de recherche de votre navigateur internet en appuyant simultanément sur CTRL et A, puis CTRL+C.

Cela va sans dire mais ça va mieux en le disant tout de même, Ouvrez Excel 😉

Collez ces résultats dans Excel, grâce au traditionnel CTRL+V. Si vous n’êtes pas familier de ces raccourcis clavier, reportez-vous à notre article 50 raccourcis Excel à connaître.

Comme vous pouvez le constater, les résultats ont bien été copiés en colonne A, mais ces données semblent difficilement exploitables.

Abordons maintenant la partie la plus complexe, mais aussi la plus intéressante ;

Extraire les URL dans Excel

Afin de pouvoir extraire extraire les URL contenues en colonne A, nous allons devoir créer une fonction extraireUrl en donnant des instructions via Visual Basic.
Pas de panique, responsablemarketing est là pour vous 😉

Sélectionnez dans le Menu DÉVELOPPEUR > Visual basic > Insertion > Module.
Puis copiez-collez les lignes de code suivantes :

Function extraireUrl(cell As range, _
Optional default_value As Variant)
If (cell.range("A1").Hyperlinks.Count <> 1) Then
extraireUrl = default_value
Else
extraireUrl = cell.range("A1").Hyperlinks(1).Address & "#" & cell.range("A1").Hyperlinks(1).SubAddress
End If
End Function

et c’est là que la magie opère…

Vous pouvez maintenant vous positionner en cellule B2 et saisir la formule suivante: =extraireUrl(A1), comme s’il s’agissait de n’importe quelle fonction standard.
Il ne vous reste plus qu’à copier cette formule jusqu’à la dernière ligne de résultat de votre feuille Excel.

Et voilà, le tour est joué ! Vous disposez désormais d’une liste des URL de vos 100 concurrents les mieux référencés sur Excel 🙂

A ce stade, vous pouvez, si vous le souhaitez, effectuer différentes opérations de mise en forme, comme par exemple, filtrer la colonne B en ne conservant que les cellules comportant des URL et copiez ces URL à un autre endroit.

Et vous, comment faites-vous pour extraire les liens ?

Veuillez svp utiliser la zone de commentaires pour nous faire part de vos suggestions et/ou recommandations.

Vous aimez cet article?

Je vous invite à le partager sur vos réseaux sociaux favoris et également à laisser un commentaire si vous le souhaitez.