Comment trouver automatiquement un site internet à partir d’un nom d’entreprise ?

cover_domain-name-finder-trouver-site-internet-automatiquement
Partager cet article

J’ai eu plusieurs fois cette problématique pour plusieurs projets. Comment trouver le site internet d’une entreprise à partir de son nom ou juste via sa raison sociale ?

C’est assez simple pour une liste de quelques entreprises. Bien souvent, il suffit de rechercher sur Google et de consulter les 3 ou 4 premiers sites que Google propose.

Dans le lot, vous trouverez souvent le site internet de l’entreprise. Ou encore plus simplement via les fiches Google Business Profil (anciennement Google My Business).

Par contre cela devient plus long et complexe si vous souhaitez le faire sur plusieurs dizaines, centaines voir milliers d’entreprises.

Et la tâche est encore plus ardue avec des petites entreprises qui n’ont pas un référencement naturel flamboyant.

Pour éviter ce long traitement manuel, je vais vous présenter 5 solutions pour résoudre ce problème automatiquement.

1 – Trouver les sites internet d’entreprise avec Google Sheets

notation-premiere-methode-collecte-url

Pour cette première solution, nous allons utiliser un outil sûrement connu par tous ceux qui vont lire cet article… Google Sheets.

Comme évoqué en introduction, il nous faut au minimum le nom de l’entreprise. Et de préférence son nom commercial et pas sa raison sociale (dénomination sociale).

Certaines entreprises ont la même dénomination pour ces deux noms, d’autres ont des noms radicalement opposés. Vous connaissez QONTO en tant que nom commercial mais peut être moins OLINDA SAS (sa dénomination sociale).

Pour la suite, il vous faudra uniquement un fichier Google Sheets avec dans une première colonne un simple nom d’entreprise.

Pour automatiser un maximum cette recherche, nous allons utiliser l’Autocomplete API de Clearbit.

De base cette API a été créée pour trouver les logos des entreprises mais en inspectant les HTTP RESPONSE, on s’aperçoit que nous avons aussi le “domain” (nom de domaine) comme donnée retournée.

clearbit-api-nom-de-domaine-nom-entreprise

Nous allons donc récupérer la valeur “Domain” plutôt que le logo des entreprises et ainsi scraper automatiquement les sites internet avec un nom d’entreprise et cela gratuitement.

Si vous souhaitez plus d’informations sur cette API : https://dashboard.clearbit.com/docs#autocomplete-api

A – Extraire une URL pour un nom d’entreprise

L’idée va ensuite être assez simple, nous allons utiliser Autocompletion de Clearbit avec quelques formules sous Google Sheets. Commençons par générer les données pour chaque entreprise. Pour cela il faut faire une recherche avec le nom de l’entreprise.

name-company-to-url-google-sheets

On va utiliser la fonction CONCATENER pour compléter l’URL et ainsi formuler notre requête.

  • https://autocomplete.clearbit.com/v1/companies/suggest?query=
convertir-nom-entreprise-en-site-interne

Comme vous pouvez le voir, nous avons couplé (concaténé) le nom de l’entreprise avec l’URL que nous avons récupérée de l’autocomplétion de Clearbit.


=CONCATENER(B$2;A3)

Cette formule permet de générer des URL dont voici un exemple :

URL-clearbit-google-sheets-name-domain-finder

Comme vous pouvez le voir, on retrouve bien les informations que l’on voyait dans la documentation API du début. On s’aperçoit également qu’il y a plusieurs réponses pour la requête sur le nom Qonto. Ici c’est bien la première qui nous intéresse.

Nous allons maintenant extraire la donnée de cette page, c’est-à-dire « domain » : « qonto.com » et plus particulièrement juste l’URL de l’entreprise.


=REGEXEXTRACT(INDEX(IMPORTDATA(B3); 1; 2); "\""(.*?)\""")

regex-extract-company-name-from-api-clearbit

Et comme vous pouvez le voir nous avons bien l’URL du site internet avec juste deux formules Google Sheets et le nom de l’entreprise. Ce qui permet de trouver automatiquement le site internet d’une entreprise avec uniquement son nom.

B – Extraire plusieurs URL pour un nom d’entreprise

Dans l’exemple de l’URL pour Qonto, il existe trois valeurs sur le nom Qonto. Nous allons donc extraire les trois valeurs avec la même formule que l’on vient dupliquer puis séparer dans plusieurs cellules distinctes.


=SPLIT(CONCATENER(REGEXEXTRACT(INDEX(IMPORTDATA(B3); 1; 2); "\""(.*?)\""");" ";REGEXEXTRACT(INDEX(IMPORTDATA(B3); 1; 5); "\""(.*?)\""");" ";REGEXEXTRACT(INDEX(IMPORTDATA(B3); 1; 8); "\""(.*?)\"""));" ";)

mass-extract-name-company-url-google-sheets

À savoir qu’il existe aussi une automatisation via Zapier de cela que vous pouvez retrouver ici

Enfin même si vous n’avez pas l’âme d’un développeur vous pouvez utiliser ChatGPT pour générer un script en Python qui pourra essayer de trouver une correspondance du nom de l’entreprise avec un site internet.

2 – Trouver le site web d’une entreprise via Importfromweb sur Google Sheets

notation-deuxième-methode-collecte-url

La première idée que l’on a pour trouver un site internet d’une entreprise, dont on ne connaît juste le nom, est de faire une recherche sur Google. Il existe une extension Google Sheets qui permet de faire une recherche sur Google puis de récupérer le premier lien qui apparaît dans les résultats de recherche sur Google Sheets.

Permettant ainsi une automatisation de votre recherche si vous avez plusieurs centaines de recherches à effectuer.

Après l’avoir installée, il faut l’activer et la mettre en place sur votre document Google Sheets. Comme sur cette capture d’écran.

activer-ajouter-import-from-web-google-sheets

ImportFromWeb va venir faire une recherche Google à votre place puis extraire et afficher les données que vous souhaitez sur l’ensemble des éléments qui apparaissent lors d’une recherche basique sur Google.

Nous allons passer à la configuration de l’extension pour avoir exactement ce que l’on souhaite c’est à dire :

  • Une recherche en France (pays) ;
  • Une recherche Française (langue) ;
  • Ajouter la ou les requêtes Google que l’on souhaite faire ;
  • Obtenir uniquement le 1er lien (URL) du premier résultat sur Google de notre recherche ;
formule-google-sheets-trouver-site-internet-entreprise

=IMPORTFROMGOOGLE(A2;"link";F$2:G$4)

Décomposons cette formule :

  • IMPORTFROMGOOGLE est une formule qui vient s’ajouter suite à l’installation de l’add-ons. Elle permet d’effectuer une recherche sur Google et d’importer les résultats dans votre Google Sheets.

  • A2 correspond au texte de la recherche Google que vous souhaitez (dans l’exemple Qonto) ;

  • « link », va extraire uniquement les liens de la recherche que vous avez lancée ;

  • F$2:G$4 correspond a un tableau pour ajouter des conditions et préférences.
    • countryCode fr pour que la recherche se fasse en France ;
    • languages fr pour que la recherche se fasse en Français ;
    • numResults 1 pour obtenir uniquement les données du premier résultat sur Google.
resultats-site-internet-nom-entreprise-via-google-sheets-import-from-web-google-2

Comme vous pouvez le voir la formule fonctionne très bien peu importe ce que vous pouvez rechercher. Vous obtiendrez le premier résultat (naturel/SEO) disponible lors d’une recherche Google.

Cette solution permet de trouver efficacement le site internet d’une entreprise. Presque toujours le simple nom de la société permet de trouver le site.

Si le nom de l’entreprise est très générique vous pouvez ajouter des détails comme pour une recherche Google. Comme par exemple la ville, le code postal, ou le domaine d’activité après le nom de l’entreprise.

Pour Qonto, nous aurions très bien pu mettre dans la cellule « A2 » -> « Qonto Banque France » pour améliorer le ciblage de la requête.

C’est également une très bonne solution si vous avez uniquement la raison sociale et pas de nom commercial

  • Raison sociale + ville

Vous retrouverez sûrement sur la page « Mentions Légales » du site comme résultat.

3 – Avec des outils de scraping comme Phantombuster

rating-phantombuster-domain-name-finder

Il existe également des outils en ligne qui permettent d’effectuer cette tâche. Toutefois rares sont ceux qui proposent une version gratuite. Phantombuster vous permet de faire cela avec une recherche de 10 minutes gratuites par mois. En anglais vous trouverez cela sous le nom de Domain Name Finder.

Vous pouvez retrouver l’outil sur ce lien : https://phantombuster.com/automations/toolbox/3171/domain-name-finder

bot-domain-name-finder-phantombuster

Pour utiliser cet outil, vous devrez avoir un fichier Google Sheets avec une colonne qui contient l’ensemble des noms d’entreprises dont vous souhaitez trouver le site internet.

Il vous faudra ensuite partager le lien en public de votre Google Sheets. Puis l’ajouter dans Phantombuster.

Pensez bien à mettre « France – French (fr-FR) » dans Country & language. Vous pourrez ensuite lancer la recherche.

configuration-de-outil-phantombuster-trouver-site-internet

Quand le robot aura terminé votre liste, vous pourrez télécharger un fichier csv avec les résultats. Et vous aurez trouvé l’URL d’une entreprise avec le nom d’entreprise automatiquement.

4 – Avec des solutions en ligne

rating-outil-en-ligne

À mon sens la moins bonne solution mais je tenais à vous la présenter même si je ne la recommande pas car il existe de meilleurs outils.

Il s’agit d’un site ou vous avez juste à copier/coller les noms d’entreprises et il vous fait une proposition d’un nom de domaine associé à ce nom.

Voici un exemple :

seo-domain-finder

À noter que c’est totalement gratuit, donc c’est un point positif quand même. Dans cette version gratuite, vous avez le droit à 10 noms par recherches. Pour la version payante, vous avez environ 1000 recherches pour 8.99$.

5 – Avec des solutions d’enrichissement de données

rating-finder-website-domain-paid-2

Si vous avez un budget à consacrer à cette mission de trouver les sites d’internet à partir d’un nom d’entreprise. Je vous conseille de vous intéresser aux solutions d’enrichissement de données.

Voici deux exemples :

Pappers

Pappers est un site internet ou vous retrouverez les informations légales, juridiques et financières des entreprises. Il est très similaire à societe.com mais peut être un peu moins connu.

Pappers apporte selon moi plus de données et une meilleure visualisation des informations. Ce qui va nous intéresser sur Pappers, c’est la partie B2B qui propose des données marketing sur les entreprises :

« Pappers vous permet de connaître par cœur vos futurs clients, leurs informations et leur entreprise. Notre base de données regroupe à la fois des informations financières, juridiques, le site web et les informations de contacts.« 

Et comme vous pouvez le lire, ils sont en mesure de donner le site web de nombreuses entreprises sous forme de liste.

Vous pouvez retrouver plus d’informations directement sur ce lien : pappers.fr/b2b

Societeinfo

Societeinfo, l’entreprise a créé une solution entièrement dédiées à la recherche de prospects et l’enrichissement de données sur des profils d’entreprises. Ici aussi, vous retrouverez une partie sur les données web des entreprises via ce lien societeinfo.com/data/donnees-web.

Parmi l’ensemble des données proposées, vous avez le site internet des entreprises (ce qui nous intéresse). Mais aussi d’autres données comme les réseaux sociaux, les technologies utilisées…

Quelques autres solutions payantes intéressantes

Bonus – D’autres pistes pour trouver les URLs des entreprises

Les réseaux sociaux :

Aujourd’hui rares sont les entreprises qui n’ont pas de réseaux sociaux (Page Facebook, compte Instragram, Profil LinkedIn …)

Vous pouvez donc utiliser les réseaux sociaux des entreprises pour trouver automatiquement l’URL du site internet de l’entreprise.

Par exemple, via LinkedIn avec les pages entreprises ou via le nom d’un dirigeant. Des outils comme Phantombuster ou Captain Data peuvent aussi extraire les informations d’un profil entreprise ou d’un profil personnel.

Vous aurez alors une colonne avec le nom de l’entreprise et son site internet, s’il est bien renseigné.

Les nouvelles IA

Vous avez sûrement déjà testé ou au moins entendu parler de Chat GPT, on peut également utilisé ces technologies pour trouver automatiquement le site internet d’une entreprise.

Voici un exemple simple :

site-internet-finder-website-chatgpt

À noter qu’aujourd’hui Chat GPT est limité dans le temps et n’est pas actualisé avec les données internet en live. Mais il est quasiment certain que dans quelques mois ou années, une solution émerge et permette de trouver toutes les correspondances possibles d’une liste de nom d’entreprise en site internet.

Voilà les grandes solutions pour obtenir des URL web à partir de la raison sociale ou du nom d’une entreprise et cela automatiquement. Si vous avez d’autres solutions ou idées, n’hésitez pas à venir me la ou les partager. Je pourrai éventuellement mettre à jour cet article avec votre solution.

Antoine Moulard
Antoine Moulard

N'hésitez pas à me contacter si vous avez des remarques ou des questions sur cet article. LinkedIn

Consulter d'autres articles

Vos commentaires

Pour les visiteurs de l'UE, le widget "Commentaires Facebook" ne fonctionnera que pour les visiteurs du site qui se sont connectés à Facebook et ont accepté les cookies.

Si vous souhaitez commenter cet article, je vous invite à vous connecter à votre compte Facebook pour voir apparaître le widget "Commentaires Facebook".

Pour en savoir plus sur moi !

photo-profil-am-cercle

N'hésitez pas à vous abonner 🤙