Retour aux projets

Scraping Bars & Restaurants Paris + 92/93/94/95 (Google Maps & Uber Eats)

Scraping Bars & Restaurants Paris + 92/93/94/95 (Google Maps & Uber Eats)
Simon RochwergSimon Rochwerg

Extraction et enrichissement à grande échelle des bars/restaurants de Paris + petite couronne (92/93/94/95) depuis Google Maps, avec récupération d’emails pertinents, nettoyage/dédoublonnage et livraison XLSX/CSV. Deuxième lot sur Uber Eats (Paris) pour capter davantage de 06 et compléter les contacts.

🎯 Contexte & objectifs

Constituer une base Bars & Restaurants sur Paris + 92/93/94/95 pour l’outreach B2B, en maximisant :

  1. les emails vérifiés et pertinents, 2) tous les téléphones (y compris 06/07), 3) la couverture via la combinaison Google Maps + Uber Eats.

🤖 Ce que fait l’IA dans le pipeline

  1. Découverte & sélection du site (IA + SERP API)

    • Connexion de Google Maps à SERP API pour requêtes Google ciblées.
    • Une IA de ranking sélectionne automatiquement le meilleur site officiel (désambiguisation des homonymes, exclusion des plateformes/agrégateurs).
  2. Extraction structurée (Parser + IA de normalisation)

    • Notre parser scrappe le site retenu et extrait emails, téléphones (fixes + 06/07), adresses, réseaux sociaux (IG/FB/TikTok), mentions légales.
    • Une IA de nettoyage homogénéise les formats (email/tel/adresse), corrige les anomalies usuelles et complète les champs manquants à partir des indices publics.
  3. Classement intelligent des emails (IA de scoring)

    • Une IA de classification note chaque email (ex. contact@, info@, direction@, prénom.nom@domaine, etc.).
    • Elle privilégie les adresses directes (personnalisées, prospection-friendly) et dépriorise les boîtes génériques ou non exploitables (no-reply, plateformes).
  4. Vérification anti-bounce (validation technique)

    • Syntaxe → RFC conforme.
    • MX/DNS → vérification du domaine et des serveurs de mail.
    • Routage/SMTP (quand possible, sans envoi réel) → réduit fortement le bounce rate.
    • Dé-duplication intra/inter-sources (GMaps ↔ Uber Eats) par email/téléphone/URL.
  5. Consolidation & qualité

    • Fusion des données Google Maps (adresse, catégorie, horaires, avis, site) et Uber Eats (souvent plus de 06/07 et parfois des emails complémentaires).
    • Segmentation Paris par arrondissement + communes 92/93/94/95 pour la couverture maximale.
    • Filtrage des domaines non pertinents (places de marché, plateformes, annuaires).
  6. Livrables prêts à l’emploi

    • XLSX + CSV (schéma stable), onglet récap, dictionnaire des champs, identifiants source et horodatage d’extraction.

📈 Chiffres clés (extraits)

  • Paris (Google Maps) : Bars 1 205 emails / 2 947 lignes (40,9 %) ; Restaurants 1 422 / 3 711 (38,3 %).
  • 92/93/94/95 (Google Maps) : 3 708 emails uniques livrés.
  • Uber Eats (Paris) : ~3 000 restaurants Paris + ~1 800 proches Paris, forte proportion de mobiles 06/07 et emails additionnels.

Pourquoi Uber Eats ? Plateforme très “directe” côté commerçants : on y trouve fréquemment plus de téléphones (06/07) et des emails absents de GMaps — c’est un complément puissant pour l’outreach.

🧰 Stack & bonnes pratiques

  • Python (scraping & orchestration), SERP API, workers parallélisés, gestion des retries.
  • IA de ranking, normalisation, et scoring d’emails (prompting + règles métiers).
  • Validation email (syntaxe, MX, routage), dé-duplication inter-sources.
  • Export XLSX/CSV + dictionnaire de champs ; logs d’exécution pour audit.

✅ Résultats

  • Base riche, nettoyée et vérifiée, prête pour l’outreach multicanal.
  • Hausse marquée des 06/07 grâce à Uber Eats.
  • Import immédiat dans CRM / n8n, réduction du bounce rate et du temps de qualification.

💰 Budget & jalons

  • Google Maps (Paris + 92/93/94/95) : 600 € TTC.
  • Uber Eats (Paris) : 250 € TTC (remise incluse).
  • Total : 850 € TTC — livraisons étalées sur ~3 semaines.

Vous avez un projet similaire ?

Discutons ensemble de vos besoins en données.

Obtenir un devis