Scraping Bars & Restaurants Paris + 92/93/94/95 (Google Maps & Uber Eats)

Extraction et enrichissement à grande échelle des bars/restaurants de Paris + petite couronne (92/93/94/95) depuis Google Maps, avec récupération d’emails pertinents, nettoyage/dédoublonnage et livraison XLSX/CSV. Deuxième lot sur Uber Eats (Paris) pour capter davantage de 06 et compléter les contacts.
🎯 Contexte & objectifs
Constituer une base Bars & Restaurants sur Paris + 92/93/94/95 pour l’outreach B2B, en maximisant :
- les emails vérifiés et pertinents, 2) tous les téléphones (y compris 06/07), 3) la couverture via la combinaison Google Maps + Uber Eats.
🤖 Ce que fait l’IA dans le pipeline
-
Découverte & sélection du site (IA + SERP API)
- Connexion de Google Maps à SERP API pour requêtes Google ciblées.
- Une IA de ranking sélectionne automatiquement le meilleur site officiel (désambiguisation des homonymes, exclusion des plateformes/agrégateurs).
-
Extraction structurée (Parser + IA de normalisation)
- Notre parser scrappe le site retenu et extrait emails, téléphones (fixes + 06/07), adresses, réseaux sociaux (IG/FB/TikTok), mentions légales.
- Une IA de nettoyage homogénéise les formats (email/tel/adresse), corrige les anomalies usuelles et complète les champs manquants à partir des indices publics.
-
Classement intelligent des emails (IA de scoring)
- Une IA de classification note chaque email (ex.
contact@,info@,direction@, prénom.nom@domaine, etc.). - Elle privilégie les adresses directes (personnalisées, prospection-friendly) et dépriorise les boîtes génériques ou non exploitables (no-reply, plateformes).
- Une IA de classification note chaque email (ex.
-
Vérification anti-bounce (validation technique)
- Syntaxe → RFC conforme.
- MX/DNS → vérification du domaine et des serveurs de mail.
- Routage/SMTP (quand possible, sans envoi réel) → réduit fortement le bounce rate.
- Dé-duplication intra/inter-sources (GMaps ↔ Uber Eats) par email/téléphone/URL.
-
Consolidation & qualité
- Fusion des données Google Maps (adresse, catégorie, horaires, avis, site) et Uber Eats (souvent plus de 06/07 et parfois des emails complémentaires).
- Segmentation Paris par arrondissement + communes 92/93/94/95 pour la couverture maximale.
- Filtrage des domaines non pertinents (places de marché, plateformes, annuaires).
-
Livrables prêts à l’emploi
- XLSX + CSV (schéma stable), onglet récap, dictionnaire des champs, identifiants source et horodatage d’extraction.
📈 Chiffres clés (extraits)
- Paris (Google Maps) : Bars 1 205 emails / 2 947 lignes (40,9 %) ; Restaurants 1 422 / 3 711 (38,3 %).
- 92/93/94/95 (Google Maps) : 3 708 emails uniques livrés.
- Uber Eats (Paris) : ~3 000 restaurants Paris + ~1 800 proches Paris, forte proportion de mobiles 06/07 et emails additionnels.
Pourquoi Uber Eats ? Plateforme très “directe” côté commerçants : on y trouve fréquemment plus de téléphones (06/07) et des emails absents de GMaps — c’est un complément puissant pour l’outreach.
🧰 Stack & bonnes pratiques
- Python (scraping & orchestration), SERP API, workers parallélisés, gestion des retries.
- IA de ranking, normalisation, et scoring d’emails (prompting + règles métiers).
- Validation email (syntaxe, MX, routage), dé-duplication inter-sources.
- Export XLSX/CSV + dictionnaire de champs ; logs d’exécution pour audit.
✅ Résultats
- Base riche, nettoyée et vérifiée, prête pour l’outreach multicanal.
- Hausse marquée des 06/07 grâce à Uber Eats.
- Import immédiat dans CRM / n8n, réduction du bounce rate et du temps de qualification.
💰 Budget & jalons
- Google Maps (Paris + 92/93/94/95) : 600 € TTC.
- Uber Eats (Paris) : 250 € TTC (remise incluse).
- Total : 850 € TTC — livraisons étalées sur ~3 semaines.