Retour aux projets

Pipeline Shopify Automatisé (Scraping → IA → Matrixify)

Pipeline Shopify Automatisé (Scraping → IA → Matrixify)
Simon RochwergSimon Rochwerg

Mise en place d’un pipeline automatisé permettant d’extraire un catalogue fournisseur ou un site internet, de l’enrichir via IA et de l’importer massivement dans Shopify grâce à Matrixify.

Automatisation du Catalogue Shopify – Pipeline Scraping → IA → Matrixify

📞 Vous souhaitez automatiser votre catalogue Shopify ? Téléphone / WhatsApp: +33 6 95 01 61 92 Réserver un appel : https://calendly.com/simon-rochwerg-dx_b/30min

🎯 Objectif du projet

Le client souhaitait augmenter rapidement son catalogue Shopify (plusieurs milliers de produits), tout en maintenant un haut niveau de qualité sur les fiches produits. Beaucoup de meta-données complexes à gérer : descriptions, images, caractéristiques techniques, PDF…
Un processus lent, non scalable manuellement, et source d’erreurs.

L’objectif était de construire un pipeline entièrement automatisé pour :

  • extraire les données produits d’un site fournisseur,
  • nettoyer et normaliser les informations,
  • enrichir les fiches avec l’IA,
  • générer un CSV Matrixify complet,
  • importer automatiquement produits, variantes et accessoires dans Shopify.

🛠️ Ce que j’ai réalisé

1. Scraping avancé du site fournisseur

Développement d’un scraper robuste permettant de récupérer :

  • titres et descriptions,
  • caractéristiques techniques,
  • images haute définition,
  • documents techniques (PDF),
  • variantes produits,
  • accessoires.

L’ensemble est structuré, nettoyé et uniformisé pour s’adapter au modèle de données Shopify.


2. Normalisation & Data Cleaning

Mise en place d’un pipeline de nettoyage :

  • suppression des doublons (via SKU & EAN),
  • harmonisation des marques,
  • gestion du poids logistique,
  • suppression des valeurs nulles dans les fiches techniques,
  • formatage SEO (titres 70 caractères, méta descriptions 160).

3. Enrichissement IA (api openai)

Création de prompts dédiés pour générer automatiquement :

  • une description produit cohérente et professionnelle,
  • une fiche technique structurée au format YAML,
  • une FAQ (inner fields) complète.

Les prompts fournis par le client ont été stabilisés pour garantir une qualité constante.


4. Génération du fichier Matrixify

Construction d’un générateur automatique de CSV Matrixify :

  • produits principaux,
  • variantes individuelles,
  • accessoires liés,
  • métadonnées (metafields),
  • images,
  • PDF uploadés directement dans Shopify.

Chaque lot est importé en draft pour permettre la validation du client avant publication.


5. Import massif dans Shopify

Grâce à Matrixify :

  • insertion de dizaines de produits en une seule opération,
  • gestion des relations produit ↔ variante ↔ accessoire,
  • upload automatique des documents techniques,
  • rendu final propre, cohérent et déjà optimisé SEO.

🚀 Résultats obtenus

  • Plusieurs catégories complètes intégrées automatiquement en quelques minutes.
  • Fiches produits enrichies par IA, homogènes, lisibles et optimisées.
  • Zéro travail manuel pour l’équipe e-commerce : tout est automatisé.
  • Pipeline réutilisable pour n’importe quel autre fournisseur à l’avenir.
  • Un système capable de scaler à plusieurs milliers de produits sans effort humain.

📈 Impact business

  • Forte réduction du temps d’intégration (de plusieurs jours à quelques minutes).
  • Suppression des erreurs humaines récurrentes (variantes, PDF, métadonnées).
  • Amélioration de la qualité perçue des fiches produits.
  • Base technique robuste pour automatiser d’autres sources fournisseurs.

🧩 Technologies utilisées

  • Python (scraping & transformation)
  • OpenAI
  • Matrixify (Shopify)
  • Shopify Admin API

📞 Vous souhaitez automatiser votre catalogue Shopify ?

Téléphone / WhatsApp: +33 6 95 01 61 92
Réserver un appel : https://calendly.com/simon-rochwerg-dx_b/30min

Vous avez un projet similaire ?

Discutons ensemble de vos besoins en données.

Obtenir un devis