La confusion des rôles data coûte cher
Recruter un Data Scientist pour construire un pipeline Spark, ou un Data Engineer pour modéliser des risques clients : c'est le chemin direct vers un échec à 6 mois et une équipe data inefficace. Les 3 rôles data — Data Scientist, Data Engineer, ML Engineer — sont complémentaires mais pas interchangeables.
Data Engineer : construit la tuyauterie
Mission : construire et maintenir l'infrastructure de données. Ingestion, transformation, stockage, optimisation. Stack : Python, SQL, Airflow, dbt, Spark, Snowflake, BigQuery, Kafka, Fivetran. Signaux positifs : contributions open source à Airflow/dbt, expérience avec terabytes+. Salaire Paris 2026 : Junior 45-60 k€, Confirmé 60-85 k€, Senior 85-120 k€.
Data Scientist : extrait l'insight
Mission : transformer la donnée en décision business via analyse statistique et modèles. Stack : Python (pandas, scikit-learn, statsmodels), R, SQL, notebooks, dashboards (Tableau, Looker, Metabase). Signaux positifs : PhD ou master quanti, compétitions Kaggle, publications, capacité à vulgariser. Salaire Paris 2026 : Junior 45-62 k€, Confirmé 62-85 k€, Senior 85-115 k€.
ML Engineer : met en production
Mission : déployer et maintenir des modèles de machine learning en production. Ponte entre Data Scientist et Software Engineer. Stack : Python, Docker, Kubernetes, MLflow, TFX, Vertex AI, SageMaker, CI/CD, monitoring (Evidently, Weights & Biases). Signaux positifs : a déjà shipé des modèles en prod avec charge réelle. Salaire Paris 2026 : Junior 50-68 k€, Confirmé 68-95 k€, Senior 95-140 k€. Le profil le plus rare en France.
Questions d'entretien discriminantes
Pour Data Engineer
"Tu reçois un fichier CSV de 50 GB / heure. Comment construis-tu le pipeline ?" Réponse attendue : Spark / Flink + partitioning + orchestrateur + data quality. Si la réponse commence par "j'utilise pandas", c'est disqualifiant.
Pour Data Scientist
"Comment valides-tu qu'un modèle est prêt pour la production ?" Réponse attendue : test set, cross-validation, robustesse aux données changeantes, biais, test A/B sur un échantillon.
Pour ML Engineer
"Un modèle en prod voit son AUC baisser de 0.85 à 0.72 en 3 semaines. Que fais-tu ?" Réponse attendue : vérification data drift, concept drift, retraining, rollback. Si la réponse est "je debug le code", c'est un Data Scientist qui s'est trompé de titre.
Où les trouver
Data Engineers : ex-scale-ups avec stack data mature (BlaBlaCar, Deezer, Contentsquare), communauté dbt/Airflow. Data Scientists : alumni Polytechnique/ENSAE/Centrale, Kaggle France, meetups Paris Data Science. ML Engineers : ex-Meta/Google Paris, communauté MLOps France, profils PhD reconvertis.
Besoin de structurer votre équipe data ?
Rocket4RPO aide les scale-ups à recruter les bons profils data dans le bon ordre. Contactez-nous.