Un test à faire chez soi (durée : 1 à 3h) ou en live coding.
Peut porter sur :
Construction d’un pipeline ETL.
Manipulation de données avec SQL/Python.
Optimisation de requêtes.
Utilisation d’un outil (Airflow, Spark, Pandas, etc.).
Pour un poste senior : revue d’architecture, questions sur scalabilité.
Interview questions [1]
Question 1
Quels langages de programmation maîtrisez-vous pour l’ingénierie data (Python, Scala, Java...) ?
Quelle est votre expérience avec les bases de données relationnelles (PostgreSQL, MySQL...) et NoSQL (MongoDB, Cassandra...) ?
Quel est votre niveau sur les cloud providers (AWS, GCP, Azure) ? Avez-vous utilisé des services comme S3, BigQuery, Redshift, Databricks ?
Comment versionnez-vous vos données ou vos modèles (DVC, Delta Lake, etc.) ?
Quels outils CI/CD utilisez-vous pour les projets data ?