Data Engineer PySpark confirmé - H/F
QUI SOMMES-NOUS ?
Face à la montée en puissance de la cybercriminalité, favorisée par la complexité croissante des systèmes et des réseaux, la Direction de la Sécurité des Technologies de l’Information développe et soutient des solutions de sécurité de haut niveau pour les systèmes d’information et de communication des organisations internationales, des gouvernements, des opérateurs d’infrastructures critiques. En collaboration étroite avec des agences européennes ou d’autres entités Thales, les équipes de Toulouse fournissent les solutions de cybersécurité de programmes spatiaux via ses activités d’ingénierie de sécurité, de conception d’architecture, d’intégration et qualification de solution (SOC), et assurent le support à l’accréditation sécurité avant déploiement, mais aussi la maintenance et le maintien en condition de sécurité.
Le Centre de Compétence Augmented Data recherche un Data Engineer PySpark confirmé - H/F en CDI à Toulouse (Site de Labège – 31).
Nous recherchons actuellement un Data Engineer expérimenté dans les solutions basées sur PySpark, adossées à des stockages de types HDFS ou Parquet, pour participer à l’un de nos projets mettant en œuvre plusieurs composants software et impliquant plusieurs collaborateurs sur des missions de Data Engineering similaires.
Vous intégrez le Centre de Compétence Augmented Data, dont le cœur de métier est la conception et la mise en œuvre de solutions techniques innovantes et performantes autour de la gestion et du traitement massif de données dans un contexte mêlant Big Data et développements d’applicatifs exploitant ces données, le tout correspondant aux exigences de nos clients dans les domaines du spatial, de l’aéronautique, de l’énergie, du secteur public ou encore de l’e-santé.
QUI ETES-VOUS ?
Issu d’une formation universitaire ou ingénieur en informatique, vous justifiez d’une expérience solide dans le domaine de la donnée (Data Science, Data Engineering, Stockage), en ingénierie logicielle globalement.
Une connaissance cloud serait un réel atout, qu’il soit public (AWS, GCP, AZURE) ou privé.
Vous avez de bonnes expériences en développement logiciel et/ou scripting (principalement Scala & Java).
Vous êtes à l’aise en anglais.
Vous êtes curieux et rigoureux.
Vous aimez travailler en équipe au quotidien.
Pour vous le succès n’est que collectif.
CE QUE NOUS POUVONS FAIRE ENSEMBLE :
En nous rejoignant, vous vous verrez confier les missions suivantes :
La conception et architecture de solutions logicielles dans des contextes cloud ou assimilés, pouvant inclure des composants de calculs utilisant PySpark,
La rédaction de dossiers d’architecture technique répondant au besoin client,
La participation aux développements et à la maintenance opérationnelle des composants logiciels mis en œuvre,
L’estimation des charges techniques liées aux activités de conception, de développement, d’intégration et de validation,
La participation aux réponses à appel d'offre émises par nos clients et qui impliquerait l’utilisation de technologies de calculs distribuées,
La veille technologique dans votre domaine d'expertise et réalisation en avance de phase de prototypes innovants.
Techniquement vous serez donc amené à réaliser les activités suivantes :
• Mise en place de pipelines de traitement de données
• Utilisation de l’état de l’art des technologies actuelles dédiées à ces activités : Spark / Spark Streaming / Flink / Storm / Kafka
• Développement sur des stacks Hadoop (HDFS / Hive / Pig / HBase / Oozie)
• Utilisation de tous les types de stockage actuels :
• SQL : Oracle, SQLServer, PostgreSQL
• NoSQL : Cassandra / MongoDB / HBase
• Objet : S3 / MinIO
Innovation, passion, ambition : rejoignez Thales et créez le monde de demain, dès aujourd’hui.