Ingénieur en informatique scientifique et machine learning (F/H)
Environnement et contexte de travail
Notre établissement fait partie de l'Université PSL. Située au cœur de Paris, celle-ci fait dialoguer tous les domaines du savoir, de l'innovation et de la création. Classée parmi les 50 premières universités mondiales, elle forme au plus près de la recherche des chercheurs, artistes, ingénieurs, entrepreneurs ou dirigeants conscients de leur responsabilité sociale, individuelle et collective.
Structure d'accueil
Environnement et contexte de travail
Le poste sera à cheval entre deux équipes, CoML et LAAC. CoML (Cognitive Machine Learning, voir site web ). CoML, faisant partie du Département d'études cognitives de l'École normale supérieure(DEC), est une équipe de recherche collaborative impliquant l'EHESS,
l'ENS, le CNRS et Inria. Située à la croisée de la cognition et de l'informatique, l'équipe est à la pointe des algorithmes d'apprentissage automatique inspirés du cerveau. La mission principale de l'équipe CoML est d'ingénierie ces capacités humaines en élaborant des algorithmes efficaces et évolutifs égalant ou dépassant les performances humaines avec des données similaires. Leur recherche explore les aspects mathématiques et algorithmiques de ces modèles, évaluant leur validité empirique en comparant les résultats avec des données comportementales et neuroscientifiques. Les résultats attendus incluent des algorithmes d'apprentissage automatique plus adaptables et autonomes, ainsi que des modèles quantitatifs des processus cognitifs, avec un accent sur la parole, le langage et le
raisonnement du bon sens. L'objectif de l'équipe LAAC (Language Acquisition Across Cultures, voir site web ) est de faire la lumière sur les mécanismes et processus impliqués dans l'acquisition précoce du langage dans une variété de cultures et de communautés linguistiques. À cette fin, nous utilisons une approche interdisciplinaire (allant de la modélisation informatique aux expériences de laboratoire et à l'analyse avancée des données) dans le contexte d'une science ouverte, collaborative et engagée publiquement. Nous avons une culture de soutien,
respectueuse de la diversité culturelle et individuelle. Le candidat retenu bénéficiera d'un environnement de travail collégial et positif, dans ces deux petites équipes (< 10 personnes chacune) bien intégrées dans un laboratoire interdisciplinaire plus important (~70 personnes). Le Laboratoire de Sciences Cognitives et Psycholinguistique (LSCP, voir site web ) est une unité de recherche commune de l'École des Hautes Études en Sciences Sociales (EHESS), de l'École Normale Supérieure et du Centre National de la Recherche Scientifique (CNRS). Notre laboratoire est situé à Paris dans le Département d'Etudes Cognitives (DEC) de l'Ecole Normale Supérieure. Le but des recherches au LSCP est de comprendre les mécanismes psychologiques qui sous-tendent l'acquisition et le fonctionnement de fonctions cognitives typiquement humaines, telles que le langage, la cognition sociale et la conscience. Le LSCP est un de 5 laboratoires composant le Département d'Études Cognitives (DEC), un département interdisciplinaire de l’Ecole normale supérieure, aux interfaces des sciences humaines et sociales, des sciences du vivant et des sciences de l'ingénieur.
Missions
Activités principales
Missions
Pour les équipes Cognitive Machine Learning (CoML) et Language Acquisition Across Cultures (LAAC) de notre laboratoire, nous recherchons un.e ingénieur.e pour contribuer au développement de nouveaux outils informatiques. La personne retenue va concevoir, entraîner, affiner et d'évaluer des modèles de réseaux neuronaux pour annoter automatiquement des enregistrements audio. L’ingénieur.e s’assurera aussi de rendre disponible aux membres de l’équipe des logiciels et algorithmes qui proviennent de la communauté scientifique, en les intégrant par exemple dans des outils déjà existants. La personne recrutée travaillera en collaboration avec d'autres membres de l’équipe (dont 4 ingénieurs plein temps ayant des compétences diverses : gestion de données, ingénieur logiciel, systèmes, …) pour rendre tous ces logiciels distribuables, en mettant en place les bonnes pratiques de développement et du génie logiciel. Ce travail de développement compte pour 85% du temps environ. Certaines autres tâches plus spécifiques seront aussi nécessaires de façon ponctuelle comme traiter et distribuer des bases de données.
Il existe également de nombreuses possibilités d'élargir vos compétences (par exemple, versioning, création de conteneurs comme docker, gestion, rédaction des papiers, etc.) et d'apprendre les technologies pertinentes. Un mentorat régulier est utilisé pour aider les membres de l'équipe à clarifier leurs objectifs de carrière et à prendre des mesures pour les atteindre.
Profil du candidat
Savoirs et compétences attendus
● Expérience en deep learning, idéalement avec scikit-learn et pytorch. Connaissance en modèles supervisés, auto-supervisés, et fine-tuning des grandes modèles pre-entraînés (Whisper, GSLM).
● Maîtrise de Python, Pytorch, bash , Git.
● Bonne connaissance du système Linux (Debian/CentOS) : droits/utilisateurs, administration.
● Maîtrise des bonnes pratiques de développement (tests, documentation, intégration continue, versioning de code).
● Expérience dans le domaine de la recherche et/ou du traitement de parole appréciés.
● Appétence à travailler dans un contexte international, sens de l'écoute et des relations interpersonnelles.
● Autonomie, rigueur, curiosité, organisation, et sens du contact.
● Bonnes capacités de communication (capacité à comprendre et à donner des instructions, à expliquer ce qui a été fait, etc.), y compris en anglais (mais un excellent anglais écrit n'est PAS nécessaire).