Offre d'emploi

Data Scientist NLP / GenAI expérimenté·e

Paris, France

Attributs

Type de contrat :

CDI

Télétravail :

Hybride

Description du poste

UNIVERS OBSERVABLE DE L'ENTREPRISE

Notre client est une entreprise de conseil en stratégie qui a développé un outil permettant de collecter et d'analyser un grand volume de données web pour proposer automatiquement des idées sur-mesure à chaque utilisateur, en reproduisant le comportement humain d'acquisition de connaissances sur le web.

Dans le cadre d'un remplacement, notre client recherche un.e Data Scientist NLP / GenAI expérimenté.e pour rejoindre son équipe Data (2 personnes) et prendre un rôle central dans l'évolution de leur solution.

MISSIONS

En étroite collaboration avec les équipes internes, les clients et partenaires externes, vous aurez pour missions de :

  • Développer des algorithmes de NLP et GenAI afin d'améliorer les modèles de restitutions de connaissances récoltées sur le web
  • Explorer et créer des supports d'information permettant de transmettre la connaissance à l'utilisateur en tenant compte de sa charge cognitive (Visual Language Model, Text to Speech, graphes de connaissances…)
  • Garantir la traçabilité et la fiabilité des résultats (IA explicable) en reliant les synthèses à leurs sources originales
  • Concevoir des solutions d'IA performantes, scalables et souveraines (LLM open-source, solutions on-premise…)
  • Réaliser une veille et mener des expérimentations pour évaluer de nouvelles approches ou de nouveaux modèles (LLMs, RAG, vector databases…)
  • Travailler en binôme avec un post-doctorant, participer à la structuration de l'équipe et à la montée en compétences des autres membres de l'équipe sur les sujets d'IA générative et NLP.

Profil recherché

SPHÈRE ACADÉMIQUE

Vous êtes titulaire d'un BAC+5 ou d'un doctorat en data science, informatique, statistique ou linguistique informatique et vous possédez minimum 4 ans d'expérience (thèse incluse) en conception et développement de produits basés sur le NLP et les LLMs.

SPHÈRE TECHNIQUE

  • Expertise en IA générative : maitrise des LLMs open-source (Llama, Mistral, Falcon…), architectures RAG, prompt engineering, frameworks d'inférence, bases de données vectorielles et techniques de grounding de modèles
  • Maitrise des techniques de NLP fondamentales (reconnaissance d'entités nommées, classification de texte, topic modeling, résumé automatique de texte) et des bibliothèques associées (Hugging Face Transformers, SpaCy, NLTK)
  • Maitrise de Python, des bibliothèques d'analyse de données (Pandas, NumPy) et des frameworks de Machine Learning / Deep Learning (PyTorch et/ou TensorFlow)
  • Compétences solides en développement logiciel appliquées à des projets d'IA (Python, Git, tests..)

SPHERES ORBITALES - bonus

  • Une expérience en optimisation de modèles IA pour la performance et la scalabilité, avec une sensibilité aux enjeux de souveraineté numérique est un plus
  • Des connaissances en Docker et CI/CD sont un plus

SPHÈRE SOCIALE

  • Curiosité technique, rigueur scientifique et autonomie
  • Capacité à documenter et à rendre compte de votre travail
  • Orientation résultats
  • Appétence pour le partage de connaissances, le travail en équipe et le mentoring

INFORMATIONS SATELLITAIRES

  • Date de décollage : dès que possible
  • Base de lancement : Paris 9ème - 2 jours de télétravail par semaine
  • Combustible : à partir de 55 k€ brut annuel, selon profil et expérience
  • Poste en CDI
  • Processus de recrutement : 1 entretien avec un.e recruteur.se Science me Up + 1 entretien avec le CTO et le CEO + 1 test technique + 1 entretien final pour débriefer du test

L'offre vous intéresse ?

Offre publiée le 06 Juin 2025 - Catégorie : Data Science

À propos du recruteur

Julie KIRSCHNER

Julie KIRSCHNER

Partager l'offre d'emploi

Vous cherchez un autre poste ?