Critères de l'offre
Métiers :
- Data scientist (H/F)
Secteur :
- Recrutement et placement
Lieux :
- Yvelines (78)
Conditions :
- Alternance / Apprentissage
- Temps Plein
Description du poste
Dassault Systèmes, l'entreprise de la 3DEXPERIENCE, est un « accélérateur de progrès humain ». Elle propose aux entreprises et aux particuliers des environnements virtuels collaboratifs qui leur permettent d'imaginer des innovations plus durables. En développant un jumeau virtuel du monde réel, grâce à la plateforme 3DEXPERIENCE et à ses applications, Dassault Systèmes donne à ses clients les moyens de repousser les limites de l'innovation, de l'apprentissage et de la production.
Les 20 000 collaborateurs de Dassault Systèmes travaillent à créer de la valeur pour nos 270 000 clients de toutes tailles, dans toutes les industries, dans plus de 140 pays. Pour plus d'informations, visitez notre site www.3ds.com/fr
Au sein du département « R&D Information System », vous rejoignez l'équipe R&D Data Science qui est en charge de la spécification, du développement, de la mise en production et de la maintenance d'un système décisionnel permettant d'aider l'équipe DevOps dans la supervision et l'optimisation de notre chaine de production : intégration continue et déploiement continu.
Dans l'approche DevOps, l'équipe prend en charge les parties Continuous Monitoring and Learning soit :
- Le développement des robots de collection et d'agrégation de données massives issues de nos chaînes de développement, d'opérations et de production.
- La conception, le développement et le test des algorithmes innovants : Descriptive analytics, Predictive analytics, Discovery analytics and Perspective analytics.
- La présentation des résultats sous forme de Dashboard pour nos équipes DevOps.
Vous travaillerez en collaboration étroite avec l'équipe Data Science et les autres équipes du département, plus particulièrement les équipes : SI, BI, développeurs et architectes.
Les Large Language Models (LLM) comme Mistral (Mistral AI), GPT (OpenAI) ou Llama3 (Meta), fondés sur des architectures Transformers [1], révolutionnent la génération de code en automatisant des tâches complexes (développement, débogage, optimisation), offrant une assistance précieuse aux développeurs. Cependant, leur production reste aléatoire (erreurs logiques, code non testé, dépendance à la reformulation de prompts précis), ce qui exige des mécanismes de validation rigoureux pour garantir fiabilité et sécurité.
Pour adresser ces limites, les systèmes multi-agents collaboratifs émergent comme une solution prometteuse. Inspirés des méthodologies humaines (planification itérative, tests, correction), ces frameworks décomposent le processus de codage en étapes spécialisées, confiées à des agents autonomes interagissant de manière synergique. Par exemple, le framework AgentCoder [2] propose une architecture où un agent programmeur génère du code à partir des spécifications, un agent testeur conçoit des cas de test pertinents, et un agent exécuteur de tests valide le code en fonction de ces tests, fournissant ainsi un feedback détaillé et précis (succès/échecs, erreurs, logs, …) pour réduire les hallucinations des LLMs et améliorer continuellement la qualité du code produit. CODESIM [3], basé sur une approche par simulation, est un framework multi-agents pour la génération de code qui intègre planification, codage et débogage via une simulation étape par étape, améliorant significativement la précision et réduisant la dépendance aux outils externes. Inspiré par la résolution de problèmes humaine, il combine aussi trois agents spécialisés : un agent planificateur modélise les entrées/sorties attendues avant la génération de code. Un agent programmeur génère le code aligné sur ce plan et un troisième agent déboggeur simule l'exécution pour détecter les incohérences et corriger en temps réel.
L'intégration de tels systèmes multi-agents dans le processus de développement logiciel, combinant créativité des LLMs (génération rapide d'idées) et rigueur systémique (validation structurée) pourrait améliorer la qualité et l'efficacité de la génération de code assistée par l'IA.
Vos missions
Au sein de notre équipe Data Science, votre mission consistera à concevoir et implémenter un système multiagents collaboratif dédié à l'assistance aux tâches liées au code. Ce système visera à permettre une collaboration intelligente entre différents agents, avec des mécanismes de feedback et d'itération pour améliorer la qualité du code généré. Les tâches spécifiques incluront :
· Analyse des capacités des LLM pour les tâches liées au code : évaluer les performances de différents LLMs dans des tâches telles que la génération, la correction d'erreurs et l'optimisation de code.
· Conception de l'architecture du système multi-agents : Définir les rôles et interactions des agents (par exemple, agent programmeur, agent concepteur de tests, agent exécuteur de tests) pour assurer une collaboration efficace.
· Implémentation des agents : Développer les agents en utilisant des bibliothèques…