Critères de l'offre
Secteur :
- Industries Aéro, Naval et Défense
Diplômes :
- Diplôme de grande école d'ingénieur
- + 1 diplôme
Compétences :
- Anglais
- OpenX
- Big data
- Systémique
- Electron
- + 7 compétences
Lieux :
- Palaiseau (91)
Conditions :
- Stage
- Temps Plein
Description du poste
QUI SOMMES-NOUS ?
Construisons ensemble un avenir de confiance
Thales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cybersécurité & Identité numérique. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et plus inclusif. Le Groupe investit près de 4 milliards d'euros par an en Recherche & Développement, notamment dans des domaines clés de l'innovation tels que l'IA, la cybersécurité, le quantique, les technologies du cloud et la 6G. Thales compte près de 81 000 collaborateurs dans 68 pays.
Nos engagements, vos avantages
- Une réussite commune portée par notre culture et excellence technologique, votre expérience et notre ambition partagée
- Un package de rémunération attractif (épargne salariale, variable ou 13ième mois selon les postes, restaurant d'entreprise,…)
- La possibilité de développer vos compétences en continu grâce à nos parcours de formation et nos académies internes #ENTREPRISEAPPRENANTE
- Notre attention portée à votre équilibre personnel et professionnel (Accord télétravail, RTT, congés d'ancienneté, jours enfants malades, guide parentalité, crèches, CSE / ASC,… )
- Des communautés internes permettant de vous engager sur les sujets qui vous tiennent à cœur : innovation, diversité, environnement
- Un environnement inclusif et bienveillant où vous êtes accueilli et valorisé avec notre politique handi-accueillante, notre charte LGBT+, notre initiative #StOpe pour lutter contre le sexisme.
Dans ce cadre nous recherchons un :
STAGE - Ingénieur en Classement ELO des actions en apprentissage par renforcement (H/F) - 6 mois
Basé à Palaiseau (91)
QUI ETES-VOUS ?
- Etudiant en Ecole d'Ingénieur ou formation équivalente, vous préparez un master 2 avec une spécialisation en intelligence artificielle ?
- Vos études et vos éventuelles expériences vous ont permis d'acquérir des connaissances solides dans les domaines suivants :
- Programmation Python
- Gestionnaire de version git
- Apprentissage par renforcement « value-based », tabulaire ou profond
- Vous disposez idéalement de compétences en :
- Open AI gym ou gymnasium
- Intelligence artificielle symbolique
- Vous faites preuves de curiosité, raison qui vous pousse à faire votre stage en recherche ?
- Enfin vous êtes à l'aise en français et en anglais ?
Vous vous reconnaissez ? Alors découvrez vos futures missions !
CE QUE NOUS POUVONS ACCOMPLIR ENSEMBLE :
Le stage se déroulerait au sein du Laboratoire Raisonnement et Analyse dans les Systèmes Complexes de Thales Research & Technology, à Palaiseau.
Le classement Elo est utilisé pour ordonner les joueurs d'échec en fonction de leur niveau propre. Ce classement repose sur l'attribution de points, à chaque confrontation, au regard de l'estimation de succès ou d'échec supposé par son niveau courant. Après un certain nombre de confrontations, le niveau de chaque joueur s'établi et se stabilise.
Nous développons un algorithme d'apprentissage par renforcement pour lequel la politique de décision est un modèle décisionnel déclaratif (sous forme de règles). La mise à jour de la politique repose sur une mesure de qualité des associations états/actions. On peut voir le choix d'une action pour un état donné durant l'apprentissage comme une confrontation entre l'agent apprenant et l'environnement.
L'objectif de ce stage consiste à étudier l'intérêt d'un classement Elo des actions permettant la mise-à-jour de la politique de manière agnostique au problème d'apprentissage.
Dans ce contexte, vos missions seront les suivantes :
- Appréhender rapidement la méthodologie du classement Elo
- S'approprier l'algorithme existant, et plus généralement les algorithmes d'apprentissage par renforcement dits "value-based"
- Identifier et mettre en œuvre un moyen d'utiliser ce classement comme mesure de qualité des associations états/actions.
- Etudier l'effet sur la performance de l'apprentissage et la qualité de la politique apprise.
- Etudier la possibilité d'utiliser ces informations de classement dans l'exploration de l'espace d'apprentissage.
- Proposer des perspectives
- Présenter les résultats
- Rédiger un rapport de synthèse
Thales s'engage pour l'emploi et l'insertion des personnes en situation de handicap. A ce titre, notre établissement Thales Research&Technology France est reconnu Organisme Handi-Accueillant
Tous nos stages sont conventionnés et soumis à une gratification dont le montant est déterminé selon votre niveau d'études.
Thales reconnait tous les talents, la diversité est notre meilleur atout. Postulez et rejoignez nous !