
Consultant en IA et Architecture de Modèles à Grande Échelle H/F
- Hybride
- BOULOGNE BILLANCOURT, Île-de-France, France
- CDI Rouges
Consultant en IA et Architecture de Modèles à Grande Échelle pour hedge fund - déploiement en production à grande échelle - architecture de systèmes et infrastructure cloud - SageMaker (AWS).
Description de l'offre d'emploi
Dans un contexte de transformation porté par l’IA, les entreprises doivent faire face à un double défi : innover vite, tout en garantissant robustesse et scalabilité. Ce nouvel équilibre redéfinit les standards techniques et organisationnels du marché.
C'est précisément dans ce paysage en pleine mutation que nous intervenons auprès de nos clients (grands groupe et start-up), en proposant une expertise complète couvrant la définition de la stratégie data/IA, jusqu’à l’industrialisation de modèles via des pipelines MLOps robustes et scalable. Nous accompagnons aussi des migrations de workloads HPC vers le cloud (AWS, GCP), et optimisons des infrastructures pour des usages LLMs à grande échelle.
Nous recherchons un consultant expérimenté pour rejoindre un hedge fund quantitatif de premier plan. L’objectif principal est d'accompagner le déploiement de modèles d’intelligence artificielle à grande échelle, avec un focus particulier sur l’optimisation de l’entraînement, la gestion de volumes massifs de données, et l’accompagnement d'une équipe senior de Data Scientists dans la montée en compétences sur des architectures et des technologies avancées de traitement de données.
Missions :
Optimisation de l’entraînement à grande échelle : Responsable de la définition et de l’optimisation de l'architecture et de l’infrastructure nécessaires à l’entraînement de modèles IA sur des volumes de données massifs (péta-octets). Ce travail inclut la gestion du sharding, quantization, sparsification, et le déploiement sur des clusters de plusieurs GPU/instances AWS.
Accompagnement de l’équipe de Data Scientists : Travailler en étroite collaboration avec une équipe de 5 Data Scientists seniors pour les guider et les former sur les pratiques et outils nécessaires pour le traitement des données à grande échelle. Mettre en place des sessions de montée en compétence pour renforcer les compétences en matière de distribution de l'entraînement de modèles sur des GPU et des environnements cloud.
Définition de l’architecture d’entraînement : Concevoir l’architecture nécessaire pour l’entraînement de modèles à grande échelle. Cette architecture doit permettre la gestion de tera-octets de données par training, et garantir la distribution efficace du travail sur une ferme de GPU/instances AWS en parallèle.
Évolution de la ML Platform : Collaborer avec l’équipe interne pour définir un plan d’évolution de l’infrastructure actuelle de la plateforme ML vers une architecture de production adaptée à des besoins de traitement à grande échelle.
Pré-requis du poste
Expérience en déploiement en production à grande échelle : Avoir une expérience avérée dans le déploiement de modèles d’IA à grande échelle, en particulier sur des architectures distribuées utilisant plusieurs GPU et des infrastructures cloud comme AWS.
Expertise en optimisation d’entraînement : Maîtriser les techniques avancées d’optimisation pour l’entraînement de modèles IA, telles que la quantization, sparsification, et sharding.
Maîtrise des volumes massifs de données : Connaissance approfondie de la gestion de péta-octets de données, y compris la distribution et le traitement de ces données sur des infrastructures distribuées.
Capacités pédagogiques et relationnelles : Avoir des compétences avérées pour accompagner des équipes techniques très expérimentées dans la montée en compétences sur des sujets liés à l’IA à grande échelle.
Compétences en architecture de systèmes et infrastructure cloud : Expérience dans la conception de l'architecture d'infrastructure pour les modèles IA à large échelle, notamment l'utilisation d'outils et services cloud pour gérer les ressources de calcul nécessaires (S3, SageMaker).
Qualifications
Diplôme en Informatique, Data Science, Mathématiques ou domaine connexe.
Expérience de travail avec des frameworks comme TensorFlow, PyTorch, et des outils d’orchestration comme Kubernetes, MLFlow.
Expérience avec des services cloud (AWS, Azure, GCP) et des outils de gestion des données et du calcul distribué.
Expérience avec des plateformes de machine learning à grande échelle et des architectures distribuées pour l'entraînement de modèles IA.
Conditions
Contrat : CDI – statut cadre
Siège : Boulogne-Billancourt et nos clients sont en IDF
Télétravail : 2 jours par semaine
Démarrage : septembre 2025
Anglais et Français niveau C1 ou C2
Rémunération : selon profil
Autres : Mutuelle, 50% des frais de transport remboursés, carte ticket restaurant, prime vacances, budget formation & certifications, RTT.
Parcours de recrutement
Premier entretien RH & Commercial : découverte du parcours et des attentes du candidat.
Entretien technique avec un consultant expert pour évaluer les compétences techniques.
Rencontre avec Wilfried, notre CTO et Antoine, notre Head of IA afin de valider la projection professionnelle au sein du cabinet
Proposition et intégration
Chez Aneo, chacun.e a sa place. Nous valorisons toutes les singularités et recrutons dans le respect de l’égalité des chances.
ou
C'est fait !
Votre candidature a été envoyée avec succès !