Remote
Descripcion del puesto
Rejoignez Tether, une start‑up innovante spécialisée dans les modèles d’intelligence artificielle de nouvelle génération. En tant qu’AI Research Engineer dédié au pré‑training, vous intégrerez l’équipe « Modèles IA » et participerez à la conception, l’optimisation et le déploiement de modèles de grande envergure, incluant des architectures multimodales (texte‑image‑audio). Vous travaillerez sur des clusters de plusieurs milliers de GPU NVIDIA, en environnement Linux et sur des infrastructures de calcul distribuées (Horovod, DeepSpeed, Megatron‑LM, etc.).
**Missions principales**
- Concevoir et implémenter des architectures de modèles innovantes (transformers, diffusion, architectures hybrides) adaptées à des tâches variées (NLP, vision, audio, multimodal).
- Piloter le pré‑training de modèles à grande échelle, en définissant les stratégies de parallélisation (data‑parallel, pipeline‑parallel, tensor‑parallel) afin de maximiser l’utilisation des ressources GPU.
- Curater, nettoyer et enrichir les jeux de données massifs (terabytes) en appliquant des pipelines de traitement automatisés, des techniques de filtrage sémantique et des méthodes de data‑augmentation avancées.
- Mettre en place des métriques de suivi de la performance (perplexité, BLEU, FID, etc.) et des tableaux de bord de monitoring (TensorBoard, Weights & Biases) pour détecter rapidement les goulets d’étranglement.
- Optimiser les coûts d’infrastructure grâce à des techniques de quantisation, de pruning et de distillation, tout en maintenant ou améliorant la qualité des modèles.
- Collaborer étroitement avec les équipes produit, data‑science et ingénierie pour transformer les prototypes de recherche en services IA scalables et prêts à être commercialisés.
- Rédiger des rapports scientifiques, publier des articles dans des conférences de renom (NeurIPS, ICML, CVPR) et contribuer à la communauté open‑source (GitHub, papers).
**Profil recherché**
- Diplôme d’ingénieur ou Master/PhD en informatique, IA, mathématiques appliquées ou domaine équivalent.
- Minimum 5 ans d’expérience en recherche appliquée ou en ingénierie de modèles de deep learning à grande échelle.
- Maîtrise avancée de Python et des frameworks PyTorch/TensorFlow, ainsi que des bibliothèques de formation distribuée (DeepSpeed, Megatron‑LM, Horovod).
- Expérience confirmée avec les GPU NVIDIA (CUDA, cuDNN) et les environnements de calcul haute performance (SLURM, Kubernetes).
- Solides compétences en traitement de données massives (Spark, Dask, Hadoop) et en gestion de pipelines de données (Airflow, Prefect).
- Connaissance des techniques de pré‑training, de fine‑tuning, de quantisation, de pruning et de distillation.
- Capacité à travailler de façon autonome en remote, à gérer plusieurs projets simultanément et à communiquer clairement les résultats à des interlocuteurs non‑techniques.
- Anglais professionnel requis; l’italien ou le français sont un plus.
**Ce que nous offrons**
- CDI à temps plein, 100 % remote avec flexibilité horaire.
- Accès à une infrastructure de pointe (plus de 10 000 GPU NVIDIA A100).
- Budget dédié à la formation continue (conférences, cours en ligne, certifications).
- Environnement de travail stimulant, culture d’innovation et esprit start‑up.
- Participation aux projets à fort impact commercial et scientifique.
- Programme de stock‑options et avantages sociaux compétitifs.
Si vous êtes passionné(e) par les défis du pré‑training à grande échelle et que vous souhaitez contribuer à façonner l’avenir de l’IA, postulez dès maintenant et rejoignez l’aventure Tether !