Remote
Descripcion del puesto
Rejoignez tether, start‑up innovante spécialisée dans les modèles d’intelligence artificielle de nouvelle génération, et intégrez l’équipe dédiée aux modèles IA. En tant qu’Ingénieur Recherche IA – Pré‑entraînement, vous serez le moteur technique qui conçoit, implémente et optimise les architectures de modèles de grande taille, y compris les systèmes multimodaux. Vous travaillerez sur des projets de pointe, depuis la définition de nouvelles architectures LLM (Large Language Model) jusqu’à l’optimisation du pipeline de pré‑entraînement sur des clusters massifs composés de milliers de GPU NVIDIA.
**Vos missions principales**
- Concevoir et développer des architectures innovantes de modèles IA (LLM, vision‑langage, audio‑texte, etc.) en vous appuyant sur les dernières avancées de la recherche.
- Piloter le pré‑entraînement de modèles de plusieurs milliards de paramètres, en assurant la scalabilité et la robustesse du code sur des environnements distribués (Horovod, DeepSpeed, Megatron‑LM, etc.).
- Mettre en place des stratégies de curation et de filtrage de données massives (téraoctets) afin d’améliorer la qualité des jeux de données et de réduire les biais.
- Identifier, analyser et résoudre les goulets d’étranglement du pré‑entraînement (bande passante, utilisation GPU, synchronisation, etc.) grâce à des techniques d’optimisation avancées (mixed‑precision, gradient checkpointing, pipeline parallelism).
- Développer et maintenir des outils internes de monitoring, de profiling et de visualisation des performances (TensorBoard, Weights & Biases, custom dashboards).
- Collaborer étroitement avec les équipes produit, data‑science et infrastructure pour transformer les prototypes de recherche en solutions déployables à grande échelle.
- Publier des articles scientifiques, brevets ou rapports internes afin de positionner tether comme un acteur de référence dans le domaine du pré‑entraînement IA.
**Profil recherché**
Vous êtes passionné·e par la recherche appliquée en IA et avez déjà mené à bien des projets de pré‑entraînement de modèles de grande taille. Vous maîtrisez les frameworks de deep learning (PyTorch, TensorFlow) ainsi que les bibliothèques de parallélisation (DeepSpeed, Megatron‑LM, Horovod). Vous avez une solide expérience en programmation Python et C/C++, êtes à l’aise avec les environnements Linux, Docker/Kubernetes et les systèmes de versionning (Git). Vous avez une bonne compréhension des architectures GPU, du calcul haute performance et des réseaux de communication (NVLink, InfiniBand). Vous êtes autonome, rigoureux·se, capable de travailler en équipe à distance et de communiquer clairement vos résultats à des interlocuteurs techniques et non‑techniques.
**Ce que nous offrons**
- Un poste 100 % remote avec une flexibilité horaire adaptée aux fuseaux horaires européens.
- Un environnement de travail stimulant, entouré d’experts reconnus dans le domaine de l’IA.
- Un accès à des infrastructures de calcul de pointe (clusters GPU NVIDIA A100/A6000).
- Un package salarial compétitif, des bonus liés aux performances et des actions de la société.
- Des opportunités de formation continue, de participation à des conférences internationales et de publication scientifique.
- Une culture d’entreprise basée sur l’innovation, la transparence et le partage des connaissances.
Si vous êtes prêt·e à relever le défi de repousser les limites du pré‑entraînement IA et à contribuer à la prochaine génération de modèles multimodaux, postulez dès maintenant et rejoignez l’aventure tether !