Critères de l'offre
Métiers :
- Ingénieur production (H/F)
Secteur :
- ESN, Editeurs de logiciel, Services informatiques
Lieux :
- Lyon (69)
Conditions :
- Indépendant / Franchisé
- 400 € - 600 €
- Temps Plein
Description du poste
Actuellement, afin de répondre aux besoins de nos clients, nous recherchons un Ingénieur production & Observabilité sur IOT H/F à Lyon, France.
Ce programme porte un enjeu de mise en place d'un standard groupe Plateforme IoT.. Ce standard s'appuie sur la solution Thingsboard.
La Plateforme va voir le jour avec une première instance opérationnelle, exploitable et interconnectée, en garantissant un niveau de service compatible avec les enjeux métier, la stratégie IoT et conforme avec le standard Plateforme IoT.
Puis entrer en phase de Maintien en Conditions Opérationnelles (MCO) fin 2026. Cette étape va également se traduire par un passage du mode projet au mode Produit de la plateforme, avec l'arrivée de nouvelles activités pour assurer la MCO et le RUN de la plateforme.
L'équipe produit cible doit proposer un modèle industrialisé et optimisé au travers des notions essentielles suivantes : observabilité, polyvalence et scalabilité.
Mission
Vous devrez, dans le cadre de votre mission, assurer le rôle pivot entre le run, le build et les expertises externes. Sa mission principale sera de garantir la disponibilité, la fiabilité et la compréhension du fonctionnement de la Plateforme IoT, en assurant l'observabilité bout-en-bout, le diagnostic des incidents, et l'orchestration des actions correctives, tout en contribuant à l'amélioration continue et à l'automatisation du run.
Livrables
Diagnostic des incidents et perturbations
o Etre le point d'entrée principal des incidents plateforme
o Qualifier rapidement les incidents :
o Réaliser le diagnostic niveau plateforme :
o Résoudre directement les incidents simples ou
o Escalader de manière ciblée et argumentée vers les bons groupes d'expertise (développeurs de la plateforme, sécurité, infra…)
Exploitation & MCO de la plateforme
o Participer au maintien en conditions opérationnelles
o Contribuer à la gestion des environnements (dev / test / prod)
o Identifier les dérives de performance, de qualité ou de coûts
o Participer aux analyses post-incident (REX)
o Alimenter le backlog "amélioration plateforme"
Interface et coordination transverse
o Travailler au quotidien avec les développeurs plateforme
o Être l'interlocuteur privilégié des expertises internes :
o Fournir une vision claire de l'état de la plateforme aux parties prenantes
Amélioration continue du run
o Maintenir et optimiser la politique de surveillance (logs, métriques, alerting,dashboard) pour garantir une vision end-to-end, reflet de l'expérience utilisateur
o Identifier les tâches manuelles récurrentes, proposer et implémenter des automatisations
o Contribuer à la standardisation des pratiques d'exploitation
o Participer à la documentation run (runbooks, procédures)
Ce programme porte un enjeu de mise en place d'un standard groupe Plateforme IoT.. Ce standard s'appuie sur la solution Thingsboard.
La Plateforme va voir le jour avec une première instance opérationnelle, exploitable et interconnectée, en garantissant un niveau de service compatible avec les enjeux métier, la stratégie IoT et conforme avec le standard Plateforme IoT.
Puis entrer en phase de Maintien en Conditions Opérationnelles (MCO) fin 2026. Cette étape va également se traduire par un passage du mode projet au mode Produit de la plateforme, avec l'arrivée de nouvelles activités pour assurer la MCO et le RUN de la plateforme.
L'équipe produit cible doit proposer un modèle industrialisé et optimisé au travers des notions essentielles suivantes : observabilité, polyvalence et scalabilité.
Mission
Vous devrez, dans le cadre de votre mission, assurer le rôle pivot entre le run, le build et les expertises externes. Sa mission principale sera de garantir la disponibilité, la fiabilité et la compréhension du fonctionnement de la Plateforme IoT, en assurant l'observabilité bout-en-bout, le diagnostic des incidents, et l'orchestration des actions correctives, tout en contribuant à l'amélioration continue et à l'automatisation du run.
Livrables
Diagnostic des incidents et perturbations
o Etre le point d'entrée principal des incidents plateforme
o Qualifier rapidement les incidents :
o Réaliser le diagnostic niveau plateforme :
o Résoudre directement les incidents simples ou
o Escalader de manière ciblée et argumentée vers les bons groupes d'expertise (développeurs de la plateforme, sécurité, infra…)
Exploitation & MCO de la plateforme
o Participer au maintien en conditions opérationnelles
o Contribuer à la gestion des environnements (dev / test / prod)
o Identifier les dérives de performance, de qualité ou de coûts
o Participer aux analyses post-incident (REX)
o Alimenter le backlog "amélioration plateforme"
Interface et coordination transverse
o Travailler au quotidien avec les développeurs plateforme
o Être l'interlocuteur privilégié des expertises internes :
o Fournir une vision claire de l'état de la plateforme aux parties prenantes
Amélioration continue du run
o Maintenir et optimiser la politique de surveillance (logs, métriques, alerting,dashboard) pour garantir une vision end-to-end, reflet de l'expérience utilisateur
o Identifier les tâches manuelles récurrentes, proposer et implémenter des automatisations
o Contribuer à la standardisation des pratiques d'exploitation
o Participer à la documentation run (runbooks, procédures)
Référence : 634002

