Le rôle de Concepteur(-trice) principal(e), Fiabilité des services, consiste à analyser et à spécifier les solutions pour les projets assignés, en assurant leur faisabilité. Ce poste exige une collaboration étroite avec les équipes PLEX, les unités TI et les clients d'affaires, en fournissant un soutien pour les tâches fonctionnelles et les changements de projet en cours. L'objectif ultime est de contribuer à la stabilité financière de millions de Québécois en favorisant un avenir plus durable.
Concevoir des solutions SRE évolutives et résilientes sur l'infrastructure AWS.,Définir et mettre en œuvre des stratégies adaptées aux besoins de l'entreprise.,Proposer des améliorations architecturales pour optimiser les coûts, améliorer les performances et assurer une haute disponibilité.,Collaborer avec les parties prenantes pour aligner les priorités SRE sur les objectifs commerciaux.,Contribuer à l'élaboration de la feuille de route technologique et influencer les décisions opérationnelles stratégiques.,Former et encadrer les équipes de développement et d'exploitation pour intégrer les pratiques SRE dans les flux de travail quotidiens.,Promouvoir une culture d'amélioration continue et de collaboration interdisciplinaire.,Développer et maintenir des outils et pipelines CI/CD pour automatiser les déploiements et les opérations.,Automatiser la gestion de l'infrastructure et les tâches opérationnelles répétitives.,Identifier et résoudre les problèmes de fiabilité, de latence et d'évolutivité dans les environnements AWS.,Mettre en œuvre des pratiques d'ingénierie du chaos pour tester la résilience du système.,Superviser les SLO, SLI et SLA pour garantir que les niveaux de service répondent aux attentes.,Établir des processus robustes de gestion des incidents et mener des post-mortems pour documenter les causes profondes.,Assurer un suivi diligent des actions correctives et préventives.
Baccalauréat en technologies de l'information, en génie logiciel ou dans un domaine connexe (ou expérience équivalente).,Cinq (5) ans d'expérience pertinente en gestion des opérations.,Cinq (5) ans d'expérience pertinente en SRE et avec les services AWS clés (EC2, S3, RDS, Lambda, Cloudwatch, Route 53, etc.).,Maîtrise des concepts d'architecture cloud : VPC, IAM, réseau, sécurité, etc.,Connaissance avancée des concepts IaC (Cloudformation, Terraform, etc.).,Capacité à automatiser et à gérer des infrastructures dans des environnements complexes.,Expertise avec des outils comme Datadog, Cloudwatch et ITOM SNOW.,Compréhension des concepts de traçage distribué et de journaux centralisés.,Expérience dans l'utilisation d'Azure DevOps, GitHub, Jenkins, Gitlab CI/CD ou d'outils similaires.,Connaissance approfondie d'au moins un (1) langage de script (Python, Bash) et d'un langage de programmation (Go, Java, etc.).,Expérience en gestion d'incidents critiques dans des environnements de production.,Compréhension approfondie des pratiques d'ingénierie du chaos.,Capacité à travailler dans un contexte Agile.
Baccalauréat
Implication occasionnelle dans des incidents critiques en soirée, la nuit ou les fins de semaine.
La CDPQ est un groupe mondial d’investissement qui gère les fonds de régimes de retraite et d’assurances publics. Elle investit dans les grands marchés financiers, en placements privés, en infrastructures, en immobilier et en crédit privé afin de créer de la valeur à long terme.
BerryMap utilise des cookies pour fournir des fonctionnalités essentielles, analyser l'utilisation et améliorer votre expérience. Vous pouvez personnaliser vos préférences ci-dessous.