Site Reliability Engineer/DevOps Engineer hired
Descrizione e responsabilità
Il Team per la Trasformazione Digitale è alla ricerca di un esperto Site Reliability Engineer/Production Engineer, che gestisca e supporti lo sviluppo delle piattaforme digitali coordinate dalla struttura.
Le principali responsabilità di tale figura saranno:
- Gestire l’intero ciclo di vita dei servizi infrastrutturali delle piattaforme applicative (sviluppo, produzione e dismissione)
- Progettare il monitoraggio delle piattaforme applicative, individuando le metriche più appropriate per garantire l’alta affidabilità delle infrastrutture
- Progettare e implementare infrastrutture cloud basate sui requisiti degli stakeholder
- Produrre dettagliate specifiche tecniche di progettazione delle infrastrutture cloud
- Investire sull’automazione dei processi per migliorare scalabilità e affidabilità delle piattaforme applicative
- Eseguire le attività di security hardening sulle infrastrutture cloud
- Identificare il debito tecnico da eliminare con priorità
- Identificare e proporre tecnologie alternative per sviluppare implementazioni più scalabili
- Coordinare le attività di risoluzione di problemi tecnici complessi fino alla risoluzione
- Fornire stime accurate delle risorse necessarie per lo sviluppo delle infrastrutture
- Sviluppare test automatizzati per convalidare il codice sorgente
- Collaborare con colleghi e stakeholder per sviluppare e mantenere processi di disaster recovery
- Scrivere documenti di postmortem e i necessari report tecnici sugli incidenti e gli eventuali malfunzionamenti
- Promuovere e condividere la cultura devops nel team di lavoro e nella comunità del settore pubblico
Siamo alla ricerca di talenti appassionati nel costruire e gestire infrastrutture IT complesse, con una comprovata esperienza nello sviluppo e costruzione di piattaforme digitali, con un background scientifico e tecnico molto forte.
Qualifiche chiave
- Buona conoscenza di Linux, delle pratiche di sicurezza informatica e delle nozioni fondamentali di rete
- Esperienza pratica nel cloud pubblico (Google Cloud, Azure o AWS)
- Esperienza pratica nelle tecnologie cloud Open Source specificamente OpenStack
- Esperienza lavorativa in ambiente agile
- Ottima esperienza nella programmazione e scripting in Python / Bash
- Esperienza con tecnologie di scheduling per container come Kubernetes o Docker Swarm
- Esperienza con moderni sistemi di logging come ElasticSearch o Graylog
- Comprensione ed esperienza di processi di monitoring con tecnologie come Graphite o Prometheus
- Familiarità con i principi e la filosofia DevOps e una forte attitudine a ridurre il sovraccarico operativo dei sistemi mediante i processi di automazione
- Esperienza nel design nello sviluppo di architetture software robuste e scalabili
- Esperienza di lavoro con strumenti di gestione di progetti tradizionali (Gantt) e agili (Scrum o Kanban)
- Atteggiamento fortemente motivato, orientato all’innovazione, curioso e aperto
Formazione
- Laurea magistrale in Informatica o affine con almeno 3 anni di esperienza nell’industria IT come Site Reliability Engineer/ Production Engineer, o, in assenza di laurea, almeno 5 anni di esperienza nell’industria IT come Site Reliability Engineer/ Production Engineer
- Ottima conoscenza della lingua inglese