Site Reliability Engineer/DevOps Engineer - Team per la Trasformazione Digitale

Site Reliability Engineer/DevOps Engineer hired

Descrizione e responsabilità

Il Team per la Trasformazione Digitale è alla ricerca di un esperto Site Reliability Engineer/Production Engineer, che gestisca e supporti lo sviluppo delle piattaforme digitali coordinate dalla struttura.

Le principali responsabilità di tale figura saranno:

Gestire l’intero ciclo di vita dei servizi infrastrutturali delle piattaforme applicative (sviluppo, produzione e dismissione)
Progettare il monitoraggio delle piattaforme applicative, individuando le metriche più appropriate per garantire l’alta affidabilità delle infrastrutture
Progettare e implementare infrastrutture cloud basate sui requisiti degli stakeholder
Produrre dettagliate specifiche tecniche di progettazione delle infrastrutture cloud
Investire sull’automazione dei processi per migliorare scalabilità e affidabilità delle piattaforme applicative
Eseguire le attività di security hardening sulle infrastrutture cloud
Identificare il debito tecnico da eliminare con priorità
Identificare e proporre tecnologie alternative per sviluppare implementazioni più scalabili
Coordinare le attività di risoluzione di problemi tecnici complessi fino alla risoluzione
Fornire stime accurate delle risorse necessarie per lo sviluppo delle infrastrutture
Sviluppare test automatizzati per convalidare il codice sorgente
Collaborare con colleghi e stakeholder per sviluppare e mantenere processi di disaster recovery
Scrivere documenti di postmortem e i necessari report tecnici sugli incidenti e gli eventuali malfunzionamenti
Promuovere e condividere la cultura devops nel team di lavoro e nella comunità del settore pubblico

Siamo alla ricerca di talenti appassionati nel costruire e gestire infrastrutture IT complesse, con una comprovata esperienza nello sviluppo e costruzione di piattaforme digitali, con un background scientifico e tecnico molto forte.

Qualifiche chiave

Buona conoscenza di Linux, delle pratiche di sicurezza informatica e delle nozioni fondamentali di rete
Esperienza pratica nel cloud pubblico (Google Cloud, Azure o AWS)
Esperienza pratica nelle tecnologie cloud Open Source specificamente OpenStack
Esperienza lavorativa in ambiente agile
Ottima esperienza nella programmazione e scripting in Python / Bash
Esperienza con tecnologie di scheduling per container come Kubernetes o Docker Swarm
Esperienza con moderni sistemi di logging come ElasticSearch o Graylog
Comprensione ed esperienza di processi di monitoring con tecnologie come Graphite o Prometheus
Familiarità con i principi e la filosofia DevOps e una forte attitudine a ridurre il sovraccarico operativo dei sistemi mediante i processi di automazione
Esperienza nel design nello sviluppo di architetture software robuste e scalabili
Esperienza di lavoro con strumenti di gestione di progetti tradizionali (Gantt) e agili (Scrum o Kanban)
Atteggiamento fortemente motivato, orientato all’innovazione, curioso e aperto

Formazione

Laurea magistrale in Informatica o affine con almeno 3 anni di esperienza nell’industria IT come Site Reliability Engineer/ Production Engineer, o, in assenza di laurea, almeno 5 anni di esperienza nell’industria IT come Site Reliability Engineer/ Production Engineer
Ottima conoscenza della lingua inglese