SR PLATFORM ENGINEER/ DEVOPS /GenAIOps (Senior) Hibrido, AMBA #00244
Responsabilidades*
-Provisionar y escalar clústeres AKS/EKS con GPU para inferencia y fine-tuning de modelos, usando módulos Terraform reutilizables. -Automatizar CI/CD de aplicaciones y pipelines LLM con GitHub Actions y Azure DevOps, incluyendo tests de seguridad, performance y validación de prompts. -Implementar observabilidad de extremo a extremo (traces, métricas, logs) con OpenTelemetry y dashboards en Prometheus/Grafana para detectar latencias, uso de tokens y drift de modelos. -Gestionar ciclo de vida de modelos (versionado, promoción, rollback) con MLflow 3 / LLMOps y artefactos en repositorios seguros. -Optimizar costos y cuotas (TPM/RPM) en Azure OpenAI y Bedrock, aplicando auto-scaling y políticas de rate-limit. -Colaborar con equipos de Ingeniería y Data Science para integrar nuevos agentes, vectordbs y workflows sin fricción operacional.
Conocimientos requeridos*
- +5 años en roles DevOps/SRE manejando infraestructura cloud a escala. -Sólido dominio de Azure y AWS: AKS/EKS, IAM, VNet/VPC, load balancers y servicios administrados. -Experiencia con IaC (Terraform o Pulumi) y pipelines CI/CD en GitHub Actions/Azure DevOps. -Conocimientos prácticos en LLMOps/GenAIOps: despliegue de LLMs, gestión de artefactos y monitoreo de calidad. -Habilidades en seguridad y compliance: escaneo de contenedores, políticas de secretos, guardrails de prompts.
Locacion: Microcentro, CABA 3 veces por semana