Recrutement Novaia

MLOps - DevOps - Data Engineer H/F - Novaia

  • Marseille 8e - 13
  • CDI
  • Novaia
Publié le 28 août 2025
Postuler sur le site du recruteur

Les missions du poste

Contexte

Novaia (callbots IA) industrialise des flux voix temps réel à gros volume (STT/TTS, LLM, AMD) sur une infra scalable (Kubernetes + GPU) pour des campagnes téléphoniques massives. Nous cherchons un profil hybride MLOPS/DEVOPS/Data Engineer pour fiabiliser, accélérer et réduire les coûts de bout en bout.

Mission

Concevoir, déployer et opérer une plateforme MLOPS/Data temps réel (sub-300 MS) : ingestion audio STT NLP/LLM orchestration TTS, avec observabilité, CI/CD, sécurité et contrôle des coûts.

Responsabilités clés

- Infra & Ops

Concevoir l'infra Kubernetes (prod/staging), autoscaling CPU/GPU, réseau, stockage.

Mettre en place CI/CD (build, tests, canary/blue-green, rollback).

Observabilité end-to-end : logs, métriques, traces, alerting (SLO/SLI).

Sécurité : IAM, secrets, durcissement, sauvegardes, PRA.

- MLOPS

Registry/traçabilité des modèles (MLflow/DVC/W&B), packaging (ONNX/TensorRT), serving (vLLM/Triton/TorchServe/FastAPI).

Déploiements progressifs (shadow/canary), AB-tests, surveillance de dérive.

Optimisation latence/coût : quantization, distillation, KV-cache, batch, pinning GPU.

- Data Engineering

Pipelines batch & streaming (Airflow, dbt, Kafka/Redpanda) pour logs audio/intent/succès d'appels.

Qualité des données, schémas, GDPR (pseudonymisation, rétention).

Exposition de datasets/metrics pour les Data Scientists et les équipes métier.

Téléphonie/Voix (plus)

Intégration Asterisk/FreeSWITCH/Jambonz/Drachtio, routage SIP, AMD.

Intégration STT (Whisper/Vosk/ASR cloud) et TTS (Coqui/ElevenLabs/Azure), budgets de latence.

- FinOps

Suivi coût/minute & coût/inférence, dashboards, right-sizing GPU, réservations/spot.

Stack cible (idéalement vous en maîtrisez une bonne partie)

Infra : Kubernetes, Docker, Terraform, Ansible, Helm; OVH/Scaleway/AWS/GCP; MinIO/S3; Ceph.

CI/CD : GitHub Actions / GitLab CI; ArgoCD/Flux; Trivy/Grype.

Obs : Prometheus, Grafana, Loki/ELK, OpenTelemetry, Sentry.

Data : Airflow, dbt, PostgreSQL/MySQL, Kafka/Redpanda, Redis, Parquet.

MLOPS/Serving : MLflow, DVC, W&B; vLLM, Triton, TorchServe, FastAPI; ONNX/TensorRT.

Langages : Python (pydantic/pytest), Bash; GO (plus); SQL.

Voix/Téléphonie : Asterisk, FreeSWITCH, Jambonz, SIP; Whisper/Vosk; Coqui/ElevenLabs/Azure TTS.

Postuler sur le site du recruteur

Ces offres pourraient aussi vous correspondre.

Parcourir plus d'offres d'emploi