AI Engineer (m/w/d) - LLM Apps, RAG & Argentic Systems (german speaking)

Remote, USA
Posted Jun 14, 2026
Full-time

Standort: Remote (DACH-Zeitzone), Office Berlin optional
Anstellung: Vollzeit, unbefristet
Start: Ab sofort
Sprache: Deutsch C2, Englisch min. C1

───────────

ÜBER SANDAN AI

sandan AI ist ein in Berlin ansässiges AI-Native-Startup für Enterprise-Kunden im DACH-Raum. Wir prägen, wie Marketing in einer agentischen Wirtschaft aussieht – und bauen die Plattform, auf der diese neue Generation von Marketing-Workflows läuft. Unser Anspruch: Software so zu entwickeln, wie Software 2026 entwickelt werden sollte – agentisch, iterativ, mit AI als integralem Bestandteil des EngineeringWorkflows.

────────────

UNSERE ARBEITSWEISE
Wir entwickeln agentisch. Claude Code und Codex sind Kern unseres Engineering-Workflows – nicht Spielerei. Wer bei uns einsteigt, arbeitet entweder schon produktiv mit diesen Tools oder will sich aktiv und tief einarbeiten.

Aufgaben

Du baust die Intelligenz, die in ArcGEN läuft. Du verantwortest unsere LLM-Pipelines, Agenten-Architekturen und Eval-Frameworks - vom Prototypen im Notebook bis zur produktiven Pipeline mit nachweisbarer Qualität.

Design und Betrieb von RAG-Pipelines (Embeddings, Vector Stores, Re-Ranking)

Architektur agentischer Systeme – Tool-Calling, MCP, Sub-Agent-Orchestrierung

Aufbau und Pflege von LLM-Eval-Frameworks: Metriken, Benchmarks, A/B-Testing, Quality-Gates

Prompt-Engineering und systematische Prompt-Optimierung

Entwicklung ML-Modelle für Marketing-Use-Cases (Attribution, Targeting, Forecasting, Anomaly Detection)

Überführung von Notebook-Explorationen in produktionsreife Pipelines

Enge Zusammenarbeit mit unseren Full-Stack-Engineers an der Plattform-Integration

Qualifikation

Must-have:

Praxis mit modernen LLM-Workflows in Production: RAG, Embeddings, Vector Databases (Pinecone, Weaviate, pgvector)

Solide Python-Kenntnisse inkl. pandas, NumPy, scikit-learn sowie PyTorch oder TensorFlow

Erfahrung im End-to-End-ML-Lifecycle: Datenaufbereitung, Training, Evaluation, Deployment, Monitoring

Erfahrung mit systematischer Modell-Evaluation: Metriken, Benchmarks, Eval-Frameworks

Deutsch C2 und Englisch C1

Builder-Mentalität: Du lieferst Production-Systeme, nicht nur Notebooks

Pluspunkte:

Eigenentwicklung von Custom Agents, Sub-Agents oder spezialisierten Coding-Workflows

Erfahrung mit MCP (Model Context Protocol) und Tool-Calling-Architekturen

Praxis mit Agent-Frameworks (Mastra, LangGraph, Vercel AI SDK)

Erfahrung mit Fine-Tuning, LoRA-Adaptern oder Distillation

MLOps-Tools (MLflow, Weights & Biases, DVC)

Background in Marketing-Analytics, Attribution-Modellen oder Performance-Marketing-Daten

Kaggle, Open-Source-Beiträge oder Publikationen im ML-/AI-Bereich

Benefits

Wettbewerbsfähiges Gehalt mit jährlicher Anpassung

Vollständig finanzierter Zugang zu Claude Max, Codex, GitHub Copilot, OpenAI- und Anthropic-APIs sowie allen relevanten LLM-Tools

Compute-Budget für Experimente, Modell-Training und ML-Workloads

MacBook Pro nach Wahl

Remote-First, flexible Arbeitszeiten

Quartalsweise Team-Meetups in Berlin oder Dubai (DIFC AI Campus, optional)

Direkter Einfluss auf Produkt-Architektur in einer frühen Phase

Steile Lernkurve in Agentic AI, LLM-Orchestrierung und AI-Native-Engineering

Lebenslauf reicht. Wenn du GitHub, Portfolio, Kaggle oder ein
Open-Source-Projekt hast – sehr gerne mit dazu.

Wir freuen uns auf deine Bewerbung!

More Remote Jobs