AI Engineering
Bauen mit LLMs: Integration, RAG, Evaluation, Kostenkontrolle und Produktmuster.
Function Calling und Tool Use: LLMs handlungsfähig machen
Wie Function Calling und Tool Use funktionieren, wie Sie Werkzeuge sauber definieren und absichern und welche Architektur LLM-Agenten in Produktion zuverlässig macht.
Streaming-Antworten in LLM-Produkten: UX, Technik und Fallstricke
Warum Streaming die wahrgenommene Geschwindigkeit von LLM-Produkten prägt, wie Server-Sent Events und Token-Streaming funktionieren und worauf es bei der UX ankommt.
Embeddings und semantische Suche: Bedeutung statt Stichworte finden
Wie Embeddings Bedeutung in Vektoren übersetzen, wie semantische Suche funktioniert und worauf es bei Chunking, Modellwahl und der Kombination mit klassischer Suche ankommt.
Guardrails für LLM-Produkte: Ein- und Ausgaben absichern
Wie Guardrails die Ein- und Ausgaben von LLM-Anwendungen absichern, welche Arten es gibt und wie Sie sie schichten, ohne das Produkt unbrauchbar oder die Kosten unkontrollierbar zu machen.
Prompt Injection: LLM-Produkte gegen Manipulation absichern
Wie Prompt-Injection-Angriffe funktionieren, warum sie sich nicht vollständig verhindern lassen und welche Schutzschichten LLM-Produkte in der Praxis brauchen.
LLM Integration in SaaS: Architecture Patterns That Survive Production
How to wire an LLM into a production SaaS without runaway cost or latency. Streaming, caching, fallback, and workspace isolation patterns from real products.
Retrieval-Augmented Generation (RAG): Ein praktischer Engineering-Leitfaden
RAG jenseits des Hello-World. Chunking-Strategie, Embedding-Wahl, hybride Suche, Re-Ranking und das Evaluations-Harness, das zeigt, ob es wirklich funktioniert.
AI-Kostenmanagement: LLM-Ausgaben in SaaS planbar halten
Token-Ökonomie für Produktteams. Prompt-Budgets, Caching, Modell-Tiering und das Pro-Workspace-Metering, das verhindert, dass ein AI-Feature Ihre Marge auffrisst.
Prompt Engineering für Produkte (nicht für Demos)
Produktives Prompting ist Software. Versionierung, Tests, strukturierte Ausgabe, Injection-Abwehr und warum Ihr System-Prompt mit Changelog in die Versionskontrolle gehört.
LLM-Features evaluieren: Testen, was keine richtige Antwort hat
Sie können keine KI ausliefern, die Sie nicht messen können. Eval-Sets aufbauen, LLM-as-Judge, Regressions-Gates in der CI und menschliche Review-Schleifen für Produktqualität.
pgvector vs. dedizierte Vektordatenbanken: Die Wahl für SaaS-Skalierung
Wann Postgres pgvector genügt und wann Sie Pinecone, Qdrant oder Weaviate brauchen. Index-Typen, Skalierungsgrenzen und die Betriebskosten eines zweiten Datenspeichers.
KI-Agenten in einem SaaS-Produkt: Wo sie helfen und wo sie schaden
Agentische Features jenseits des Hypes. Tool-Use-Design, das Autonomie-Spektrum, Human-in-the-Loop-Checkpoints und warum die meisten nützlichen Agenten eng sind, nicht generell.
Claude API vs. OpenAI für EU-SaaS: Datenresidenz und praktische Trade-offs
Die Wahl eines LLM-Anbieters für ein DACH-Produkt: Datenverarbeitungsbedingungen, EU-Residenz, Modellstärken und die Abstraktionsschicht, die den Wechsel ohne Rewrite erlaubt.
KI-Feature-UX gestalten: Vertrauen, Latenz und der Leerzustand
Gute KI-UX managt Unsicherheit. Streaming-Feedback, Konfidenz-Hinweise, editierbare Ausgabe, eleganter Fehlerfall und das Onboarding von Nutzern, die noch nie geprompted haben.
KI-Features und DSGVO: Rechtmässige Verarbeitung, wenn ein LLM personenbezogene Daten berührt
Die Compliance-Schicht unter jedem KI-Feature. Rechtsgrundlage, automatisierte Entscheidungen nach Artikel 22, Subprozessor-Offenlegung und personenbezogene Daten aus dem Training heraushalten.
Fine-Tuning vs. Prompting vs. RAG: Das richtige Werkzeug wählen
Drei Wege, ein LLM Ihre Aufgabe tun zu lassen. Wann Prompting genügt, wann RAG es verankert, wann Fine-Tuning seine Kosten verdient — und warum die meisten Teams zum falschen greifen.
EU AI Act und General-Purpose-KI: Was Entwickler auf LLM-Basis wissen müssen
Die GPAI-Regeln traten im August 2025 in Kraft. Was nachgelagerte Entwickler erben, Transparenz- und Urheberrechtspflichten und wo die Linie zwischen Anbieter und Betreiber verläuft.
KI-Observability: Logging, Tracing und das Erkennen von Qualitätsdrift
Sie können nicht reparieren, was Sie nicht sehen. LLM-Aufrufe tracen, Prompts und Ausgaben rechtmässig loggen, Latenz- und Kosten-Dashboards und Alerting bei Qualitätsregression.
KI-Content-Moderation in SaaS: Sicherheit ohne Trust-and-Safety-Team
Auch kleine Teams brauchen Moderation. Klassifikator-Kaskaden, LLM-basiertes Review, menschliche Eskalation und die DSA-Pflichten, die gelten, sobald Nutzer Inhalte erzeugen.
KI-gestütztes Onboarding: Die ersten fünf Minuten personalisieren
Die erste Sitzung entscheidet über die Aktivierung. Ein LLM nutzen, um das Onboarding auf das genannte Ziel des Nutzers zuzuschneiden, Starter-Content zu erzeugen und die Time-to-Value zu verkürzen.
