Hören Sie auf zu suchen. Fangen Sie an zu fragen. Ihr sicheres Custom GPT.

Hören Sie auf zu suchen. Fangen Sie an zu fragen. Ihr sicheres Custom GPT.

Erstellen Sie einen privaten KI-Assistenten, der Ihr internes Wissen versteht. Mit fortschrittlicher RAG-Architekturliefert er sofortige, präzise Antworten aus Ihren Dokumenten – bei voller DSGVO-Konformität.

Kein Training mit Ihren Daten. Keine Halluzinationen. Nur Fakten.

Bauen Sie einen privaten KI-Assistenten, der Ihre internen Kenntnisse meistert. Mit fortschrittlicher RAG-Architektur liefert er sofortige, präzise Antworten aus Ihren Dokumenten mit vollständiger DSGVO-Konformität.

Kein Training mit Ihren Daten. Keine Halluzinationen. Nur Fakten.

Services

Services

Maßgeschneiderte KI-Effizienz

Über mich

Lernen Sie Ihren KI-Berater kennen

Meine Faszination für KI wird nicht durch den Hype angetrieben, sondern durch wissenschaftliche Genauigkeit. Während meines M.Sc. in Data Science an der TU Wien spezialisierte ich mich auf RAG-Architekturen und NLP und erkannte früh, dass wahre Effizienz tiefe technische Ingenieurskunst erfordert, nicht nur Standardwerkzeuge.

Mein Hintergrund im Kreditrisikomodellierung (Bankwesen) und Big 4 Beratung lehrte mich, dass Präzision unverhandelbar ist. Heute kombiniere ich diese technische Exzellenz mit einem schlanken, iterativen Ansatz, um robuste, forschungsbasierte Systeme mit Startup-Geschwindigkeit zu liefern.

Ich glaube an radikale Transparenz. Egal ob es um Datenschutz (DSGVO), Systemarchitektur oder Preismodelle geht: Sie sollten immer genau wissen, wie Ihre Investition funktioniert. Mein Ziel ist es, KI von einem Schlagwort in ein sicheres, transparentes und messbar effizientes Asset für Ihr Unternehmen zu verwandeln.

M.Sc. Data Science

M.Sc. Data Science

M.Sc. Data Science

Ex Big-4 Consultant

Ex Big-4 Consultant

Ex Big-4 Consultant

Ex Banking Modeler

Ex Banking Modeler

Ex Banking Modeler

B.Sc. E-Commerce

B.Sc. E-Commerce

B.Sc. E-Commerce

Ex Eom Consultant

Ex Eom Consultant

Ex Eom Consultant

Technischer Freelancer

Technischer Freelancer

Technischer Freelancer

RAG

RAG

Wie RAG Präzision liefert

Ein RAG-System, entwickelt mit LangChain

01 Indizierung

Wir laden Ihre Dokumente, bereinigen den Text und teilen ihn in kleine Abschnitte. Jeder Abschnitt wird in einen numerischen Vektor umgewandelt, damit das System seine Bedeutung verstehen kann. Alle Vektoren werden sicher in einer Vektordatenbank gespeichert.

02 Query Embedding

Wenn Sie eine Frage stellen, wird Ihre Anfrage ebenfalls in einen Vektor umgewandelt. Dies ermöglicht es dem System, Ihre Frage mit der Bedeutung Ihrer Dokumente zu vergleichen.

03 Ähnlichkeitssuche

Das System durchsucht die Vektordatenbank und findet die relevantesten Dokumentstücke. Dies sind die Abschnitte, die am besten zur Bedeutung Ihrer Frage passen.

04 (Optional) Re-Ranking

Ein tieferes KI-Modell überprüft die Top-Ergebnisse und sortiert sie nach ihrer tatsächlichen semantischen Qualität. Dies verbessert die Genauigkeit, insbesondere wenn Sie viele Dokumente haben.

05 Augmented Prompt & LLM-Antwort

Die am besten passenden Textstücke werden Ihrer Frage hinzugefügt. Das LLM verwendet diesen kombinierten Kontext, um eine präzise, fundierte Antwort zu generieren.

01 Indizierung

Wir laden Ihre Dokumente, bereinigen den Text und teilen ihn in kleine Abschnitte. Jeder Abschnitt wird in einen numerischen Vektor umgewandelt, damit das System seine Bedeutung verstehen kann. Alle Vektoren werden sicher in einer Vektordatenbank gespeichert.

02 Query Embedding

Wenn Sie eine Frage stellen, wird Ihre Anfrage ebenfalls in einen Vektor umgewandelt. Dies ermöglicht es dem System, Ihre Frage mit der Bedeutung Ihrer Dokumente zu vergleichen.

03 Ähnlichkeitssuche

Das System durchsucht die Vektordatenbank und findet die relevantesten Dokumentstücke. Dies sind die Abschnitte, die am besten zur Bedeutung Ihrer Frage passen.

04 (Optional) Re-Ranking

Ein tieferes KI-Modell überprüft die Top-Ergebnisse und sortiert sie nach ihrer tatsächlichen semantischen Qualität. Dies verbessert die Genauigkeit, insbesondere wenn Sie viele Dokumente haben.

05 Augmented Prompt & LLM-Antwort

Die am besten passenden Textstücke werden Ihrer Frage hinzugefügt. Das LLM verwendet diesen kombinierten Kontext, um eine präzise, fundierte Antwort zu generieren.

Warum uns wählen

Was uns auszeichnet

Andere Unternehmen

Allgemeine KI-Wrapper

Standard-Chatbots, die keinen Kontext haben. Sie stützen sich auf allgemeine Internetkenntnisse und können oft Ihre spezifische interne Terminologie nicht verstehen.

Allgemeine KI-Wrapper

Standard-Chatbots, die keinen Kontext haben. Sie stützen sich auf allgemeine Internetkenntnisse und können oft Ihre spezifische interne Terminologie nicht verstehen.

Unklare Datenverwaltung

Verlass auf externe Plattformen, bei denen die Datenverarbeitung undurchsichtig ist. Risiko von Serverstandorten außerhalb der EU oder der Nutzung von Daten für das Modelltraining.

Unklare Datenverwaltung

Verlass auf externe Plattformen, bei denen die Datenverarbeitung undurchsichtig ist. Risiko von Serverstandorten außerhalb der EU oder der Nutzung von Daten für das Modelltraining.

Versteckte Kosten & "Black Box"-Bereiche

"Angebot anfordern"-Buttons, vage Tagespreise und undefinierte Leistungen. Oft wissen Sie nicht, wofür Sie bezahlen oder wann es fertig sein wird.

Versteckte Kosten & "Black Box"-Bereiche

"Angebot anfordern"-Buttons, vage Tagespreise und undefinierte Leistungen. Oft wissen Sie nicht, wofür Sie bezahlen oder wann es fertig sein wird.

Begrenzte No-Code-Werkzeuge

Drag-and-drop Builder, die schnell an ihre Grenzen stoßen. Nicht in der Lage, komplexe APIs, große Datensätze oder benutzerdefinierte Logik skalierend zu verarbeiten.

Begrenzte No-Code-Werkzeuge

Drag-and-drop Builder, die schnell an ihre Grenzen stoßen. Nicht in der Lage, komplexe APIs, große Datensätze oder benutzerdefinierte Logik skalierend zu verarbeiten.

Hype-gesteuert oder langsam

Entweder die Implementierung von unstrukturierten „KI-Hype“-Funktionen ohne Validierung oder das Verharren in theoretischen Beratungsschleifen ohne Ergebnisse.

Hype-gesteuert oder langsam

Entweder die Implementierung von unstrukturierten „KI-Hype“-Funktionen ohne Validierung oder das Verharren in theoretischen Beratungsschleifen ohne Ergebnisse.

Mit uns

Spezialisierte RAG-Systeme

Architekturen, die speziell für Ihre Wissensdatenbank entwickelt wurden. Wir verwenden fortschrittliche Abrufmethoden, um sicherzustellen, dass die KI Ihre Dokumente wirklich versteht, bevor sie antwortet.

Spezialisierte RAG-Systeme

Architekturen, die speziell für Ihre Wissensdatenbank entwickelt wurden. Wir verwenden fortschrittliche Abrufmethoden, um sicherzustellen, dass die KI Ihre Dokumente wirklich versteht, bevor sie antwortet.

DSGVO-Nativ & in der EU gehostet

Datenschutz durch Design. Ihr System läuft auf deutschen Servern und wir setzen eine strikte „Null-Schulung“-Politik durch, sodass Ihre Daten Ihnen gehören.

DSGVO-Nativ & in der EU gehostet

Datenschutz durch Design. Ihr System läuft auf deutschen Servern und wir setzen eine strikte „Null-Schulung“-Politik durch, sodass Ihre Daten Ihnen gehören.

Klare Preisgestaltung & Offener Prozess

Feste Pakete & transparente Ergebnisse. Sie sehen genau, was Sie bekommen, wie viel es kostet und wo wir uns jederzeit im Entwicklungsfahrplan befinden.

Klare Preisgestaltung & Offener Prozess

Feste Pakete & transparente Ergebnisse. Sie sehen genau, was Sie bekommen, wie viel es kostet und wo wir uns jederzeit im Entwicklungsfahrplan befinden.

Tiefgehende technische Exzellenz

Auf Code gebaut. Wir entwickeln robuste Backend-Lösungen, die komplexe Workflows bewältigen können, die No-Code-Tools einfach nicht handhaben können.

Tiefgehende technische Exzellenz

Auf Code gebaut. Wir entwickeln robuste Backend-Lösungen, die komplexe Workflows bewältigen können, die No-Code-Tools einfach nicht handhaben können.

Wissenschaft x Start-up-Speed

Evidenzbasierte Methodik trifft auf den Lean Startup-Ansatz. Wir verwenden erprobte, forschungsgestützte Architekturen, setzen aber schnelle, iterative MVPs ein, um Ihnen schnell ROI zu verschaffen.

Wissenschaft x Start-up-Speed

Evidenzbasierte Methodik trifft auf den Lean Startup-Ansatz. Wir verwenden erprobte, forschungsgestützte Architekturen, setzen aber schnelle, iterative MVPs ein, um Ihnen schnell ROI zu verschaffen.

IT-Infrastruktur

DSGVO-konforme Infrastruktur

Das Starterpaket

01 Sichere Verbindung

Ihr Browser verbindet sich über einen hochsicheren Tunnel (TLS 1.3).

02 Isolierte Weiterleitung

Unser Sicherheits-Gateway identifiziert Sie und leitet den Datenverkehr direkt zu Ihrem persönlichen, isolierten Container. Diese strikte Trennung garantiert, dass Ihr System vollständig von anderen Clients abgeschottet ist.

03 App & Logik

Ihre dedizierte Anwendung bearbeitet die Anfrage ausschließlich in Ihrer privaten Umgebung. Sie fungiert als sicheres "Gehirn", das Ihren Datenzugriff und Ihre Suchlogik verwaltet.

04 Privater Vektorspeicher

Ihre Dokumente werden in einer spezialisierten Datenbank (Chroma) direkt auf dem Server in Deutschland gespeichert. Dieses "Datenarchiv" ist verschlüsselt und nur von Ihrer Anwendungsinstanz zugänglich.

05 Anonyme KI-Inferenz

Um die Antwort zu generieren, ssenden wir nur relevante, anonymisierte Textfragmente an das Unternehmens-AI-Modell. Der Anbieter ist vertraglich verpflichtet, diese Daten unmittelbar nach der Verarbeitung zu löschen (Zero-Retention-Policy).

01 Sichere Verbindung

Ihr Browser verbindet sich über einen hochsicheren Tunnel (TLS 1.3).

02 Isolierte Weiterleitung

Unser Sicherheits-Gateway identifiziert Sie und leitet den Datenverkehr direkt zu Ihrem persönlichen, isolierten Container. Diese strikte Trennung garantiert, dass Ihr System vollständig von anderen Clients abgeschottet ist.

03 App & Logik

Ihre dedizierte Anwendung bearbeitet die Anfrage ausschließlich in Ihrer privaten Umgebung. Sie fungiert als sicheres "Gehirn", das Ihren Datenzugriff und Ihre Suchlogik verwaltet.

04 Privater Vektorspeicher

Ihre Dokumente werden in einer spezialisierten Datenbank (Chroma) direkt auf dem Server in Deutschland gespeichert. Dieses "Datenarchiv" ist verschlüsselt und nur von Ihrer Anwendungsinstanz zugänglich.

05 Anonyme KI-Inferenz

Um die Antwort zu generieren, ssenden wir nur relevante, anonymisierte Textfragmente an das Unternehmens-AI-Modell. Der Anbieter ist vertraglich verpflichtet, diese Daten unmittelbar nach der Verarbeitung zu löschen (Zero-Retention-Policy).

Das Profi-Paket

01 Unternehmens-Single-Sign-On

Mitarbeiter greifen mit ihren vorhandenen Unternehmensanmeldedaten (z. B. Microsoft 365 oder Google Workspace) auf das System zu. Dies gewährleistet eine nahtlose Integration in Ihre IT-Sicherheitsrichtlinien, ohne dass neue Passwörter erforderlich sind.

02 Dedizierter Privater Server

Ihre gesamte Infrastruktur läuft auf einem dedizierten Virtual Private Server (VPS), der der exklusiv für Ihr Unternehmen reserviert ist. Im Gegensatz zu Shared Hosting garantiert dies maximale Performance und eine vollständige physische Isolation Ihrer Daten.

03 Fortgeschrittene Logik & Gedächtnis

Ein leistungsstarkes Backend (FastAPI) steuert komplexe Workflows und verbindet sich mit Ihren internen Werkzeugen. Eine integrierte Datenbank (PostgreSQL) sichert Ihren Chat-Verlauf und macht frühere Unterhaltungen jederzeit abrufbar.

04 Hochleistungs-Cloud

Um große Dokumentenarchive zu verwalten, nutzen wir eine spezialisierte Unternehmens-Vektordatenbank (Pinecone EU). Diese Hybrid-Cloud-Konfiguration ermöglicht es dem System, in Millisekunden mit höchster Genauigkeit Tausende von Dokumenten zu durchsuchen.

05 Intelligenter Datenschutzfilter

Bevor ein Text Ihren privaten Server verlässt, erkennt und maskiert unser aktiver Privatsphärenschild automatisch sensible persönliche Daten (wie Namen oder IBANs). Der KI-Anbieter erhält nur anonymisierten Kontext, um die Antwort zu generieren.

01 Unternehmens-Single-Sign-On

Mitarbeiter greifen mit ihren vorhandenen Unternehmensanmeldedaten (z. B. Microsoft 365 oder Google Workspace) auf das System zu. Dies gewährleistet eine nahtlose Integration in Ihre IT-Sicherheitsrichtlinien, ohne dass neue Passwörter erforderlich sind.

02 Dedizierter Privater Server

Ihre gesamte Infrastruktur läuft auf einem dedizierten Virtual Private Server (VPS), der der exklusiv für Ihr Unternehmen reserviert ist. Im Gegensatz zu Shared Hosting garantiert dies maximale Performance und eine vollständige physische Isolation Ihrer Daten.

03 Fortgeschrittene Logik & Gedächtnis

Ein leistungsstarkes Backend (FastAPI) steuert komplexe Workflows und verbindet sich mit Ihren internen Werkzeugen. Eine integrierte Datenbank (PostgreSQL) sichert Ihren Chat-Verlauf und macht frühere Unterhaltungen jederzeit abrufbar.

04 Hochleistungs-Cloud

Um große Dokumentenarchive zu verwalten, nutzen wir eine spezialisierte Unternehmens-Vektordatenbank (Pinecone EU). Diese Hybrid-Cloud-Konfiguration ermöglicht es dem System, in Millisekunden mit höchster Genauigkeit Tausende von Dokumenten zu durchsuchen.

05 Intelligenter Datenschutzfilter

Bevor ein Text Ihren privaten Server verlässt, erkennt und maskiert unser aktiver Privatsphärenschild automatisch sensible persönliche Daten (wie Namen oder IBANs). Der KI-Anbieter erhält nur anonymisierten Kontext, um die Antwort zu generieren.

01 Unternehmens-SSO

Mitarbeiter greifen mit ihren vorhandenen Unternehmensanmeldedaten (z. B. Microsoft 365 oder Google Workspace) auf das System zu. Dies gewährleistet eine nahtlose Integration in Ihre IT-Sicherheitsrichtlinien, ohne dass neue Passwörter erforderlich sind.

02 Privater Server

Ihre gesamte Infrastruktur läuft auf einem dedizierten Virtual Private Server (VPS), der der exklusiv für Ihr Unternehmen reserviert ist. Im Gegensatz zu Shared Hosting garantiert dies maximale Performance und eine vollständige physische Isolation Ihrer Daten.

03 Logik & Langzeitgedächtnis

Ein leistungsstarkes Backend (FastAPI) steuert komplexe Workflows und verbindet sich mit Ihren internen Werkzeugen. Eine integrierte Datenbank (PostgreSQL) sichert Ihren Chat-Verlauf und macht frühere Unterhaltungen jederzeit abrufbar.

04 Hochleistungs-Cloud

Um große Dokumentenarchive zu verwalten, nutzen wir eine spezialisierte Unternehmens-Vektordatenbank (Pinecone EU). Diese Hybrid-Cloud-Konfiguration ermöglicht es dem System, in Millisekunden mit höchster Genauigkeit Tausende von Dokumenten zu durchsuchen.

05 Intelligenter Datenschutzfilter

Bevor ein Text Ihren privaten Server verlässt, erkennt und maskiert unser aktiver Privatsphärenschild automatisch sensible persönliche Daten (wie Namen oder IBANs). Der KI-Anbieter erhält nur anonymisierten Kontext, um die Antwort zu generieren.

Vorteile

Messbarer Geschäftswert

Unbegrenzte Anfragen

Verschwenden Sie keine Zeit mehr mit der Ordnersuche. Ihr Team erhält sekundenschnelle, präzise Antworten aus PDFs, Verträgen und Wikis – und hat so den Kopf frei für das Wesentliche.

Unbegrenzte Anfragen

Verschwenden Sie keine Zeit mehr mit der Ordnersuche. Ihr Team erhält sekundenschnelle, präzise Antworten aus PDFs, Verträgen und Wikis – und hat so den Kopf frei für das Wesentliche.

Unbegrenzte Anfragen

Verschwenden Sie keine Zeit mehr mit der Ordnersuche. Ihr Team erhält sekundenschnelle, präzise Antworten aus PDFs, Verträgen und Wikis – und hat so den Kopf frei für das Wesentliche.

DSGVO-konform

Bereitstellung von KI ohne rechtliche Bedenken. Wir garantieren deutsche Datenresidenz & eine "No-Training"-Garantie, sodass Ihre Geschäftsgeheimnisse niemals zu Trainingsdaten werden.

DSGVO-konform

Bereitstellung von KI ohne rechtliche Bedenken. Wir garantieren deutsche Datenresidenz & eine "No-Training"-Garantie, sodass Ihre Geschäftsgeheimnisse niemals zu Trainingsdaten werden.

DSGVO-konform

Bereitstellung von KI ohne rechtliche Bedenken. Wir garantieren deutsche Datenresidenz & eine "No-Training"-Garantie, sodass Ihre Geschäftsgeheimnisse niemals zu Trainingsdaten werden.

Eine Quelle der Wahrheit

Informationssilos abbauen. Ob in Google Drive, SharePoint oder Notion. Der Assistent bündelt Ihr verteiltes Wissen an einem zentralen Ort.

Eine Quelle der Wahrheit

Informationssilos abbauen. Ob in Google Drive, SharePoint oder Notion. Der Assistent bündelt Ihr verteiltes Wissen an einem zentralen Ort.

Eine Quelle der Wahrheit

Informationssilos abbauen. Ob in Google Drive, SharePoint oder Notion. Der Assistent bündelt Ihr verteiltes Wissen an einem zentralen Ort.

Nahtlose Integration

Keine komplexe neue Software zu lernen. Wir integrieren den Assistenten in die Tools, die Ihr Team bereits täglich verwendet (Intranet, Slack, Teams).

Nahtlose Integration

Keine komplexe neue Software zu lernen. Wir integrieren den Assistenten in die Tools, die Ihr Team bereits täglich verwendet (Intranet, Slack, Teams).

Nahtlose Integration

Keine komplexe neue Software zu lernen. Wir integrieren den Assistenten in die Tools, die Ihr Team bereits täglich verwendet (Intranet, Slack, Teams).

Volle Transparenz & Kontrolle

Wertvolle Einblicke, volle Anonymität. Unser Dashboard analysiert Suchtrends und deckt Wissenslücken auf, ohne das Verhalten einzelner Mitarbeiter zu überwachen.

Volle Transparenz & Kontrolle

Wertvolle Einblicke, volle Anonymität. Unser Dashboard analysiert Suchtrends und deckt Wissenslücken auf, ohne das Verhalten einzelner Mitarbeiter zu überwachen.

Volle Transparenz & Kontrolle

Wertvolle Einblicke, volle Anonymität. Unser Dashboard analysiert Suchtrends und deckt Wissenslücken auf, ohne das Verhalten einzelner Mitarbeiter zu überwachen.

Immer auf dem neuesten Stand

Unsere modulare Architektur erlaubt den Wechsel auf die nächste KI-Generation. So bleibt Ihre Infrastruktur zukunftssicher & Ihr Wettbewerbsvorteil dauerhaft erhalten.

Immer auf dem neuesten Stand

Unsere modulare Architektur erlaubt den Wechsel auf die nächste KI-Generation. So bleibt Ihre Infrastruktur zukunftssicher & Ihr Wettbewerbsvorteil dauerhaft erhalten.

Immer auf dem neuesten Stand

Unsere modulare Architektur erlaubt den Wechsel auf die nächste KI-Generation. So bleibt Ihre Infrastruktur zukunftssicher & Ihr Wettbewerbsvorteil dauerhaft erhalten.

Stand der Wissenschaft

Wissenschaftlich fundierte KI

40% Höhere Qualität & 25% Schneller

Ein rigoroses Feldexperiment der Harvard Business School und BCG zeigte, dass Berater, die GPT-4 nutzten, komplexe Aufgaben 25,1 % schneller abschlossen und deren Ergebnisse als 40 % hochwertiger bewertet wurden, verglichen mit der Kontrollgruppe.

Quelle:Harvard Business School & BCG: "Navigating the Jagged Technological Frontier".

Ein rigoroses Feldexperiment von der Harvard Business School und BCG zeigte, dass Berater, die GPT-4 nutzten, komplexe Aufgaben 25,1 % schneller erledigten, während die Ergebnisse als 40 % höherwertig bewertet wurden im Vergleich zur Kontrollgruppe.

Quelle:Harvard Business School & BCG: "Navigating the Jagged Technological Frontier".

96% Halluzinations-
Reduzierung

96% Halluzinationen
Reduktion

Im Gegensatz zu standardmäßigen LLMs basieren RAG-Architekturen Antworten auf Ihren tatsächlichen Unternehmensdaten. Stanford-Forschung zeigt, dass RAG-Pipelines die Halluzinationsraten um bis zu 96% reduzieren können, was Zuverlässigkeit auf Enterprise-Niveau garantiert.

Quelle: Stanford University & DeepMind Research, 2024

30–45% Kostenreduzierung

30–45% Kostenreduzierung

McKinsey-Analysen zeigen, dass der Einsatz von generativer KI im Kundenservice die Betriebskosten durch automatisierte Triage, schnellere Problemlösung und Mitarbeiterunterstützung um bis zu 45% senken kann.

Quelle: McKinsey & Company: "Das wirtschaftliche Potenzial der generativen KI"

McKinsey-Analysen zeigen, dass der Einsatz generativer KI in Kundenservice-Operationen die Betriebskosten um bis zu 45 % senken kann, durch automatisierte Einteilung, schnellere Lösung und Unterstützung der Mitarbeiter.

Quelle: McKinsey & Company: "Das wirtschaftliche Potenzial der generativen KI"

RAG schlägt Fine-Tuning

RAG schlägt Fine-Tuning

Microsoft Research bestätigt, dass RAG-Architekturen bei Aufgaben zur Wissensabfrage durchweg besser abschneiden als feinabgestimmte Modelle, sowohl in Bezug auf die Genauigkeit als auch die Agilität. Sie ermöglichen sofortige Datenaktualisierungen ohne kostspieliges Retraining.

Quelle: Microsoft Research & NVIDIA Benchmarks

Microsoft Research bestätigt, dass bei Aufgaben der Wissensabfrage RAG-Architekturen durchweg feinabgestimmte Modelle in Bezug auf Genauigkeit und Beweglichkeit übertreffen und sofortige Datenaktualisierungen ohne teures Retraining ermöglichen.

Quelle: Microsoft Research & NVIDIA Benchmarks

Preise

Transparente Lösungen

Starter – Private GPT Assistant

Der perfekte Einstieg für Ihren ersten, eigenen Custom GPT.

850 €

/ Projekt € (+ € 49 / Monat Hosting & Wartung; monatlich kündbar)

Datenumfang: Bis zu 50 Dokumente (PDF, DOCX, TXT, max. 100 MB insgesamt). Einmaliger Import.

Datenumfang: Bis zu 50 Dokumente (PDF, DOCX, TXT, max. 100 MB insgesamt). Einmaliger Import.

Datenumfang: Bis zu 50 Dokumente (PDF, DOCX, TXT, max. 100 MB insgesamt). Einmaliger Import.

Datenschutz: Strikt isolierte Container-Umgebung. Gehostet in Deutschland (Hetzner Cloud). Vollständig DSGVO-konform durch Zero-Retention-Policy (Keine Datenspeicherung).

Engine & Logik: Standard RAG-Pipeline. Nutzt ChromaDB (Privat/Lokal) & OpenAI-Einbettungen für schnelle Abfragen.

Engine & Logik: Standard RAG-Pipeline. Nutzt ChromaDB (Privat/Lokal) & OpenAI-Einbettungen für schnelle Abfragen.

Engine & Logik: Standard RAG-Pipeline. Nutzt ChromaDB (Privat/Lokal) & OpenAI-Einbettungen für schnelle Abfragen.

Interface: Standard-Chat-Benutzeroberfläche. Saubere, funktionale Web-Interface (auf Streamlit basierend) über einen sicheren HTTPS-Link.

Interface: Standard-Chat-Benutzeroberfläche. Saubere, funktionale Web-Interface (auf Streamlit basierend) über einen sicheren HTTPS-Link.

Interface: Standard-Chat-Benutzeroberfläche. Saubere, funktionale Web-Interface (auf Streamlit basierend) über einen sicheren HTTPS-Link.

Integration: Eigenständige Lösung. Kein API-Zugriff oder externe Werkzeugverbindung.

Integration: Eigenständige Lösung. Kein API-Zugriff oder externe Werkzeugverbindung.

Integration: Eigenständige Lösung. Kein API-Zugriff oder externe Werkzeugverbindung.

Bereitstellung: 5–7 Tage. Schnelle Bereitstellung für zügige Tests.

Bereitstellung: 5–7 Tage. Schnelle Bereitstellung für zügige Tests.

Bereitstellung: 5–7 Tage. Schnelle Bereitstellung für zügige Tests.

Support: 2 Wochen Hypercare. E-Mail-Support inbegriffen.

Support: 2 Wochen Hypercare. E-Mail-Support inbegriffen.

Support: 2 Wochen Hypercare. E-Mail-Support inbegriffen.

Professional – Custom GPT Integration

Die Komplettlösung für den produktiven Einsatz, mit Live-Datenanbindung und persistentem Gedächtnis.

€ 1.950

/Projekt (+ € 99 / Monat Hosting & Wartung; monatlich kündbar)

Datenumfang: Multi-Source-Indexierung. Verbindet sich mit Google Drive, Notion oder SharePoint. Bis zu 1 GB Daten.

Datenumfang: Multi-Source-Indexierung. Verbindet sich mit Google Drive, Notion oder SharePoint. Bis zu 1 GB Daten.

Datenumfang: Multi-Source-Indexierung. Verbindet sich mit Google Drive, Notion oder SharePoint. Bis zu 1 GB Daten.

Erweiterte Privatsphäre: Dedizierter privater Server. Isolierte Docker-Umgebung und Datenbank. Physische Datentrennung, Zero-Retention-Policy & Intelligente PII-Anonymisierung.

Erweiterte Privatsphäre: Dedizierter privater Server. Isolierte Docker-Umgebung und Datenbank. Physische Datentrennung, Zero-Retention-Policy & Intelligente PII-Anonymisierung.

Erweiterte Privatsphäre: Dedizierter privater Server. Isolierte Docker-Umgebung und Datenbank. Physische Datentrennung, Zero-Retention-Policy & Intelligente PII-Anonymisierung.

Engine & Logik: Advanced RAG-Architektur. Verwendet Pinecone, Reranking und PostgreSQL für Chat-Verlauf.

Engine & Logik: Advanced RAG-Architektur. Verwendet Pinecone, Reranking und PostgreSQL für Chat-Verlauf.

Engine & Logik: Advanced RAG-Architektur. Verwendet Pinecone, Reranking und PostgreSQL für Chat-Verlauf.

Benutzeroberfläche: Custom Branding UI. Ihr Logo, Farben & SSO-Login (Microsoft/Google).

Benutzeroberfläche: Custom Branding UI. Ihr Logo, Farben & SSO-Login (Microsoft/Google).

Benutzeroberfläche: Custom Branding UI. Ihr Logo, Farben & SSO-Login (Microsoft/Google).

Integration: Vollständiger API-Zugriff. Verbinden Sie den Bot über die REST-API mit Slack, Teams oder Ihren internen Tools.

Integration: Vollständiger API-Zugriff. Verbinden Sie den Bot über die REST-API mit Slack, Teams oder Ihren internen Tools.

Integration: Vollständiger API-Zugriff. Verbinden Sie den Bot über die REST-API mit Slack, Teams oder Ihren internen Tools.

Lieferung: 10–14 Tage. Einschließlich Einrichtung, Testen und Anbindung der Datenquellen.

Lieferung: 10–14 Tage. Einschließlich Einrichtung, Testen und Anbindung der Datenquellen.

Lieferung: 10–14 Tage. Einschließlich Einrichtung, Testen und Anbindung der Datenquellen.

Support: 1 Monat vorrangiger Support. Einschließlich eines Prompt-Engineering Workshops

Support: 1 Monat vorrangiger Support. Einschließlich eines Prompt-Engineering Workshops

Support: 1 Monat vorrangiger Support. Einschließlich eines Prompt-Engineering Workshops

Managed AI Operations

Halten Sie Ihr System sicher, präzise und wachsend mit Ihrem Unternehmen.

€ 450

/Monat (Monatlich kündbar)

Infrastruktur- & Security-Updates: Beinhaltet Server-Hosting, SSL-Erneuerungen und Sofortiges Patching von Sicherheitslücken (Docker/Python).

Infrastruktur- & Security-Updates: Beinhaltet Server-Hosting, SSL-Erneuerungen und Sofortiges Patching von Sicherheitslücken (Docker/Python).

Infrastruktur- & Security-Updates: Beinhaltet Server-Hosting, SSL-Erneuerungen und Sofortiges Patching von Sicherheitslücken (Docker/Python).

Monatlicher Knowledge-Sync. Senden Sie uns einmal im Monat Ihre neuen Dateien (PDFs, Dokumente) – wir übernehmen Chunking, Bereinigung und Neuindizierung.

Monatlicher Knowledge-Sync. Senden Sie uns einmal im Monat Ihre neuen Dateien (PDFs, Dokumente) – wir übernehmen Chunking, Bereinigung und Neuindizierung.

Monatlicher Knowledge-Sync. Senden Sie uns einmal im Monat Ihre neuen Dateien (PDFs, Dokumente) – wir übernehmen Chunking, Bereinigung und Neuindizierung.

Prompt & Präzision: Aktives Monitoring der Antwortqualität.

Prompt & Präzision: Aktives Monitoring der Antwortqualität.

Prompt & Präzision: Aktives Monitoring der Antwortqualität.

Priority Engineer Access: Zugang über Slack/E-Mail. Antwortzeit < 24h.

Priority Engineer Access: Zugang über Slack/E-Mail. Antwortzeit < 24h.

Priority Engineer Access: Zugang über Slack/E-Mail. Antwortzeit < 24h.

Nutzungsberichte Monatliche Aufschlüsselung: Wie viele Anfragen? Was fragen die Mitarbeiter? (Anonymisierte Einblicke).

Nutzungsberichte Monatliche Aufschlüsselung: Wie viele Anfragen? Was fragen die Mitarbeiter? (Anonymisierte Einblicke).

Nutzungsberichte Monatliche Aufschlüsselung: Wie viele Anfragen? Was fragen die Mitarbeiter? (Anonymisierte Einblicke).

Der Prozess

Ihr Erfolgspfad

01

01 — Anfrage & Erstkontakt

Anfrage & Erstkontakt über das Formular auf der Website oder per E-Mail. Sie erhalten eine schnelle Bestätigung und wir antworten garantiert innerhalb von 24 Stunden.

01 — Anfrage & Erstkontakt

Anfrage & Erstkontakt über das Formular auf der Website oder per E-Mail. Sie erhalten eine schnelle Bestätigung und wir antworten garantiert innerhalb von 24 Stunden.

02 — Planung eines Meetings

Wir vereinbaren ein kurzes Online- oder persönliches Treffen, um Ihre Ziele, Abläufe und Erwartungen zu besprechen.

02 — Planung eines Meetings

Wir vereinbaren ein kurzes Online- oder persönliches Treffen, um Ihre Ziele, Abläufe und Erwartungen zu besprechen.

02

03

03 — Beratung & Serviceübersicht

Während des Gesprächs erhalten Sie einen Überblick über mögliche Anwendungsfälle des GPT-Assistenten, transparente Preisgestaltung und einen einen individuellen Implementierungsplan, passend zu Ihrer Datenstruktur.

03 — Beratung & Serviceübersicht

Während des Gesprächs erhalten Sie einen Überblick über mögliche Anwendungsfälle des GPT-Assistenten, transparente Preisgestaltung und einen einen individuellen Implementierungsplan, passend zu Ihrer Datenstruktur.

04 — Projektstart

Nach der Genehmigung beginnen wir mit der Entwicklung Ihres maßgeschneiderten GPT-Assistenten. Sie erhalten regelmäßige Fortschrittsberichte per E-Mail oder Slack, um während der Einrichtung und Tests vollständige Transparenz zu gewährleisten.

04 — Projektstart

Nach der Genehmigung beginnen wir mit der Entwicklung Ihres maßgeschneiderten GPT-Assistenten. Sie erhalten regelmäßige Fortschrittsberichte per E-Mail oder Slack, um während der Einrichtung und Tests vollständige Transparenz zu gewährleisten.

04

05

05 — Projektabschluss & Nachbereitung

Nach dem Go-Live erhalten Sie eine Dokumentation und zwei Wochen kostenlosen Hypercare-Support für Anpassungen.

05 — Projektabschluss & Nachbereitung

Nach dem Go-Live erhalten Sie eine Dokumentation und zwei Wochen kostenlosen Hypercare-Support für Anpassungen.

FAQ

FAQ

Wie gehen Sie mit Datenschutz und DSGVO-Konformität um?

Wir gewährleisten Sicherheit durch ein abgestuftes Datenschutzmodell: Standardmäßig (Starter) garantieren wir die DSGVO-Konformität mittels verschlüsseltem Hosting in Deutschland und strikten Null-Aufbewahrungsvereinbarungen mit Enterprise-API-Anbietern. Die professionelle Stufe fügt einen aktiven Datenschutzfilter (PII Masking) hinzu, der persönliche Daten automatisch anonymisiert, bevor sie den Server verlassen. Bei strengen Souveränitätsanforderungen können wir auch vollständig isolierte lokale LLMs einsetzen, die ausschließlich auf Ihrer eigenen Infrastruktur laufen.

Wo werden meine Unternehmensdaten gespeichert?

Gibt es laufende Kosten oder erforderliche Lizenzen?

Wie unterscheidet sich dies vom direkten Einsatz von ChatGPT?

Können mehrere Mitarbeiter denselben Assistenten verwenden?

Können wir sicher Kunden- oder interne Daten in Prompts einbeziehen?

Bekommen wir immer die neueste GPT-Version?

Wie werden Datenaktualisierungen gehandhabt?

Wie greife ich auf meinen privaten Assistenten zu?

Was ist der Unterschied zwischen der "Standard-App" und der "Advanced App"?

Warum Pinecone (Pro) anstelle von Chroma (Starter) verwenden?

Wie funktioniert der Login?

Dedizierter Server vs. Container – was ist der Vorteil?

Erinnert sich der Assistent an frühere Gespräche?

Wie gehen Sie mit Datenschutz und DSGVO-Konformität um?

Wir gewährleisten Sicherheit durch ein abgestuftes Datenschutzmodell: Standardmäßig (Starter) garantieren wir die DSGVO-Konformität mittels verschlüsseltem Hosting in Deutschland und strikten Null-Aufbewahrungsvereinbarungen mit Enterprise-API-Anbietern. Die professionelle Stufe fügt einen aktiven Datenschutzfilter (PII Masking) hinzu, der persönliche Daten automatisch anonymisiert, bevor sie den Server verlassen. Bei strengen Souveränitätsanforderungen können wir auch vollständig isolierte lokale LLMs einsetzen, die ausschließlich auf Ihrer eigenen Infrastruktur laufen.

Wo werden meine Unternehmensdaten gespeichert?

Gibt es laufende Kosten oder erforderliche Lizenzen?

Wie unterscheidet sich dies vom direkten Einsatz von ChatGPT?

Können mehrere Mitarbeiter denselben Assistenten verwenden?

Können wir sicher Kunden- oder interne Daten in Prompts einbeziehen?

Bekommen wir immer die neueste GPT-Version?

Wie werden Datenaktualisierungen gehandhabt?

Wie greife ich auf meinen privaten Assistenten zu?

Was ist der Unterschied zwischen der "Standard-App" und der "Advanced App"?

Warum Pinecone (Pro) anstelle von Chroma (Starter) verwenden?

Wie funktioniert der Login?

Dedizierter Server vs. Container – was ist der Vorteil?

Erinnert sich der Assistent an frühere Gespräche?

Kontakt

Kontaktieren Sie uns