KI im CRM spart echte Zeit: Tickets zusammenfassen, Leads bewerten, eine Customer-360-Analyse auf Knopfdruck. Zwei Dinge halten kleine Teams aber oft zurück. Erstens kosten OpenAI oder Claude pro Token — und das summiert sich. Zweitens stellt sich die Frage, wohin die Kundendaten gehen. Hier vorweg die Entwarnung: Die AI Suite anonymisiert personenbezogene Daten, bevor sie das System verlassen — der Datenschutz bleibt also gewahrt, unabhängig vom Anbieter. Mehr dazu unten.
Die gute Nachricht: KI im CRM geht auch kostenlos. Mit OpenRouter und einem freien NVIDIA-Nemotron-Modell läuft die AI Suite ohne Kosten pro Token. Und wer die volle Kontrolle über seine Daten will, kann Nemotron sogar auf dem eigenen Server betreiben. In diesem Beitrag zeigen wir die Einrichtung — und die zwei Stolpersteine, die wir dabei gefunden und gelöst haben.
Schnellstart — für einen schnellen Start und gute Ergebnisse
Anbieter: Custom (OpenRouter) · Modell: nvidia/nemotron-3-nano-30b-a3b:free · Wichtig: „Disable reasoning (for JSON tasks)“ aktivieren.
Für tiefere Analysen (Customer 360, Lead Summary): nvidia/nemotron-3-super-120b-a12b:free — ebenfalls mit „Disable reasoning“.
Das sind die drei Einstellungen, die aus „kostenlos“ auch „funktioniert wirklich“ machen. Warum genau diese — das erklärt der Rest dieses Beitrags.
Warum überhaupt ein kostenloses Modell?
- Keine laufenden Kosten. Free-Modelle rechnen nicht pro Token ab. Du nutzt alle Funktionen, ohne ein Verbrauchsbudget im Blick zu behalten.
- Risikofrei testen. Bevor Du Dich für einen bezahlten Anbieter entscheidest, probierst Du in Ruhe aus, ob die KI Deinen Anforderungen genügt.
Warum Nemotron — und nicht irgendein Free-Modell
Der OpenRouter-Katalog kostenloser Modelle ist groß und ändert sich ständig. Wir empfehlen NVIDIA Nemotron, weil es mehreres zusammenbringt:
- Stabil gehostet — es verschwindet nicht über Nacht wie viele Preview-Modelle.
- Mehrsprachig — die Ausgabe folgt Deiner Profilsprache, also auch Deutsch, Italienisch, Französisch, Spanisch oder Arabisch.
- Saubere, strukturierte Ergebnisse — gerade bei JSON-basierten Funktionen wie Lead-Scoring und Sentiment.
- Offen lizenziert — und das ist der entscheidende Punkt beim Datenschutz (gleich mehr dazu). Du kannst Nemotron selbst hosten. Bei OpenAI oder Claude geht das prinzipbedingt nicht.
Wie sieht es mit dem Datenschutz aus?
Wichtig vorweg: Dein Datenschutz bleibt gewahrt — durch die Anonymisierung der AI Suite. Bevor ein Prompt das System verlässt, entfernt oder pseudonymisiert der Privacy Shield personenbezogene Daten wie Namen, E-Mail-Adressen und Telefonnummern. An den KI-Anbieter gehen also keine Klardaten — egal ob OpenAI, Claude oder Nemotron.
Trotzdem eine ehrliche Einordnung, denn „NVIDIA“ heißt nicht automatisch „EU“:
- Über OpenRouter: Die Inferenz läuft auf NVIDIA-/Drittanbieter-Infrastruktur, in der Regel nicht in der EU. Geschützt bist Du durch die Anonymisierung (siehe oben) — die personenbezogenen Daten bleiben bei Dir.
- Selbst gehostet: Weil Nemotron offen lizenziert ist, kannst Du es per Ollama auf Deinem eigenen Server (zum Beispiel in der EU) betreiben. Dann verlassen die Daten Dein System gar nicht — volle Datensouveränität.
Kurz: kostenlos bekommst Du sofort. Datensouveränität kommt nicht „gratis durch Nemotron“ — sie kommt durch die Anonymisierung der AI Suite und, wenn Du sie brauchst, durch Self-Hosting.
Was wir dabei gelernt haben
Zwei Dinge waren nicht offensichtlich:
1. „openrouter/free“ ist eine Falle
Es klingt naheliegend, einfach den Auto-Router openrouter/free einzutragen. In der Praxis ist das ein Platzhalter, der je nach Anfrage ein anderes Modell wählt — mit unvorhersehbarem Ergebnis. Bei uns kam statt einer Analyse teils nur eine kurze Floskel zurück. Die Lektion: ein echtes, festes Modell wählen statt eines Routers.
2. Reasoning-Modelle „verdenken“ ihr Token-Budget
Moderne Modelle wie Nemotron „denken“ intern vor, bevor sie antworten. Bei Aufgaben mit knappem Budget — Lead-Scoring und Sentiment laufen mit sehr wenigen Tokens — ist das Budget dann aufgebraucht, bevor eine Antwort kommt. Das Ergebnis: nichts Brauchbares, ohne sichtbaren Fehler.
Unsere Lösung steckt seit AI Suite 3.0.3 fest im Modul: der Schalter „Disable reasoning (for JSON tasks)“. Ist er aktiv, antwortet das Modell direkt — schnell und zuverlässig, auch innerhalb enger Grenzen. Genau dieser eine Haken macht aus „theoretisch kostenlos“ ein „funktioniert wirklich“.
So richtest Du es ein
- Lege ein kostenloses OpenRouter-Konto an und erstelle einen API-Schlüssel.
- Geh zu Einrichtung → AI Suite → Anbieter und wähl Custom (OpenRouter). Trag die URL
https://openrouter.ai/api/v1und Deinen Schlüssel ein. - Setz das Modell auf
nvidia/nemotron-3-nano-30b-a3b:free. - Aktivier „Disable reasoning (for JSON tasks)“. Fertig.
Tipp: Für tiefere Analysen wie Customer 360 oder Lead Summary lohnt sich die größere Variante nvidia/nemotron-3-super-120b-a12b:free — ebenfalls mit aktiviertem „Disable reasoning“.
Ehrliche Einordnung
Die ersten Ergebnisse sind richtig gut: saubere, strukturierte Analysen in der jeweiligen Sprache. Drei Punkte halten wir transparent:
- Wir führen noch Langzeittests durch, bevor wir Nemotron als festen Standard empfehlen.
- Für die Revenue-Forecast-Funktion, bei der numerische Präzision zählt, kann ein bezahltes Modell die bessere Wahl sein.
- Free-Tiers haben Rate-Limits — für ruhige Einzelnutzung kein Problem, bei hohem Volumen aber spürbar.
Unterm Strich: Mit Nemotron und dem „Disable reasoning“-Schalter bekommst Du eine leistungsfähige KI für Perfex CRM — ohne Kosten pro Token, und mit einem klaren Weg zu voller Datensouveränität, wenn Du ihn brauchst.
Probier es direkt in unserer Live-Demo aus oder sieh Dir die AI Suite an.