ZeptixZeptix
DemoDEVAnmelden
Aufbau7 Min.Aktualisiert: 2026-05-16

Reranker erklärt — wann sich der zweite Sortierer in deinem Bot lohnt

Was ein Reranker macht, wann er sich lohnt, was er kostet und wie du ihn im Zeptix-Visualizer aktivierst — verständlich erklärt.

Reranker erklärt — wann sich der zweite Sortierer lohnt

Ein Reranker ist die zweite Sortier-Stufe in deinem Zeptix-Bot. Die erste Stufe sucht schnell viele potenzielle Treffer. Der Reranker schaut sich diese Treffer noch einmal genau an und sortiert sie nach echter Relevanz neu. Das Ergebnis: präzisere Antworten, ohne dass du auf Recall verzichten musst. Aber er kostet Latenz und manchmal Geld.

TL;DR

  • Reranker = zweite Sortier-Runde nach der Suche.
  • BGE Base ist kostenlos, läuft lokal, gut für Pro-Plan.
  • Cohere v3 ist präziser, kostet API-Gebühren, ab Pro-Plan.
  • Aktivieren lohnt sich bei größeren Wissensbasen oder kniffligen Fragen.
  • Latenz steigt um 150 bis 300 ms pro Antwort.

Was macht ein Reranker eigentlich?

Stell dir vor, du fragst deinen Bot: „Welcher Helm passt für lange Touren?" Der Suche-Knoten findet 16 Snippets, die irgendwie mit Helm und Tour zu tun haben. Das könnten sein:

  • Ein Snippet über Helm-Materialien.
  • Ein Snippet über Tourenplanung.
  • Ein Snippet über Kopfformen für Sporthelme.
  • Ein Snippet über Helm-Komfort auf langen Strecken.

Die Reihenfolge dieser Treffer entscheidet, was dein Sprachmodell am Ende formuliert. Der Reranker liest jeden Treffer zusammen mit der Frage und gibt jedem eine echte Relevanz-Note. Plötzlich steht „Helm-Komfort auf langen Strecken" oben — und die Antwort wird viel besser.

Warum die erste Sortierung allein nicht reicht

Die schnelle Vor-Suche basiert auf Vektor-Ähnlichkeit. Sie ist gut darin, thematisch passende Inhalte zu finden, aber nicht gut darin, wer wirklich die beste Antwort ist. Beispiel: Auf die Frage „Was kostet Plan Pro?" findet die Vor-Suche zehn Snippets, in denen es um Pricing geht. Der Reranker erkennt, dass nur drei davon konkret Plan Pro betreffen, und sortiert diese nach oben.

Engines im Vergleich

EnginePlanLatenzKostenQualität
AusAlle0 ms0 €Basis
BGE BasePro++150 ms0 € (lokal)Gut
Cohere v3Pro++250 msAPI-GebührenSehr gut

BGE Base läuft auf Zeptix-Servern und kostet dich nichts extra. Cohere v3 ist die genauere Option, geht aber an einen externen Anbieter. Beide sind nur ab dem Pro-Plan verfügbar — auf Free und Starter ist nur „Aus" zulässig. Der Visualizer zeigt unzulässige Optionen ausgegraut.

Wann lohnt sich der Reranker?

Reranker an, wenn:

  • Deine Wissensbasis hat über 100 Dokumente oder mehr als 500 Snippets.
  • Endnutzer fragen oft mit Synonymen oder umgangssprachlich.
  • Antworten verwenden manchmal das richtige Thema, aber den falschen Aspekt.
  • Du willst Top-K hochziehen (12 oder 16), ohne Präzision zu verlieren.

Reranker aus reicht, wenn:

  • Deine Wissensbasis ist klein (unter 50 Dokumente).
  • Endnutzer fragen sehr ähnlich wie deine Inhalte formuliert sind.
  • Latenz ist kritisch (z.B. Voice-Bots mit Echtzeit-Anspruch).
  • Dein Plan unterstützt es nicht (Free, Starter, PAYG).

Wie du den Reranker aktivierst

  1. Öffne https://zeptix.dev/visualizer und wähle deinen Bot.
  2. Im Canvas siehst du den Knoten „Auswahl schärfen" — wenn er grau ist, ist der Reranker aus.
  3. Klicke den Knoten an, der Inspector öffnet rechts.
  4. Wähle bei Reranker-Engine entweder „BGE Base (lokal)" oder „Cohere v3".
  5. Lass den Rerank-Pool auf 50 — das passt für die meisten Bots.
  6. Speichern, dann Live-Vorschau mit drei Test-Fragen.

Der Knoten „Auswahl schärfen" wird dabei sichtbar grün — das ist die visuelle Bestätigung, dass die Stage aktiv ist. Auch der Status-Bar unten zeigt eine erhöhte geschätzte Latenz (von 0.8 s auf etwa 1.0 bis 1.1 s).

Reranker-Pool — was bedeutet die Zahl?

Der Rerank-Pool legt fest, wie viele Initial-Treffer der Reranker neu sortiert. Höher ist nicht automatisch besser:

PoolWirkung
20Nur die schon guten Treffer werden umsortiert. Schnell.
50Standard. Reranker bekommt genug Auswahl, ohne zu stark zu bremsen.
100Sehr breit. Sinnvoll bei diversen Wissensbasen, etwa 50 ms langsamer.

Bei 90 Prozent aller Bots ist 50 die richtige Wahl.

Häufige Fehler

  • Reranker an + Top-K = 4: Bringt fast nichts, weil der Reranker zu wenig Auswahl hat. Top-K mindestens 8.
  • Reranker an + Schwelle = 0.70: Nach der Schwelle bleiben nur drei Treffer übrig — der Reranker hat nichts zu sortieren.
  • Reranker an, ohne zu testen: Manchmal ist die Reihenfolge schon vorher okay. Vor dem Aktivieren mit der Live-Vorschau zwei bis drei Vergleichsfragen testen.

Für Fortgeschrittene

Wenn du den Reranker mit Multi-Query kombinierst (mehrere Fragevarianten gleichzeitig), bekommst du die beste Pipeline-Qualität — aber auch die höchste Latenz und Cost. Sinnvoll nur für hochwertige B2B-Bots, bei denen Antwortqualität wichtiger ist als Geschwindigkeit.

Nächste Schritte

← Vorheriger ArtikelPräzision oder Recall? Top-K und Schwelle im Visualizer richtig setzenNächster Artikel →Persona-Tuning im Visualizer — Persönlichkeit, Stil und harte Regeln
Reranker erklärt — wann sich der zweite Sortierer in deinem Bot lohnt | Zeptix