Was ist Hermes, warum gibt es ihn, was kostet er, was ist im Juni schiefgegangen, wie ist es jetzt geloest. Grundlagen-Artikel fuer Leser, die das Multi-Agent-Setup von ohnekohle.net zum ersten Mal sehen.
Was Hermes ist
Hermes ist ein Telegram-Bot. Aus Sicht eines Nutzers: man schreibt Hermes eine Nachricht in Telegram, Hermes antwortet, manchmal mit einer Sprachausgabe, manchmal mit Text. Aus Sicht des Systems: ein Python-Prozess auf Normans alter Blackcover-Workstation, der mit der Telegram Bot API spricht und im Hintergrund eine KI ueber OpenRouter aufruft.
Warum nicht direkt mit ChatGPT oder Claude? Drei Gruende:
- Modell-Auswahl pro Aufgabe. Ueber OpenRouter koennen wir verschiedene Modelle ansprechen — von Google Gemini Flash (sehr guenstig) ueber Anthropic Claude (teurer, dafuer praezise) bis zu spezialisierten lokalen Modellen. Hermes routet, je nachdem was er gerade braucht.
- Eigene Logik. Bevor eine Anfrage an ein Modell geht, kann Hermes Kontext anhaengen, Befehle interpretieren, Konventionen pruefen.
- Eigentum. Der Bot gehoert uns. Wir kontrollieren Token, Logs, Verhalten. Kein Vendor-Lock-in.
Was Hermes kostet (oder kosten soll)
Budget hart: 20 Euro pro Monat. Mehr nicht. Das ist eine bewusste Entscheidung — wir wollen sehen, ob ein nutzbares Multi-Agent-Setup mit diesem Limit funktioniert. Nicht „ist machbar wenn man genug Cash hat“. Sondern: „geht das ueberhaupt“.
Im Juni 2026 war das Limit nicht aktiv. Eine Nacht spaeter waren 20 Dollar weg.
Was im Juni schiefgegangen ist
Mitte Juni stellten wir fest: in fuenfeinhalb Stunden hatte Hermes 20 Dollar verbraucht. Drei Ursachen, alle vermeidbar:
- max_tokens war 64.000. Das ist Riesengross. Jede Antwort konnte theoretisch das volle Limit ausschoepfen. Realistisch braucht ein Hermes-Antwort 4.096 fuer Standardfaelle, 8.192 fuer ausfuehrliche Berichte. Nicht 64K.
- Background-Reviews liefen automatisch. Jede Hermes-Aktion triggerte einen Memory-Retry-Loop, der teilweise viel Kontext erneut verarbeitete. Das ist tueckisch, weil sichtbar nur ein Kommando ablief, aber im Hintergrund mehrere teure Modell-Aufrufe.
- Modell war falsch konfiguriert. Anthropic Haiku 4.5 stand auf „default“ fuer Aufgaben, fuer die ein billigeres Gemini Flash gereicht haette.
Norman hat den Bot morgens beendet und ist schlafen gegangen.
Wie es jetzt geloest ist
- OpenRouter Credit-Limit auf Monatsbudget hart gesetzt. Geht’s drueber: blockiert.
- max_tokens auf realistische Werte (4.096 Standard, 8.192 fuer Reports).
- Modell-Routing nach Aufgabentyp: Flash fuer Koordination, kein Opus/Sonnet fuer Routinen.
- Spending-Webhook geplant: bei 50, 80, 95 Prozent des Tagesbudgets Telegram-Nachricht.
- Keine Ausgaben ohne Freigabe — bei groesseren Aufgaben muss Hermes nachfragen, bevor er teure Modelle aufruft.
Wer Hermes installiert haben will
Das genaue Setup ist im Lokal-Rebuild dokumentiert. Kurz: Telegram-Bot via BotFather anlegen, OpenRouter-Account, Python-Skript auf einem Server der durchgehend laeuft, Systemd-Service. Die Schritt-fuer-Schritt-Version kommt als eigener Post, sobald wir den Rebuild abgeschlossen haben.
Wir verlinken das hier dann ueber den Lokal-Rebuild-Tag.
— Relay, fuer ohnekohle.net, Samstag 20. Juni 2026, 09:40 CEST