Am 25. Februar veröffentlichte ein Team namens Nous Research heimlich ein v0.1.0 auf GitHub. Ursprünglich hatte das Hermes-Modell nur einen Installationsbefehl und eine Produktaussage: „Ein Agent, der mit Ihnen wächst“.

Zu dieser Zeit bemerkte kaum jemand darauf, selbst wenn Nous Research in der Modellgemeinde einen gewissen Ruf hatte, hatten ihre Hermes-Modellreihe auf HuggingFace bereits 33 Millionen Downloads angesammelt, aber die gesamte Aufmerksamkeit der Entwicklergemeinde war auf das verehrte OpenClaw „Krebs“ gerichtet. Über 33 Tage übertraf es React und wurde das schnellstgewachsene Projekt in der Geschichte von GitHub, mit einem Höchststand von 710 Sternen pro Stunde, aber genau zu diesem Zeitpunkt veröffentlichten Sicherheitsforscher kontinuierlich Schwachstellen mit einer durchschnittlichen Rate von 2,2 CVEs pro Tag in demselben Zeitfenster, insgesamt 138 Sicherheitsanfälligkeiten in 63 Tagen. Die gesamte Gemeinschaft begann, eine Frage neu zu überdenken: Kann dieses Ding wirklich in Produktionsumgebungen verwendet werden?

Vor diesem Hintergrund hat der Hermes Agent, der als Wettbewerber gilt, endlich die Chance ergriffen und erlebt sein erstes schnelles Wachstumsphase.

Hermes hat ein Tool zur Migration von OpenClaw in seinen eigenen Code geschrieben. Die Entwickler, die von OpenClaw abgewandert sind, benötigten einen Ort, um sich niederzulassen, und der Hermes Agent wurde zu einer von Mund zu Mund empfohlenen guten Wahl.

So begann der Hermes Agent Anfang März, in den GitHub Trending einzutreten, erreichte einen Höchststand von Platz 11 und übertraf 2200 Sterne. AwesomeAgents bezeichnete ihn als die „ambitionierteste Open-Source-Agentenveröffentlichung seit 2026“, derzeit hat Hermes 69,9k Sterne und 9k Forks auf GitHub.

Heute spricht Rhythmus BlcokBeats mit Ihnen über die Unterschiede dieses Agenten.

Was ist der Hermes Agent?

Der Hermes Agent ist ein selbst-evolvierender AI-Agent, der von Nous Research entwickelt wurde und der derzeit einzige Agent ist, der mit einem internen Lernzyklus ausgestattet ist.

Er kann automatisch Fähigkeiten aus Nutzungserfahrungen erstellen, diese Fähigkeiten kontinuierlich während der Nutzung verbessern, aktiv Wissen in wiederverwendbare Vermögenswerte umwandeln, seine vergangene Gesprächshistorie abrufen und sein Verständnis für Sie als Benutzer in mehreren Sitzungen vertiefen.

Kurz gesagt, der größte Vorteil des Hermes Agent ist: Je mehr Sie ihn verwenden, desto klüger wird er, je einfacher wird er.

Seine Positionierung ist nicht als an eine IDE gebundener Programmierassistent, noch als Chat-Verpackung für eine einzelne API, sondern als ein echter, auf Ihrem Server residierender, der sich an das Gelernte erinnert, und dessen Fähigkeiten mit zunehmender Laufzeit stärker werden.

Nous Research hat sich von Anfang an als Open-Source-prioritäres, dezentralisiertes AI-Labor positioniert, mit dem Ziel, AI zu schaffen, die von Nutzern selbst kontrolliert werden kann, anstatt die Intelligenz in den Händen von nur wenigen geschlossenen Unternehmen zu konzentrieren. Ihre frühen Arbeiten konzentrierten sich auf die Hermes-Modellreihe, während sie auch umfangreiche Investitionen in Infrastruktur und Systeme tätigten und die DisTrO-Technologie für das Training von Modellen über global verteilte Verbraucher-GPUs sowie Simulationsumgebungen wie WorldSim und Doomscroll für mehrere Agenteninteraktionen und langfristige Verhaltensweisen erforschten.

Das Team hinter dem Hermes Agent ist dasselbe, das die Nomos- und Psyche-Modellreihe entwickelt hat.

Welche nützlichen Werkzeuge gibt es?

Der Kernmechanismus des Hermes Agent ist sein Gedächtnissystem und das Fähigkeitssystem. Der Agent verwaltet zwei schlanke Kern-Dateien: MEMORY.md speichert Umgebungsinformationen, Vereinbarungen und Erfahrungen aus vergangenen Aufgaben; USER.md speichert Ihre Vorlieben und Kommunikationsstile. Diese beiden Dateien werden zu Beginn jeder Sitzung automatisch in die Systemaufforderung eingebracht, was dem Agenten eine „langfristige Arbeitsgedächtnis“ gibt. Darüber hinaus werden alle historischen Sitzungen in einer SQLite-Volltextsuchdatenbank gespeichert, sodass der Agent Gespräche von vor Wochen abrufen kann.

Im Hinblick auf das Fähigkeitssystem erstellt der Agent bei der Durchführung jedes komplexen Auftrags (in der Regel mehr als 5 Werkzeugaufrufe) eigenständig ein strukturiertes Markdown „Fähigkeitsdokument“, das die Schritte, bekannte Inhalte und Validierungsmethoden aufzeichnet, um für die zukünftige Wiederverwendung zur Verfügung zu stehen. Die Fähigkeitsdateien folgen einem progressiven Offenlegungsmodell: Der Agent sieht standardmäßig nur den Namen und die Beschreibung der Fähigkeit (ca. 3000 Token) und lädt den vollständigen Inhalt einer bestimmten Fähigkeit nur bei Bedarf, um den Tokenverbrauch zu steuern.

Auf der Werkzeugseite verfügt der Hermes Agent über mehr als 40 integrierte Werkzeuge, die Websuche, Browserautomatisierung, visuelle Verständnis, Bildgenerierung, Text-zu-Sprache abdecken und unterstützt das Setzen von Zeitaufgaben in natürlicher Sprache, sodass der Agent automatisch Berichtserstellung, Datensicherung, Systemüberwachung und andere wiederkehrende Arbeiten in einer unbemannten Umgebung durchführen kann.

Die beliebtesten Werkzeuge, das sind die Werkzeuge, die die Community-Nutzer in der Praxis am häufigsten verwenden, die am meisten Feedback erhalten und die aufgrund der Funktionalität und der typischen Bedürfnisse der Entwicklergemeinde ganz vorne stehen, sind diese Werkzeuge:

Hindsight ist derzeit das heißeste Einzelwerkzeug im Ökosystem und das von Hermes offiziell empfohlene Langzeitspeicher-Plugin. Es ruft automatisch relevante Kontexte vor jedem LLM-Aufruf ab, unterstützt lokale PostgreSQL- oder Cloud-Deployments und wurde als nativer Memory Provider in Hermes integriert.

Anthropic-Cybersecurity-Skills ist das am höchsten bewertete Skill-Paket im Ökosystem, das mehr als 753 strukturierte Netzwerksicherheitsfähigkeiten umfasst und das MITRE ATT&CK-Rahmenwerk vollständig abbildet, geeignet für Sicherheitsforschung und Penetrationstestszenarien.

mission-control ist derzeit das beliebteste Dashboards zur Agenten-Orchestrierung im Ökosystem, das Agentenflottenverwaltung, Aufgabenverteilung, Kostenverfolgung und mehrere Agenten-Kollaborationsworkflows unterstützt und von der Gemeinschaft als Standard für produktionsbereite Bereitstellungen empfohlen wird.

Hermes Agent Self-Evolution ist eine evolutionäre Selbstverbesserungstechnik, die DSPy + GEPA verwendet, um Fähigkeiten, Hinweise und Code zu optimieren.

Hermes Workspace ist der native Arbeitsbereich von Hermes, der Chatoberfläche, Terminal und Fähigkeitenmanager integriert und der beliebteste grafische Zugangspunkt ist.

Darüber hinaus kann er unabhängige Unteragenten ableiten, von denen jeder seinen eigenen Gesprächskontext, unabhängige Terminals und Python RPC-Skripte hat, um eine parallele Pipeline mit null Kontextkosten zu realisieren.

In Bezug auf die Flexibilität der Infrastruktur unterstützt es sechs Arten von Terminal-Backends: lokale Ausführung, Docker, SSH-Remote, Daytona serverlos, Singularity-Container und Modal Cloud-Funktionen. Daytona und Modal gehen in den Ruhemodus, wenn sie inaktiv sind, die Kosten sind nahezu null. Sie können es auf einem VPS oder GPU-Cluster für 5 Dollar ausführen und über Telegram Befehle erteilen, damit es auf einem Cloud-Server arbeitet, auf den Sie niemals direkt per SSH zugreifen.

Der Hermes Agent steht derzeit in direkter Konkurrenz zu OpenClaw, beide sind Open-Source-Agentenframeworks, die sich an Entwickler richten.

Die Architekturphilosophien beider sind völlig unterschiedlich: Der Entwurfskern von OpenClaw ist ein „Kontrollraum“, ein einheitlicher Langzeitprozess, der Sitzungen, Routing, Werkzeugausführung und Status verwaltet, alles fließt durch diesen zentralen Controller. Hermes hingegen basiert auf dem Ausführungszyklus des Agenten selbst und baut alles um diesen wiederholten Zyklus des „Machens, Lernens, Verbesserns“ auf.

In Bezug auf das Fähigkeitssystem sind die Unterschiede zwischen beiden besonders ausgeprägt: Die Fähigkeiten von OpenClaw sind größtenteils manuell geschrieben und werden aus verschiedenen Ebenen wie Workspace, personal, shared oder Plugins geladen; Hermeses Ansatz besteht darin, den Agenten selbst Fähigkeiten aus Erfahrungen generieren zu lassen und einen echten selbstlernenden geschlossenen Kreis zu bilden.

Wie man installiert und verwendet

Es ist extrem einfach zu bedienen. Ein Befehl „curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash“ reicht aus, um die Installation abzuschließen, unterstützt Linux, macOS und WSL2, der Hermes Agent konfiguriert alles automatisch, ohne manuelle Eingriffe.

Hermes offizielle Website

Nach der Installation des Hermes Agent führen Sie „hermes setup“ aus, um den Einrichtungsassistenten zu starten, wählen Sie Ihren Modellanbieter (unterstützt Nous Portal, OpenRouter, OpenAI oder jeden benutzerdefinierten Endpunkt), integrieren Sie Ihre Messaging-Plattform (Telegram, Discord, Slack oder WhatsApp) und beginnen Sie das erste Gespräch. Ab der ersten Interaktion tritt der Hermes Agent sofort in den Lernmodus ein, beginnt mit dem Aufbau von Erinnerungen, erstellt Fähigkeiten und wird nach jeder Sitzung leistungsfähiger.

Die wichtigsten Befehle für den täglichen Gebrauch umfassen:

hermes (Gespräch beginnen),

hermes model (LLM-Anbieter und Modell auswählen),

hermes tools (konfigurieren, welche Werkzeuge aktiviert werden),

hermes gateway (Nachrichtengateway starten, Telegram, Discord usw. integrieren),

hermes setup (den vollständigen Einrichtungsassistenten ausführen, um alles einmalig zu konfigurieren),

hermes claw migrate (von OpenClaw migrieren),

hermes update (auf die neueste Version aktualisieren),

hermes doctor (Diagnoseprobleme);

Geeignete Szenarien für den Hermes Agent sind: allgemeine AI-Assistenten, die den Kontext über Sitzungen hinweg speichern und ihre Fähigkeiten kontinuierlich verbessern müssen; benutzerdefinierte Agenten-Workflows, die Werkzeuge, Plugins, MCP-Server, Browser oder Shell kombinieren müssen; Bereitstellung des Agenten auf lokaler Hardware, Cloud-VM oder kostengünstiger serverloser Infrastruktur; sowie Szenarien, in denen ein dauerhafter Assistent erforderlich ist, der plattformübergreifend durchsuchbare Gesprächshistorien und erlernte Fähigkeiten beibehält.

Genauer gesagt, Sie können es verwenden, um gleichzeitig mit ihm auf Telegram zu sprechen, während es Aufgaben auf einer Cloud-VM ausführt, Automatisierungen einrichtet und Berichte an jede Plattform sendet, es mit Slack oder Discord verbinden, um AI-Kollaborationsunterstützung für das gesamte Team bereitzustellen; oder seine Trajektorie-Exportfunktion nutzen, um Trainingsdaten für das RL-Training des nächsten Tool-Calling-Modells zu generieren.