선정 전에 「Hermes Agent 재시작하면 기억이 사라지나」만 묻는다면, 답은 단순히 전원을 끄는지 여부가 아니라 3계층 기억을 어떻게 이해하는지에 달려 있습니다. 본문은 로컬 Hermes 배포를 준비하는 개발자를 위한 글입니다. Nous Research가 Stateless 채팅에서 Persistent Agent로 어떻게 진화했는지 정리하고, Raspberry Pi / VPS / Mac Mini M4 리소스 프로필로 각 계층 부하를 대조하며, 나만의 AI 에이전트를 키우기 위한 Mac Mini M4 월 임대 TCO 관점과 6단계 도입 체크리스트를 제공합니다.
2026년 2월, Nous Research가 OSS 공개한 Hermes Agent는 GitHub에서 빠르게 주목받았습니다. 핵심은 「조금 더 대화」가 아니라 내 머신에 상주하는 Agent입니다. 크로스 세션 지속 기억, Skill 문서 자동 생성, 태스크를 쌓을수록 「오래된 동료」에 가까워집니다. MIT 라이선스, curl 한 줄 설치, Telegram / Discord / Slack 등 20개 이상 채널 지원으로 클라우드 Copilot에서 로컬 AI Agent 배포로 넘어가는 개발자의 첫 관문이 되었습니다.
그러나 Hermes는 일회성 스크립트가 아닙니다. Gateway는 7×24 온라인이어야 하고, 기억 계층은 ~/.hermes/에 지속 기록되며, Skill은 사용 중 반복 개선됩니다. 노트북 덮개, Raspberry Pi SD 카드 마모, VPS 유지보수 창——모두 「복리」를 끊습니다. 공식 문서도 모델 컨텍스트 최소 64K tokens를 요구해 다단계 도구 호출을 안정화합니다. 하드웨어 요구는 「돌아간다」에서 「연속으로 돌아간다」로 올라갑니다.
선정의 핵심은 「설치 가능한가」가 아니라 어떤 머신이 3계층 기억을 안정적으로 축적하고, 검색을 느리게 하지 않으며, 채널을 끊지 않는가입니다. 아래에서는 아키텍처 분해와 실측 대조로 답합니다. VPS 이전 타임라인이 궁금하면 전일 VPS 3개월 마이그레이션 실측도 참고하세요.
단기 컨텍스트 계층: 현재 세션과 툴체인 상태. Gateway 프로세스 내 유지, 재시작 후 디스크 기록 여부에 의존합니다.
Skill 문서 계층: 복잡 태스크가 Markdown Skill로 침전. 디스크 증가 → 검색·IO 부하 상승.
사용자 모델 계층: USER.md, MEMORY.md, state.db 크로스 세션 복리. 스냅샷 롤백과 장기 오프라인이 최대 적.
채널 계층: Telegram 등 20+ 연결은 상주 리스너 필수. 끊김 = 자동화 태스크 대기 또는 실패.
추론 계층(선택): 로컬 Hermes-3 / MLX는 UMA 소비. API 전용도 Gateway 메모리는 충분히 확보해야 합니다.
결론: 「계속 켜 둠」은 Persistent를 위한 것이지 낭비 전력이 아닙니다——Mac Mini M4 월 임대는 CapEx를 예측 가능한 OpEx로 바꿉니다.
커뮤니티는 Hermes 기억을 3계층(Nous 문서의 SOUL.md, Skill, episodic 스토리지와 일치)으로 요약합니다.
현재 대화, 도구 호출 체인, Gateway 메모리 상태. 기존 Chatbot context window와 비슷하지만 Hermes는 고가치 조각을 장기 계층으로 밀어 넣습니다. 이 계층은 CPU와 네트워크 지연에 민감합니다. 스마트폰에서 Telegram으로 태스크를 보내면 머신이 원격 VPS에 있을수록 체감 지연이 커집니다.
복잡 태스크 완료 후 해결 과정이 Skill로 정제되어, 다음에는 처음부터 추론하지 않습니다. Skill은 Markdown으로 디스크에 저장되고, 수량이 늘면 ripgrep / FTS 검색과 랜덤 IO가 병목이 됩니다. 테스트에서 state.db가 2GB를 넘으면 검색이 밀리초에서 수백 밀리초로——Agent가 「둔해」 보이는 건 대개 IO이지 모델 저하가 아닙니다.
USER.md, MEMORY.md, SQLite state.db가 선호·사실·episodic 검색 인덱스를 보관합니다. 이것이 Hermes의 「Stateless API」 대비 해자입니다. Atropos RL 미세조정 Hermes-3는 긴 태스크와 도구 호출에 강하지만, 3계층이 연속돼야 「쓸수록 이해하는」복리가 생깁니다. 결국 나만의 AI 에이전트를 만드는 핵심 계층입니다.
| 기억 계층 | 주요 스토리지 | 전형적 하드웨어 부하 | 끊김/재시작 영향 |
|---|---|---|---|
| L1 세션 컨텍스트 | Gateway 프로세스 + 일부 로그 | CPU, 네트워크 RTT | 미기록 시 해당 라운드 상세 소실 |
| L2 Skill | ~/.hermes/skills/ 등 | 디스크 용량, 검색 IO | 파일은 남지만 인덱스 재구축 시간 |
| L3 사용자 모델 | state.db, Markdown 기억 | 메모리 캐시, FTS5 | 스냅샷 롤백 시 검색 품질 저하 |
「하드웨어 선정 전 기억 계층을 보라: L1은 지연, L2는 디스크, L3는 연속성——셋 다 『가끔 온라인』을 싫어한다.」
아래는 커뮤니티 배포 경험과 필자 모니터링 데이터 기반 정성 비교(벤더 benchmark 아님)입니다. 「2026년 Hermes Agent에 어떤 머신을 쓸까」에 대한 답입니다.
| 방식 | 기억 연속성 | 로컬 Hermes-3 / Metal | 7×24 적합도 | 전형적 병목 |
|---|---|---|---|---|
| Raspberry Pi 4/5 | SD 카드·메모리 부족으로 중단 쉬움 | 사실상 불가 | 낮음(IO·방열) | 8GB 메모리, 느린 스토리지 |
| Linux VPS | 가능, 유지보수 창 리스크 | Metal 없음 | 중(데이터센터 안정) | 지역 간 지연, macOS 스크립트 단절 |
| Mac Mini M4 월 임대 | 네이티브 macOS + Time Machine | UMA 16/32GB | 높음(저소음·저전력) | 메모리 등급 선택 중요 |
Mac Mini M4 강점은 통합 메모리 아키텍처(UMA)입니다. CPU, GPU, Neural Engine이 고대역 메모리 풀을 공유해 로컬 추론 시 CPU와 「VRAM」 간 복사가 불필요합니다. Hermes는 macOS를 공식 지원하며 curl -fsSL https://get.hermes-agent.org | bash로 설치 가능합니다. launchd로 Gateway를 상주시키면 책상이나 약전실에서 장기 가동(유휴 전력 약 5–8W, 커뮤니티 경험치)에 적합합니다.
# macOS 원클릭 설치 (임대 기기 수령 후) curl -fsSL https://get.hermes-agent.org | bash # 3계층 기억 핵심 디렉터리 백업 tar czf hermes-backup.tgz -C ~ .hermes # Gateway 상태 확인 (설치 마법사가 서비스 구성) # 서브커맨드는 현행 hermes --help 참조
주의: Hermes는 모델 컨텍스트 ≥ 64K를 요구합니다. 로컬 llama.cpp / Ollama는 --ctx-size 65536 또는 동등 파라미터를 명시해야 기동 단계에서 거부되지 않습니다.
Mac Mini M4 자가 구매는 3년 이상 독점이 확정된 경우에 적합합니다. 대다수 「Persistent Agent 워크플로」 검증자에게는 월 임대가 계약금·감가상각을 고정 OpEx로 바꾸고 만료 시 M 시리즈 업그레이드 여지를 남깁니다. 아래는 결정 매트릭스입니다(월 요금은 대여 가격 참조).
| 관점(24개월) | 자가 M4(16GB) | 월 임대 M4 |
|---|---|---|
| 현금 점유 | 일시 하드웨어 지출 높음 | 분산 월납·낮은 계약금 |
| 기억 자산 리스크 | 자체 수리·이전 관리 | 교체 시 ~/.hermes 백업 이전 가능 |
| Hermes 적합 | 최적 | 동일 네이티브 macOS |
| 적합 대상 | 장기 독점 + 감가 자체 부담 | Agent 30일 풀가동 후 구매 결정 |
힌트: 개발자는 Hermes에 코드베이스 추적을 맡기고, 크리에이터는 기획 Skill을 축적하며, 연구자는 논문 처리 플로를 재사용 Skill로——하드웨어 역할은 이 세 가지 복리를 끊기지 않게 하는 것입니다.
기억 계층 요구 명확화: 클라우드 API만 → 16GB 시작. 로컬 추론 + 대 Skill 라이브러리 → 32GB.
독점 하드웨어 선택: 위 표를 대조하고 Raspberry Pi와 「덮개 닫는 노트북」을 제외합니다.
월 임대 주문: 온라인 Mac Mini M4 구성, 계약·수령, 전원·네트워크 연결(깊은 운영 지식 불필요).
Hermes 설치: 공식 curl 실행, hermes model로 Nous Portal / OpenRouter 등 설정.
채널·Gateway 구성: Telegram 등 연결, Gateway 7×24 launchd 기동 확인.
~/.hermes 백업: 정기 tar. 해지 전 내보내기·기기 데이터 삭제——기억은 신규 기기로 이전 가능.
~/.hermes/(Linux/macOS). 데이터는 로컬에 남고 MIT OSS로 원격 측정 없음(공식 README 기준).Raspberry Pi는 장난감급 검증, VPS는 단기 Demo에 맞습니다. Hermes를 「성장하는 동료」로 본다면 기억 연속성이 「가끔 온라인」안을 한 표로 부결합니다. Mac 자가 구매도 가능하지만 먼저 30일 월 임대가 계약금 일시 지출보다 합리적인 경우가 많습니다.
팀이 같은 머신에서 iOS 빌드, Xcode 자동화, 원격 SSH까지 돌린다면 저사양 VPS를 억지로 쓰면 서명 환경 불완전, 이웃 간섭, 슬립 문제가 납니다. Hermes Agent를 안정 상주시키고 macOS 네이티브 툴체인도 유지하려는 프로덕션 환경에서는 NodeMini Mac Mini 클라우드 임대가 「타협 Linux VPS + 클라우드 API만」보다 수월합니다——나만의 AI 에이전트를 Stateless에서 Persistent로 키우는 데 집중하고, 새벽 Gateway 수리에서 벗어날 수 있습니다.
L2/L3는 ~/.hermes/에 있어 재시작해도 파일은 유지됩니다. L1 미기록 내용은 소실됩니다. 장기 오프라인은 episodic 검색을 둔하게 만듭니다. 교체 전 아카이브하세요.
NodeMini는 월/분기 독점 Mac Mini를 제공합니다. 기종·가격은 대여 가격 참조. 모델 API 요금은 선택한 Hermes 제공자(Nous Portal, OpenRouter 등)에서 별도 정산합니다.
전일 글은 이전 타임라인 + TCO. 본문은 3계층 기억 아키텍처와 하드웨어 프로필에 초점. 함께 읽기를 권합니다. 연결 상세는 고객센터를 참고하세요.