H繁中版
文件參考手冊optional skills catalog
<!-- Source: https://hermesbible.com/docs/reference/optional-skills-catalog -->

選用 skill 隨附在 hermes-agent 的 optional-skills/ 目錄下,但預設並未啟用。需明確安裝:

hermes skills install official/<category>/<skill>

例如:

hermes skills install official/blockchain/solana
hermes skills install official/mlops/flash-attention

下方每個 skill 都連結到專屬頁面,包含完整定義、設定與使用方式。

解除安裝:

hermes skills uninstall <skill-name>

autonomous-ai-agents

Skill描述
antigravity-cli操作 Antigravity CLI(agy):外掛、認證、沙箱。
blackbox將程式設計任務委派給 Blackbox AI CLI agent。多模型 agent 內建評審,透過多個 LLM 執行任務並挑選最佳結果。需要 blackbox CLI 和 Blackbox AI API 金鑰。
grok將程式設計委派給 xAI Grok Build CLI(功能、PR)。
honcho設定並使用 Honcho 記憶體搭配 Hermes——跨 session 使用者建模、多設定檔對等隔離、觀察設定、辯證推理、session 摘要、上下文預算強制執行。設定 Honcho、疑難排解... 時使用。
openhands將程式設計委派給 OpenHands CLI(模型無關、LiteLLM)。

blockchain

Skill描述
evm唯讀 EVM 客戶端:錢包、代幣、gas,涵蓋 8 條鏈。
hyperliquidHyperliquid 市場資料、帳戶歷史、交易回顧。
solana查詢 Solana 區塊鏈資料並附 USD 定價——錢包餘額、代幣投資組合含價值、交易明細、NFT、巨鯨偵測、即時網路統計。使用 Solana RPC + CoinGecko。無需 API 金鑰。

communication

Skill描述
one-three-one-rule技術提案與權衡分析的結構化決策框架。當使用者面臨多種方案的選擇(架構決策、工具選用、重構策略、遷移路徑)時,此 skill 提...

creative

Skill描述
baoyu-article-illustrator文章插圖:類型 × 風格 × 色彩一致性。
baoyu-comic知識漫畫:教育、傳記、教學類型。
blender-mcp透過 socket 連線到 blender-mcp 外掛,直接從 Hermes 控制 Blender。建立 3D 物件、材質、動畫,執行任意 Blender Python(bpy)程式碼。使用者想在 Blender 中建立或修改任何內容時使用。
concept-diagrams產生平面、簡約的明暗感知 SVG 圖表,輸出為獨立 HTML 檔案,使用統一的教育視覺語言,包含 9 種語義色彩漸層、句首大寫排版、自動深色模式。最適合教育和簡...
ideation透過創意約束產生專案想法。
hyperframes使用 HyperFrames 建立基於 HTML 的影片合成、動態標題卡、社群覆蓋層、字幕口述影片、音訊反應視覺效果、著色器轉場。HTML 是影片的真實來源。使用者想... 時使用。
kanban-video-orchestrator規劃、設定並監控由 Hermes Kanban 支援的多 agent 影片製作管線。使用者想製作任何影片時使用——敘事電影、產品/行銷、MV、解說、ASCII/終端機藝術、抽象/生成迴...
meme-generation選擇模板並用 Pillow 疊加文字,產生真正的迷因圖片。輸出實際的 .png 迷因檔案。
pixel-art像素藝術搭配時代色盤(NES、Game Boy、PICO-8)。

devops

Skill描述
inference-sh-cli透過 inference.sh CLI(infsh)執行 150+ 個 AI 應用——圖片生成、影片建立、LLM、搜尋、3D、社群自動化。使用終端機工具。觸發詞:inference.sh、infsh、ai apps、flux、veo、圖片生成、影片生成、seedrea...
docker-management管理 Docker 容器、映像、磁碟區、網路和 Compose 堆疊——生命週期操作、除錯、清理、Dockerfile 最佳化。
hermes-s6-container-supervision修改、除錯或擴充 Hermes Agent Docker 映像中的 s6-overlay 監督樹——新增服務、除錯設定檔閘道器、理解 Architecture B 主程式模式。
pinggy-tunnel透過 Pinggy 建立零安裝的 localhost SSH 隧道。
watchers帶水位線去重的 RSS、JSON API 和 GitHub 輪詢。

dogfood

Skill描述
adversarial-ux-test扮演你產品中最難搞、最抗拒科技的使用者。以該角色瀏覽應用程式,找出每個 UX 痛點,再透過務實層過濾抱怨,區分真實問題與雜訊。建立可執行的 ticke...

email

Skill描述
agentmail透過 AgentMail 給予 agent 專屬的電子郵件收件匣。使用 agent 擁有的電子郵件地址(例如 hermes-agent@agentmail.to)自主收發和管理郵件。

finance

Skill描述
3-statement-model在 Excel 中建立完整的三表整合模型(損益表、資產負債表、現金流量表),包含營運資金排程、折攤滾動、債務排程、以及使現金和保留盈餘平衡的調節項目。搭配 excel-author 使用。
comps-analysis在 Excel 中建立可比公司分析——營運指標、估值倍數、統計基準對比同業群組。搭配 excel-author 使用。適用於上市公司估值、IPO 定價、產業基準分析或異常值偵測。
dcf-model在 Excel 中建立機構級 DCF 估值模型——營收預測、FCF 建構、WACC、終值、熊市/基準/樂觀情境、5×5 敏感度表。搭配 excel-author 使用。適用於內在價值股票分析。
excel-author使用 openpyxl 無頭建立可稽核的 Excel 工作簿——藍/黑/綠單元格慣例、公式優於硬編碼、命名範圍、平衡檢查、敏感度表。適用於財務模型、稽核輸出、調節。
lbo-model在 Excel 中建立槓桿收購模型——資金來源與運用、債務排程、現金掃除、退出倍數、IRR/MOIC 敏感度。搭配 excel-author 使用。適用於 PE 篩選、贊助方估值或投影片中的說明性 LBO。
merger-model在 Excel 中建立增厚/稀釋(合併)模型——預估損益表、協同效應、融資組合、EPS 影響。搭配 excel-author 使用。適用於 M&A 投影片、董事會資料或交易評估。
pptx-author使用 python-pptx 無頭建立 PowerPoint 簡報。搭配 excel-author 可建立模型支撐的簡報,每個數字都可追溯到工作簿儲存格。適用於投影片、IC 備忘錄、財報說明。
stocks股票報價、歷史、搜尋、比較、加密貨幣,透過 Yahoo。

gaming

Skill描述
minecraft-modpack-server架設模組化 Minecraft 伺服器(CurseForge、Modrinth)。
pokemon-player透過無頭模擬器 + RAM 讀取玩 Pokemon。

health

Skill描述
fitness-nutrition健身訓練規劃器和營養追蹤器。透過 wger 按肌群、器材或分類搜尋 690+ 個動作。透過 USDA FoodData Central 查詢 380,000+ 種食物的巨量營養素和熱量。計算 BMI、TDEE、最大肌力、巨量營養素分配、體...
neuroskill-bci連線到運行中的 NeuroSkill 實例,將使用者的即時認知與情緒狀態(專注、放鬆、情緒、認知負荷、嗜睡、心率、HRV、睡眠分期、40+ 種衍生 EXG 分數)融入回應...。

mcp

Skill描述
fastmcp使用 FastMCP 在 Python 中建構、測試、檢查、安裝和部署 MCP 伺服器。建立新 MCP 伺服器、將 API 或資料庫包裝為 MCP 工具、公開資源或提示詞、或為 Claude Code、Cur... 準備 FastMCP 伺服器時使用。
mcporter使用 mcporter CLI 直接列出、設定、認證和呼叫 MCP 伺服器/工具(HTTP 或 stdio),包括臨時伺服器、設定編輯、CLI/型別生成。

migration

Skill描述
openclaw-migration將使用者的 OpenClaw 自訂配置遷移到 Hermes Agent。匯入 Hermes 相容的記憶體、SOUL.md、命令允許清單、使用者 skill 和選定的工作區資產(來自 ~/.openclaw),然後回報無法遷移的...

mlops

Skill描述
huggingface-accelerate最簡單的分散式訓練 API。4 行即可為任何 PyTorch 腳本新增分散式支援。DeepSpeed/FSDP/Megatron/DDP 統一 API。自動裝置配置、混合精度(FP16/BF16/FP8)。互動式設定、單一啟動指令...
axolotlAxolotl:YAML LLM 微調(LoRA、DPO、GRPO)。
chromaAI 應用的開源向量嵌入資料庫。儲存嵌入和中繼資料,執行向量和全文搜尋,按中繼資料篩選。簡潔的 4 函數 API。從筆記本擴展到生產級叢集。適用於語義搜尋、RAG...
clipOpenAI 連接視覺與語言的模型。支援零樣本圖片分類、圖片-文字匹配、跨模態檢索。在 4 億圖片-文字對上訓練。適用於圖片搜尋、內容審核或視覺-語言任務...
dspyDSPy:聲明式 LM 程式、自動最佳化提示詞、RAG。
faissFacebook 的高效相似度搜尋和密集向量聚類函式庫。支援數十億向量、GPU 加速和多種索引類型(Flat、IVF、HNSW)。適用於快速 k-NN 搜尋、大規模向量檢索或...
optimizing-attention-flash使用 Flash Attention 最佳化 transformer attention,加速 2-4 倍,記憶體減少 10-20 倍。訓練/執行長序列(>512 tokens)的 transformer、遇到 attention GPU 記憶體問題、或需要更快推論... 時使用。
guidance使用正則表達式和文法控制 LLM 輸出,保證產生有效的 JSON/XML/程式碼,強制結構化格式,並使用 Guidance 建構多步驟工作流程——Microsoft Research 的受限制生成框架。
huggingface-tokenizers為研究和生產最佳化的快速 tokenizer。基於 Rust 的實作可在 <20 秒內標記化 1GB 資料。支援 BPE、WordPiece 和 Unigram 演算法。訓練自訂詞彙表、追蹤對齊、處理填充/截斷。Integ...
instructor使用 Pydantic 驗證從 LLM 回應中提取結構化資料,自動重試失敗的提取,解析複雜 JSON 並具型別安全,並使用 Instructor 串流部分結果——經過實戰驗證的結構化輸出函式庫。
lambda-labs-gpu-cloud保留和隨需的 GPU 雲端實例,用於 ML 訓練和推論。需要具備簡單 SSH 存取、持久化檔案系統或高效能多節點叢集的專屬 GPU 實例進行大規模訓練時使用。
llava大型語言與視覺助理。支援視覺指令微調和基於圖片的對話。結合 CLIP 視覺編碼器與 Vicuna/LLaMA 語言模型。支援多輪圖片聊天、視覺問答、和 instruct...
modal-serverless-gpu無伺服器 GPU 雲端平台,用於執行 ML 工作負載。需要無需基礎設施管理的隨需 GPU 存取、將 ML 模型部署為 API、或執行自動擴展的批次工作時使用。
nemo-curatorGPU 加速的 LLM 訓練資料整理。支援文字/圖片/影片/音訊。功能包含模糊去重(16 倍加速)、品質過濾(30+ 启發式規則)、語義去重、PII 編輯、NSFW 偵測。跨 GPU 擴展...
obliteratusOBLITERATUS:消除 LLM 拒絕回答(diff-in-means)。
outlinesOutlines:結構化 JSON/正則表達式/Pydantic LLM 生成。
peft-fine-tuning使用 LoRA、QLoRA 和 25+ 種方法的 LLM 參數高效微調。GPU 記憶體有限時微調大型模型(7B-70B)、需要以 <1% 參數訓練且精確度損失最小化、或多適配器場景... 時使用。
pinecone用於生產級 AI 應用的託管向量資料庫。全託管、自動擴展,支援混合搜尋(密集 + 稀疏)、中繼資料篩選和命名空間。低延遲(<100ms p95)。適用於生產級 RAG、推薦系統或...
pytorch-fsdpPyTorch FSDP 全分片資料平行訓練的專家指導——參數分片、混合精度、CPU 卸載、FSDP2。
pytorch-lightning高階 PyTorch 框架,具備 Trainer 類別、自動分散式訓練(DDP/FSDP/DeepSpeed)、回调系統和最小樣板。從筆記本到超級電腦,相同程式碼即可擴展。需要簡潔的訓練迴圈... 時使用。
qdrant-vector-search用於 RAG 和語義搜尋的高效能向量相似度搜尋引擎。建構需要快速最近鄰搜尋、帶篩選的混合搜尋或可擴展向量儲存的生產級 RAG 系統時使用,Rust 驅動的效能...
sparse-autoencoder-training使用 SAELens 訓練和分析稀疏自編碼器(SAEs)的指導,將神經網路激活分解為可解釋特徵。發現可解釋特徵、分析叠加、或研究... 時使用。
simpo-trainingLLM 對齊的簡易偏好最佳化。DPO 的無參照替代方案,效能更佳(AlpacaEval 2.0 上 +6.4 分)。無需參照模型,比 DPO 更高效。偏好對齊且想要更簡... 時使用。
slime-rl-training使用 slime(Megatron+SGLang 框架)進行 LLM 強化學習後訓練的指導。訓練 GLM 模型、實作自訂資料生成工作流程、或需要緊密整合 Megatron-LM 進行 RL 擴展... 時使用。
stable-diffusion-image-generation使用 HuggingFace Diffusers 的 Stable Diffusion 模型進行最先進的文字轉圖片生成。從文字提示產生圖片、執行圖片翻譯、修圖、或建構自訂擴散管線時使用。
tensorrt-llm使用 NVIDIA TensorRT 最佳化 LLM 推論,達到最大吞吐量和最低延遲。在 NVIDIA GPU(A100/H100)上進行生產部署、需要比 PyTorch 快 10-100 倍的推論、或以量化... 服務模型時使用。
distributed-llm-pretraining-torchtitan使用 torchtitan 進行 PyTorch 原生分散式 LLM 預訓練,支援 4D 平行(FSDP2、TP、PP、CP)。從 8 到 512+ GPU 大規模預訓練 Llama 3.1、DeepSeek V3 或自訂模型,搭配 Float8、torch.compile、dist... 時使用。
fine-tuning-with-trlTRL:SFT、DPO、PPO、GRPO、獎勵建模,用於 LLM RLHF。
unslothUnsloth:2-5 倍更快的 LoRA/QLoRA 微調,更少 VRAM。
whisperOpenAI 的通用語音辨識模型。支援 99 種語言、逐字稿、翻譯為英語、語言辨識。六種模型尺寸,從 tiny(39M 參數)到 large(1550M 參數)。適用於語音轉文字、podcast...

payments

Skill描述
mpp-agent透過 Machine Payments Protocol(MPP)支付 HTTP 402 API。
stripe-link-cli透過 Stripe Link 進行 agent 支付——卡片、SPT、審批。
stripe-projects透過 Stripe Projects 配置 SaaS 服務 + 同步憑證。

productivity

Skill描述
canvasCanvas LMS 整合——使用 API token 認證取得已註冊課程和作業。
here.now將靜態網站發佈到 {slug}.here.now,並在雲端硬碟中儲存私有檔案以進行 agent 間的交接。
memento-flashcards間隔重複記憶卡系統。從事實或文字建立記憶卡,使用 agent 評分的自由文字回答與記憶卡對話,從 YouTube 逐字稿產生測驗,透過自適應排程複習到期記憶卡,匯出/匯入...
shop商店目錄搜尋、結帳、訂單追蹤、退貨。
shopify透過 curl 使用 Shopify Admin 和 Storefront GraphQL API。產品、訂單、客戶、庫存、metafields。
siyuanSiYuan Note API,透過 curl 在自架知識庫中搜尋、讀取、建立和管理區塊和文件。
telephony無需修改核心工具即可赋予 Hermes 電話功能。配置並持久化 Twilio 號碼、收發 SMS/MMS、撥打直接電話、透過 Bland.ai 或 Vapi 撥打 AI 驅動的外呼電話。

research

Skill描述
bioinformaticsbioSkills 和 ClawBio 400+ 個生物資訊 skill 的入口。涵蓋基因體學、轉錄體學、單細胞、變異叫體、藥物基因體學、宏基因體學、結構生物學等。按需取得領域特定參考資料...
darwinian-evolver使用 Imbue 的演化迴圈演化提示詞/正則/SQL/程式碼。
domain-intel使用 Python 標準函式庫的被動域名偵察。子域名發現、SSL 憑證檢查、WHOIS 查詢、DNS 記錄、域名可用性檢查、大量多域名分析。無需 API 金鑰。
drug-discovery用於藥物發現工作流程的藥學研究助理。在 ChEMBL 上搜尋生物活性化合物、計算類藥性(Lipinski Ro5、QED、TPSA、合成可及性)、透過 OpenFDA 查詢藥物交互作用、解讀 ADMET...
duckduckgo-search透過 DuckDuckGo 的免費網路搜尋——文字、新聞、圖片、影片。無需 API 金鑰。安裝時優先使用 ddgs CLI;僅在確認 ddgs 在當前執行環境中可用後才使用 Python DDGS 函式庫。
gitnexus-explorer使用 GitNexus 索引程式碼庫,透過 Web UI + Cloudflare tunnel 提供互動式知識圖譜。
osint-investigation公開紀錄 OSINT 調查框架——SEC EDGAR 申報、USAspending 合約、參議院遊說、OFAC 制裁、ICIJ 離岸洩漏、NYC 房產紀錄(ACRIS)、OpenCorporates 登記、CourtListener 法院紀錄、Wayback...
parallel-cliParallel CLI 的選用供應商 skill——agent 原生網路搜尋、提取、深度研究、資料富化、FindAll、監控。優先使用 JSON 輸出和非互動流程。
qmd使用 qmd 在本機搜尋個人知識庫、筆記、文件和會議逐字稿——混合檢索引擎,支援 BM25、向量搜尋和 LLM 重排序。支援 CLI 和 MCP 整合。
scrapling使用 Scrapling 進行網頁爬蟲——HTTP 取得、隱匿瀏覽器自動化、Cloudflare 繞過、透過 CLI 和 Python 進行蜘蛛爬行。
searxng-search透過 SearXNG 的免費元搜尋——聚合 70+ 個搜尋引擎的結果。可自架或使用公開實例。無需 API 金鑰。網路搜尋工具不可用時自動降級。

security

Skill描述
1password設定並使用 1Password CLI(op)。安裝 CLI、啟用桌面應用程式整合、登入、以及為命令讀取/注入密鑰時使用。
godmode越獄 LLM:Parseltongue、GODMODE、ULTRAPLINIAN。
oss-forensicsGitHub 儲存庫的供應鏈調查、證據恢復和鑑識分析。涵蓋已刪除提交恢復、強制推送偵測、IOC 提取、多源證據收集、假設形成/驗證、和...
sherlock跨 400+ 社群網路的 OSINT 用戶名搜尋。透過用戶名搜尋社群媒體帳號。
web-pentest授權的 Web 應用程式滲透測試——偵察、漏洞分析、基於證明的利用、專業報告。採用 Shannon 的「無利用,無報告」方法論,具備嚴格的範圍、授權... 門檻。

software-development

Skill描述
code-wiki為任何程式碼庫產生 wiki 文件 + Mermaid 圖表。
rest-graphql-debug偵錯 REST/GraphQL API:狀態碼、認證、結構描述、重現。
subagent-driven-development透過 delegate_task subagent 執行計畫(兩階段審查)。

web-development

Skill描述
page-agent將 alibaba/page-agent 嵌入你自己的 Web 應用程式——純 JavaScript 的頁面內 GUI agent,以單一 <script> 標籤或 npm 套件提供,讓你網站的終端使用者以自然語言驅動 UI(「點擊登入、填入使用者名...」

貢獻選用 Skill

要向儲存庫新增選用 skill:

  1. optional-skills/<category>/<skill-name>/ 下建立目錄
  2. 新增包含標準 frontmatter(name、description、version、author)的 SKILL.md
  3. references/templates/scripts/ 子目錄中包含任何支援檔案
  4. 提交 pull request——合併後,該 skill 將出現在此目錄中並獲得自己的文件頁面


常見問題與疑難排解