智能体技能归档 - 上海久湛信息科技有限公司

📊 技术看板：pptx Skill —— AI 原生 PPT 自动化引擎

13 4 月, 202613 4 月, 2026 由 inforstack评论关闭

什么是 pptx Skill？pptx Skill 是专为 AI Agent（如 Claude Code）设计的 PowerPoint 自动化扩展包。它允许 AI 直接通过代码指令（基于 Python 的 python-pptx 库）创建、读取和修改 .pptx 格式的演示文稿。它打破了以往 AI 只能给出“幻灯片大纲”的局限，让 AI 能够真正生成可直接交付的文件，并精准控制每一页的排版、图表和样式。核心技术能力能力维度技术实现与功能全量创作 (Full Creation) 自动创建幻灯片、设置版式（Layout）、插入文本框及形状。智能排版 (Styling) 精准控制字体大小、颜色、加粗、对齐方式以及占位符位置。图表映射 (Data Visual) 根据 AI 分析的数据结果，自动生成原生的 PPT 图表（柱状图、饼图、折线图等）。内容更新 (Edit & Update) 打开现有 PPT，搜索特定文本或占位符并进行自动化替换或内容更新。多媒体支持 (Multimedia) 支持在指定位置插入图片（如由 DALL-E 或 Gemini 产生的可视化图表）。工作流程：从意图到演示稿1.逻辑构建：用户下令：“根据这份 50 页的研究报告，制作一套 10 页的汇报 PPT，包含核心趋势图。”2.大纲规划：AI 拆解每一页的主标题、核心要点（Bullet Points）和配图逻辑。3.脚本执行：oAI 调用 pptx Skill 启动 Python 脚本环境。o脚本通过 Presentation() 类初始化文件，逐页添加 Slide 对象。4.样式渲染：AI 根据预设模版或语义理解，自动调整文本层次结构。5.文件交付：任务完成，AI 直接在当前目录输出生成的 .pptx 文件。典型应用场景自动化经营分析汇报：AI 抓取数据库数据，自动填充到固定的月度汇报模版中，生成图表。技术方案宣讲：将复杂的系统架构（Architecture）或逻辑流程，快速转化为可视化的展示页面。大规模内容转 PPT：将长篇技术文档、项目计划或课堂讲义，一键转化为结构清晰的演示稿。批量修订：在全公司范围内，将数百份 PPT 中的旧 Logo 或过期数据进行全局自动化替换。技术优势非截图式生成：生成的每一行文字、每一个形状都是原生可编辑的，方便人工进行二次微调。逻辑一致性：AI 在读取长文后直接输出 PPT，避免了人工转录过程中的信息遗漏。开发者友好：基于成熟的 python-pptx 生态，企业可以轻松定制自己的内部 PPT 主题和样式库。 💡 专家建议“在实际部署中，建议结合 Multi-Agent 模式使用。例如，让一个 Agent 负责数据分析，另一个 Agent 负责调用 pptx Skill 进行视觉呈现。这样产出的演示稿不仅数据准确，且逻辑结构更符合专业汇报标准。” 立即在你的 AI 工作区启用：安装指令示例：npx skills add https://github.com/anthropics/skills/tree/main/skills/pptx...

Superpowers —— 为 AI 智能体注入“软件工程之魂”

8 4 月, 20268 4 月, 2026 由 inforstack评论关闭

类别：开发者工具 / 工程方法论 1. 什么是 Superpowers？在 AI 编程时代，许多智能体（Agent）往往跳过设计直接编码，导致代码质量参差不齐且难以维护。Superpowers 是由顶级开发者 Jesse Vincent (obra) 发起的一套开源技能框架和软件开发方法论。它的核心理念是：不只是让 AI 写代码，而是让 AI 像资深工程师一样思考。 Superpowers 通过一套可组合的“技能库”，强制 AI 遵循测试驱动开发（TDD）、系统化调试和前置设计（Design-First）等最佳实践。 [Image 1: Ad-hoc Coding vs. Superpowers Workflow] (视觉建议：左侧展示混乱的代码堆砌，标注“猜想与重写”；右侧展示清晰的阶梯式流程：头脑风暴 -> 设计规范 -> 编写测试 -> 实施计划 -> 验证完成) 2. 核心哲学：系统化胜过随机性 Superpowers 的架构建立在四个严谨的原则之上：测试驱动开发 (TDD)：永远先写测试，再写代码。强制执行 “红-绿-重构” 循环。系统化胜过随机猜想：建立标准化的调试和开发流程，消除 AI 的“幻觉”和盲目尝试。复杂度削减：将“保持简单”作为首要目标，防止 AI 生成过度设计的冗余代码。事实胜于雄辩：在声明成功之前，必须通过自动化的验证步骤，用证据证明功能已修复。 3. 核心技能库 (The Skills Library) Superpowers 提供的技能并非简单的指令，而是带有“硬性约束”的工作流节点： 3.1 启发式头脑风暴 (Socratic Brainstorming) 在动笔之前，智能体会启动“苏格拉底式”追问，提炼需求细节，探索架构替代方案，并生成一份易于人类阅读和审批的设计文档。 3.2 极简任务分解 (Bite-sized Planning) 将复杂的开发任务拆解为每个仅需 2-5 分钟即可完成的原子任务，每个任务都包含明确的文件路径、代码逻辑和验证步骤。 3.3 四阶段系统化调试 (4-Phase Debugging) 告别反复重试。技能要求智能体通过：根因追踪（Root-cause tracing）、纵深防御（Defense-in-depth）、条件等待验证等四个阶段，彻底解决 Bug 及其潜在隐患。 3.4 自动化 Git 工作树 (Git Worktrees) 自动为每个任务创建隔离的开发分支，运行环境配置，并验证清洁的测试基线，确保开发过程的工程化整洁。 4. 跨平台兼容性 Superpowers 作为一个方法论框架，可以无缝集成到您现有的 AI 编程环境中： Claude Code / Cursor：通过插件市场直接安装。 OpenClaw / Codex：支持手动配置与集成，作为智能体的底层指令集。 5. 结语：让 AI 具备“合规性” Superpowers 的独特之处在于它应用了心理学中的“说服力原则”，通过压力场景测试（Pressure Scenarios），确保 AI 智能体即使在面临时间压力或沉没成本时，依然能够坚持执行 TDD 和文档编写等“繁琐但正确”的技能。它不仅赋予了 AI 编程的“超能力”，更赋予了它作为专业工程师的纪律性。资源链接 GitHub 仓库： obra/superpowers 技术深度解析：为什么心理学原则能改变代码质量？...

探索 OpenClaw 智能体技能 —— 从“对话助手”向“执行专家”的跨越

8 4 月, 20268 4 月, 2026 由 inforstack评论关闭

1. 什么是 OpenClaw Agent Skills？在传统的 AI 交互中，大语言模型（LLM）往往受限于“言语”层面。而 OpenClaw 的核心使命是通过 Agent Skills（智能体技能）体系，赋予模型直接操作外部世界的能力。所谓“技能”，本质上是一套标准化的工具调用（Tool Calling）协议。它允许 OpenClaw 在感知到用户需求后，自主决定调用哪些本地或远程工具（如搜索、文件读写、代码运行、数据库查询等），从而完成复杂的闭环任务。 [Image 1: The "Brain to Hands" Evolution] (视觉建议：左侧展示一个孤立的大脑代表模型，右侧展示大脑通过多条机械臂连接到服务器、终端和 API，代表 Agent Skills) 2. 核心架构：插件化技能系统 OpenClaw 的技能系统采用了高度解耦的插件化设计，其卓越性体现在以下三个维度： 2.1 动态发现与自描述每一个 Skill 都包含一个精密的 manifest.json 描述文件。模型在启动时会自动扫描这些技能，并理解它们的入参格式、返回类型及适用场景。这种“即插即用”的设计意味着开发者无需修改核心代码即可扩展功能。 2.2 跨平台兼容性无论是本地运行的 Ollama，还是云端的 Claude 3.5 或 Gemma 4，OpenClaw 都能将复杂的插件逻辑抽象为模型可理解的 Function Calling 格式，确保技能在不同底座模型间的一致性表现。 2.3 安全沙盒机制所有的执行类技能（如 shell_execute）均运行在受控的沙盒环境中。用户可以通过配置文件定义权限白名单，确保 AI 在自动执行任务时不会触碰敏感数据或核心系统设置。 3. 典型技能示例与实战应用目前 OpenClaw 已原生内置并支持扩展多种高价值技能：代码审计技能 (code_analyzer)：自动扫描当前目录下的源代码，识别潜在的 Bug 或性能瓶颈，并给出重构建议。多模态感知技能 (vision_interpreter)：结合 Gemma 4 的能力，分析屏幕截图或设计稿，自动生成 React 或 Tailwind CSS 代码。实时调研技能 (web_researcher)：自动爬取多个技术网站，汇总最新行业动态并输出结构化报告。 4. 如何开发你的第一个自定义技能？为 OpenClaw 编写技能非常简单，只需三步：定义逻辑：使用 Python 或 TypeScript 编写工具函数。编写描述：为函数添加详细的 Docstring，明确每个参数的含义（模型将依靠这些描述来决定何时调用该工具）。注册加载：将脚本放入 ~/.openclaw/skills/ 目录，重启即生效。 TypeScript // 示例：一个简单的天气获取技能定义 export const getWeather = { name: "get_weather", description: "获取指定城市的实时天气信息", parameters: { type: "object", properties: { location: { type: "string", description: "城市名称，如：上海" } }, required: ["location"] }, execute: async ({ location }) => { // 调用外部 API 的逻辑 } }; 5. 结语：构建你的私有技能库 OpenClaw Agent Skills 不仅仅是一个功能模块，它是开发者构建“自动化数字分身”的基础工具。随着技能库的不断丰富，你的 OpenClaw 将从一个简单的聊天窗口，进化为一个深谙你工作流、能自主解决问题的工程专家。...