敏感数据过滤

PicoClaw 会自动从工具结果中过滤敏感值 —— 如 API 密钥、令牌和密钥 —— 在将其发送给 LLM 之前。这可以防止凭据泄漏到模型上下文中，被回显给用户或被记录到日志中。

值的收集方式

敏感值在启动时从 .security.yml 文件中收集。该文件中定义的每个字符串值都被视为潜在的密钥。

过滤在 tools 部分下进行配置：

字段	类型	默认值	说明
`filter_sensitive_data`	bool	`true`	启用或禁用敏感数据过滤。
`filter_min_length`	int	`8`	被视为需要过滤的值的最小长度。短于此长度的值将被忽略，以避免误报。

也可以通过环境变量切换过滤：

export PICOCLAW_TOOLS_FILTER_SENSITIVE_DATA=false

假设 .security.yml 包含：

openai:
  api_key: "sk-abc123xxxxxxxxxxxxxxxxxx"
database:
  password: "super-secret-db-pass"

工具返回的内容为：

Connected to database with password super-secret-db-pass
API response from sk-abc123xxxxxxxxxxxxxxxxxx: {"status": "ok"}

LLM 将看到：

Connected to database with password [FILTERED]
API response from [FILTERED]: {"status": "ok"}

短内容快速路径 —— 工具结果短于最小过滤长度时，直接返回而不进行扫描。
O(n+m) 替换 —— 底层 strings.Replacer 使用高效的类 Aho-Corasick 算法，其中 n 是内容长度，m 是所有模式的总长度。
延迟初始化 —— 替换器在启动时构建一次，后续所有工具调用复用。