feat: 实现 Mermaid 代码块魔改支持

- 添加 convertMermaidCodeblocks() 函数，在代码高亮前拦截 mermaid 代码块 - 支持标准 Markdown 代码块 (\\\mermaid) 渲染 - 更新 detectMermaidBlocks() 添加 mermaid-from-codeblock 选择器 - 更新 extractMermaidCode() 支持新容器类型 - 创建测试文件 test-codeblock-magic.html - 更新用户文档、开发者文档和 FAQ - 完全绕过代码高亮和 WordPress 格式化 - 支持 PJAX 页面切换 - 特殊字符和换行符正确保留
2026-01-24 21:35:12 +08:00
parent e5e8a245be
commit 29bfd284e0
18 changed files with 5566 additions and 50 deletions
--- a/tests/test-ai-comment-flow.md
+++ b/tests/test-ai-comment-flow.md
@@ -0,0 +1,187 @@
+# AI 评论审核流程说明
+
+## 流程概述
+
+本文档通过 Mermaid 流程图详细展示用户提交评论后，系统进行 AI 审核的全流程，涵盖预处理、规则判断、AI 检测、结果处理、数据学习等核心环节。
+
+## 流程图
+
+::: mermaid
+flowchart TD
+Start([用户提交评论]) --> PreProcess[预处理评论<br/>钩子：preprocess_comment/post_comment_preprocessing]
+PreProcess --> CheckEnabled{启用 AI 检测?}
+CheckEnabled -->|否| SaveComment[保存评论]
+CheckEnabled -->|是| CheckMode{检测模式?}
+CheckMode -->|manual（关闭实时检测）| SaveComment
+CheckMode -->|keyword/sample/all| CheckLoggedIn{已登录用户?}
+CheckLoggedIn -->|是且跳过登录用户| SaveComment
+CheckLoggedIn -->|否或不跳过| CheckWhitelist{在白名单?}
+CheckWhitelist -->|是| SaveComment
+CheckWhitelist -->|否| CheckKeyword[检查关键字触发]
+CheckKeyword --> DecideCheck{决定是否检测}
+DecideCheck -->|keyword模式且触发关键字| NeedCheck[需要检测]
+DecideCheck -->|sample模式且触发关键字| NeedCheck
+DecideCheck -->|sample模式且随机抽中| NeedCheck
+DecideCheck -->|all模式| NeedCheck
+DecideCheck -->|其他情况| SaveComment
+NeedCheck --> SetPending[强制设置 comment_approved=0<br/>待审核状态]
+SetPending --> SetFlag[设置 _argon_needs_spam_check=true]
+SetFlag --> SaveKeywords[保存触发的关键字]
+SaveKeywords --> SaveComment
+SaveComment --> CommentPost[评论入库后处理<br/>钩子：comment_post/post_comment_updatemetas]
+CommentPost --> SaveMeta[保存评论元数据]
+SaveMeta --> CheckNeedFlag{有 _argon_needs_spam_check 标记?}
+CheckNeedFlag -->|否| ShowPending[显示审核中状态]
+CheckNeedFlag -->|是| SaveCheckMeta[保存检测标记到数据库]
+SaveCheckMeta --> AutoDetect[触发自动检测<br/>钩子：comment_post/argon_auto_detect_spam_on_comment]
+AutoDetect --> CheckSaved{有检测标记?}
+CheckSaved -->|否| End1([结束])
+CheckSaved -->|是| CheckDetected{已检测过?}
+CheckDetected -->|是| End2([结束])
+CheckDetected -->|否| CheckReason{检测原因?}
+CheckReason -->|关键字触发| SyncDetect[立即同步检测]
+CheckReason -->|其他| AsyncDetect[异步检测（延迟1秒）]
+SyncDetect --> DetectHandler[检测处理函数<br/>argon_async_spam_detection_handler]
+AsyncDetect --> DetectHandler
+DetectHandler --> CallAI[调用 AI API<br/>argon_detect_spam_comment]
+CallAI --> GetPrompt[根据 Prompt 模式获取提示词]
+CallAI --> BuildContext[构建评论上下文（用户名+内容）]
+BuildContext --> SendAPI[发送到 AI API]
+SendAPI --> ParseResult[解析 AI 返回结果]
+ParseResult --> SaveTime[记录检测时间]
+SaveTime --> GenCode[生成识别码]
+GenCode --> UpdateStats[更新用户统计]
+UpdateStats --> CheckResult{检测结果?}
+CheckResult -->|内容违规（高置信度）| CheckAction1{自动处理方式?}
+CheckResult -->|内容违规（低置信度）| MarkLowConf[标记为疑似垃圾<br/>等待人工审核]
+CheckResult -->|内容正常/用户名违规/无邮箱| TrashNoEmail[移入回收站]
+CheckResult -->|内容正常/用户名违规/有邮箱| ChangeUsername[修改用户名]
+CheckResult -->|都正常| MarkNormal[标记为正常评论]
+CheckAction1 -->|trash| TrashComment[移入回收站]
+CheckAction1 -->|hold| HoldComment[标记为待审核]
+CheckAction1 -->|mark| MarkOnly[仅标记不处理]
+TrashComment --> SendSpamEmail[发送垃圾评论通知]
+HoldComment --> SendSpamEmail
+MarkOnly --> SaveResult1[保存检测结果]
+SendSpamEmail --> SaveResult1
+MarkLowConf --> SaveResult2[保存检测结果]
+TrashNoEmail --> SaveResult3[保存检测结果]
+ChangeUsername --> GenNewName[生成新用户名]
+GenNewName --> UpdateDB[更新数据库]
+UpdateDB --> SendChangeEmail[发送用户名变更通知]
+SendChangeEmail --> SaveResult4[保存检测结果]
+MarkNormal --> SaveResult5[保存检测结果]
+SaveResult1 --> AILearn{启用 AI 学习?}
+SaveResult2 --> AILearn
+SaveResult3 --> AILearn
+SaveResult4 --> AILearn
+SaveResult5 --> AILearn
+AILearn -->|是| ExtractKeywords[提取关键词]
+AILearn -->|否| DetectEnd([检测完成])
+ExtractKeywords --> UpdateKeywords[更新学习关键词库]
+UpdateKeywords --> DetectEnd
+ShowPending --> UserView([用户看到：审核中状态])
+DetectEnd --> AdminReview([管理员审核])
+
+style Start fill:#e1f5e1,stroke:#2e7d32,stroke-width:2px
+style End1 fill:#ffe1e1,stroke:#c62828,stroke-width:2px
+style End2 fill:#ffe1e1,stroke:#c62828,stroke-width:2px
+style DetectEnd fill:#e1f5e1,stroke:#2e7d32,stroke-width:2px
+style UserView fill:#fff4e1,stroke:#ff8f00,stroke-width:2px
+style AdminReview fill:#e1e8ff,stroke:#1565c0,stroke-width:2px
+style NeedCheck fill:#ffcccc,stroke:#c62828,stroke-width:1px
+style SetPending fill:#ffcccc,stroke:#c62828,stroke-width:1px
+style TrashComment fill:#ff6b6b,stroke:#c62828,stroke-width:1px
+style TrashNoEmail fill:#ff6b6b,stroke:#c62828,stroke-width:1px
+style HoldComment fill:#ffa500,stroke:#ff8f00,stroke-width:1px
+style MarkLowConf fill:#ffa500,stroke:#ff8f00,stroke-width:1px
+style ChangeUsername fill:#4ecdc4,stroke:#00897b,stroke-width:1px
+style MarkNormal fill:#95e1d3,stroke:#2e7d32,stroke-width:1px
+:::
+
+## 流程关键节点说明
+
+### 1. 预处理阶段
+
+- 触发 `preprocess_comment`/`post_comment_preprocessing` 钩子，完成评论基础清洗。
+- 优先判断是否启用 AI 检测，未启用则直接保存评论。
+
+### 2. 检测规则判断
+
+- 检测模式分 4 类：manual（关闭）、keyword（关键字）、sample（抽样）、all（全量）。
+- 白名单用户、已登录且配置跳过的用户，直接跳过检测。
+- keyword/sample 模式下，仅关键字触发/随机抽中时才启动检测。
+
+### 3. AI 检测执行
+
+- 关键字触发：立即同步检测；其他情况：延迟 1 秒异步检测。
+- 调用 `argon_detect_spam_comment` 接口，拼接用户名+评论内容作为上下文发送 AI。
+
+### 4. 结果处理逻辑
+
+| 检测结果                | 处理方式                          |
+|-------------------------|-----------------------------------|
+| 内容违规（高置信度）| 按配置自动处理（移入回收站/待审核/仅标记） |
+| 内容违规（低置信度）| 标记疑似垃圾，等待人工审核        |
+| 用户名违规（无邮箱）| 直接移入回收站                    |
+| 用户名违规（有邮箱）| 自动生成新用户名并通知用户        |
+| 内容+用户名均正常       | 标记为正常评论                    |
+
+### 5. 后续环节
+
+- 所有检测结果均保存至数据库，支持 AI 学习功能（提取关键词更新词库）。
+- 用户侧仅展示"审核中"状态，最终结果需管理员复核。
+
+## 技术说明
+
+### 使用的钩子
+
+- `preprocess_comment` - 评论预处理
+- `post_comment_preprocessing` - 评论预处理（备用）
+- `comment_post` - 评论入库后
+- `post_comment_updatemetas` - 更新评论元数据
+- `argon_auto_detect_spam_on_comment` - 自动检测触发
+
+### 关键函数
+
+- `argon_detect_spam_comment()` - AI 检测主函数
+- `argon_async_spam_detection_handler()` - 异步检测处理
+- `argon_get_spam_detection_prompt()` - 获取检测 Prompt
+- `argon_build_comment_context()` - 构建评论上下文
+
+### 数据库字段
+
+- `comment_approved` - 评论审核状态（0=待审核，1=已通过）
+- `_argon_needs_spam_check` - 是否需要 AI 检测标记
+- `_argon_spam_detection_result` - AI 检测结果
+- `_argon_spam_detection_time` - 检测时间戳
+- `_argon_spam_keywords` - 触发的关键字
+
+## 配置建议
+
+### 小型博客（评论量 < 100/天）
+
+- 检测模式：keyword（关键字触发）
+- Prompt 模式：标准模式
+- 自动处理阈值：置信度 > 0.9
+
+### 中型博客（评论量 100-500/天）
+
+- 检测模式：sample（智能抽样）
+- Prompt 模式：标准模式
+- 自动处理阈值：置信度 > 0.85
+
+### 大型博客（评论量 > 500/天）
+
+- 检测模式：sample（智能抽样 30-40%）
+- Prompt 模式：极简模式
+- 自动处理阈值：置信度 > 0.8
+- 定期批量扫描待审核评论
+
+## 注意事项
+
+1. **API 成本控制**：合理设置检测模式和抽样比例
+2. **误判处理**：始终保留人工审核入口
+3. **隐私保护**：不要将敏感信息发送给 AI
+4. **性能优化**：关键字触发使用同步检测，其他使用异步
+5. **定期优化**：根据误判率调整 Prompt 和阈值