Files
argon-theme/.kiro/steering/ai-spam-detection-optimization.md

5.0 KiB
Raw Blame History

AI 垃圾评论检测优化方案

当前问题

  1. Prompt 单一:只有一个固定的 Prompt无法适应不同场景
  2. 缺少置信度AI 判断没有置信度评分,无法区分确定性高低
  3. 处理过于机械:直接根据 AI 结果自动处理,缺少灵活性
  4. 缺少上下文:只分析评论本身,没有考虑文章内容和用户历史
  5. 无学习机制:无法根据管理员的审核结果优化判断

优化方案

1. 多级 Prompt 系统

极简模式minimal

  • 适用场景API 费用敏感、快速检测
  • Token 消耗:约 100-150 tokens
  • 特点:只判断是否垃圾,理由简短

标准模式standard - 默认

  • 适用场景:日常使用,平衡准确性和成本
  • Token 消耗:约 200-300 tokens
  • 特点:详细审核标准,包含置信度和处理建议

增强模式enhanced

  • 适用场景:重要内容、疑难案例
  • Token 消耗:约 300-500 tokens
  • 特点:多维度分析,包含综合分析说明

2. 智能置信度系统

AI 返回置信度0-1

  • 0.9-1.0:非常确定 → 可自动处理
  • 0.7-0.9:比较确定 → 建议自动处理
  • 0.5-0.7:中等确定 → 建议人工审核
  • 0.0-0.5:不太确定 → 必须人工审核

3. 智能处理建议

AI 返回处理建议:

  • auto:自动处理(高置信度垃圾内容)
  • review:建议人工审核(中等置信度或边缘情况)
  • approve:建议直接通过(正常内容)

管理员可设置:

  • 只有置信度 > 0.85 才自动处理
  • 置信度 0.5-0.85 标记为待审核
  • 置信度 < 0.5 直接通过并记录

4. 上下文增强

评论检测时提供:

  • 文章信息:标题、摘要(判断相关性)
  • 用户历史:检测次数、通过率(判断可信度)
  • 评论时间:判断是否为批量发送
  • IP 地址:判断是否为已知垃圾来源

5. 多维度分析

AI 分析维度:

  • 内容合规性:是否违规
  • 内容质量:是否有实质性内容
  • 用户行为:用户名、邮箱、网站是否可疑
  • 上下文相关性:与文章主题的相关性

6. 学习优化机制

记录管理员的审核决策:

  • 管理员批准了 AI 标记的垃圾评论 → 降低该类型的检测阈值
  • 管理员拒绝了 AI 的判断 → 提高该类型的检测阈值
  • 定期分析误判率,优化 Prompt

实施步骤

步骤 1添加 Prompt 模式选择

在设置页添加选项:

<select name="argon_comment_spam_detection_prompt_mode">
    <option value="minimal">极简模式(省 token</option>
    <option value="standard" selected>标准模式(推荐)</option>
    <option value="enhanced">增强模式(更准确)</option>
    <option value="custom">自定义 Prompt</option>
</select>

步骤 2优化检测函数

添加新函数:

  • argon_get_spam_detection_prompt($mode) - 获取不同模式的 Prompt
  • argon_build_comment_context($comment) - 构建评论上下文
  • argon_should_auto_process($result) - 根据置信度判断是否自动处理

步骤 3优化处理逻辑

根据 AI 的建议和置信度:

if ($confidence > 0.85 && $suggestion === 'auto') {
    // 自动处理
} elseif ($confidence > 0.5) {
    // 标记为待审核
} else {
    // 直接通过,记录低置信度
}

步骤 4添加学习机制

记录管理员操作:

// 管理员批准/拒绝 AI 判断时
update_option('argon_spam_detection_feedback_' . $pattern_hash, [
    'ai_decision' => $ai_result,
    'admin_decision' => $admin_action,
    'timestamp' => time()
]);

步骤 5优化显示界面

在后台评论列表显示:

  • AI 置信度标签
  • 处理建议
  • 综合分析(鼠标悬停显示)

预期效果

  1. 准确率提升:通过多维度分析和置信度评分,减少误判
  2. 灵活性增强:管理员可根据置信度选择处理方式
  3. 成本优化:提供多级 Prompt平衡准确性和成本
  4. 持续优化:通过学习机制不断提升判断准确性
  5. 用户体验:减少误杀正常评论,提升用户满意度

配置建议

小型博客(评论量 < 100/天)

  • Prompt 模式:标准模式
  • 实时检测:智能抽查 20%
  • 自动处理阈值:置信度 > 0.9

中型博客(评论量 100-500/天)

  • Prompt 模式:标准模式
  • 实时检测:智能抽查 30%
  • 自动处理阈值:置信度 > 0.85

大型博客(评论量 > 500/天)

  • Prompt 模式:极简模式
  • 实时检测:智能抽查 40%
  • 自动处理阈值:置信度 > 0.8
  • 定期使用增强模式批量扫描待审核评论

注意事项

  1. API 成本:增强模式会消耗更多 tokens建议按需使用
  2. 响应时间上下文信息越多AI 响应时间越长
  3. 隐私保护:不要将敏感信息(如完整邮箱)发送给 AI
  4. 误判处理:始终提供人工审核入口,避免误杀
  5. 定期review:定期检查 AI 判断结果,优化 Prompt