5.0 KiB
5.0 KiB
AI 垃圾评论检测优化方案
当前问题
- Prompt 单一:只有一个固定的 Prompt,无法适应不同场景
- 缺少置信度:AI 判断没有置信度评分,无法区分确定性高低
- 处理过于机械:直接根据 AI 结果自动处理,缺少灵活性
- 缺少上下文:只分析评论本身,没有考虑文章内容和用户历史
- 无学习机制:无法根据管理员的审核结果优化判断
优化方案
1. 多级 Prompt 系统
极简模式(minimal)
- 适用场景:API 费用敏感、快速检测
- Token 消耗:约 100-150 tokens
- 特点:只判断是否垃圾,理由简短
标准模式(standard) - 默认
- 适用场景:日常使用,平衡准确性和成本
- Token 消耗:约 200-300 tokens
- 特点:详细审核标准,包含置信度和处理建议
增强模式(enhanced)
- 适用场景:重要内容、疑难案例
- Token 消耗:约 300-500 tokens
- 特点:多维度分析,包含综合分析说明
2. 智能置信度系统
AI 返回置信度(0-1):
- 0.9-1.0:非常确定 → 可自动处理
- 0.7-0.9:比较确定 → 建议自动处理
- 0.5-0.7:中等确定 → 建议人工审核
- 0.0-0.5:不太确定 → 必须人工审核
3. 智能处理建议
AI 返回处理建议:
- auto:自动处理(高置信度垃圾内容)
- review:建议人工审核(中等置信度或边缘情况)
- approve:建议直接通过(正常内容)
管理员可设置:
- 只有置信度 > 0.85 才自动处理
- 置信度 0.5-0.85 标记为待审核
- 置信度 < 0.5 直接通过并记录
4. 上下文增强
评论检测时提供:
- 文章信息:标题、摘要(判断相关性)
- 用户历史:检测次数、通过率(判断可信度)
- 评论时间:判断是否为批量发送
- IP 地址:判断是否为已知垃圾来源
5. 多维度分析
AI 分析维度:
- 内容合规性:是否违规
- 内容质量:是否有实质性内容
- 用户行为:用户名、邮箱、网站是否可疑
- 上下文相关性:与文章主题的相关性
6. 学习优化机制
记录管理员的审核决策:
- 管理员批准了 AI 标记的垃圾评论 → 降低该类型的检测阈值
- 管理员拒绝了 AI 的判断 → 提高该类型的检测阈值
- 定期分析误判率,优化 Prompt
实施步骤
步骤 1:添加 Prompt 模式选择
在设置页添加选项:
<select name="argon_comment_spam_detection_prompt_mode">
<option value="minimal">极简模式(省 token)</option>
<option value="standard" selected>标准模式(推荐)</option>
<option value="enhanced">增强模式(更准确)</option>
<option value="custom">自定义 Prompt</option>
</select>
步骤 2:优化检测函数
添加新函数:
argon_get_spam_detection_prompt($mode)- 获取不同模式的 Promptargon_build_comment_context($comment)- 构建评论上下文argon_should_auto_process($result)- 根据置信度判断是否自动处理
步骤 3:优化处理逻辑
根据 AI 的建议和置信度:
if ($confidence > 0.85 && $suggestion === 'auto') {
// 自动处理
} elseif ($confidence > 0.5) {
// 标记为待审核
} else {
// 直接通过,记录低置信度
}
步骤 4:添加学习机制
记录管理员操作:
// 管理员批准/拒绝 AI 判断时
update_option('argon_spam_detection_feedback_' . $pattern_hash, [
'ai_decision' => $ai_result,
'admin_decision' => $admin_action,
'timestamp' => time()
]);
步骤 5:优化显示界面
在后台评论列表显示:
- AI 置信度标签
- 处理建议
- 综合分析(鼠标悬停显示)
预期效果
- 准确率提升:通过多维度分析和置信度评分,减少误判
- 灵活性增强:管理员可根据置信度选择处理方式
- 成本优化:提供多级 Prompt,平衡准确性和成本
- 持续优化:通过学习机制不断提升判断准确性
- 用户体验:减少误杀正常评论,提升用户满意度
配置建议
小型博客(评论量 < 100/天)
- Prompt 模式:标准模式
- 实时检测:智能抽查 20%
- 自动处理阈值:置信度 > 0.9
中型博客(评论量 100-500/天)
- Prompt 模式:标准模式
- 实时检测:智能抽查 30%
- 自动处理阈值:置信度 > 0.85
大型博客(评论量 > 500/天)
- Prompt 模式:极简模式
- 实时检测:智能抽查 40%
- 自动处理阈值:置信度 > 0.8
- 定期使用增强模式批量扫描待审核评论
注意事项
- API 成本:增强模式会消耗更多 tokens,建议按需使用
- 响应时间:上下文信息越多,AI 响应时间越长
- 隐私保护:不要将敏感信息(如完整邮箱)发送给 AI
- 误判处理:始终提供人工审核入口,避免误杀
- 定期review:定期检查 AI 判断结果,优化 Prompt