Files
argon-theme/.kiro/steering/ai-spam-detection-optimization.md

159 lines
5.0 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# AI 垃圾评论检测优化方案
## 当前问题
1. **Prompt 单一**:只有一个固定的 Prompt无法适应不同场景
2. **缺少置信度**AI 判断没有置信度评分,无法区分确定性高低
3. **处理过于机械**:直接根据 AI 结果自动处理,缺少灵活性
4. **缺少上下文**:只分析评论本身,没有考虑文章内容和用户历史
5. **无学习机制**:无法根据管理员的审核结果优化判断
## 优化方案
### 1. 多级 Prompt 系统
**极简模式minimal**
- 适用场景API 费用敏感、快速检测
- Token 消耗:约 100-150 tokens
- 特点:只判断是否垃圾,理由简短
**标准模式standard** - 默认
- 适用场景:日常使用,平衡准确性和成本
- Token 消耗:约 200-300 tokens
- 特点:详细审核标准,包含置信度和处理建议
**增强模式enhanced**
- 适用场景:重要内容、疑难案例
- Token 消耗:约 300-500 tokens
- 特点:多维度分析,包含综合分析说明
### 2. 智能置信度系统
AI 返回置信度0-1
- **0.9-1.0**:非常确定 → 可自动处理
- **0.7-0.9**:比较确定 → 建议自动处理
- **0.5-0.7**:中等确定 → 建议人工审核
- **0.0-0.5**:不太确定 → 必须人工审核
### 3. 智能处理建议
AI 返回处理建议:
- **auto**:自动处理(高置信度垃圾内容)
- **review**:建议人工审核(中等置信度或边缘情况)
- **approve**:建议直接通过(正常内容)
管理员可设置:
- 只有置信度 > 0.85 才自动处理
- 置信度 0.5-0.85 标记为待审核
- 置信度 < 0.5 直接通过并记录
### 4. 上下文增强
评论检测时提供:
- **文章信息**:标题、摘要(判断相关性)
- **用户历史**:检测次数、通过率(判断可信度)
- **评论时间**:判断是否为批量发送
- **IP 地址**:判断是否为已知垃圾来源
### 5. 多维度分析
AI 分析维度:
- **内容合规性**:是否违规
- **内容质量**:是否有实质性内容
- **用户行为**:用户名、邮箱、网站是否可疑
- **上下文相关性**:与文章主题的相关性
### 6. 学习优化机制
记录管理员的审核决策:
- 管理员批准了 AI 标记的垃圾评论 → 降低该类型的检测阈值
- 管理员拒绝了 AI 的判断 → 提高该类型的检测阈值
- 定期分析误判率,优化 Prompt
## 实施步骤
### 步骤 1添加 Prompt 模式选择
在设置页添加选项:
```php
<select name="argon_comment_spam_detection_prompt_mode">
<option value="minimal">极简模式(省 token</option>
<option value="standard" selected>标准模式(推荐)</option>
<option value="enhanced">增强模式(更准确)</option>
<option value="custom">自定义 Prompt</option>
</select>
```
### 步骤 2优化检测函数
添加新函数:
- `argon_get_spam_detection_prompt($mode)` - 获取不同模式的 Prompt
- `argon_build_comment_context($comment)` - 构建评论上下文
- `argon_should_auto_process($result)` - 根据置信度判断是否自动处理
### 步骤 3优化处理逻辑
根据 AI 的建议和置信度:
```php
if ($confidence > 0.85 && $suggestion === 'auto') {
// 自动处理
} elseif ($confidence > 0.5) {
// 标记为待审核
} else {
// 直接通过,记录低置信度
}
```
### 步骤 4添加学习机制
记录管理员操作:
```php
// 管理员批准/拒绝 AI 判断时
update_option('argon_spam_detection_feedback_' . $pattern_hash, [
'ai_decision' => $ai_result,
'admin_decision' => $admin_action,
'timestamp' => time()
]);
```
### 步骤 5优化显示界面
在后台评论列表显示:
- AI 置信度标签
- 处理建议
- 综合分析(鼠标悬停显示)
## 预期效果
1. **准确率提升**:通过多维度分析和置信度评分,减少误判
2. **灵活性增强**:管理员可根据置信度选择处理方式
3. **成本优化**:提供多级 Prompt平衡准确性和成本
4. **持续优化**:通过学习机制不断提升判断准确性
5. **用户体验**:减少误杀正常评论,提升用户满意度
## 配置建议
### 小型博客(评论量 < 100/天)
- Prompt 模式:标准模式
- 实时检测:智能抽查 20%
- 自动处理阈值:置信度 > 0.9
### 中型博客(评论量 100-500/天)
- Prompt 模式:标准模式
- 实时检测:智能抽查 30%
- 自动处理阈值:置信度 > 0.85
### 大型博客(评论量 > 500/天)
- Prompt 模式:极简模式
- 实时检测:智能抽查 40%
- 自动处理阈值:置信度 > 0.8
- 定期使用增强模式批量扫描待审核评论
## 注意事项
1. **API 成本**:增强模式会消耗更多 tokens建议按需使用
2. **响应时间**上下文信息越多AI 响应时间越长
3. **隐私保护**:不要将敏感信息(如完整邮箱)发送给 AI
4. **误判处理**:始终提供人工审核入口,避免误杀
5. **定期review**:定期检查 AI 判断结果,优化 Prompt