chore: 删除临时优化脚本

This commit is contained in:
2026-01-23 16:23:05 +08:00
parent 731894f1cd
commit bbe94f9073

View File

@@ -0,0 +1,158 @@
# AI 垃圾评论检测优化方案
## 当前问题
1. **Prompt 单一**:只有一个固定的 Prompt无法适应不同场景
2. **缺少置信度**AI 判断没有置信度评分,无法区分确定性高低
3. **处理过于机械**:直接根据 AI 结果自动处理,缺少灵活性
4. **缺少上下文**:只分析评论本身,没有考虑文章内容和用户历史
5. **无学习机制**:无法根据管理员的审核结果优化判断
## 优化方案
### 1. 多级 Prompt 系统
**极简模式minimal**
- 适用场景API 费用敏感、快速检测
- Token 消耗:约 100-150 tokens
- 特点:只判断是否垃圾,理由简短
**标准模式standard** - 默认
- 适用场景:日常使用,平衡准确性和成本
- Token 消耗:约 200-300 tokens
- 特点:详细审核标准,包含置信度和处理建议
**增强模式enhanced**
- 适用场景:重要内容、疑难案例
- Token 消耗:约 300-500 tokens
- 特点:多维度分析,包含综合分析说明
### 2. 智能置信度系统
AI 返回置信度0-1
- **0.9-1.0**:非常确定 → 可自动处理
- **0.7-0.9**:比较确定 → 建议自动处理
- **0.5-0.7**:中等确定 → 建议人工审核
- **0.0-0.5**:不太确定 → 必须人工审核
### 3. 智能处理建议
AI 返回处理建议:
- **auto**:自动处理(高置信度垃圾内容)
- **review**:建议人工审核(中等置信度或边缘情况)
- **approve**:建议直接通过(正常内容)
管理员可设置:
- 只有置信度 > 0.85 才自动处理
- 置信度 0.5-0.85 标记为待审核
- 置信度 < 0.5 直接通过并记录
### 4. 上下文增强
评论检测时提供:
- **文章信息**:标题、摘要(判断相关性)
- **用户历史**:检测次数、通过率(判断可信度)
- **评论时间**:判断是否为批量发送
- **IP 地址**:判断是否为已知垃圾来源
### 5. 多维度分析
AI 分析维度:
- **内容合规性**:是否违规
- **内容质量**:是否有实质性内容
- **用户行为**:用户名、邮箱、网站是否可疑
- **上下文相关性**:与文章主题的相关性
### 6. 学习优化机制
记录管理员的审核决策:
- 管理员批准了 AI 标记的垃圾评论 → 降低该类型的检测阈值
- 管理员拒绝了 AI 的判断 → 提高该类型的检测阈值
- 定期分析误判率,优化 Prompt
## 实施步骤
### 步骤 1添加 Prompt 模式选择
在设置页添加选项:
```php
<select name="argon_comment_spam_detection_prompt_mode">
<option value="minimal">极简模式(省 token</option>
<option value="standard" selected>标准模式(推荐)</option>
<option value="enhanced">增强模式(更准确)</option>
<option value="custom">自定义 Prompt</option>
</select>
```
### 步骤 2优化检测函数
添加新函数:
- `argon_get_spam_detection_prompt($mode)` - 获取不同模式的 Prompt
- `argon_build_comment_context($comment)` - 构建评论上下文
- `argon_should_auto_process($result)` - 根据置信度判断是否自动处理
### 步骤 3优化处理逻辑
根据 AI 的建议和置信度:
```php
if ($confidence > 0.85 && $suggestion === 'auto') {
// 自动处理
} elseif ($confidence > 0.5) {
// 标记为待审核
} else {
// 直接通过,记录低置信度
}
```
### 步骤 4添加学习机制
记录管理员操作:
```php
// 管理员批准/拒绝 AI 判断时
update_option('argon_spam_detection_feedback_' . $pattern_hash, [
'ai_decision' => $ai_result,
'admin_decision' => $admin_action,
'timestamp' => time()
]);
```
### 步骤 5优化显示界面
在后台评论列表显示:
- AI 置信度标签
- 处理建议
- 综合分析(鼠标悬停显示)
## 预期效果
1. **准确率提升**:通过多维度分析和置信度评分,减少误判
2. **灵活性增强**:管理员可根据置信度选择处理方式
3. **成本优化**:提供多级 Prompt平衡准确性和成本
4. **持续优化**:通过学习机制不断提升判断准确性
5. **用户体验**:减少误杀正常评论,提升用户满意度
## 配置建议
### 小型博客(评论量 < 100/天)
- Prompt 模式:标准模式
- 实时检测:智能抽查 20%
- 自动处理阈值:置信度 > 0.9
### 中型博客(评论量 100-500/天)
- Prompt 模式:标准模式
- 实时检测:智能抽查 30%
- 自动处理阈值:置信度 > 0.85
### 大型博客(评论量 > 500/天)
- Prompt 模式:极简模式
- 实时检测:智能抽查 40%
- 自动处理阈值:置信度 > 0.8
- 定期使用增强模式批量扫描待审核评论
## 注意事项
1. **API 成本**:增强模式会消耗更多 tokens建议按需使用
2. **响应时间**上下文信息越多AI 响应时间越长
3. **隐私保护**:不要将敏感信息(如完整邮箱)发送给 AI
4. **误判处理**:始终提供人工审核入口,避免误杀
5. **定期review**:定期检查 AI 判断结果,优化 Prompt