昨天看到一个很好的GitHub项目,是一个claude skills,写人味儿文章的,我觉得这个项目挺有意思的。
https://github.com/blader/humanizer/blob/main/README.md
打开看了一下,没有想到有好几十条AI特征的识别来避免AI味文章,这是个非常好的项目。应该有很多同学已经在使用AI来写作,但是AI写作很很多地方你看出来它就是有AI味儿,很没有人味儿。如果你去分析的话,可能会发现一些特定的结构,但是这么完整的分析AI 味的风格识别还真是很少见。 是个很有意思的项目。
维基百科的见解
“LLM使用统计算法来猜测接下来应该出现什么。结果往往会趋向于最符合统计规律、适用于最广泛情况的那个答案。”
检测到的24种模式(附前后示例)
内容模式
| # | 模式 | 修改前 | 修改后 |
|---|---|---|---|
| 1 | 意义夸大 | “标志着……发展的一个关键转折点……” | “成立于1989年,旨在收集区域统计数据” |
| 2 | 堆砌权威引用 | “被《纽约时报》、BBC、《金融时报》和《印度教徒报》引用过” | “在2024年《纽约时报》的一次采访中,她提出……” |
| 3 | 肤浅的-ing分析 | “象征着……反映了……展示了……” | 删除或用实际来源展开说明 |
| 4 | 营销推广式语言 | “坐落于令人叹为观止的地区” | “是贡德尔地区的一个小镇” |
| 5 | 模糊归因 | “专家们相信它起着至关重要的作用” | “根据2019年……的一项调查……” |
| 6 | 公式化挑战 | “尽管面临挑战……依然蓬勃发展” | 关于实际挑战的具体事实 |
语言模式
| # | 模式 | 修改前 | 修改后 |
|---|---|---|---|
| 7 | AI常用词汇 | “此外……证明了……局面……展示着” | “也……仍然很常见” |
| 8 | 回避”是”动词 | “作为……的功能……拥有……” | “是……有……” |
| 9 | 否定式平行结构 | “它不仅仅是X,还是Y” | 直接陈述观点 |
| 10 | 三连排比 | “创新、灵感与洞见” | 使用自然数量的项目 |
| 11 | 同义词循环 | “主角……主要角色……核心人物……英雄” | “主角”(意思最明确时重复使用) |
| 12 | 虚假范围 | “从大爆炸到暗物质” | 直接列出主题 |
风格模式
| # | 模式 | 修改前 | 修改后 |
|---|---|---|---|
| 13 | 破折号滥用 | “机构——而非人民——然而这仍在继续——” | 使用逗号或句号 |
| 14 | 粗体字滥用 | “OKRs, KPIs, BMC“ | “OKRs, KPIs, BMC” |
| 15 | 行内标题列表 | “性能:性能得到改善” | 转换为连贯的叙述 |
| 16 | 标题大小写 | “战略谈判与合作伙伴关系” | “战略谈判与合作伙伴关系” |
| 17 | 表情符号 | “🚀 启动阶段:💡 关键见解:” | 删除表情符号 |
| 18 | 花式引号 | 说“该项目” | 说”该项目” |
交流模式
| # | 模式 | 修改前 | 修改后 |
|---|---|---|---|
| 19 | 聊天机器人痕迹 | “希望这能帮到你!如果有任何问题请告诉我……” | 完全删除 |
| 20 | 信息不足声明 | “虽然现有资料中的细节有限……” | 查找来源或删除 |
| 21 | 奉承语气 | “好问题!你说得太对了!” | 直接回应 |
填充词和模糊表达
| # | 模式 | 修改前 | 修改后 |
|---|---|---|---|
| 22 | 填充短语 | “为了”,”由于这个事实” | “为了”,”因为” |
| 23 | 过度模糊表达 | “可能也许会” | “可能” |
| 24 | 笼统结论 | “未来一片光明” | 具体的计划或事实 |
完整示例
修改前(有AI感):
好问题!以下是一篇关于这个话题的文章。希望对你有帮助!
AI辅助编程是大型语言模型变革潜力的持久证明,标志着软件开发演进的一个关键转折点。在当今快速变化的技术格局中,这些突破性工具——坐落于研究与实践的交汇处——正在重塑工程师构思、迭代和交付的方式,凸显了它们在现代工作流程中的重要作用。
其核心价值主张很明确:简化流程、加强协作、促进统一。这不仅仅是关于自动补全;更是关于规模化释放创造力,确保组织在向用户提供无缝、直观和强大体验的同时保持敏捷。该工具作为催化剂。助手作为合作伙伴。系统作为创新的基础。
行业观察家们注意到,采用已从爱好者实验加速到企业级推广,从独立开发者到跨职能团队。这项技术曾被《纽约时报》、《连线》和《The Verge》报道过。此外,生成文档、测试和重构的能力展示了AI如何促成更好的成果,突出了自动化与人类判断之间错综复杂的相互作用。
💡 **速度**:代码生成显著加快,减少了摩擦,赋能开发者。
🚀 **质量**:通过改进训练,输出质量得到提升,有助于达到更高标准。
✅ **采用**:使用持续增长,反映了更广泛的行业趋势。
虽然根据现有信息具体细节有限,但可能可以认为这些工具可能具有一些积极效果。尽管存在新兴技术的典型挑战——包括幻觉、偏见和责任问题——该生态系统仍在蓬勃发展。为了充分实现这一潜力,团队必须与最佳实践保持一致。
总之,未来一片光明。随着我们继续迈向卓越的旅程,激动人心的时刻就在前方。如果你希望我扩展任何部分,请告诉我!
修改后(人性化):
AI编程助手能加快某些任务。在谷歌2024年的一项研究中,使用Codex的开发者在完成简单函数时比对照组快55%,但在调试或架构决策方面没有改进。
这些工具擅长处理样板代码:配置文件、测试脚手架、重复的重构工作。它们不擅长知道自己何时出错。我曾批量接受过一些建议,它们能编译通过,也能通过代码检查,但因为我没有仔细看,结果还是做错了。
我采访过的一位金融科技初创公司工程师米拉说,她使用Copilot"就像给无聊的代码用自动补全",但在提交前会检查每一行。一家大公司的资深开发人员杰克则禁用了它,因为它总是建议来自一个已弃用的内部库的模式。
生产力声明很难验证。GitHub说Copilot用户"接受了30%的建议",但接受不等于正确,正确也不等于有价值。2024年Uplevel的研究发现,使用和不使用AI助手的团队之间,在拉取请求的吞吐量上没有统计学上的显著差异。
这并不意味着这些工具没用。这意味着它们是工具。它们不能替代判断,也不能消除对测试的需求。如果你没有测试,你就无法判断建议是否正确。
因为它是对那个claude skill用的,所以如果我们平时用的话,需要把这些特征抽取出来来方便让AI去添加到prompt,方便AI去写文章 嗯,所以我直接把这个把它这个核心原则抽取出来,让deepseek做了一个简单的总结,这样的话我们可以在一些prompt里边比如说添加一个变量或者直接把粘贴上去去用,嗯 嗯,这是挺好的一个东西,然后也分享给大家可以去整合到自己的AI写作的一些工具里面
整合它的主要识别方式,使用一个 prompt 来应用它的去AI规则,你可以使用一个变量把它全放进去,比如 {{content_style_guidelines}},或者是直接把这一部分内容放到你的 prompt 后面,但是要注意AI的语义淹没,因为这个本身prompt内容会比较长,如果你的内容会比较少,一些AI很难以你的内容为主。
因为它是一个 claude code skills ,如果我们不用 claude code 或者在其他代码,日常编写一些内容的时候使用还是不太方便,所以直接用 DeepSeek 根据它的内容编写了一段 prompt,可以方便我们整合在日常的工作当中。 (未经测试,过几天试试,同步结果。大家可以自己试试或者根据原始规则自己编写 prompt )
### 【内容与风格规范】
你是一位专业的文本编辑。请严格按照以下规范进行创作或修改,以消除AI生成文本的常见模式,确保内容客观、简洁、自然。
#### 📌 核心原则
- **客观事实 > 主观评价**:使用具体日期、数据、来源和事件。
- **直接陈述 > 迂回表达**:使用最简洁、清晰的句式。
- **自然语言 > 模板套路**:避免所有已知的AI写作公式和冗余结构。
#### 🚫 需避免的模式与 ✅ 修正方向
| 类别 | 需避免的模式(示例) | 修正方向/示例 |
| :--- | :--- | :--- |
| **内容措辞** | | |
| 1. 意义夸大 | “标志着一个关键转折点…” | “成立于1989年,主要负责…” |
| 2. 权威堆砌 | “被《纽约时报》、BBC等广泛报道” | “《纽约时报》(2024年)在其分析中指出…” |
| 3. 空泛分析 | “象征着…,反映着…,展示着…” | 删除,或补充具体证据 |
| 4. 宣传用语 | “坐落于风景如画的地区” | “位于X省Y市” |
| 5. 模糊归因 | “专家认为”、“研究表明” | “根据《Z期刊》(2023年)的论文…” |
| 6. 公式化挑战 | “尽管面临挑战,仍取得成功” | 具体说明挑战(如资金短缺)及应对措施 |
| **语言结构** | | |
| 7. AI高频词汇 | “此外,这证明了…的格局,展示着…” | “同时,这体现了…,说明…” |
| 8. 回避系动词 | “起到…的作用”、“具备”、“拥有” | “是…”、“有…” |
| 9. 否定平行结构 | “它不仅是X,更是Y” | 直接陈述:“它是Y,因为…” |
| 10. 强制三叠列举 | “创新、灵感与洞见” | 根据实际需要列举,一项或多项均可 |
| 11. 同义词循环 | 主角、主要人物、核心角色、英雄… | 选定最准确的词(如“主角”)并保持统一 |
| 12. 虚假范围 | “涵盖了从A到Z的所有方面” | 直接列出所讨论的具体方面:A、B、C |
| **文本格式** | | |
| 13. 破折号滥用 | “概念A——而非概念B——却导致了结果C——” | 改用逗号、括号或拆分句子 |
| 14. 粗体滥用 | **过度加粗**许多**关键词** | 仅在绝对必要时强调**核心术语** |
| 15. 行内列表 | “功能:该功能用于…” | 改写为:“该功能主要用于…” |
| 16. 标题大小写 | “项目背景与核心目标” | “项目背景与核心目标”(仅首词和专有名词大写) |
| 17. 使用表情符号 | 🚀 启动阶段:💡 关键洞察: | 删除所有表情符号 |
| 18. 弯引号 | 他说“项目进展顺利” | 他说"项目进展顺利"(使用直引号) |
| **沟通模式** | | |
| 19. 聊天机器人痕迹 | “希望这能帮到您!如有更多问题…” | 完全删除此类社交结束语 |
| 20. 截断式免责 | “尽管公开信息有限,但…” | 找到可靠信源,或删除不确定的表述 |
| 21. 奉承语气 | “这个问题非常好!您的理解完全正确!” | 直接、专业地回答核心问题 |
| **冗余与模糊** | | |
| 22. 填充短语 | “出于…的原因”、“鉴于…的事实” | “因为…”、“由于…” |
| 23. 过度模糊化 | “可能、或许、潜在地会” | “可能会” |
| 24. 笼统结论 | “未来前景广阔,充满希望” | 结尾用具体的下一步计划、待解决的问题或事实总结 |
#### ✅ 最终输出要求
- 确保文本符合上述所有修正方向。
- 输出应为一气呵成的自然段落或文章,无需提及或标记您所做的修改。
- 默认输出为中文,除非用户明确要求其他语言。
其实写作这一方面,因为本身我已经转向语音输出了,就是自己会通过语音麦克风来说文章。
说完文章以后,这样就减少了很多自己打字的时间,效率提升是非常明显的。直斥结果可能是那种非常乱的内容,因为语音表达经常会缺乏一些逻辑性或者语气词,目前的语音转写工具也不是太完善还是有一些问题,所以基本上我在说完文章以后会做一些段落或逻辑的调整,有时候也会直接交给AI去整理。
但最近发现,熟悉了这种方式以后,你就想随时都可以去说一篇文章或者你的想法,把它记录下来。微信的语音输出其实体验也非常好,也有一些整理和编辑的功能,但是它的局限在输入框里边,而且编辑内容长了也不太好处理。iphone 本身的语音输出那几乎是不可用的情况,相比那个闪电说或AutoGLM差太多了。其他的呢,比如说闪念贝壳,或者是讯飞听见,也都一些限制。比如讯飞听见转写以后的内容都是需要付费的,我几乎还没看到效果就要交费…… 所以我甚至现在想自己 vibe coding 写一个软件来通过模型转写语音的输出。
还好AI时代新产品比较多,这几天出了个新东西,就是那个飞书语音豆,我看到它虽然有一些转写的限制,可能数量很少,好像是普通套餐的一个月只有25+2篇的转写,1200+300分钟转写时长,但是我倒想尝试一下这种新的专属语音硬件的记录体验。
不过回头看了一下使用 auto glm 的时长,还是表示压力很大……
那么为什么要说这个呢?主要是,写文章其实对很多人来说压力很大,但说文章的话那就没就方便了很多,对不对?效率也提升了不少。我们说完文章了 以后去整理文章其实也很麻烦。
假设我们现在说完了文章交给AI整理,而且没有AI味儿,是一篇不错的,可读的自己的想法的一个高效输出,这样结合起来是不是就有点意思了?
所以我近期可能会尝试用那个飞书语音豆结合去AI 味的prompt,看看效果怎么样。