旧金山营销和网页设计机构 Qontour 做了一个《The Dictionary of Obscure Sorrows》网站。
它的域名是 thedictionaryofobscuresorrows.com。John Koenig 原项目域名是 dictionaryofobscuresorrows.com。只多了一个 “the”。
麻烦就从这里开始。
这个仿站收录作者介绍、媒体报道和购书链接,还转载了书中 311 个词条、定义、词源和短文。页面里有 DALL-E 2 生成图,也有 GPT-4 造词功能,还有 Amazon 联盟链接。
Koenig 本人已在邮件中否认参与该站。按目前公开材料看,这不是普通粉丝做了一个漂亮网页,更像是把一本仍在销售的书,重新包装成机构作品集、搜索入口和流量页面。
仿站为什么看起来像官方
《The Dictionary of Obscure Sorrows》不是一个突然冒出来的网络词典。
Koenig 从 2009 年起在 Tumblr 上发起这个项目,为那些真实存在、但不好命名的情绪造词。后来项目扩展到视频短片。词条 “sonder” 传播很广。
2021 年,Simon & Schuster 出版同名图书。这本书后来进入《纽约时报》畅销书榜。
Qontour 的站点大约在 2023 年前后上线。它在页脚和作品集中署名,称自己是这本书的粉丝,并把项目展示为 Webflow 设计、AI 图像库和互动功能案例。
问题不在“粉丝”两个字。
问题在于,它同时做了几件会制造官方感的事:接近原站的域名、完整的内容呈现、作者介绍、购书入口、AI 互动功能,再加上机构自己的作品集署名。
| 对比项 | Koenig 原项目 / 正规来源 | Qontour 站点 | 带来的问题 |
|---|---|---|---|
| 域名 | dictionaryofobscuresorrows.com | thedictionaryofobscuresorrows.com | 读者很容易误认 |
| 内容来源 | Tumblr 项目与 2021 年出版图书 | 转载书中词条、定义、词源和短文 | 涉嫌未经授权复制 |
| 图像呈现 | 原书插图与原项目视觉 | DALL-E 2 生成图像 | 改变作品呈现方式 |
| 新功能 | 原项目没有 AI 造词入口 | GPT-4 生成新词 | 混淆作者风格与机器生成内容 |
| 商业入口 | 出版社和正规购书渠道 | Amazon 联盟链接 | 存在流量变现机制 |
| 署名位置 | John Koenig | Qontour 页脚和作品集 | 容易让人误判参与方 |
这里要守住事实边界。
目前没有法院认定 Qontour 侵权,也没有可靠证据说明联盟链接带来多少收入。能确定的是:Koenig 否认参与,站点转载了书中内容,Qontour 用它展示自己的网页和 AI 能力,并放入了可变现入口。
这已经不是“我喜欢这本书,所以做个导航页”的范围。
真正被抢走的是搜索入口
这起事件更麻烦的一层,是搜索。
公开材料显示,Google 对书名、词条名,甚至 John Koenig 本人姓名的搜索结果中,Qontour 站点常常排在官方 Tumblr、出版社页面或 Wikipedia 之前。ChatGPT、Gemini 等问答结果也曾把该站当作官方来源,并把站点归到 Koenig 名下。
传统盗版站多半是把内容复制过去,等人访问。
这一次的玩法更像是:复制内容,优化网页,加 AI 功能,争夺搜索和答案入口。
对读者来说,结果很直接。你搜一本书,点进一个看似更完整、更现代的网站,可能以为这就是作者本人维护的页面。你再引用、转发、购买,错误来源就继续扩散。
对创作者和出版方来说,损失也不只是哪几本书的销量。
更大的成本是纠错。作者要解释“这不是我做的”;出版社要提交投诉;读者和媒体要重新核对来源。一个十多年积累出来的语言项目,被一个优化更好的页面盖在前面,署名和来源就会慢慢变脏。
Simon & Schuster 去年曾向 Google 提交 DMCA 移除请求。公开材料显示,请求涉及盗版站的两个页面。但从后续可见性看,这并没有明显改变该站在搜索结果里的位置。
这说明一个现实约束:版权方可以投诉具体页面,却很难马上修正搜索系统和 AI 摘要系统里的“来源判断”。
出版、媒体和内容团队遇到类似情况,动作不能只停在发声明。更现实的做法是三件事:
- 核对高频搜索词,确认仿站是否压过官方页面;
- 固定证据,整理域名、页面、版权声明、联盟链接和 AI 功能;
- 同时向搜索平台、托管服务、联盟平台和 AI 问答产品提交更正或移除请求。
这不浪漫,但有用。
AI 放大了未经同意的再包装
这件事不能简单写成“AI 写了一本假书”。
事实不是这样。Koenig 的原文被转载,AI 主要被用在两处:一是 DALL-E 2 图像,二是 GPT-4 造词功能。
也正因为如此,它更值得警惕。
AI 在这里不是唯一的侵权来源,而是降低了再包装成本。换图、做交互、生成新词、搭一个看起来更现代的网站,都变得便宜。复制者不需要重建十几年的创作积累,只要把人类作品放进一个更会被搜索抓取的壳里。
对独立创作者来说,最危险的是“控制权”被拆开。
文字还在你的书里,名字还在封面上,但搜索入口可能在别人手里。读者看到的视觉风格可能不是你定的。AI 生成的新词可能被误以为是你的延展。购书点击也可能先流经别人设置的页面。
对出版和内容平台从业者来说,接下来最该观察的不是模型又会不会画图、造词。
更具体的变量有两个:
| 变量 | 该看什么 | 为什么重要 |
|---|---|---|
| 搜索平台处理 | 投诉后是否降权、移除、标注原始来源 | 决定仿站还能不能继续吃入口流量 |
| AI 问答纠错 | ChatGPT、Gemini 等是否更正来源归属 | 决定错误署名会不会被答案系统继续放大 |
普通读者也有一个很小但有效的动作:买书、引用、转载、做资料卡之前,先看域名、出版社页面和作者长期运营的原始页面。
这不是洁癖。
在 AI 可以把一个仿站做得很像官方站的时候,核对来源就是对创作者最基本的保护。
