Quote: o3o.ca/@Corrmesh/1135596412545…
基本上引入“悄悄炼AI”的论据之后基本就没有讨论的必要了——一切平台都可以二分为 walled garden 和非 walled garden,后者一定有方法“悄悄炼AI”。例如 ActivityPub,加个实例抓公共轴或者自搭一个然后连上 relay 都可以“悄悄炼AI”。最讽刺的是,这种前提下,最安全的平台是找个不会把你数据卖出去的 walled garden——当然是不存在的。
有时候我真的很难理解为什么有人能仅因为一个平台区别就能对其它平台的用户 mean 成这个样子。其实,扩展一下讨论到其它开源博客/论坛甚至毛象等等平台,开放 API、提供 RSS、robots.txt 不设防等等本身都是非负面的,整个讨论里的“老鼠屎”就只是在未获得 consent 下“悄悄炼AI”的人。Bluesky 开放数据当然也不是为了给 AI 训练,据 Bluesky 开发者所说(当然也有可能是 marketing,请各位自行判断),平台开放这一大堆数据也是希望助力各种学术研究。例如四月份 arxiv 上就有篇““I’m in the Bluesky Tonight”: Insights from a Year Worth of Social Data”收集了 235M 的 Bluesky 数据进行社会学统计分析,数据现在还公开放在 Zenodo 上。(arxiv.org/abs/2404.18984)
学术研究和 AI 训练的界限到底划在哪里、上面那篇研究的隐私数据削除是不是还不足、为了规避 AI 我们的 semi-walled garden 的墙到底要建多高,这些都还是可以讨论的。就算是发泄情绪,也希望大家能够分清自己想骂的到底是“悄悄炼AI”的人还是平台还是用户,而不要上来就是 🤗🤗。😅😅
(本条嘟文应该会由某 Friendica Bluesky 插件自动转发到 Bluesky。)