今年2月,Adobe悄悄更新了产品做事条款。
个中一项条款哀求用户赞许Adobe可以“通过自动和手动的办法”访问用户作品,包括受保密协议(NDA)保护的内容,并利用“机器学习等技能来改进Adobe的做事和软件”。

发声抵制!为了演习AI“版权卫士”Adobe陷入舆论漩涡|AI新榜_用户_数据 智能写作

如果用户谢绝接管新条款,则无法正常利用Adobe的软件。

这一条款调度近期遭到曝光,引发了创意人士、数字艺术家和设计师等Adobe主力用户发文抵制。
他们认为该条款本色上是一种逼迫授权,无异于“霸王条款”,目的是演习Adobe旗下的天生式AI模型“Firefly”。

X博主“Sam Santala”在6月初发布的一条质疑该条款的推文,目前浏览量已达千万。

许多用户在社交媒体上表示,出于对隐私和版权的担忧,他们选择停滞利用Adobe的产品。

不足为奇,Meta公司也采纳了类似的方法。
随着Meta的天生式AI功能在欧洲上线,其隐私政策更新为:“在Meta产品和做事上共享的信息”,包括“帖子、照片乃至标题等内容”将被用于演习AI。

如果用户不同意新的隐私政策,应考虑停滞利用Meta旗下的社交媒体产品,如Facebook和Instagram。

随着AI技能迅猛发展,各大科技公司与用户之间环绕数据隐私、内容所有权和掌握权的争夺愈发激烈。

从生产力工具到社交媒体,你的数据正在被无偿“投喂”给AI

“我们只用授权内容来演习AI”

“顺便说一句,由于你正在利用我们的做事,因此我们拥有你的内容授权。

针对Adobe引发争议的产品做事条款,一位网友指出,这位创意软件巨子在处理用户内容用于AI演习方面的前后态度并不一致。

Adobe天生式AI模型“Firefly”于2023年3月发布测试版,声称其演习数据来源于Adobe图像库中的数亿张图像、一些公开容许的图像及版权保护已过期的公开图像。

其他的AI图像天生工具,如Stability AI的Stable Diffusion、OpenAI的Dall-E2、Midjourney的Midjourney,都曾因版权问题而备受争议。

Adobe在这一背景下采纳了差异化的市场定位——成为AI武备竞赛中的“白衣骑士”,强调其模型演习数据的合法性,并承诺对利用Adobe Firefly天生的图片引发的版权轇轕支付索赔。

资深设计师阿杰戏称自己是“Adobe正版受害者”,认为Adobe利用其弘大的创意生态系统来演习AI,虽然是一个聪明的商业策略,但对用户来说,中间涉及的平台-创作者利益分配和用户知情权是缺失落的,这让“老用户非常受伤”,也毁坏平台与用户之间的信赖。

与此同时,外洋屡屡曝出与Adobe有关的版权轇轕,更让用户对Adobe是否真的尊重创作者版权打上了问号。

艺术家Brian Kesinger创造,在未经他赞许的情形下,Adobe图像库中涌现了打着他名义贩卖的与其作品风格相似的AI天生图像。

拍照师安塞尔·亚当斯的遗产管理方公开责怪Adobe,称其涉嫌***已故拍照师作品的天生式人工智能仿制品。

在舆论压力下,Adobe于6月19日修订了做事条款,明确表示不会利用用户存储在本地或云真个内容来演习AI模型。

但这一澄清并未完备平息创作者的担忧。
外洋AI圈有名博主“Bilawal Sidhu”指出,Adobe的修订版做事条款仍许可利用用户私有云数据演习非天生式AI工具的机器学习模型。

只管用户可以选择退出“内容剖析”,但繁芜的取消操作常常让不少用户望而生畏。
Adobe供应的退出“内容剖析”机制之繁琐,从一些创作者在Youtube上推出的干系传授教化***,可见一斑。

此外,不同国家和地区对用户数据保护的法规存在差异,这影响了社交媒体平台在制订用户做事条款时的策略。

据国外科技媒体Mashable宣布,在通用数据保护条例(GDPR)的框架下,英国和欧盟的用户享有“反对权”,他们可以明确选择不将其个人数据用于演习Meta公司的人工智能模型。

而美国用户未得到同等的知情权。
根据Meta现有的数据共享政策,美国用户在Meta旗下社交媒体产品上发布的内容,可能在未经明确赞许的情形下已经被用于演习AI。

AIGC时期,科技公司如何“获取”创作者数据?

数据被喻为AI时期的“新石油”。
但资源的“开采”,目前仍有不少灰色地带。

月之暗面创始人杨植麟近期在北京智源大会上表示,模型的“大”依然是第一性事理,现在最大的问题是办理怎么取得原来稀缺或者不存在的数据,以及如何高效地形成规模效应。

数据短缺,正成为AI大模型竞赛中的一个关键问题。
据早前《纽约时报》宣布,OpenAI利用语音转录工具Whisper网络了超过100万小时的YouTube***文本作为GPT-4的演习数据。

OpenAI对Scaling Law(规模定律)的极致运用被一些业内人士形象地称为“暴力美学”,在灰色地带抓取数据演习模型,以获取相对付谷歌、Meta等科技巨子的竞争上风。

Scaling Law推戴者相信,当***模型足够“大”,就会产生智能呈现的能力。

不止OpenAI,如今很多须要“炼模型”的科技大厂、头部互联网平台对用户数据的采集也处在模糊地带。

在海内,随着《互联网信息做事深度综合管理规定》和《天生式人工智能做事管理暂行办法》相继出台,对AI天生内容的监管日益严格。

个中《天生式人工智能做事管理暂行办法》规定天生式人工智能做事供应者在利用用户数据进行演习时,必须遵守合法来源、知识产权保护、个人信息赞许等原则。

然而,在实际操作中,用户每每在不知情的情形下赞许平台利用其数据。
例如,绘画博主“雪鱼”创造自己的作品在未经许可的情形下,被AI绘画运用“Trik”拿来进行模型演习,一怒之下,该博主选择了停更。

近期我们整理了海内外主流社交媒体平台的用户做事协议条款,创造多家平台的协议中都哀求用户授权平台广泛的内容利用权,包括存储、利用、传播、复制以及“制作派生作品”等。
这些也都存在一定的模糊地带。

马斯克掌管的X(前推特)直接在用户做事条款中明确写道:可能会利用网络的信息和公开可用的信息来帮助演习其机器学习或人工智能模型。

唯一不同的是微信***号,明确表示用户利用***号过程中上传、发布的全部内容,均不会由于上传、发布行为发生知识产权、肖像权等权利的转移。
仅在出于宣扬或先容功能等目的时,以一定的办法在腾讯集团干系产品或外部渠道推广用户内容或素材。

澎湃研究所指出,用户做事条款中包含的“制作派生作品”这一提法,让平台轻易就得到了用户的提前授权,可以免费将用户上传和发布的内容用于演习AIGC模型。

这种做法虽然通过一套严密的“话术”得到大量用户数据,节约了模型演习本钱,但同时也引发了用户个人信息权利的双重困境:数字版权归属和数据隐私问题,严重危害用户对平台的信赖。

目前平台在确保天生式AI不陵犯创作者权柄方面尚存在较大不敷,也缺少足够监管。

此外,科技公司获取用户数据的另一种路子是:注册利用AI产品时,用户赞许的用户利用须知或用户做事条款。

例如,快手AI***模型“可灵”在内测阶段的用户须知中明确表示,用户上传的素材(如有)、输入的指令以及模型天生的内容可能会连续用于大模型优化演习,以不断调度优化模型的效果。

如果用户不同意该条款,则无法利用干系产品和做事。
尤其在天生式AI中的图生***、图生图等利用场景中,输入即是输出内容的一部分。
由于AIGC模型算法和运行过程依然存在“黑箱”特性,不仅开拓者难以向用户充分阐明数据处理的过程,也在监管和管理层面带来了寻衅。

据君合状师事务所北京办公室合资人董潇状师解读,《天生式人工智能做事管理暂行办法》第7条哀求天生式人工智能研发利用者对预演习、优化演习数据来源的合法性卖力,但对付天生式人工智能研发利用者对用于演习算法的数据来源的审核责任究竟应达到何种程度未作出明确规定。

如何平衡科技创新与用户隐私安全,保障创作者权柄,仍待行业进一步发展和法律监管方法持续完善。

在此背景下,一些开拓者和创作者已经采纳行动,推出了一系列“反AI”工具。
从作品保护工具Glaze到AI数据投毒工具Nightshade,再到反AI社区Cara走红,面对科技公司未经用户/创作者赞许便抓取干系数据演习AI模型,人们的怒火已经愈演愈烈。