在理论层面上,研究职员希望更好地理解人们是如何写剧透的,以及什么样的措辞模式和共同知识将句子标记为剧透者。
(Getty Image/iStock相册)研究职员已经开拓出艾-以系统为根本,可以在书本和电视节目的在线评论中找出毁坏者。

人工智能系统警告你留心在线评论中的破坏者_人员_句子 文字写作

“在互联网上到处都是剧透者,在社交媒体上也很常见。
作为互联网用户,我们理解毁坏者的痛楚,以及他们如何毁坏一个人的体验,“该论文的资深作者之一NdapaNakaswell说。

一些网站许可儿们用标记来手动标记他们的帖子,这些标签可以作为“预报牌”。
但这种情形并不总是发生。
因此,在打算措辞学协会(AssociationforComputationalLinguology)上揭橥这项研究的研究职员,希望开拓一种由神经网络驱动的人工智能工具,以自动检测毁坏者。
他们把这个工具命名为SpoilerNet。

在理论层面上,研究职员希望更好地理解人们是如何写剧透的,以及什么样的措辞模式和共同知识将句子标记为剧透者。

又改为:IIT-马德拉斯科学家推出“AI4Bharat”平台推动人工智能创新

研究职员开拓的这个工具可以用来构建一个浏览器扩展来保护人们免受毁坏。
为了演习和测试SpoilerNet,研究职员去探求包含毁坏者的大量句子数据集。
剧透警报!他们什么也没找到。
因此,他们网络了超过130万本书评,并附有书评者的剧透标签,从而创建了自己的书评。

标签包含句子,个中包括扰流器,并将其隐蔽在文本中的“视图扰流器”链接后面。
这些评论是从Goodreads网络的,这是一个社交网站,许可儿们跟踪他们所读到的内容,并与其他读者分享他们的想法和评论。

“据我们所知,这是第一个具有这种规模和粒度的扰流注释的数据集,”论文的第一作者Mengting wan说。

研究职员创造,在评论的后半部分,剧透的句子每每聚在一起。
但是他们也创造不同的用户有不同的标准来标记毁坏者,而神经网络须要经由仔细的校准才能考虑到这一点。

此外,同一词在不同的语境中可能具有不同的语义。
例如,“绿色”只是一个书评中的颜色,但它可以是一个主要人物的名字,也可以是另一本书中剧透者的旗子暗记。
万说,识别和理解这些差异是很有寻衅性的。

研究职员对SpoilerNet进行了关于Goodread 80%的评论的培训,通过几层神经网络运行文本。
该系统可检测出毁坏者,准确率为89%至92%。

他们还在SpoilerNet上运行了一个由大约880个电视节目的16,000多个单句评论组成的数据集。
该工具检测毁坏者的准确率为74%至80%。

大多数缺点来自于系统被那些常日是充满启迪和启迪性的词语所分散把稳力,例如行刺或去世亡。

展望未来,Goodreads数据集可以作为一个强大的工具,用来演习算法来检测不同类型内容中的毁坏者。