1. 首页
  2. 网络安全

人工智能系统警告你注意在线评论中的破坏者。

On a theoretical level, researchers want to better understand how people write spoilers and what kind of linguistic patterns and common knowledge mark a sentence as a spoiler.
在理论层面上,研究人员希望更好地了解人们是如何写剧透的,以及什么样的语言模式和共同知识将句子标记为剧透者。(Getty Image/iStock相册)

研究人员已经开发出艾-以系统为基础,可以在书籍和电视节目的在线评论中找出破坏者。

“在互联网上到处都是剧透者,在社交媒体上也很常见。作为互联网用户,我们理解破坏者的痛苦,以及他们如何破坏一个人的体验,“该论文的资深作者之一NdapaNakaswell说。

一些网站允许人们用标记来手动标记他们的帖子,这些标签可以作为“预告牌”。但这种情况并不总是发生。因此,在计算语言学协会(AssociationforComputationalLinguology)上发表这项研究的研究人员,希望开发一种由神经网络驱动的人工智能工具,以自动检测破坏者。他们把这个工具命名为SpoilerNet。

在理论层面上,研究人员希望更好地了解人们是如何写剧透的,以及什么样的语言模式和共同知识将句子标记为剧透者。

又改为:IIT-马德拉斯科学家推出“AI4Bharat”平台推动人工智能创新

研究人员开发的这个工具可以用来构建一个浏览器扩展来保护人们免受破坏。为了训练和测试SpoilerNet,研究人员去寻找包含破坏者的大量句子数据集。剧透警报!他们什么也没找到。因此,他们收集了超过130万本书评,并附有书评者的剧透标签,从而创建了自己的书评。

标签包含句子,其中包括扰流器,并将其隐藏在文本中的“视图扰流器”链接后面。这些评论是从Goodreads收集的,这是一个社交网站,允许人们跟踪他们所读到的内容,并与其他读者分享他们的想法和评论。

“据我们所知,这是第一个具有这种规模和粒度的扰流注释的数据集,”论文的第一作者Mengting wan说。

研究人员发现,在评论的后半部分,剧透的句子往往聚在一起。但是他们也发现不同的用户有不同的标准来标记破坏者,而神经网络需要经过仔细的校准才能考虑到这一点。

此外,同一词在不同的语境中可能具有不同的语义。例如,“绿色”只是一个书评中的颜色,但它可以是一个重要人物的名字,也可以是另一本书中剧透者的信号。万说,识别和理解这些差异是很有挑战性的。

研究人员对SpoilerNet进行了关于Goodread 80%的评论的培训,通过几层神经网络运行文本。该系统可检测出破坏者,准确率为89%至92%。

他们还在SpoilerNet上运行了一个由大约880个电视节目的16,000多个单句评论组成的数据集。该工具检测破坏者的准确率为74%至80%。

大多数错误来自于系统被那些通常是充满启示和启示性的词语所分散注意力,例如谋杀或死亡。

展望未来,Goodreads数据集可以作为一个强大的工具,用来训练算法来检测不同类型内容中的破坏者。

原创文章,作者:奈落,如若转载,请注明出处:https://www.zx116.com/?p=618

发表评论

电子邮件地址不会被公开。 必填项已用*标注