珠海都市网
您当前的位置 :首页 > 文传商讯 > 正文
Utopia人工智能可判断不同社交平台上的仇恨言论数量
2021年04月23日 16:04:36来源:作者:

赫尔辛基--(美国商业资讯)--据芬兰司法部委托Utopia Analytics进行的一项研究,网上仇恨言论最容易出现在论坛上。该报告发现,97%的已识别仇恨言论信息来自于论坛。随后的平台类型是占2.5%的Twitter信息和占0.2%的Instagram信息。而博客、新闻评论和公开的Facebook信息占所有已识别仇恨言论的比例不到0.02%。这些数据集不包括私人讨论,如Facebook组或帐户。

该项目是芬兰司法部 “Facts Against Hate”计划的组成部分,旨在测试人工智能在网络环境中识别仇恨言论的能力。该方法将人类评估与机器学习相结合。项目的一个关键目标是找到仇恨言论的主要渠道,并识别平台之间的差异。

仇恨言论的定义基于社会科学的学术研究结果。该定义通过如下过程完成:首先确定仇恨言论的类别,然后使用类别数据在网络信息数据集中人工识别出仇恨言论的例子。这些标注随后被用作Utopia AI Moderator的训练数据,这是一个利用文本分析和机器学习且与语言无关的工具。该项目的数据集由2020年9月至10月以芬兰语发表的1,200万条在线评论和帖子构成。

结果显示,芬兰公开的社交媒体平台上每月出现大约15万条包含仇恨言论的信息,约占所有信息的1.8%。

在国际公共社交媒体平台中,Twitter似乎最为突出,有7,450条信息被认定为仇恨言论,占所有推文的0.14%。转发在传播这些信息中发挥了重要作用:所有仇恨言论推文中有39%是重复的。

Utopia首席执行官Mari-Sanna Paukkeri博士表示:“尽管数据集主要由芬兰语消息构成,但其他语言中的结果也会非常相似。例如,芬兰仇恨言论的主要平台Ylilauta其实就是大家都熟知的4chan的芬兰版。此外,只需要两周,我们就可以建立一个类似的人工智能模型来识别其他任何语言中的仇恨言论。只需要一位具备相关技能的专业人员告诉我们对应文化和语言中如何定义仇恨言论即可,另外我们还需要具体数据来进行分析。”

媒体库/照片:https://utopiaanalytics.com/media-library

原文版本可在businesswire.com上查阅:https://www.businesswire.com/news/home/20210422005039/en/

免责声明:本公告之原文版本乃官方授权版本。译文仅供方便了解之用,烦请参照原文,原文版本乃唯一具法律效力之版本。

联系方式:

Janne Huuskonen
总监
janne.huuskonen@utopiaanalytics.com
+358 50 444 0941
utopiaanalytics.com

责任编辑: admin

看新闻,关注新闻

本网网友:Curtain ( 落幕 )
评论:爷爷说他们那个年代。谁考试不会答。就答说毛主席万岁。没人敢打叉。

腾讯网友:﹎拿命再愛√
评论:我的优点是:我很淑女;但是我的缺点是:我淑女的不明显。

其它网友:私念° 7/m
评论:如果你看到面前的阴影,别怕,那是因为你的背后有阳光!

百度网友:虐恋sadomasochism
评论:你若使用美人儿计,我就将计就计

搜狐网友:仅此°future
评论:听说你过得不好,我坐在门口乐了一整天。

网易网友:Rainy°伤情
评论:学习伤我千千遍,我待学习如初恋。

凤凰网友:煙抽黑了心
评论:好的文字是这样的:你写得不动声色,我看得肝肠寸断

天猫网友:身軆被我所用
评论:人之所以活得累是因为:放不下架子,撕不开面子,解不开情节。

天涯网友:念旧-  Tender
评论:成熟的人不问过去,聪明的人不问现在,豁达的人不问将来。

猫扑网友:她有我保护
评论:我能想到最浪漫的事,就是看你一起慢慢变老,而我依然青春年少.

相关阅读
分享到:
版权和免责申明

珠海都市网所有文字、图片、视频、音频等资料均来自互联网,不代表本站赞同其观点,本站亦不为其版权负责。相关作品的原创性、文中陈述文字以及内容数据庞杂本站无法一一核实,如果您发现本网站上有侵犯您的合法权益的内容,请联系我们,本网站将立即予以删除!