不“露”就无法被推荐?揭露Instagram算法的真相

一项来自欧洲的独立调查显示,Instagram会优先推荐穿着曝露的男女照片,间接塑造了内容发布者的行为以及1.4亿欧洲人的世界观,这仍然是欧盟法规的盲点。

莎拉(Sarah)是一个欧洲大城市的食品业企业家(非真名)。她创立的公司帮助女性能轻松自在地进食,并倡导“直觉饮食”。像许多小企业主一样,莎拉依靠社交媒体吸引客户。她说,Instagram是仅次于Facebook的欧洲第二大社交网络,是她不能没有的营销渠道。

但是在研究Instagram上的照片和视频后,她觉得如果不穿着泳衣摆姿势的话,她的53,000名关注者就很难看得到她的照片。确实,最近几个月她最受欢迎的七个贴文中,有四个是她穿着比基尼的照片。Ely Killeuse是一名作者,在Instagram上有132,000位追随者,她也同意这样的结论。她说,“几乎所有” 她最受喜爱的照片,都是她穿着内衣或泳衣所拍的。

图文没看头,就不会被推荐?!

当然,也有可能是他们的观众本来就喜欢看穿着泳衣的莎拉和伊利。但自2016年初以来,Instagram将图文安排在用户的信息墙中,而用户“最关心的照片”将显示在顶部。如果莎拉和伊利发布的其他图文不那么受欢迎,也可能是因为他们的粉丝根本没机会看到。

哪些照片该出现、哪些不该出现,不只是品味问题。靠 Instagram 来吸引客户的企业家,必须采纳这些平台设下的规范,才能赢得粉丝的眼球。即使这些规范不能反映其业务、核心受众和客户所基于的价值。

分析了2,400张照片

为了解Instagram优先考虑的图片,欧洲数据新闻网 (European Data Journalism Network) 和算法监察 (AlgorithmWatch) 的调查记者要求26名志愿者安装浏览器插件,并关注经过挑选的专业内容创建者。我们从12个国家/地区(其中14个为男性)中选择了37位专业人员,他们使用Instagram为其品牌做广告或为他们的业务吸引新客户,主要在食品,旅游,健身,时尚或美容领域。 

该插件会自动定期打开Instagram主页,并记录哪些帖子出现在志愿者的新闻源上方,从而概述了平台认为与每个志愿者最相关的内容。

如果Instagram不与该算法混合,则用户新闻源中帖子的多样性应与他们关注的内容创建者的帖子的多样性相匹配。如果Instagram根据每个用户的个人喜好个性化其新闻源,则应以不同的方式为每个用户歪曲其新闻源中帖子的多样性。这不是我们发现的。

在2月至5月期间,分析了我们监控的内容创建者发布的1,737篇帖子,其中包含2,400张照片。在这些帖子中,有362个(占21%)被计算机程序识别为包含图片,这些图片显示了穿着比基尼或内衣的女性或裸露胸部的男性。但是,在我们志愿者的新闻提要中,带有此类图片的帖子占同一帐户显示的所有帖子的30%(有些帖子被显示多次)。

来源:Datawraper / 截图及翻译:Topic News

包含女性内衣或比基尼图片的帖子出现在我们志愿者的新闻源中的可能性要高出54%。包含裸露胸部图片的帖子被显示的可能性增加了28%。相比之下,显示食物或风景图片的帖子在新闻源中显示的可能性要低约60%。

这些结果可以在调查页面上阅读细节,来源自具有统计意义的标准测试。

等待审查

也许并非所有Instagram用户都感受到裸露图片的偏好。但对于大多数的志愿者而言,这是显而易见的。不过,仍有少数人的信息流可见创作者的多样性发布内容。可见Instagram的算法可能偏爱裸露,但也有个性化或其他因素限制了某些用户的这种效果。

我们的结果不足以对Instagram的新闻提要算法进行全面审核。他们仅记录志愿者在自己的账号中发生的情况。如果无法得知 Facebook 内部数据和服务器,将永远不可能得出明确的结论。

Facebook并未确切回答我们的问题,但发表了声明:“这项研究在许多方面都有缺陷,并显示出对Instagram运作方式的误解。我们会根据您感兴趣的内容和其他帐号发布的帖子进行排名,而不是根据泳衣等因素进行排名。”

但是,我们有理由相信我们的发现可以代表Instagram的总体运作方式。

最大化参与度

在2015年 Facebook 获得的一项专利中,解释了信息流如何选择图片的优先排序。根据该专利,当用户发布图片时,将对其进行自动分析。图片具有“参与度”,用于确定是否在用户的新闻源中显示图像。

参与度指标部分基于过去的用户行为。如果用户喜欢某个特定品牌,而照片显示该品牌的产品,则参与度指标会增加。但是,参与度指标也可以基于服务的所有用户的过去行为来计算。该专利特别指出,照片中人物的性别,种族和“穿衣状态”可用于计算参与度指标。

Instagram声称新闻源是根据用户“最关心”的内容来组织,但该公司的专利说明却解释了他们实际上可以根据自行定义的指标来对内容进行排名。用户是否看到他们真正感兴趣的图片,不仅取决于他们过去的行为,还取决于 Instagram 认为平台用户“应该”最感兴趣的内容。

虚假相关

在算法决定要在用户的新闻源中显示哪些图片之前,Facebook会使用称为计算机视觉的软件自动分析图片。此类软件从训练数据集中提取自动推断,该训练数据集由成千上万个手动注释的图像组成。它的局限性可能会影响Instagram如何优先处理新闻源中的图片。

多年来,计算机科学家已经知道,这样的系统会复制并放大其训练数据的偏差,从而导致虚假的或谬误的关联。例如,一个基于网上发现的犬类图片来识别狼和狗的程序将无法识别出人类对动物的理解。取而代之的是,它将在白雪皑皑的背景下为任何动物加上“狼”的标签。

计算机视觉的培训数据通常是由收入低下的工人提供的,他们有动力迅速工作并提供符合雇主期望的结果。代尔夫特理工大学的博士生Agathe Balayn谈到自动化系统的偏见问题时,这导致他们不加批判地采用提供给他们的类别,而忽略了照片可能包含的微妙之处。

后果可能很严重。去年12月,一位巴西艺术家试图在他的Instagram帖子中做广告。该请求被拒绝,理由是该帖子包含暴力内容。它只描绘了一个男孩和一级方程式赛车手刘易斯·汉密尔顿。两者都是黑皮肤的。在四月份,一位瑜伽老师被拒绝刊登广告,理由是该图片显示出亵渎行为,即使她只是做侧吊姿势。她是亚裔美国人。

(在我们的实验设置中,我们还使用了计算机视觉系统Google Vision。尽管其结果令人震惊-例如,“ beauty”标签仅返回给女性使用-其偏见很可能类似于Facebook的计算机视觉引擎,仅仅是因为它部分是由同一个人制造的。)

游走边缘

Instagram的准则规定,“禁止”在服务上使用裸露内容,但偏爱显示皮肤的帖子。鼓励与禁止之间的细微差别,是由未经审核且可能带有偏见的计算机视觉算法决定的。每次发布图片时,一些内容创建者都必须在 “有点裸,但是不能太裸” 的灰色地带间吸引他们的粉丝关注。

2019年美国杂志《 Salty》由128位Instagram用户所做的调查中发现,移除滥用内容的行为很普遍。只要Instagram的算法未经审核,就不可能知道这种情况有多普遍,以及有色人种和妇女是否受到不成比例的影响。 

但是,对Facebook提交的238项包含“计算机视觉”一词的专利进行的审查显示,在被列为发明人的340人中,只有27人是女性。男性主导的环境通常会导致不利于女性的结果。例如,汽车的安全带仅在男性假人上进行测试,从而导致女性受伤的可能性更高。我们的研究表明,Facebook的算法也可能遵循这种模式。

害怕被私下报复

莎拉(Sarah)和其他依赖 Instagram的企业家,都对披露此新闻内幕感到害怕。大多数专业的 Instagram 内容创作者都担心自己帐户会被 Facebook 删除或被暗地里封号(在用户不知情的情况下,大幅降低用户发文在粉丝信息流中出现的“惩罚”)这种报复行为就等于对他们的业务宣判死刑。

一位拥有7万名粉丝年轻的企业家表示,Instagram对她的业务“非常重要”,她对算法监查 (AlgorithmWatch) 记者表示,她不想因暗中取缔而被报复。另一名接受访问的小企业主伊利·基柳斯(Ely Killeuse)说,拥有另一种收入来源是她的当务之急。她说,对 Instagram 的过度依赖将使自己失去自由和理智。 

通用数据保护法规(GDPR)于2018年生效,而业务平台(P2B)法规将于2020年7月12日生效,已经为用户和专业人士提供了许多保证。 GDPR特别指出,用户对自动化决策拥有“解释权”,P2B法规应强制在线服务披露“确定排名的主要参数”。

可能的歧视

尽管我们的调查结果表明,男性和女性内容创作者如果想吸引受众,就不得不“牺牲小色相”,但对女性的影响可能更大,可视为对女性企业家的歧视。尽管《欧盟基本权利宪章》禁止基于性别的歧视,但Instagram用户没有法律途径提起法律诉讼。立法中未考虑社交媒体事业的细节。

维也纳大学经济贸易大学助理教授米里亚姆·库尔曼(Miriam Kullmann)向AlgorithmWatch表示,欧洲反歧视立法几乎只涉及雇佣关系。自雇人士(例如我们调查中的企业主)不受保护范围。

三分之一的欧洲人使用 Instagram

随着越来越多的欧洲企业使用 Instagram 来分享内容,他们创建的贴文能产生巨大的影响,通常会吸引成千上万的关注者。Facebook声称,四月份有近1.4亿欧盟居民(三分之一)使用Instagram。 

在18至24岁的年轻人中,Instagram的普及率在每个欧盟国家中约为100%。与Covid-19大流行相关的居家隔离,也增加了在Instagram上花费的时间,数量惊人。Facebook在投资者报告中称,在意大利实行封城的一周之内,Instagram的浏览量是正常的两倍。

属于自己的创作自由环境

大约一个世纪前,著名的英国作家弗吉尼亚·伍尔夫(Virginia Woolf)说,女性需要“一个自己的房间”,才能使自己的创造力蓬勃发展。她写道,服从外部权威的意见,就有如让自己作品的核心开始腐烂。

在Instagram上,你别无选择地必须顺应算法的喜好。选择保守,就会减少被其他用户发掘的机会。男女企业家如果想在社交媒体上发光,就不得不遵守Facebook制定的游戏规则。

作者:Nicolas Kayser-Bril, Judith Duportail, Kira Schacht, Édouard Richard
原文来源:这项调查是由 EDJNetAlgorithm Watch 在 Nicolas Kayser-Bril 的协调下进行。本站自行翻译,有小部分原文内容删除(CC BY 4.0

Comments