一块钱能买到上万播放量数据 流量造假灰产如何整治
技术加持 假流量有迹可循
“大家都在买数据,不买你就比不过别人。”一位业内人士说。
在各种利益推动下,直播刷量正在批量化、规模化发展。在商业利益驱动下,很多直播平台不但不打击这种刷量作假行为,反而自己也参与其中。
当1个人观看直播的时候,直播平台就会在后台将在线直播人数扩大到10倍;当10个人观看直播的时候,直播人数会扩大20倍;而当100个人观看直播的时候,直播平台很可能已经把人数设置为当前实际人数的几十倍乃至上百倍。
在闫怀志看来,虚假流量花招迭出、渐成顽疾的背后驱动力是巨大的利益链条。在造假链条中,直播者能够凭借虚假流量吸引眼球、伪造个人商业价值;直播平台能够以此吸引更多的直播者和受众,随之而来的还有大量的广告商;而直播平台的投资公司更可以此为噱头,将资本泡沫越吹越大。各方齐齐穿上皇帝的新衣,心照不宣地共同上演一场互嗨大戏。
虚假数据能够完美地骗过所有人吗?实则不然。
“既然是虚假数据,自然与真实产生的流量数据存在显著差别。”闫怀志说,刷量平台通常会留下刷量痕迹,如阅读数与评论数明显不相匹配等,通过分钟级流量监测即可轻松识破。
然而,随着人工智能技术的发展,刷量平台的手段也开始升级。他们通过分析网民习惯甚至是拟合真实数据曲线,构建出正常的“刷量模型”,凭此来把控刷量节奏。更有甚者,还可以利用相关技术,人工合成评论文字甚至是语音。
当然,识别假流量同样可以通过构建用户画像等多维模型来检测,但这种方式的检测代价较高,难以推广。
那么,第三方平台是如何对数据进行监测的?
闫怀志介绍,无论是自身流量统计还是第三方流量统计,都离不开对流量的监测。第三方数据机构可以通过网站服务器端,凭借统计分析软件来对网站进行流量监测,也可以在流量链路(如移动网络服务提供商处)进行统计分析。
“第三方数据在一定程度上能够保障流量大小本身的真实性。”闫怀志说,但是对于流量本身是否由刷单产生,除非是明显的造假行为,否则第三方监测机构也难以做出明确判断。