Unbiased Learning to Rank Based on Relevance Correction
-
摘要: 用户点击数据较文档的相关标签更易被获取且能反映用户兴趣,将其作为标签能够有效降低人工标注成本并且模型能随数据实时更新.但用户点击含有偏差和噪声,因此需设计有效的无偏排序方法.针对无偏排序中对偶学习方法收敛得到次优解从而无法完全消除偏差的问题,提出一种基于相关修正的无偏排序学习方法.首先,利用现有小规模相关标注数据训练排序模型,对候选文档进行较精准的相关得分预测;再基于用户点击和文档相关得分训练点击倾向模型;最后,将得到的模型参数设为对偶去偏初始值并联合训练.该方法不影响模型上线的计算速度,可用于在线学习场景,模拟不同程度偏差噪声并在真实点击场景下进行测试,结果表明该方案能够有效提升现有无偏排序学习方法表现.Abstract: Compared with the human annotated relevance labels, the user click data are easily obtained and can better reflect user preferences. Using clicks as training labels can reduce the cost, and the ranking models can be updated in real time. However, the raw clicks are biased and noisy, so it is necessary to design an effective method of unbiased learning to rank. Aiming at the problem that the dual learning algorithm achieve sub-optimal solutions thus cannot eliminate the bias completely, we propose a new method of unbiased learning to rank based on relevance correction. Firstly, we use the existing small-scale query-document pairs with relevance labels to train the ranking model and then use it to get more accurate predictions of the relevance score. Secondly, the click data and the predicted relevance scores are used to train the propensity model. Finally, we take the parameter values of the obtained model as the initial values of the dual learning process, and then jointly train the models with user clicks. The proposed method does not affect the online calculation speed and can be used in online learning scenarios. Tested in different degrees of click bias and real click scenarios, the proposed method can enhance the performance of the existing method as showed in the results.
-
-
期刊类型引用(11)
1. 安晓明,王忠勇,翟慧鹏,巩克现,王玮,孙鹏. 基于深度学习的二进制变种协议字段划分方法. 计算机工程与设计. 2024(04): 982-988 . 百度学术
2. 黄涛,王郅伟,刘家池,龙千禧,况博裕,付安民,张玉清. 工控协议安全研究综述. 通信学报. 2024(06): 60-74 . 百度学术
3. 许伟杰,邹洪,张佳发,曾子峰,江家伟. 基于模糊测试技术的工控协议安全性分析系统. 微型电脑应用. 2024(09): 250-253 . 百度学术
4. 赵起超,杨晓龙,赵文宇,刘经纬,贾磊,于潼. 基于语义级协议解析的工控网络安全监测方法. 信息安全与通信保密. 2024(09): 19-30 . 百度学术
5. 谭高升,李伟,裴彦纯,孙军,王诗蕊. 工控协议深度包解析与检测技术研究. 网络安全技术与应用. 2023(05): 1-4 . 百度学术
6. 付安民,毛安,黄涛,胡超,刘莹,张晓明,王占丰. 基于主动交互式学习的工控协议逆向分析. 西安电子科技大学学报. 2023(04): 22-33 . 百度学术
7. 况博裕,李雨泽,顾芳铭,苏铓,付安民. 车联网安全研究综述:威胁、对策与未来展望. 计算机研究与发展. 2023(10): 2304-2321 . 本站查看
8. 徐魁,海洋,李晓辉,朱承才,陶军. 未知二进制协议的报文分割方法. 计算机技术与发展. 2023(11): 119-125 . 百度学术
9. 屠雅春,许驰,杜昕宜,王倚天,夏长清,金曦. 基于字符距离聚类的未知工控协议分类方法. 计算机应用研究. 2023(12): 3696-3700+3705 . 百度学术
10. 孙彦斌,汪弘毅,田志宏,方滨兴. 工业控制系统安全防护技术发展研究. 中国工程科学. 2023(06): 126-136 . 百度学术
11. 李长连,余思阳,程驰. 基于设备流量行为的工业物联网指纹识别技术. 工业信息安全. 2022(10): 47-56 . 百度学术
其他类型引用(8)
计量
- 文章访问数: 112
- HTML全文浏览量: 5
- PDF下载量: 68
- 被引次数: 19