AI内参_22_021_SIGIR_2018论文精读如何对搜索页面上的点击行为进行序列建模
你好,我是洪亮杰。
今天我和你分享的主题是SIGR二零一八论文精读。
如何对搜索页面上的点击行为进行序列建模?我们已经分享了SIGR二零一八的最佳论文,介绍了如何对推荐系统中的偏差进行建模,从而能够利用这种对偏差的理解来更加准确的对待。
基于流行度的推荐结果,周一我们分享了本次大会的最佳短论文,主要讲了如何利用对抗学习的技术来让学习的排序模型更加健壮,可以被应用到多个领域上。
今天我们分享的论文题目是页面搜索的点击序列模型。
文章的第一作者阿雷克谢伯里索夫,来自俄罗斯的搜索引擎young斯,并且在阿姆斯特丹大学攻读博士学位之前,他已经发表过了多篇。
关于点击模型和深度学习模型结合的论文文章的第二作者,马零万德纳。
第三,作者,伊雅马尔科文和最后的作者,马顿德里克也都来自阿姆斯特丹大学,其中马顿是荷兰的计算机科学家,欧洲的信息检索学术权威,并且还是荷兰皇家科学院成员。
我先对这篇论文的核心思想做一个提炼,就是利用深度学习模型来对用户在搜索页面上的点击行为进行建模。
传统上,这种对用户在搜索页面上的点击行为进行建模的思路,就是点击模型。
从二零零零年开始,对点击模型的研究就成了信息检索以及搜索领域中一个非常活跃的课题。
在最近十年的时间里,研究人员提出了几十种不同的点击模型。
总体来说,不同的点击模型主要是对不同的用户行为进行编码,从而能够更加准确的对用户的点击行为进行预测。
在很多传统的点击模型中,为了简化模型经常使用的一个假设是针对每一个查询关键词用户在搜索结果页只进行疑似建型。
在这种简化了的假设下,研究人员对用户的浏览点击以及页面的偏差,例如位置偏差进行建模就会变得更加容易。
然而,在很多场景中,这种假设就显得过于简化了。
在同一个查询关键词的搜索结果页面下,很多用户都会点击多个结果。
因此,对于多个点击结果的建模就变得重要起来。
这篇论文就是针对用户在搜索页面上的点击行为进行了序列建模,使得我们可以轻松的对每一个搜索页面进行预测,比如会有多少点击,以及在什么位置点击的同时,这篇论文还有一个贡献,就是利用了深度学习中的循环神经网络RNN来对查询关键词的结果进行建模,扩宽了传统的完全基于概率建模的点击模型。
在深度学习时代下的表现力。
论文提出方法的核心思路是,针对每一个查询关键词模型,需要对所有可能的点击序列进行建模。
这个任务是通过构建一个神经网络来完成的。
具体来说,文章提出的模型有两个重要的模块,编码器和解码器。
编码器的作用是利用查询关键词和搜索结果为输入生成它们的嵌入向量。
近年来,嵌入向量是深度学习建模中的一个重要技术手段。
它的目的往往是先把一些离散变量信息转化为连续信息,在这里查询关键词和搜索结果都可以首先表征为离散的输入信息。
然后需要映射到一个共同的语义空间,这可以被认为是一个中间结果或者在概率模型中。
这往往被认为是一个隐含向量解码器的作用,是根据这个中间的嵌入向量表达下的查询关键词和搜索结果,然后决定在哪个位置上可能会或者不会发生点击。
这其实啊就是一个多类的分类问题。
那么怎么才能让解码器终止在某一个状态呢?作者们引入了一个特殊的符号,代表序列的终止,这样解码器也需要预测是否需要终止。
类似的对解码器的操作,在深度序列建模中十分常见。
可以说,作者们在设计编码器和解码器的结构上也是费了一番功夫的。
对于编码器而言,作者们认为,一个好的嵌入向量必须包含当前的切果信息以及当前结果周围的结果或者说是上下文的信息,以及查询关键词的信息。
这样可以把每个搜索结果都当做是一个独立的单元,有着足够丰富的信息来进行后面的建模。
因此,作者们首先把查询关键词和每个搜索结果转换成为第一个层次的嵌入向量,组成一个大的第一层次的嵌入向量。
然后作者们利用这个第一层次的嵌入向量,并且引入了循环神经网络来对当前结果前后的结果进行了两次编码,以次正向一次逆向,从而形成了第二层次的嵌入向量。
这个第二层次的嵌入向量,就是最终表征每一个搜索结果的向量。
对于解码器而言,作者们利用了关注机制,来对每一个搜索结果施加不同的权重,或者说是关注度。
每一个时间点,也就是每次做是否要点击的角策之后,都会重新生成一个关注向量,或者说是一组新的关注权重。
这里的核心是一个循环神经网络自己更新内部的状态变量,并且根据关注向量以及输入的嵌入向量来预测下面一个点击的位置。
有了编码器和解码器之后,一个难点是如何生成最有可能的点击序列。
我们刚才提到了整个模型,其实可以预测多种不同的点击序列,因此生成最优可能的k个序列就成为了必要的一个步骤。
在这篇文章里,作者们利用了极速搜索的方法,来近似生成最佳的k个序列。
在文章中,k的值是幺零二四模型的训练,采用了标准的SGD以及adam m优化法。
同时,作者们还采用了梯度裁剪的方式,来防止在优化过程中发生爆炸题题。
作者们yyg dedex俄罗斯的搜索引擎数据上进行了实验,因为之前没有类似的模型,因此文章并没有直接比较的其他模型。
作者们主要进行评估的地方,是看历史数据中已经发生的点击序列会不会被正确,预测出会不会出现在k个模型,认为最有可能发生的点击序列。
因这也就是作者们为什么选择k等于幺零二四的原因。
因为在这种情况下,接近百分之九十七的历史序列都在模型的预测序列中。
作者们还评估了模型能否预测出总的点击次数等一系列和点击预测有关的任务。
论文中提出的模型都能够以接近一的概率预测所有的点击,并点击一些过去的基于概率的点击模型。
可以说,提出的模型的确可以对用户的搜索页面的点击行为进行有效的建模。
今天我为你讲了今年SIGR二零一八的一篇精彩论文,一起来回顾一下要点。
第一,我们详细介绍了这篇文章要解决的问题以及贡献,主要是对用户在搜索页面上的点击行为进行序列建模。
第二,我们简要介绍了文章提出方法的核心内容,主要是编码器和解码器两个模块。
第三,我们简单介绍了论文的实验结果,最后给你留一个思考题。
如果针对多个连续的查询关键词的点击行为进行建模,你能否用这篇论文提出的思路来扩展模型呢?欢迎你给我留言,和我一起讨论。