群体协同过滤现象研究论文

2个回答默认排序

默认排序

按时间排序

小宇宙可劲儿造

已采纳

论文：论文题目：《Neural Graph Collaborative Filtering》论文地址：本论文是关于图结构的协同过滤算法，在原始的矩阵分解和基于深度学习的方法中，通常是通过映射描述用户（或物品）的现有特征（例如ID和属性）来获得用户（或物品）的嵌入。从而利用user和item的embedding进行协同召回。但是作者认为这种方法的固有缺点是：在user与item的interaction数据中潜伏的协作信号（collaborative signal）未在嵌入过程中进行编码。这样，所得的嵌入可能不足以捕获协同过滤效果。让我们一起来看一下本论文是怎么利用数据中潜伏的协作信号的吧。推荐算法被广泛的运用在各个领域中，在电商领域，社交媒体，广告等领域都发挥着至关重要的作用。推荐系统的核心内容就是根据用户以前的购买和点击行为来评估用户对一个物品的喜爱程度，从而针对每个用户进行个性化推荐。协同过滤算法认为历史行为相似的用户之间的兴趣是相同的，所以给用户推荐的是同类型用户的爱好，也就是UserCF，而ItemCF给用户推荐的是跟历史行为相近的物品。传统的协同过滤方法要么是基于矩阵分解，要么是基于深度学习的，这两种方法都忽略了一个非常关键的信息---user和item交互的协作信号，该信号隐藏在user和item的交互过程中。原始的协同过滤方法忽略了这种信息，所以在进行user 和 item representation时就不足以较好的进行embedding。本论文通过将用户项交互（更具体地说是二分图结构）集成到embedding过程中，开发了一个新的推荐框架神经图协同过滤（NGCF），该框架通过在其上传播embedding来利用user-item图结构。这种方法在用户项目图中进行高阶连通性的表达建模，从而以显式方式将协作信号有效地注入到embedding过程中。在介绍模型之前先来讲解一下什么是useritem interaction以及什么是高阶的useritem interaction。我们先看左边的图，这个图就是useritem interaction，u1是我们待推荐的用户，用双圆圈表示，他交互过的物品有i1，i2，i3。在看右边这个树形结构的图，这个图是u1的高阶interaction图，注意只有l > 1的才是u1的高阶连接。观察到，这么一条路径，u1 ← i2 ← u2，指示u1和u2之间的行为相似性，因为两个用户都已与i2进行了交互。而另一条更长的路径，u1←i2←u2←i4暗示u1可能会点击i4，因为他的相似用户u2之前已经购买过i4。另一方面，用户u1在l = 3这一层会更倾向于i4而不是i5，理由是i4到u1有两条路径而i5只有一条。当然这种树结构是不可能通过构建真正的树节点来表示的，因为树模型比较复杂，而且结构很大，没法对每个用户构建一个树，这样工作量太大了。那么怎么设计模型结构可以达到跟这个high-order connectivity的效果呢，这个就要运用到神经网络了。通过设计一个embedding propagation layer来表示这种embedding 在每个层之间的传递。还是拿上面那张图举例子，堆叠两层可捕获u1←i2←u2的行为相似性，堆叠三层可捕获u1←i2←u2←i4的潜在推荐以及信息流的强度（由层之间的可训练权重来评估），并确定i4和i5的推荐优先级。这个跟传统的embedding是一样的，都是对原始的userID和itemID做embedding，跟传统embedding不同的地方是，在我们的NGCF框架中，我们通过在用户-项目交互图上传播embedding来优化embedding。由于embedding优化步骤将协作信号显式注入到embedding中，因此可以为推荐提供更有效的embedding。这一层是本文的核心内容，下面我们来进行详细的解读。从直观上来看，用户交互过的item会给用户的偏好带来最直接的依据。类似地，交互过某个item的用户可以视为该item的特征，并可以用来衡量两个item的协同相似性。我们以此为基础在连接的用户和项目之间执行embedding propogation，并通过两个主要操作来制定流程：消息构建和消息聚合。 Message Construction(消息构建) 对于连接的user-item对(u,i)，我们定义从i到u的消息为：其中ei是i的embedding，eu是u的embedding，pui是用于控制每次传播的衰减因子，函数f是消息构建函数，f的定义为：其中W1和W2用来提取有用的embedding信息，可以看到W2控制的i和u直接的交互性，这使得消息取决于ei和eu之间的亲和力，比如，传递更多来自相似项的消息。另一个重要的地方是Nu和Ni，pui = 1/ 。Nu和Ni表示用户u和item i的第一跳邻居。从表示学习的角度来看，pui反映了历史item对用户偏好的贡献程度。从消息传递的角度来看，考虑到正在传播的消息应随路径长度衰减，因此pui可以解释为折扣因子。 Message Aggregation 聚合方法如下：其中表示在第一嵌入传播层之后获得的用户u的表示。激活函数采用的是leakyrelu，这个函数适合对pos和neg信号进行编码。另一个重要的信息是 ,它的定义如下：这个信息的主要作用是保留原始的特征信息。至此，我们得到了，同样的方法，我们也能获得，这个都是first order connectivoty的信息。根据前面的计算方式，我们如果将多个Embedding Propagation Layers进行堆叠，我们就可以得到high order connectivity信息了：计算方式如下：当我看到这里的时候，我的脑子里产生了一个大大的疑惑，我们在计算第l层的eu和ei时都需要第l-1层的信息，那么我们怎么知道ei和eu在第l层是否存在呢？也就是说出现u侧的总层数l大于i侧总层数的时候，我们如何根据第l-1层的ei来计算第l层的e呢？经过思考，我感觉应该是这样的，训练样本应该是一条path，也就是这个例子是u1 ← i2 ← u2 ← i4这条path，所以可以保证u1跟i4的层数l是一样的，所以不存在上面那个层数不匹配的问题。 ps:看到后面的实验结果才知道L是固定的所以每一层都不会缺失。还有一个就是，不同层之间的W是不一样的，每一层都有着自己的参数，这个看公式就知道，理由就是我们在提取不同层信息的时候需要不同的W进行信息提取。另一个疑惑是pui到底是不是每一个l层都一样？这里看公式好像就是指的是第一跳的Nu和Ni进行就计算的结果。这部分内容是为了在进行batch训练的时候进行矩阵运算所推导的数学过程，其实跟之前我们讲的那个过程在数学上的计算是完全一样的，你想象一下，如果不用矩阵进行运算，在训练过程中要如何进行这么复杂的交互运算。当进行了l层的embedding propagation后，我们就拥有了l个eu和l个ei，我们将他们进行concate操作：这样，我们不仅可以通过嵌入传播层丰富初始嵌入，还可以通过调整L来控制传播范围。最后，我们进行内积计算，以评估用户对目标商品的偏好：采用的是pair-wise方式中的bpr loss：

241 评论 1小时前发布

八零梁行

（一）关于信息茧房的理论研究信息茧房最早由哈佛大学的桑坦斯教授在2000年出版的《信息乌托邦》中提出，其认为信息茧房是人们只听人们选择的东西和可以愉悦人们的东西的通讯领域。现在人们普遍认为信息茧房是指人们的信息领域会习惯性地被自己的兴趣所引导，从而将自己的生活桎梏于像蚕茧一般的“茧房”中的现象[1]。彭兰在《人人皆媒时代的困境与突围可能》中提及了“社交过滤网、圈子与信息茧房”，认为信息茧房与人的选择性心理有关，在传统媒体时代就存在，但是算法新闻、对信息过滤的社交网络以及具有圈层分化的社交平台在今天将其进行了放大[2]。喻国明在《信息茧房“禁锢”了我们的双眼》中介绍了信息茧房的概念以及其可能产生群体极化和社会粘性丧失的负面效应，并认为应通过完善技术算法和个人媒介素养两方面改善方式;他的另外一篇文章《个性化新闻推送对新闻业务链的重塑》，从新闻生产和受众两个层面分析了个性化新闻内容推送对新闻业的重塑，认为走出“茧房”效应应按照用户的社交数据和相关关系来“定义”潜在的需求[3-4]。陈昌凤教授与她的学生一同撰写了两篇论文《权力迁移与人本精神:算法式新闻分发的技术伦理》、《信息个人化、信息偏向与技术型纠偏——新技术时代我们如何获取信息》，前者分析了算法式分发新闻的现状，认为新闻分发权由人移交到机器、新闻把关权后移、公民参与受到损害;后者说明了信息平衡对于社会和个人的重要性，介绍国外现阶段的技术性纠偏尝试:新闻应用程序“跨越分歧的阅读”、英国卫报“刺破你的泡泡”、华尔街日报“红推送、蓝推送”等[5-6]。对于信息茧房的负面影响，蔡磊平在《凸显与遮蔽:个性化推荐算法下的信息茧房现象》认为个性化推荐系统提高了信息分发率、满足受众信息需求但也造成了信息茧房现象，令受众的全面发展和对现实社会认知判断产生影响[7]。同类的还有胡婉婷在《“信息茧房”对网络公共领域建构的破坏》中分析了信息茧房对公共领域建构的影响，认为其使得意见自由表达受阻、公众理性批判缺失、社会粘性削弱[8];苏颖在《传播的权力偏向》认为信息茧房与从众效应是产生群体极化的主要原因，在突发事件中，网民的负面观点和非理性情绪在“信息茧房”得到进一步强化[9]；郭小平在《信息的协同过滤与网民的群体极化倾向》中通过对网络事件的讨论得出了信息超载后的过滤会带来群体极化的现象，并对民主和理性沟通带来威胁[10]。对于信息茧房的解决策略，王刚在《“个人日报”模式下的“信息茧房”效应反思》中认为个性化信息服务强化了“信息茧房”效应，扩大了知识鸿沟，媒体应该担负起社会责任、提供高质量新闻内容[11]；刘华栋在《社交媒体“信息茧房”的隐忧与对策》中分析了信息茧房的成因，发现社交媒体、个人议程设置、协同过滤算法三者为茧房效应的形成提供条件，提出了构建多元化信息接收渠道、构建人行道模式、提升媒介素养的建议[12]。（二）有关信息茧房与具体案例的结合研究部分研究多从具体案例的特点出发，结合信息茧房的相关概念特征进行质性分析。如杨慧的《微博的信息茧房效应研究》描述了信息茧房在微博中的体现并针对微博提出了相应改进策略[13]。许志源、唐维庸在《2016美国大选所透射的“过滤气泡”现象与启示》中以2016年的美国大选为研究事件，发现入们的“准感官统计”在新媒体时代受到技术算法的干扰，呼吁媒介在追求经济效益的同时应负起社会责任[14]。在能够搜集到的国内定量方面研究中，李佳音在《基于个性化推荐系统新闻客户端的信息茧房效应研究》中选取今日头条作为个性化推荐系统的代表，用调查问卷的方法调查今日头条用户在使用过程中信息茧房效应的影响[15];彭晓晓在《信息时代下的认知茧房》中用内容分析的方法对选取的微博样本用户进行编码、界定、挖掘，并结合社会关系网络进行分析，以此验证“茧房”效应的存在性问题[16]。两者对于本研究都有很好的启发性，但前者选取今日头条，后者通过一个范围很小的“微博上广告业界与学界的意见领袖”群体来推定信息茧房的存在，在样本范围以及差异性上有些不妥。（三）总结通过对文献进行整理，发现现有关于信息茧房研究都是基于桑坦斯教授的理论，侧重于对于信息茧房的理论再认识，并且都停留于行为模式的简单陈述。部分研究结合了具体案例，但是仍是泛泛而谈地去佐证桑坦斯教授的理论和观点，没有对信息茧房现象提出针对性的建议，缺乏对于观众行为和信息平台的深入讨论研究。（四）参考文献 [if !supportLists][1] [endif]李清池.通向信息乌托邦的道路——读《信息乌托邦》[J].中国法律,2010(02):19-20+73. [if !supportLists][2] [endif]彭兰.人人皆媒时代的困境与突围可能[J].新闻与写作,2017(11):64-68. [if !supportLists][3] [endif]喻国明.“信息茧房”禁锢了我们的双眼[J].领导科学,2016(36):20. [if !supportLists][4] [endif]喻国明,侯伟鹏,程雪梅.个性化新闻推送对新闻业务链的重塑[J].新闻记者,2017(03):9-13. [if !supportLists][5] [endif]陈昌凤,霍婕.权力迁移与人本精神:算法式新闻分发的技术伦理[J].新闻与写作,2018(01):63-66. [if !supportLists][6] [endif]陈昌凤,张心蔚.信息个人化、信息偏向与技术性纠偏——新技术时代我们如何获取信息[J].新闻与写作,2017(08):42-45. [if !supportLists][7] [endif]蔡磊平.凸显与遮蔽:个性化推荐算法下的信息茧房现象[J].东南传播,2017(07):12-13. [if !supportLists][8] [endif]胡婉婷.“信息茧房”对网络公共领域建构的破坏[J].青年记者,2016(15):26-27. [if !supportLists][9] [endif]苏颖. 传播的权力偏向[D].中国政法大学,2011. [if !supportLists][10] [endif]郭小平.信息的“协同过滤”与网民的“群体极化”倾向[J].东南传播,2006(12):43-44. [if !supportLists][11] [endif]王刚.“个人日报”模式下的“信息茧房”效应反思[J].青年记者,2017(29):18-19. [if !supportLists][12] [endif]刘华栋.社交媒体“信息茧房”的隐忧与对策[J].中国广播电视学刊,2017(04):54-57. [if !supportLists][13] [endif]杨慧. 微博的“信息茧房”效应研究[D].湖南师范大学,2014. [if !supportLists][14] [endif]许志源,唐维庸.2016美国大选所透射的“过滤气泡”现象与启示[J].传媒,2017(16):54-56. [if !supportLists][15] [endif]李佳音. 基于个性化推荐系统新闻客户端的“信息茧房”效应研究[D].中央民族大学,2017. [if !supportLists][16] [endif]孙亮.信息时代下的“认知茧房”[J].思想政治工作研究,2010(04):52.

126 评论 11小时前发布

群体协同过滤现象研究论文

2个回答 默认排序 默认排序 按时间排序

相关问答

学术期刊

向你推荐

热门问题

2个回答默认排序

默认排序

按时间排序