• 回答数

    3

  • 浏览数

    240

勤添Jacky
首页 > 学术期刊 > 网络流量研究论文统计分析

3个回答 默认排序
  • 默认排序
  • 按时间排序

AndyBarrel

已采纳

在网站流量统计分析报告中,给出的网站页面浏览数一般是在一个统计时期内的网页浏览总数,以及每天平均网页浏览数。仅从网页浏览总数或者每天的平均网页浏览数中实际上发现不了对网络营销分析有很大价值的信息。网站访问统计分析的基础是网站流量统计数据,其实可以统计的信息不仅仅是用户浏览的网页数量等“流量指标”,还包含更多用户访问网站的各种行为记录,网站访问统计的主要指标可以分为三类:1、网站流量指标;2、用户行为指标;3、用户浏览网站的方式。在进行深度网站统计分析时,除了自己网站的访问数据之外,通常还需要了解网站所在领域的状况,尤其是主要竞争者网站的访问统计信息,因此就需要获得竞争者网站的访问统计数据,这样才能进行全面的网站访问统计分析。在进行网站访问量统计分析时,页面浏览数(或称页面下载数、网页显示数)是必不可少的一项指标,实际工作中对这项指标的对比分析中经常会出现一些容易造成混淆的地方,因此在研究网站流量统计分析有关问题时, 有必要对网页浏览数的真实意义做一些讨论。 在一定统计周期内所有访问者浏览的页面数量。如果一个访问者浏览同一网页三次,那么网页浏览数就计算为三个。页面浏览数常作为网站流量统计的主要指标。不过,页面浏览数本身也有很多疑问,因为一个页面所包含的信息可能有很大差别,一个简单的页面也许只有几行文字,或者仅仅是一个用户登录框,而一个复杂的页面可能包含几十幅图片和几十屏的文字,同样的内容,在不同的网站往往页面数不同,这取决于设计人员的偏好等因素。例如一篇6000字左右的文章在普通网站通常都放在一个网页上,而在有些专业网站则很可能需要5个页面,对于用户来说,获取同样的信息,网站统计报告中记录的页面浏览数是1,而别的网站则是5个。作者在网络常用术语中也介绍过,由于页面浏览实际上并不能准确测量,因此现在IAB推荐采用的最接近页面浏览的概念是“页面显示”。无论怎么称呼,实际上也很难获得统一的标准,因此页面浏览指标对同一个网站进行评估有价值,而在不同网站之间比较时说服力就会大为降低。 这是一个平均数,即在一定时间内全部页面浏览数与所有访问者相除的结果,即一个用户浏览的网页数量。这一指标表明了访问者对网站内容或者产品信息感兴趣的程度,也就是常说的网站“粘性”。比如,如果大多数访问者的页面浏览数仅为一个网页,表明用户对网站显然没有多大兴趣,这样的访问者通常也不会成为有价值的用户。但应注意的是,由于各个网站设计的原则不同,对页面浏览数的定义不统一,同样也会造成每个访问者的页面浏览数指标在不同网站之间的可比性较低。尽管存在统计指标定义无法统一的问题,但在网站统计时仍不得不利用这些相关的指标。一般所说的“网站流量”通常指一个网站的页面浏览数,例如ALEXA全球网站排名系统的综合排名,就是根据网站的独立用户数量和每个用户的页面浏览数两项指标(加权?)相乘来计算的。因此可以看到这样的情况:两个网站相比,A网站的Reach数量(统计指标为百万用户中访问该网站的用户数量,即“Reach”)高于B 网站(假定A网站为100,B网站为60),但B网站每个用户的页面浏览数高于A网站(假定这项指标A网站为1,B网站为2),其结果是,独立用户量小的B网站在综合排名中高于A网站,因为B网站的总流量较高(B网站流量为120,A网站为100)。

86 评论

休普若斯

网站流量数据统计是网站运营人员重要的一项工作。网站流量数据统计可以通过百度统计、cnzz或者网站iis日志分析。百度统计和cnzz需要将其统计代码加入网站代码中,然后就可以进行每天的统计。网站iis日志可以下载下来,找一个便捷的分析工具进行筛选分析。这里以cnzz为例:在cnzz分站分析中有“流量分析”、“来源分析”、“受访分析”、“访客分析”、“价值透视”等功能,能够清晰的分析统计网站流量数据。

206 评论

单曲5678

网络流量建模有着广泛的应用。在本文中,我们提出了网络传输点过程(NTPP),这是一种 概率深层机制 ,它可以模拟网络中主机的流量特性,并有效地预测网络流量模式,如负载峰值。现有的随机模型依赖于网络流量本质上的自相似性,因此无法解释流量异常现象。这些异常现象,如短期流量爆发,在某些现代流量条件下非常普遍,例如数据中心流量,从而反驳了自相似性的假设。我们的模型对这种异常具有鲁棒性,因为它使用时间点流程模型有效地利用了突发网络流量的自激特性。 在从网络防御演习(CDX)、网站访问日志、数据中心流量和P2P流量等领域收集的7个不同的数据集上,NTPP在根据几个基线预测网络流量特性(从预测网络流量到检测流量峰值)方面提供了显著的性能提升。我们还演示了我们的模型在缓存场景中的一个应用程序,表明可以使用它来有效地降低缓存丢失率。

对新型网络应用和系统的需求日益增长, 使得网络流量行为更加复杂和不可预测 。例如,在数据中心网络中,流量微爆发源于应用程序[1]的突然流行,而在副本[2]间的信息同步过程中产生的大象流会在骨干网络上造成临时的负载不均衡。另一方面,由于不同的终端用户活动模式[3],诸如多媒体流媒体和视频会议等流量密集型应用导致了蜂窝网络和移动网络上的巨大流量差异。这种流量差异影响最终用户应用程序[4]的体验质量(QoE)。此外,随着基于Internet小型计算机系统接口(iSCSI)的分布式存储[5]和物联网(IoT)应用[6]的大规模地理分布式云存储同步的迅速普及,网络流量变异性成倍增加。各种安全攻击,如分布式拒绝服务攻击(DDoS),加剧了流量模式预测[7]的假阴性问题。 由于应用范围的多样化,短期和长期的流量爆发在各种类型的网络中都很常见;因此,研究人员探索了不同的 基于突发周期性假设 的流量突发预测技术,如 流量矩阵[8]的部分可预测性 、 张量补全方法 [9]等。然而,最近网络流量的高度不均匀性 使这种流量突发周期性的假设失效,并导致了明显的流量差异和多重分形流量变化 ,这需要单独的检测工作。这种交通差异和多重分形的例子包括数据中心或或ISP骨干[11]网中流量的突发峰值(微突发)[10]、多媒体应用的流量(如视频流媒体)[12]、存储同步[13]、恶意或攻击流量(例如物联网设备中的DDoS攻击)[7]。因此,需要开发一个流量事件预测模型,该模型可以捕获诸如流量突发、突发峰值、主机带宽使用的意外跳变等流量差异和多重分形流量变化。 在这项工作中,我们旨在 将差异性和可变性检测集成到网络流量建模中 ,从而为高度异常的网络流量提供统一的模型。为此,我们按照单独的网络主机(例如数据中心服务器或终端用户设备)的传输特性来分解流量预测问题,在此我们着重于总网络带宽的份额每个主机使用的时间,称为给定时间的“优势”。为此,我们提出了网络传输点过程(NTPP),它是一种基于时间点过程机制的深度概率机制。 NTPP首先使用 循环标记时间点过程 (RMTPP)表征主机突发流量产生的事件[14],该过程结合了主机的影响以根据可用带宽转发流量突发。此外,我们使用一组学习来对任意给定时间内对网络中不同主机进行排序的模板进行 排序 ,从而对不同主机之间的争用进行建模,其中主机的排序由其生成的通信量决定。这些模板提供了各种方法来评估一对主机的相对顺序,这些顺序是由它们的争用过程引起的。这些措施,连同底层的包传输过程,确保在整个时间窗口内主机之间的正确排序。为了了解传输动态以及排名的变化,我们将给定主机的观测传输时间的似然性最大化,并结合学习对模板进行排名的其他措施进行统一。这种额外的小工具使我们的模型能够预测意外的峰值,带宽使用量的跳跃,否则很难追踪(实验着重证明了这一点)。 我们根据来自不同域的 七个 真实数据集上的几个最新基准评估了我们的系统,这些数据集可能会显示异常流量。其中四项是从各个组织进行的网络防御演习中获得的,一项是从网站访问日志(1998年世界杯Web服务器)获得的,另一项是从数据中心流量的获得的,另一项是从BitTorrent网络获得的。我们观察到,在预测主机流量方面,NTPP的平均性能比最具竞争力的基准好11%,而在检测主机带宽消耗的突然跳升或峰值时,NTPP的预测精度提高了约25%。我们还使用基于NTPP的模拟器实现了下游缓存应用程序,并且观察到缓存未命中率降低了约10%。 贡献 : (1) 复杂包传输过程建模 :我们设计了NTPP,这是一个多主机网络流量动态的非线性随机模型,能够准确地捕捉到包传输过程中攻击性跳跃和不规则行为的存在。此外,与现有的离散时间流量模型(如[9]、[15])相比,我们使用了时间点过程的连续时间特性。 (2) 主机间的争用建模 :我们的NTPP方案利用了[16]中提出的产品竞争建模思想,将丰富的学习文献与网络流量建模联系起来,对[17]其进行排名。 (3) 预测能力 :NTPP不仅具有理论基础,而且具有实践效果。我们的模型能够比几种最先进的基准更有效地预测分组传输动态。此外,嵌入式鉴别模块有助于实时估计带宽消耗的突然变化,这是一个至关重要的实际挑战,所有基准都无法追踪。 (4) 下游应用 :我们演示了NTPP在下游缓存场景中的应用,突出了它的实用性。现有的原始内容缓存由于突发的流量而存在较高的缓存丢失率,而我们的模型支持的智能内容缓存通过根据不同主机的预测流量为它们保留不同数量的内存空间来实现更好的性能。

从历史上看,大量的工作集中在从各种不同的角度对万维网流量进行建模,使用各种分布模型,如泊松、帕累托、威布尔、马尔科夫和嵌入式马尔科夫、ON-OFF等。随着互联网的发展和各种Web服务的引入,提出了更复杂的模型,如马尔科夫调制泊松过程[19]、马尔科夫调制流体模型[20]、自回归模型[21]、流量矩阵[8]的部分可预测性、张量补全方法[9]等。然而, 这些模型只能捕获特定类型的网络事件,而不能泛化为捕获Internet流量中的不同流量差异和变化 。在另一个独立的线程中,研究人员将互联网流量爆发建模为一种显示自相似性[22]的现象。然而,许多工作23],[24]也质疑“自相似性”的假设,特别是在互联网骨干网中,从多个来源的流量会得到多路复用。 随着大规模数据中心、基于物联网的平台、蜂窝网络和移动网络、信息中心网络等领域的出现,互联网流量的性质发生了巨大变化。因此,出现了各种领域特有的模型,如数据中心[15]的流量微突发预测、流量异常检测[25]、物联网流量表征[26]、互联网社交事件预测[27]等。此外,由于网络流量在不同的差异和变化下具有不同的性质,最近的一些工作探索了基于机器学习的技术来预测流量模式[12]、[28]、[29]中的不同事件、异常和不一致性。然而, 这种预测模型是针对特定的网络系统设计的,缺乏通用性 。

在本节中,我们将制定NTPP,即所提出的模型(参见图1),该模型捕获了网络流量动态的两个主要组成部分—(i)集体包传输机制和(ii)多个主机之间的争用。在一开始,NTPP是由一种基于点过程的深层概率机制驱动的——点过程是一种特殊类型的随机过程,它自然地捕获了连续数据包到达背后的机制。此外,它还包含一个判别模块,该模块包含一系列对函数[17]进行排序的学习,专门设计用于建模主机间争用过程。接下来,我们将从时间点过程的概述开始,详细描述它们,然后描述学习和预测动态的方法。

355 评论

相关问答

  • 计量经济分析的研究方法论文

    计量经济学是用定量 方法 研究经济活动规律的一门科学,在经济学科中居于最重要的地位。下面是我为大家推荐的计量经济学论文,供大家参考。计量经济学论文 范文

    朵喵喵ljh 4人参与回答 2023-12-09
  • 计算机网络论文需求分析

    可以直接做一些相关期刊的了解,然后直接联系杂志社编辑沟通一下投稿的相关事宜。评职称发论文就是一个过场了,还是一个必经的过场,随便找一个地方发就行了 网上有很多的

    vicki瑶瑶 4人参与回答 2023-12-10
  • 统计分析属于设计还是论文研究

    调查法 调查法是科学研究中最常用的方法之一。它是有目的、有计划、有系统地搜集有关研究对象现实状况或历史状况的材料的方法。调查方法是科学研究中常用的基本研究方法,

    那夜无边 5人参与回答 2023-12-06
  • 知网论文统计分析

    我来帮帮你大哥风范复合化肥 大哥你也真是,咋在这做广告来了,,你看你,这题目可是关于医学论文的。你怎么做广告也不看地方。真是浪费发帖者的心血。。哎!可悲啊!

    jennifer1959 7人参与回答 2023-12-07
  • 统计学定量分析论文

    统计分析是运用统计 方法 与分析对象有关的知识,从定量与定性的结合上进行的研究活动。下文是我为大家整理的关于统计分析论文的 范文 ,欢迎大家阅读参考!

    兜兜有糖sd 3人参与回答 2023-12-11