基于混沌情景预测方法的微博信息扩散建模的几
中图分类号:TP391 文献标识码:A 文章编号:1006-4311(2014)21-0226-03
0 引言
目前,随着社交网络的飞速发展,以用户关系为基础的社交网络正逐渐受到广大网民的喜爱。作为新传媒时代的一种新兴产物,社交网络已日益深入到人们的日常生活中,并深刻影响和改变着人们的人际交流和信息传播的方式。微博作为其中的典型代表,其不断增长的用户数量和迅猛发展的影响力在中国掀起了一场“微潮流”。
微博是以用户关系作为基础而实现获取、分享和传播信息的平台,又称作微型博客。用户可以通过WEP、WAP以及其他客户端构建个人微博主页,发表140字以内的内容从而完成分享和传播信息的目的。微博作为一种新兴的社交网站,它为用户提供休闲娱乐的平台,实现生活服务信息的传播。微博具有大众化和简捷性、实时感和传播性以及多维性与传播分层性的特点。其中传播的分层性是指:假设我们把直接转发原创微博的用户分为第一层,间接转发的用户分为第二层,依此类推,那么微博原创者的转发量会明显高于其他转发者的转发量。
近年来微博的用户数量呈爆炸式增长,微博已经成为扩散信息以及传播舆论的重要平台。对于微博信息的扩散而言,它是一类复杂的非线性演化过程,混沌理论作为研究非线性的一门学科,在认识社会现象方面具有独特的思想。由于混沌理论能够揭示复杂现象的内在规律,从而能够帮助复杂的微博信息扩散现象找出背后的客观原因,因此,为研究微博信息的扩散提供了新的理论和方法。
1 混沌情景预测
基于混沌理论的混沌情景预测是一种非线性系统的预测方法。其基本思想为:在假定行为个体微观动力机制(或规则、政策)条件下,通过模拟个体的行为与互动,对个体行为结果进行加总,从而在宏观层次上预见未来可能复杂的情景。该方法侧重于应用混沌理论对复杂现象和演化过程进行解释与分析,具有深厚理论基础和先进技术支持,广泛适用于公共政策和社会经济复杂现象的评价、模拟和仿真。
混沌情景预测假定复杂系统的演变是许多基元互相作用的结果,即采用自下而上的建模思路。他将空间划分为若干离散的独立基元,相邻基元之间的相互作用是一种简单的确定性过程,一个基元会受到周围几个基元状态的影响而发生变化,并且每个基元都具有若干个离散状态。将时间分成一系列离散的时间步,每个基元在每个时间步中按照一定的规则进行同步更新状态,基元自身以及临近基元前一时刻的状态共同决定了基元的状态。
与传统的数学模型和模拟方针方法相比,混沌情景预测方法除了更容易描写基元之间的相互作用外,还更容易仿真一些难以解析表达的复杂现象和变化,从而能够真实详细的反映大量个体相互作用的模式和结构,因此,是研究微博信息扩散变化的有效方法。
2 微博信息扩散仿真模型
2.1 仿真模型的构建 微博信息扩散仿真模型的定义如下:D=(Ld,S,N,f)
模型中有4个变量。
2.1.1 空间与基元(Ld) 微博信息扩散的系统空间即为空间,而对微博中单个用户的抽象即为基元。每个基元作为微博信息的潜在接受者和转发者,都具有具体的行为和状态,为了更新自身和整个系统状态,都会与外部环境和周围基元进行信息互换。每个基元面对微博中的信息都可以选择两种行为,即接受并转发和接受但是不转发。
2.1.2 状态(S) 每个基元有三个状态,用0、1、2表示。状态为0表示未接收到微博信息,状态为1表示接收但不转发微博信息,状态2为表示接收并转发微博信息。由于转发微博的用户在微博信息扩散过程中起到关键的枢纽作用,所以表示为状态2的基元为我们重点关注的对象。模型中的每一个基元按照一定的决策规则和周围基元的状态更新各自的现有状态。已接收微博信息的基元的状态在以后时间步长将不会发生任何变化。而未接收微博信息的基元通过时间步长的推移不断更新其是否接收信息的状态以及是否转发信息的状态。
2.1.3 邻居(N) 邻居是对微博系统中人际关系网络的抽象,是指相互之间成为粉丝的其他微博用户。微博中的信息主要通过各用户的人际关系网络进行扩散。接收到微博信息的用户选择对此信息进行转发,从而使微博信息在各用户间得以扩散。邻居的类型对于微博信息的扩散具有很大的影响。本文采用图1 Moore型邻居,即基元以上面三个,下面三个,以及左右各一个基元为邻居。周围邻居的状态和当前自身的状态共同决定了每个基元的下一个状态。
2.1.4 决策规则(f) 基元遵循一定决策规则决定是否转发接收到的微博信息。决策规则是对微博用户在微博系统中转发微博决策规则的概括与抽象。在现实当中,微博用户对各种感兴趣的微博信息非常敏感,且具有较强的传播与展示的动力。而绝大多数微博用户的决策规则不存在本质的差别,接受微博信息所能带来的期望收益或效用具有不确定性,而且期望值本身也会随微博信息的发展而发生变化。因此,在没有其他微博信息可替代的假设前提下,每个基元的决策规则定义如下:周围是否已经有邻居转发了微博信息,若有,则该行为个体按照一定概率水平决定是否转发该微博信息;否则不转发。同时,根据微博传播分层性的特点,把系统空间分层,同一层内个体决定转发微博信息的概率是相等的,而且由内层向外层概率逐渐递减。
2.2 仿真流程设计 本文将微博信息扩散系统空间设置为二维空间平面区域,而系统空间具有正整数坐标的点即为基元。手动输入第一层转发概率,并把系统空间分成四层,第一层与第二层转发概率相差0.3,第二层与第三层相差0.2,第三层与第四层相差0.1。新的微博信息首先从区域中心点进入,并逐层向外扩散。如果某个基元决定转发微博信息(状态变为2),则在其相应坐标处进行标记,即放置一个“*”,否则不标记。采用MATLAB2010b软件,按照以上仿真模型编写微博信息扩散仿真程序(见附录),程序流程如图2所示。
其中,P为微博信息转发概率,N为矩阵的阶数(取奇数), i为向外扩散的层数,j为找到每层扩散者并确定其周围潜在扩散者位置的次数。
3 微博信息扩散仿真结果及分析
由于不同用户对微博的感兴趣程度很难精确量化,从而导致转发概率确定的困难,同时这也不是本文研究的重点,所以这里只是随机输入转发的概率。用概率分
别为0.7,0.8,0.85对微博信息扩散进行仿真。仿真结果见图3至图5。
从仿真结果来看,可得出以下结论:
第一,可以将微博网络中信息扩散的过程看作水波涟漪的扩散过程。发出的一条微博就好像在水面投下一颗石子,信息扩散至粉丝就像石子产生的第一层波纹接触到这些粉丝,波纹的中心即原微博。原微博的粉丝转发了这个微博,信息就扩散至粉丝而形成第二层波纹,中心变成了转发这条微博的人。第二级波纹的中心显然可以不只是一个。在粉丝足够多的情况下会形成多级多中心的波纹,微博信息扩散的范围也就可以足够大。但微博信息扩散具有一个范围,这个范围受到粉丝数量的限制,粉丝与原微博发出者的关系越弱,不接受信息的用户数量就越多。
第二,微博信息接受者的数量和空间分布对行为个体接受概率的变化非常敏感。接受者概率越大,接受的数量就越多。通过观察不难发现,明星和机构账号的粉丝多,带来的转发量也多。表示个体在接受认证微博信息的概率大。这体现了互联网经济的“马太效应”和“名人规律”,即强者愈强,弱者愈弱。由此给我们启示,可以把微博作为一个舆论控制、活动宣传、客户服务的平台。
第三,通过仿真可看出原本看似混乱的微博信息扩散,其内部具有一定的规律,依靠直接观察结果来做判断是不科学的,寻找微博信息扩散的影响因素需要一定理论作为判断依据。同时仿真表明微博信息接受者在空间分布上存在一系列的盲点,这表示微博信息不可能被每个人都接受。由于这些盲点地带的微博信息潜在接受者在个体行为上与其他地带的接受者并没有差异,因此,该现象仅是一种遵循一定规则的随机现象。如何减少盲点地带在微博宣传中是个值得思考的问题。
4 结束语
本文采用混沌情景预测方法构建了微博信息扩散仿真模型对微博中的信息扩散进行仿真研究。从仿真结果可以看出:
第一,微博信息的扩散会受到基元个体决策规则细小变化的巨大影响;
第二,微博信息接受并且转发的用户的空间分布取决于行为个体对微博信息接受概率的大小;
第三,看似混乱随机的情景,其实背后隐含着一定的规律,仅依靠表面观察的结果来做决策是很容易犯错误,应寻找微博信息扩散背后深层次的原理,从而获得最大化的效用。综上所述,本文构建的微博信息仿真模型揭示了微博信息扩散的本质性原理,对了解微博信息的扩散机制和电子商务中的病毒式营销方式具有一定指导意义和实践价值。
附(程序源代码):
%状态表示,0为没有接收到信息,1为不相信不传播,2为相信而且传播的。
a = 105;
b = input('请输入信息接收的概率');
%矩阵的阶数为奇数,所以中心位置的元素;((a+1)/2,(a+1)/2)
A = zeros(a);
A((a+1)/2,(a+1)/2) = 2;
%生成阶数为a的零矩阵,并把中心值变为2
N = (a - 1)/2; %外层循环的次数,即寻找2的次数
for i = 1:N
if i >= 1 && i <= 13
d = b;
elseif i >= 14 && i <= 26
d = b-0.3;
elseif i >=27 && i <= 39
d = b-0.5;
elseif i >= 40 && i <= 52
d = b-0.6;
end
[m,n] = find(A==2);
M = length(m);
for j = 1:M %内层循环,把2周围的0值按决策规则进行相应的赋值
B = A(m(j)-1:m(j)+1,n(j)-1:n(j)+1);
c = length(find(B==0));
B(B==0) = randsrc(c,1,[1,2;1-d,d]);
A (m(j)-1:m(j)+1,n(j)-1:n(j)+1) = B;
end
end
[x1, y1] = find(A==2);
[x2 ,y2] = find(A==0);
scatter(x1,y1,'k*');
AXIS([0 100 0 100]);
参考文献:
[1]张砀,路荣,杨青.微博客中转发行为的预测研究[J].中文信息学报,2012,26(4):109,114.
[2]吴凯,季新生,刘彩霞.基于行为预测的微博网络信息传播建模[J].计算机应用研究,2013,30(6).
[3]于洪,杨显.微博中节点影响力度量与传播路径模式研究[J].通信学报,2012,33(z1):96-102.
[4]魏玖长,赵定涛.危机信息的传播模式与影响因素研究[J].情报科学,2006,24(12).
. Information Research,2004(5):178-184.
[6]刘洪.经济系统预测的混沌理论原理与方法[M].北京: 科学出版社,2003:148-163.
[7]方美琪,张树人.复杂系统建模与仿真[M].北京:中国人民大学出版社,2005:151-175.
[8]易成岐,鲍媛媛,薛一波,姜京池.新浪微博的大规模信息传播规律研究[J].计算机科学与探索,2013,7(6).