欢迎来到学术参考网

兰州石化公司网络舆情监控系统的设计与实现

发布时间:2015-11-13 10:06

摘 要:本文为了加强网络信息监管,开展信息分析而做出了一套基于兰州石化公司网络舆情监控系统,该系统通过过滤器接口 、文章分析、词库管理、网友信任度管理、舆情分析引擎等模块实现对网站发布信息实时监控,增加关键字、敏感话题的过滤功能。

关键词:舆情监控;论坛;舆情分析引擎
1、发展现状
  石化公司“原石化城”网站从2004年开始运行至2008年,帖子共80余万条,注册用户近3万,同时在线用户1000—5000。网站系统结构按实现框架分类如图1所示:
  
  图1 石化城网站系统结构图
  原网站采用.net技术架构开发,论坛部分共18个栏目,系统开发的年限早,部分功能不能满足网络发展的需要。当前运行存在一定问题,主要有以下三类:一是系统的性能问题;二是系统安全性问题;三是未建设舆情监控机制。解决这些问题,就需要建设舆情监控系统,增加过滤、分析功能,解决论坛的安全性问题、解决论坛的效率问题。
2、对问题的分析
  网站、论坛的业务流程主体一般分为三步,如下图:发帖人登陆系统后,通过“新帖”、“回帖”等方式新建帖子,在编辑完成后提交管理员审核。管理员检查帖子内容,符合要求的帖子由管理员确认,通过“发布帖子”的功能将其发布到展示状态,发布的帖子可以被其他人查看。  
  这项工作中最大的工作压力在于系统管理员要面对千万未知用户随时可能发出的帖子,主要工作压力有如下几点:
  1、信息量大。管理员要处理所有发帖人的信息,数据量会很大。
  2、帖子的随时性。发帖人可能在任何时间发帖,而管理员难以随时等候审阅帖子。
  3、网站、论坛的及时性要求。从网站、论坛发展的要求来说,发帖人希望发帖后能够立刻显示,这对管理员的要求很大。
  4、对帖子内容的阅读理解。管理员审核帖子的主要工作是对内容的阅读理解。
  5、发帖人情况未知。在不了解发帖人的情况下,就更需要加强对帖子的审核。
3、解决思路
  系统需要解决的关键问题是保障安全的前提下,降低管理人员的工作强度、提高发贴的效率。对网站发布信息实时监控,增加关键字、敏感话题的过滤功能,以技术手段代替部分人力,缩短发现问题的时间,同时可将部分有争议的帖子推送到相关部门进行审核发布,要解决关键问题就需要从解决上述5点问题入手。
  解决问题的办法就是在管理员审核帖子之前,利用信息技术,对帖子进行过滤处理,替代部分手工操作,以减轻管理员工作压力。我们称之为“过滤器”系统,系统的管理对象主要为发出的帖子。发帖信息有四种:
  一是帖子中包含的图片、声音等媒体附件;
  二是包含文字的文档附件;
  三是帖子中的文字信息;
  四是包括发帖人IP、昵称、账号等能够标识发帖人的信息。
  系统需要分别对这4种信息进行不同的处理。媒体的自动识别目前尚不成熟,我们暂不做信息处理。终端信息的分析可采用数据库、数据分析技术处理。文字及文档附件中的文字是系统处理的关键,系统的核心功能是“识别、理解”这些文字中是否包含不安全的内容,系统先将文章分解成词,根据这些词的特点以及和词库的词比对来判断文章是否包含不安全内容。最后通过舆情分析将帖子发送出来。
二、舆情监控技术研究
1、舆情监控的出现
  每当国家及公司发生一些重要事件,网站便成为广大民众进行互动的有效途径。围绕事件的发生、发展和变化,尽管某些言论的观点是客观的、真实的,对事件的发展、问题的解决起到了一定的促进作用,但更多的是情绪化、偏激的,辱骂、攻击,甚至制造谣言,混淆视听,激起民众的不满与愤怒。其主要表现为:
> 局部事件放大效应,无限夸大事实,引发网络舆情的不满;
> 制造谣言,假造信息,制造“内幕消息”,靠制造点击率吸引民众注意,造成事情的恶性发展;
> 少数人操控效应,故意诋毁并煽动民众对公司的不满。一旦恶意网络舆情聚集,往往被不明真相的网民一再放大,将给公司造成极大的负面影响,危及公司的权威和公信力。
  为加强对网络舆论的及时监测、有效引导,以及对网络舆论危机的积极化解,对维护社会稳定、促进公司以及国家发展具有重要的现实意义,也是创建和谐社会的应有内涵。所以有必要采用更先进的网络与信息技术加强对网站的监管力度。
2、舆情分析的核心问题
  对舆情的信息挖掘,褒贬分析成为舆情分析的难点。信息挖掘技术是对文本进行分析和处理。文本主要是个体的意见、情感和态度。舆情分析是针对文本整体性的倾向问题,专注于分析文本的极性和强度。一个良好的舆情监控系统取决于舆情分析模块。舆情分析的核心问题有以下两点:
> 热点和主题的发现:舆情的信息来自论坛,在大量的信息中及时发现热点问题是舆情分析的难点;
> 热点和主题的跟踪:热点问题的产生、发展、高潮、减弱、消退是一个动态的发展过程、准确反映问题的发展状态和趋势,对于舆情的引导和决策的应对具有重要意义
3、建立舆情控制机制
根据舆论的特点,进行网络舆情管理,应当建立期网络舆情监控机制。
1、建立法规制度:以法律的形式来规范互联网的运作;
2、技术建设:通过技术手段有效管理网络;
3、把握时机,对网络舆论进行引导与正面回应:
> 主动导帖,正确引导
> 积极跟帖,正面疏导
> 善于劝帖,对过激的言论进行规劝和警告
> 适时结帖,选择恰当的时机结束讨论,避免炒作之嫌
三、舆情监控系统设计与实现
1、舆情监控系统架构:
系统架构如下图,共分5个子系统。
(1)过滤器接口:为方便系统扩展和整合,接口将采用WebService技术实现;
(2)文章分析系统:文章分析系统由三类构建组成,一是系统通知工具、文档转换器工具,二是基于中文分词引擎的文章分析器,三是词库;
(3)词库管理:词库管理系统是对词库进行维护的系统,主要功能包括新建词,修改词性,删除词等;
(4)网友信任度管理系统:网友信任库管理系统是通过对网友建帖活动数据的分析和挖掘,生成网友信任指标的系统;
(5)舆情分析引擎:对过对网友全部活动数据的分析,生成舆情分析报告。
这五部分与论坛系统共同构成舆情监控系统。
2、舆情分析引擎
这是舆情监控的核心功能,主要包括:
> 热点话题和敏感话题的识别:根据发言时间的密集程度等参数,识别出某段时间的热点话题,利用关键字布控和语义分析,识别敏感 话题;
> 主题跟踪:分析新发表的文章、帖子的话题是否是已有主题;
> 趋势分析:分析某一个主题在不同时间段,人们的关注度;
> 突发事件分析:对突发事件进行预测发展趋势;
> 报警系统:对突发事件、涉及内容安全的敏感话题及时报警。
四、结束语:
  采用计算机自动地对网络舆情进行分析、整理,建立起全面高效的舆情监控预警机制。通过实行网络舆情监控,能够了解舆论动向,从而制定应对的策略,并及时采取措施。因此,网络舆情监控对于了解社情民意,缓解舆论压力,建设和谐社会具有重要作用和意义。
  一方面,该系统的使用可以保护绝大多数上网用户的正当权益,及时过滤一些有害的信息,加强对所发布信息监管的准确性,减少遗漏现象,减轻舆情监控人员的劳动强度和加班时长,增强对一些煽动性帖子的追踪功能。另一方面,通过系统有效的监管监控,对一些有敏感、争议、假造的信息,及时引导、化解矛盾,通过正确导向,减少冲突,从而降低了维稳工作成本。总之,通过该系统的使用,在公司社区网站管理的规范化、准确性以及及时性等方面都可以产生明显的经济效益。  
参考文献:
[1] 中国互联网络信息中心,《第23次中国互联网络发展状况统计报告》,2009年1月12日
[2] 国务院,《互联网信息服务管理办法》,292号令
[3] 中研网,《中文分词技术总结》,2006-04-10

上一篇:企业网络纵深防御体系问题探讨

下一篇:浅析丰富互联网应用程序(RIA)的发展历史与应