• 回答数

    7

  • 浏览数

    316

小遥CITY
首页 > 论文发表 > 谷歌三篇论文发表时间

7个回答 默认排序
  • 默认排序
  • 按时间排序

whippedcream

已采纳

江湖传说永流传:谷歌技术有"三宝",GFS、MapReduce和大表(BigTable)!

谷歌在03到06年间连续发表了三篇很有影响力的文章,分别是03年SOSP的GFS,04年OSDI的MapReduce,和06年OSDI的BigTable。SOSP和OSDI都是操作系统领域的顶级会议,在计算机学会推荐会议里属于A类。SOSP在单数年举办,而OSDI在双数年举办。

那么这篇博客就来介绍一下MapReduce。

1. MapReduce是干啥的

因为没找到谷歌的示意图,所以我想借用一张Hadoop项目的结构图来说明下MapReduce所处的位置,如下图。

Hadoop实际上就是谷歌三宝的开源实现,Hadoop MapReduce对应Google MapReduce,HBase对应BigTable,HDFS对应GFS。HDFS(或GFS)为上层提供高效的非结构化存储服务,HBase(或BigTable)是提供结构化数据服务的分布式数据库,Hadoop MapReduce(或Google MapReduce)是一种并行计算的编程模型,用于作业调度。

GFS和BigTable已经为我们提供了高性能、高并发的服务,但是并行编程可不是所有程序员都玩得转的活儿,如果我们的应用本身不能并发,那GFS、BigTable也都是没有意义的。MapReduce的伟大之处就在于让不熟悉并行编程的程序员也能充分发挥分布式系统的威力。

简单概括的说,MapReduce是将一个大作业拆分为多个小作业的框架(大作业和小作业应该本质是一样的,只是规模不同),用户需要做的就是决定拆成多少份,以及定义作业本身。

下面用一个贯穿全文的例子来解释MapReduce是如何工作的。

2. 例子:统计词频

如果我想统计下过去10年计算机论文出现最多的几个单词,看看大家都在研究些什么,那我收集好论文后,该怎么办呢?

方法一:我可以写一个小程序,把所有论文按顺序遍历一遍,统计每一个遇到的单词的出现次数,最后就可以知道哪几个单词最热门了。

这种方法在数据集比较小时,是非常有效的,而且实现最简单,用来解决这个问题很合适。

方法二:写一个多线程程序,并发遍历论文。

这个问题理论上是可以高度并发的,因为统计一个文件时不会影响统计另一个文件。当我们的机器是多核或者多处理器,方法二肯定比方法一高效。但是写一个多线程程序要比方法一困难多了,我们必须自己同步共享数据,比如要防止两个线程重复统计文件。

方法三:把作业交给多个计算机去完成。

我们可以使用方法一的程序,部署到N台机器上去,然后把论文集分成N份,一台机器跑一个作业。这个方法跑得足够快,但是部署起来很麻烦,我们要人工把程序copy到别的机器,要人工把论文集分开,最痛苦的是还要把N个运行结果进行整合(当然我们也可以再写一个程序)。

方法四:让MapReduce来帮帮我们吧!

MapReduce本质上就是方法三,但是如何拆分文件集,如何copy程序,如何整合结果这些都是框架定义好的。我们只要定义好这个任务(用户程序),其它都交给MapReduce。

在介绍MapReduce如何工作之前,先讲讲两个核心函数map和reduce以及MapReduce的伪代码。

3. map函数和reduce函数

map函数和reduce函数是交给用户实现的,这两个函数定义了任务本身。

288 评论

假装不在上海

看你上面的刊期,在职称评定中,是以刊期为准的。如果是5月份的刊期,即使是8月份收到的,也是按5月份算的。

273 评论

斯蕾油画

论文发表一般需要的时间如下:1、普刊即省级国家级一般安排周期是1到3个月;2、本科学报的安排周期一般为2到4个月;3、北大核心以上级别期刊的安排周期一般为6到8个月,审稿周期为一个月;4、科技核心期刊从投稿到录用发表,一般是3到6个月。

133 评论

浅陌时光

首先拿自然投稿来说,省级和国家级的论文审稿需要1-2天,发表时间需要1-3个月。个别快的话半个月内就可以完成,慢的话甚至要4-7个月之久了。对于质量水平较高的期刊和一些大学期刊来说,投稿发表时间通常在6个月左右,较快的也需要3-4个月。科技核心期刊审稿需要1-3个月,发表需要6-10个月,总体时间大致是1-1.5年。北核和南核的审稿需要3-4个月时间,出版则需要6-15个月时间,跨度大,总共需要时长约1-2年。SCI和EI等与北核南核时间周期类似。众所周知,省级和国家级别的期刊是普通期刊,是职称期刊发表的起跑线。相对而言,从选刊到成功收刊用不了多长时间。有些刊物块的话研究1个月左右的时间就收到了,如果慢的话,大概也就是3个月左右的时间。

238 评论

周小米jiang

这个要看具体情况的,一个是如果你发的是普刊,那么周期就会短一些,一个是如果你发表的是核心期刊,有可能一年多才能见刊发表,前提是录用的情况下。还有一个情况是,如果你是自己投稿,会慢一些,如果你是找一些论文机构帮忙投稿发表,会快速一些。我之前找淘淘论文网发表的经济类论文,2个月就给你加急发表了,是普刊,如果是核心他们也没法加急。所以看你发表的什么刊物了。

211 评论

joannekaka

你好,根据一般习惯,是以杂志实际出版的日期为准,因为自它印刷并公开发行的时候就已经达到了出版的事实标准。杂志上标注的刊期只是杂志社为了杂志的时效性所以都会把时间往后写,这样当你8月收到9月杂志的时候不会觉得晚。特别是对一些在市场上公开销售的刊物来说,这样能避免读者买杂志总觉得像是买到过期的一样,保持读者的新鲜感。一般杂志从收稿到编辑、校对、印刷、发行都会有不同的时长,刊期越长(月刊、双月刊、季刊)出版周期就越长,特别好的学术期刊,长的甚至半年一年,所以你发表时一定要注意问清杂志的出版时间能不能赶上你的时间需要,以免做了无用功。要发表可以再问我,我就是杂志编辑

174 评论

爱玩的小猪2007

因为,Google是大数据鼻祖。很多人提起大数据,必然会想起Google 的“三驾马车”(也称谷歌三宝):GFS、MapReduce、BigTable。正所谓三篇论文定大数据之江山,它激发了大数据技术开源时代的到来,百花齐放,争相斗艳,成就了Hadoop的辉煌十载。尤其是近年来,大数据技术的发展,不论是技术的迭代,还是生态圈的繁荣,都远超人们的想象。

239 评论

相关问答

  • hadoop谷歌发表的三篇论文是

    hadoop是开源软件。。各个公司都有版本,比如Apache Hadoop和Intel Hadoop,不过使用比较多的是apache hadoop

    小优的爱人 5人参与回答 2023-12-11
  • 谷歌发表三篇论文

    等会让他赶紧染发剂对人体

    hocc豆叮 4人参与回答 2023-12-12
  • 谷歌发表的三篇论文

    Gebru的支持者表示,谷歌的政策“实施得不均衡且具有歧视性”。 最近,科技圈的发生了一件大事,知名AI学者之一、人工智能伦理研究员Timnit Gebru被谷

    我是五叶神 3人参与回答 2023-12-06
  • 谷歌三大论文的发表

    谷歌学术是一个可以免费搜索学术文章的Google网络应用。2004年11月,Google第一次发布了Google学术搜索的试用版。该项索引包括了世界上绝大部分出

    大头的陈小晶 3人参与回答 2023-12-10
  • dhfs谷歌发表的三篇论文

    示意图: 对于某元素原子的核外电子排布情况,先确定该原子的核外电子数(即原子序数、质子数、核电荷数),如26号元素铁,其原子核外总共有26个电子,然后将这26个

    小小千寻小尼玛 5人参与回答 2023-12-08