• 回答数

    3

  • 浏览数

    293

林麓是吃货
首页 > 论文发表 > 谷歌发表的重要论文

3个回答 默认排序
  • 默认排序
  • 按时间排序

ybxiong168

已采纳

相信这两天大家朋友圈都被Google Map新功能演示刷屏了,视频中介绍说Google Map将在一些城市实现实景渲染,在手机中能够就从不同视角能逼真地浏览城市场景,甚至还能实现从室外到室内的无缝融合。

这个视频引发很多讨论,看明白的、看不明白的都在各抒己见,真的非常有意思。有人看到视频中从室外飞到室内,就联想到国内房地产行业做的一些卖房应用,直言房地产公司已经吊打谷歌;也有人看到视频中围绕着威斯敏特大教堂转一圈,就觉得这不就是倾斜摄影,早就烂大街的东西。

那正在看这篇文章的读者,你的心里又是什么看法呢?

究竟是不是谷歌不行了呢?

02

Block-NeRF是什么?

伟人说过,没有调查就没有发言权。想搞清楚这背后的技术细节,最好的办法就是去看文献。刚好在CVPR 2022会议上就有一篇Google员工发表的论文《 Block-NeRF: Scalable Large Scene Neural View Synthesis 》,该论文就是Google Map这次产品更新背后的实现技术。

单看论文题目,可以知道这篇文章主要介绍一种叫做Block-NeRF的新方法,这个方法可以进行大场景神经视图合成。

视图合成,简单来说就是根据已有的视图(也就是图片)来合成一张不同视角下的新图片。举个不恰当的例子,你站在一个人左侧拍了一张照片,又站在一个人的右侧拍了一张照片,这时候你想知道站在这个人正前方拍的照片是什么样的。你在这个人左右两侧拍的照片就是已有的视图,而你想要的正前方的照片就是需要合成的视图。

当然,实际操作中一般会拍摄更多的照片,否则就难以达到理想的效果。视图合成并不是什么新概念,早期很多Image Based Rendering方向的论文就是做这个的,比较基础的方法也就是通过对现有图像进行插值来生成新的图像。当然,为了不断地提升合成图像的质量,方法变得越来越复杂。

来到AI时代,自然也会有人考虑用AI做视图合成,其中的佼佼者就是NeRF。NeRF 是 2020 年 ECCV 上获得最佳论文荣誉提名的工作,其影响力是十分巨大的。NeRF 将隐式表达推上了一个新的高度,仅用2D的姿态已知的图像作为监督,即可表示复杂的三维场景,在新视角合成这一任务上取得非常好的效果。但是NeRF受限于有限的模型容量,只能重建小尺度场景,比如一个物体、一个房间、一栋建筑等等。

Google在NeRF的基础上更进一步,通过将场景分割为多个部分,每个部分单独用一个NeRF进行训练,最后将各个NeRF合成的视图混合,从而实现大场景的视图合成。这就是Block-NeRF最核心的思想。

03

你还认为Google Map渲染的是倾斜吗?

我们现在文章里找找证据。文章在研究现状首先就介绍了大场景三维重建的内容,提到COLMAP、PMVS等知名计算机视觉项目,但同时也提到通过3D重建得到的模型存在很多变形和黑洞,这正是现在倾斜摄影模型存在的严重问题。

最后,总结说三维重建更加注重精度,而本文的任务属于新视图合成领域,甚至Block-NeRF算法都没有利用SfM(Structure from Motion)算法来获取相机位姿,仅利用车载传感器读数作为模型训练数据。

看到这里,我想大家都知道Google Map渲染的不是倾斜模型了。可是为什么要大费周章地用几百万张图片来训练Block-NeRF模型呢?从视频中不难看出,浏览过程中非常平滑,没有倾斜那种LOD过渡的感觉,而且,合成出来的图像还可以进行光照、天气等效果的调整。

当然,肯定还会有人说,现在把倾斜摄影模型导入 游戏 引擎也能有各种光照和天气效果,但是倾斜摄影模型本身的纹理就已经记录拍摄时的光照信息,即使添加一些 游戏 引擎的效果,所看到的画面也没有Google Map那么纯净。

另外,Block-Neft里还提到在制作训练数据时,把图片中的移动目标(如车和行人)等遮罩掉,使得合成的图像里不会出现车和行人的干扰。相较之下,倾斜摄影模型中的车辆和行人往往需要人工去压平修复。

从个人角度来说,我觉得Block-NeRF比倾斜摄影更加优雅。只要根据用户浏览的位置和朝向,就可以在云端实时渲染出一张以假乱真的图片。虽然倾斜也可以走云渲染的路线,但就显示效果和渲染效率来说,目前看到的应用案例也仅仅时刚刚够用而已。至于Block-NeRF会不会取代倾斜摄影,个人觉得目前并不需要此类的担心。

165 评论

芦苇薇薇

简单点来说,就是Hadoop是继承了Google的MapReduce、GFS思想,开发出来的一套框架,后来又交给了Apache作为开源项目。MapReduce诞生于谷歌实验室,MapReduce与GFS、BigTable并称为谷歌的三驾马车,、而Hadoop则是谷歌三驾马车的开源实现。2003年,Google发表了一篇技术学术论文谷歌文件系统(GFS)。GFS是google公司为了存储海量搜索数据而设计的专用文件系统。2004年,Nutch创始人Doug Cutting基于Google的GFS论文实现了分布式文件存储系统名为NDFS。2004年,Google又发表了一篇技术学术论文MapReduce。MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行分析运算。2005年,Doug Cutting又基于MapReduce,在Nutch搜索引擎实现了该功能。2006年,Yahoo雇用了Doug Cutting,Doug Cutting将NDFS和MapReduce升级命名为Hadoop,Yahoo开建了一个独立的团队给Goug Cutting专门研究发展Hadoop。

297 评论

注册个名那么难

谷歌学术是一个可以免费搜索学术文章的Google网络应用。2004年11月,Google第一次发布了Google学术搜索的试用版。该项素引包括了世界上绝大部分出版的学术期刊,可广泛搜素学术文献的简便方法。从检索情况分析,Google学术搜索可以有如下用途:1、了解有关某一领域的学术文献。由于收录范围限手学术文献,将屏蔽掉网上很多不相关信息。2、了解某一作者的著述,并提供书目信息(引用时必需的图书出版信息或期刊论文的刊名、刊期信息)。可直接在网上搜索原文、文摘等;如果是图书,还可通过Library Search(例如OCLC的Open WorldCAT)检索附近图书馆的收藏。3、了解某文献被引1情况。可直接点击Cited by…(引用数)搜索引用文献。4、对文献和期刊进行应用和引用排名。

320 评论

相关问答

  • 谷歌学术发表的论文

    可以。谷歌学术收录的论文可以毕业,已被收录可毕业。论文是一个汉语词语,拼音是lùnwén,古典文学常见论文一词,谓交谈辞章或交流思想。

    zhenghan116 3人参与回答 2023-12-10
  • 2003年谷歌发表的论文

    Gebru的支持者表示,谷歌的政策“实施得不均衡且具有歧视性”。 最近,科技圈的发生了一件大事,知名AI学者之一、人工智能伦理研究员Timnit Gebru被谷

    楞大个肚兜 3人参与回答 2023-12-10
  • 谷歌论文发表

    你说的可能是这三个吧:2003年发表了《The Google File System》2004年发表了《MapReduce: Simplified Data P

    默默茶叶 5人参与回答 2023-12-06
  • 谷歌发表的重要论文

    相信这两天大家朋友圈都被Google Map新功能演示刷屏了,视频中介绍说Google Map将在一些城市实现实景渲染,在手机中能够就从不同视角能逼真地浏览城市

    林麓是吃货 3人参与回答 2023-12-08
  • 谷歌发表的论文测试

    Google已经被大陆屏蔽了 你可以去Google香港的服务器

    凌空抽筋 5人参与回答 2023-12-11