古蒂guti
选自Nature
作者:Jeffrey M. Perkel
机器之心编译
机器之心编辑部
2019 年,「事件视界望远镜」团队拍下了第一张黑洞照片。这张照片并非传统意义上的照片,而是计算得来的——将美国、墨西哥、智利、西班牙和南极多台射电望远镜捕捉到的数据进行数学转换。该团队公开了所用代码,使科学社区可以看到,并基于此做进一步的 探索 。
而这逐渐成为一种普遍模式。从天文学到动物学,每一个伟大的现代科学发现背后都有计算机的身影。斯坦福大学计算生物学家、2013 年诺贝尔化学奖获得主 Michael Levitt 表示,现在的笔记本电脑在内存和时钟速度方面是 1967 年其实验室计算机的一万倍。「今天,我们拥有大量算力。但问题是,这仍然需要人类的思考。」
如果没有能够处理研究问题的软件以及知道如何编写和使用软件的研究人员,计算机再强大也是无用。「现在的研究与软件紧密相关,软件已经渗透到科研的方方面面。」软件可持续性研究所(Software Sustainability Institute)负责人 Neil Chue Hong 如是说。
最近,Nature 上的一篇文章试图揭示科学发现背后的重要代码,正是它们在过去几十年中改变了科研领域。这篇文章介绍了对科学界带来重大影响的十个软件工具,其中就包括与人工智能领域密切相关的 Fortran 编译器、arXiv、IPython Notebook、AlexNet 等。
语言先驱:Fortran 编译器(1957)
首批出现的现代计算机对用户并不友好。编程实际上是由手工完成的,通过电线连接一排排电路。后来的机器语言和汇编语言允许用户使用代码进行计算机编程,但这两种语言依然要求使用者对计算机架构有深入了解,导致很多科学家无法使用它们。
20 世纪 50 年代,随着符号语言的发展,尤其是「公式翻译」语言 Fortran 的出现,上述境况发生了改变。Fortran 语言由 IBM 的约翰 · 巴科斯(John Backus)团队开发。借助 Fortran,用户可以使用 x = 3 + 5 等人类可读的指令进行计算机编程,之后编译器将这类指令转化为快速高效的机器码。
这台使用 Fortran 编译器编程的 CDC 3600 计算机于 1963 年移送至美国国家大气研究中心。(图源:美国大气科学研究大学联盟 / 科学图片库。)
在早期,编程人员使用穿孔卡片(punch card)输入代码,复杂的模拟可能需要数万张穿孔卡片。不过,Fortran 使得并非计算机科学家的研究者也能够进行编程。普林斯顿大学气候学家 Syukuro Manabe 表示:「我们第一次靠自己进行编程。」他和同事使用 Fortran 语言开发了首批成功的气候模型之一。
60 多年过去了,Fortran 依然广泛应用于气候建模、流体动力学、计算机化学,以及其他涉及复杂线性代数并需要强大计算机快速处理数字的学科。Fortran 代码运行速度很快,仍然有很多编程人员知道如何写 Fortran。古老的 Fortran 代码库依然活跃在世界各地的实验室和超级计算机上。
信号处理器:快速傅里叶变换(1965)
当天文学家扫描天空时,他们捕捉到了随时间变化的复杂信号的杂音。为了理解这些无线电波的性质,他们需要观察这些信号作为频率函数的样子。一种被称为傅里叶变换(Fourier transform)的数学过程允许科学家实现这一点。但问题在于傅里叶变换并不高效,对大小为 N 的数据集它需要进行 N 次运算。
1965 年,美国数学家 James Cooley 和 John Tukey 开发了一种加速傅里叶变换过程的方法。借助递归(recursion)这种「分而治之」的编程方法(其中算法可以实现重复地再运用),快速傅里叶变换(fast Fourier transform, FFT)将计算傅里叶变换问题简化为 N log_2(N) 个步骤。速度也随着 N 的增加而提升。对于 1000 个点,速度提升约 100 倍;对于 100 万个点,速度提升约 5 万倍。
牛津大学数学家 Nick Trefethen 表示,FFT 的发现实际上是一种「再发现」,因为德国数学家卡尔 · 弗里德里希 · 高斯在 1805 年就完成了该发现,不过从未发表。但是,James Cooley 和 John Tukey 开启了 FFT 在数字信号处理、图像分析和结构生物学等领域中的应用。Trefethen 认为 FFT「是应用数学与工程领域伟大的发现之一。」FFT 已经在代码中实现了很多次,其中一种流行的变体是 FFTW(「西方最快的傅里叶变换」)。
默奇森天文望远镜,使用快速傅里叶变换来收集数据。
劳伦斯伯克利国家实验室(Lawrence Berkeley National Laboratory)分子生物物理学和综合生物成像部门主任 Paul Adams 回忆称,当他在 1995 年改进细菌蛋白 GroEL 的结构时,即使使用 FFT 和一台超级计算机,也需要「很多很多个小时,甚至是几天」的计算。但要没有 FFT,很难想象这件事要怎么做,花的时间将难以估量。
线性代数运算标准接口:BLAS(1979)
科学计算通常涉及使用向量和矩阵的数学运算,这些运算相对简单,但计算量大。20 世纪 70 年代,学界并没有出现一套普遍认可的执行此类运算的工具。因此,科研工作者不得不花费时间设计高效的代码来做基础的数学运算,导致无法专注于科学问题本身。
编程世界需要一个标准。1979 年,基础线性代数子程序库(Basic Linear Algebra Subprograms, BLAS)应运而生。直到 1990 年,该标准仍然在发展变化,定义了数十条涵盖向量和矩阵运算的基本程序。
田纳西州大学计算机科学家、BLAS 开发团队成员之一 Jack Dongarra 表示,BLAS 实际上将矩阵和向量运算简化成了像加减法一样的基础计算单元。
Cray-1 超级计算机。(图源:科学 历史 图像 / Alamy)
德州大学奥斯汀分校计算机科学家 Robert van de Geijn 表示:「BLAS 可能是为科学计算而定义的最重要接口。」除了为常用函数提供标准名称之外,研究者可以确保基于 BLAS 的代码能够以相同的方式在任何计算机上运行。该标准也使得计算机制造商能够优化 BLAS 实现,以实现硬件上的快速运行。
40 多年来,BLAS 代表了科学计算堆栈的核心,使得科学软件持续发展。乔治华盛顿大学机械与航空航天工程师 Lorena Barba 将 BLAS 称为「五层代码内的核心机制」。
预印本平台:arXiv.org(1991)
20 世纪 80 年代末,高能物理领域的研究者往往会把自己提交的论文邮寄给同行审阅,这是一种礼仪,但只邮寄给少数几个人。「那些处于食物链底端的人依赖于顶端人的施舍,这往往会把非精英机构中有抱负的研究者完全排除在特权圈之外,」物理学家 Paul Ginsparg 曾在 2011 年的一篇文章中写道。
1991 年,洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)的 Ginsparg 写了一个电子邮件自动回复器,以建立公平的竞争环境。邮件订阅者每天都会收到一份预印本列表,每份论文都带有标识符。如此一来,世界各地的用户都可以通过一封电子邮件提交或检索来自上述实验室计算机系统的论文。
Ginsparg 原本计划将文章保留三个月,将范围限制在高能物理社区,但他的同事劝他去掉了这些限制。「就是在那一刻,它从布告栏转变成了档案库,」Ginsparg 表示。在这之后,大批论文开始涌入,其学科之广远远超出了 Ginsparg 的预期。1993 年,Ginsparg 把这个系统移植到互联网上。1998 年,他正式将该系统命名为 arXiv.org。
如今,30 岁的 arXiv 收录了 180 万份预印本文章,且全部免费阅读,其每月论文提交量超过 15000 份,每月下载量高达 3000 万次。「不难看出 arXiv 为何如此受欢迎,」Nature Photonics 的编辑曾表示,「该系统为研究者提供了一种快捷、方便的科研方式,可以告诉大家你在做什么、什么时间做的,省去了传统期刊同行评审的繁琐。」
该网站的成功还对生物学、医学、 社会 学等其他学科类似存储库的建立起到了助推作用,成千上万份新冠病毒相关研究预印本的发布就是一个例证。
数据 探索 器:IPython Notebook (2011)
Fernando Pérez 在 2001 年决定「探寻拖延症」,当时他是一名研究生,决定采用 Python 的核心组件。
Python 是一种解释型语言,意味着程序会一行一行地执行。编程人员可以使用一种被称为「读取 - 求值 - 输出循环(REPL)」的计算型调用和响应(call-and-response)工具,他们可以键入代码,然后由解释器执行代码。REPL 允许快速 探索 和迭代,但 Pérez 指出 Python 并不是为科学构建的。例如,它不允许用户轻松地预加载代码模块或保持数据可视化的打开状态。因此 Pérez 创建了自己的版本。
2001 年 12 月,Pérez 发布了交互式 Python 解释器 IPython,它共有 259 行代码。10 年后,Pérez 和物理学家 Brian Granger、数学家 Evan Patterson 合作,将该工具迁移到 Web 浏览器,创建了 IPython Notebook,掀起了一场数据科学的革命。
和其他计算型 notebook 一样,IPython Notebook 将代码、结果、图形和文本组合到了单个文档中。但与其他此类型项目不同的是,IPython Notebook 是开源的,欢迎广大社区开发者为其发展做出贡献,并且支持 Python 这种科学家常用的语言。2014 年,IPython 演变成 Project Jupyter,支持约 100 种语言,并允许用户像在自己计算机上一样轻松地在远程超级计算机上 探索 数据。
Nature 在 2018 年指出:「对数据科学家而言,Jupyter 已经成为一种实际标准」。那时,GitHub 上已经有 250 万个 Jupyter notebook,如今已有近一千万个,其中包括 2016 年发现引力波和 2019 年黑洞成像的记录。Pérez 表示:「我们能为这些项目做出一点贡献也是非常有意义的」。
快速学习器:AlexNet(2012)
人工智能(AI)可分为两类,一类使用编码规则,另一类让计算机通过模拟大脑的神经结构来「学习」。多伦多大学计算机科学家、图灵奖获得者 Geoffrey Hinton 表示:「几十年来,人工智能研究者一直将第二种研究方法视为『荒谬』」。2012 年,Hinton 的研究生 Alex Krizhevsky 和 Ilya Sutskever 证明了事实并非如此。
在当年的 ImageNet 的年度竞赛上,研究者们被要求在包含 100 万张日常物品图像的数据库上训练 AI,然后在另一个图像集上测试算法。Hinton 表示:「在当时,最佳算法会在 1/4 的图像上出现分类错误」。Krizhevsky 和 Sutskever 开发的 AlexNet 是一种基于神经网络的深度学习算法,该算法将误差率降至 16%。Hinton 表示:「我们几乎将误差率降低了一半」。
Hinton 认为,该团队在 2012 年的成功反映出足够大的训练数据集、出色的编程和图形处理单元(最初为了提高计算机视频性能的处理器)新力量的结合。他表示:「突然之间,我们就能够将该算法的速度提高 30 倍,或者说可以学习 30 倍的数据」。
Hinton 表示真正的算法突破实际上发生在 3 年前。当时他的实验室创建了一个比几十年来不断完善的传统 AI 更能准确识别语音的神经网络。虽然准确率只稍微提升了一点,但已值得被记住。
AlexNet 及相关研究的成功带来了实验室、临床等多个领域深度学习的兴起。它让手机能够理解语音查询,也让图像分析工具能够轻松地从显微照片中挑选出细胞。这就是 AlexNet 在改变科学、改变世界的工具中占有一席之地的原因。
买买买嗨嗨嗨
不知不觉大半年时间过去了——大概9个月的时间,考研结束了。在前段时间查明分数之后,我的心中不禁生出了许多感想。总分387,法语92,政治72,英语113,专业课110。下面跟即将准备考研的学弟学妹们分享一下我的考研历程。
一、学院及专业介绍
1.当初之所以选择北京外国语大学是因为北京外国语大学作为所有语言类学校里最好的学府,是所有本科学语言想考研究生的理想。我本科在大连外国语读法语,当时记得很清楚,我只高了一本线很少家里人一直说现在学小语种很有优势,尤其是大连那种地方外企特别多以后找工作也是一个方便的选择。当时觉得很有道理,就也没多想报了一个自己分能上的专业。现在想想也不后悔,虽然每年期末考试都要面临着大量的法语题,还要考专四专八让我痛不欲生。后来毕业之后也是实习的一段时间,感觉大多数单位和企业需要的人才学历都很高,当时同事们也说,学历越高,工资越高,而且我还年轻。这都是我促使考研的原因,后来想了很久,决定去北外的翻译学。
2.翻译学专业以外国语言文学学科为依托,1956年开始研究生教育,2007年设立翻译学专业博士点、博士后流动站。目前,设有翻译研究中心和《翻译界》编辑部,负责教学与科研的组织工作, 与国外多所著名高校建立了联合培养、学生交换等合作机制,常年邀请国际著名翻译研究学者来校讲学,专业教学和学术研究始终保持国内一流水平,在我国翻译学学科研究生教育改革与发展中发挥着引领作用。
翻译学专业的教学与研究涵盖跨语言、跨文化过程涉及的翻译现象和规律,翻译理论、翻译教学和翻译应用研究,翻译研究前沿课题等领域,探索与语言学、文学、社会学、心理学、计算机科学等学科的交叉研究,形成前沿学科领域,积极服务国家经济社会发展和外交战略。本专业教学与研究特色鲜明,其翻译理论与跨文化研究、口笔译理论与应用研究、社会翻译学研究、翻译教学研究、认知翻译研究等在国内外翻译学界具有重要影响。
3.本专业重视硕士研究生的英汉语言功底与英汉互译能力、中西翻译理论素养与翻译研究兴趣,注重对硕士研究生进行学科理论、专业知识和研究方法的系统训练,培养具有人文素养、独立研究能力和开拓精神的翻译研究与应用人才。毕业生在翻译研究、翻译教育、外交外事、国际经贸、国际文化交流等领域具有竞争优势和可持续发展的潜力。
二、复习意见
1.政治
(1)考研政治试卷综述:单选1✘16;多选2✘17;主观题10✘5。满分为100分,时间180分钟。
(2)试卷内容结构:马克思主义基本原理概论约24%、毛泽东思想和中国特色社会主义理论体系概论约30%、中国近现代史纲要约14%、思想道德修养与法律基础约16%、形势与政策以及当代世界经济与政治约16%。
(3)考研政治的涵盖内容很多而且都是需要背诵部分,看上面的比例,能发现毛概占比非常大分数也多。我一般推荐使用的是肖秀荣三件套和徐涛的视频,那这两个怎么搭配来用。
(4)7-9月,这段时间着重看徐涛的视频网课,他的讲解很清晰会在课堂讲义上标出来一些比较重点的知识,例如辩证法出发点立足点等等,这都是在答题时候的关键,现在时间已经过去很久了我有一点忘了,不过大致就是十三届五中全会一类会议的时间点等等。
(5)9-11月,看完了徐涛的视频最好是用1到2个月的时间,然后结合着肖秀荣的1000题。肖秀荣是考研的金字招牌他有一本书叫精讲精练,我个人不是太喜欢太多了,而且感觉毫无章法。
(6)最后两个月抓住肖四和肖八,另外徐涛还有一本小黄书。这些还是远远不够的,每次政治单选和多选都会有一道是时政。这个肖秀荣会在考试之前出一个小本东西特别少,大约用一个礼拜的时间,每天看个半个小时左右就可以了。
2.英语
(1)英语翻译基础
翻译基础是我最喜欢、最擅长的一科,但是我没拿下高分。是因为去年北外英汉词条难度很大,我应该前5个都没写出,篇章翻译汉译英难度比前年也高很多。北外翻译这一科分为词条翻译和篇章翻译。
(2)词条翻译( 共30个 英汉15个 汉英15个)
1.最重要的一点就是研究真题。真题的重要性体现在两方面。北外一般每年都会出几个前几年考过的原题,比如去年和前年都考了pentathlon五项全能 18和16年都考了预期寿命 等等 这一部分必须要保证万无一失。更重要的是可以根据真题进行发散。比如,曾经考过的 Ethereum (ETH)以太坊 就可以自己归纳出 区块链 blockchain 比特币 bitcoin 以太币 ether, pentathlon 五项全能 可以发散到 冬季两项 铁人三项triathlons 十项全能decathlon等等。对于很多人而言,很有可能不会发散,或者说发散的方向不对,这里就很推荐购买一些学姐学长的资料笔记。(个人用过的会在第四部分推荐)
2.平时生活学习的时候当个有心人,多积累。比如,听新闻听到中国要避免修昔底德陷阱,就可以去查查修昔底德陷阱怎么说,同时还积累了百科知识。此外,北外很爱考缩略语,所以就要有意去寻找缩略语。比如 孙杨事件 就可以知道FINA国际泳联同时向外扩散 FIBA国际篮联 FIVB国际排联等等。
这一部分 用过的资料包括真题、自己的归纳积累扩散、学姐学长资料以及翻硕英汉词条互译词典第四版(中国政法大学出版社 黄皮小册子)
(3)篇章翻译
1.先看近几年真题。北外高翻从15年开始,汉译英的风格都偏文化类,考过长城、孔子、园林、西方哲学和中国哲学等等。英译汉的风格不定,考过文化,比如去年考的古罗马帝国,也考过联合国相关的内容。看了真题后,在备考中对于中国传统文化的概念需要掌握,比如礼义廉耻怎么说。但是,也不能只练习文化这个题材,因为高翻出题变幻莫测,去猜体型毫无必要,因为他非常任性,常人是猜不到的。所以,最好的应对方法就是修炼自己的英语基础,以不变应万变。接下来我再分两个方面说说该怎么准备,一是有一定翻译基础,二是毫无翻译基础,但是英语基础不错(没有语法硬伤)。
2.这一部分更适合有一定翻译基础的小伙伴参考。我从暑假7月开始备考,备考前我已经通过catti二笔,但是我认为就算过了二笔,距离做出高质量的笔译也差了十万八千里,特别是面对灵活程度高,需要句句脱壳的文本。catti过了二笔,在我看来,只能说明语法知识掌握扎实英语基础不错,很多大神从来没考过这个考试。所以,就算你没考过catti,英语基本功扎实,也完全有可能考上北上外。当然,要是三笔考了几次都不过,那可能说明你的英语基础急需提高。综上,我当时决定回归翻译基础。
所以我暑假练习的教材相对基础。主要就是庄绎传老师的英汉翻译简明教程(绿皮)和彭萍老师的实用语篇翻译(黄皮)。这两本书,对于有一定翻译基础的同学而言仍然有很大帮助,尤其是老师给出的参考译文也非常契合北外的风格。我当时每天花三个半小时的时间练习翻译基础,每天一篇英译汉一篇汉译英,然后对照参考译文修改。一个暑假坚持下来,发现英译汉中翻译腔少了很多,汉译英的速度更快了,并且脱壳、行文逻辑方面也有了进步。
9月到11月中旬,我主要练习的材料是陈德彪等老师编著的英语翻译二级笔译(黄皮 外语教学与研究出版社)。这本书练习两遍都不为过,老师的讲解和参考译文,帮助我对翻译有了更深刻的认识。我的练习方法是第一天一篇英汉和汉英翻译,第二天对照参考译文修改,并且➕练一篇汉译英,选文主要来自以前练过的内容和徐老师。
11月中旬到考试 我练习的材料主要是真题,当时我也报了批改班,批改班老师提供的练习材料也非常值得一练。这个阶段,我的翻译学习时间仍然保持在三个小时左右,考试前一天我还练了一小段,保持翻译手感和思维。学习方式也是第一天一套真题,第二天对照参考译文修改。真题的参考答案,很多是培训机构自己做的,质量有好有坏,建议大家多看几家译文。此外,北外的李长栓老师曾经给过2013年北外真题的参考译文,小伙伴们一定要去找来看看,花几天时间,透过答案,专研栓哥给出的翻译思路。
3.专业课
北京外国语大学的第二门课是二外,可以从德语、日语、法语、西班牙语这几个里面选。那我当时就是学法语的,当然会选这个拿手的专业。在这也能看出来,大家对语言如果没有特别强烈的爱好大学学的不是语言,还是不要考翻译学专业会非常累。当时准备这个二外的时候,把大学里面的所有专业课书都掏出来了,还有大学时候喜欢读的一些法语书,那种一点中文没有的。这些都是我的一个积累,本身没有什么太大的困扰,因为如果我要是学三本纯语言类的书,我觉得我考研的压力后期会非常大。
参考书籍:《马晓宏法语》《你好法语》《简明法语教程》《新大学法语》《法语语法练习800题》《法语词汇练习800题》这里有书,有练习册都推荐给大家。主要还是要多听多看,有的时候听一听听力磨磨耳朵,毕竟学习的过程也不只是为了应付考研。
611英语基础测试,我个人认为这种翻译学的偏向英语技能的考试单单背考研大纲上的词汇是远远不够的,反正我当时是拿了一本专八在背。英语专八的单词是真的挺难的而且我大学一直在学法语,这部分其实对我来说是一个不小的挑战,考试有三个part。可以自行上B站上和网络上找一些教育类的网课,一般英语教的比较好的是星火和华研外语。如果你想要这个考一个高分,最主要的还是以专八为主吧,买专八的练习册和练习题,每天做一个专八的阅读,每周做一套专八的模拟。阅读和翻译都要两手抓而且,在做题的时候遇见的一些从来没有见过的词汇和反复出现的短语,一定要单独记在一个本子上,英语是积累的过程学语言也是积累的,要不断的记笔记和看。
812英汉互译,《英译中国现代散文选》《英汉汉英关文翻译与鉴赏》《当代西方翻译理论》。《当代翻译理论(第二版修订本)》《翻译研究》《当代西方翻译理论选读》《历史上的译者》这几本都是可以看的,前面的译文散文主要是看原文然后尝试自己翻译,对照着网上的正确答案,一定要耐下来性子精读,最好是能把自己的汉语意思写在笔记上对应英文。有条件有时间的学可以把不同的句子单独用红笔标识出来。其实说句不负责任的话,我个人认为这种翻译单词背的好,前提下语言能力基础和感觉比较重要,如果你一直学这个语言可能你翻译的机会比别人好,剩下的跨考同学其实成绩都差不多。而且这些书都有重合的点,一定要尽可能的去理解语言类的书,尤其是国外的看起来都是杂乱无章,努力的去理解之后,书之间都是有联络的。《当代西方翻译理论选读》单元的introduction,每章的guided reading多看几遍哦。
最后祝大家考研顺利!!
我也是,有没有什么结果
水边维纳斯,宇宙探索编辑部,火之夜,永安镇故事集,羽毛,这些影片都非常的优秀。
《飞碟探索》,便宜,而且办了很长时间了。期刊名称: 飞碟探索主办单位:甘肃科学技术出版社编 辑:《飞碟探索》编辑部出 版:甘肃科学技术出版社地址:兰州市滨河
问的果然奥秘,首先关于外星生物现在还是个谜,必近人类目前科学水平是有限的.不过既然地球上有生物,也不排除别的星球上有生命迹象,理论上还是说的过去的,可惜没办法去
1,单位名称: 西南有色三0六勘察工程有限公司单位地址: 云南省晋宁县中和乡大新 电话号码: 08715067540经营范围: 水文地质勘察工程地质勘察 分机号