妞妞love美丽
导语
最先进的人工智能算法已经开始在探测星系的演化、计算量子力学波函数、 探索 新的化合物等领域施展拳脚。那么,还有没有那种无法自动化而只能由科学家完成的工作?
如今的物理学和天文学实验会产生海量的数据,已经没有人或团队能够跟进所有的这些数据了。其中一些数据每天以TB级的规模增加,而且这个趋势不会减弱。在二十一世纪 20 年代中期射电望远镜 Square Kilometer Arra 将投入使用,它每年产生的数据量和整个互联网的数据量一样多。
面对数据洪流,许多科学家开始求助于人工智能。只需要少量的人工输入,人工智能系统(如神经网络)就能够在数据海洋中漫游,识别异常,挖掘出人类尚未发现的模式。
当然,利用计算机来辅助科学研究的 历史 可以追溯到约 75 年前,然而人类几千年前就在手工调查研究数据来寻找其中的有意义的模式。但是,近期一些科学家认为以机器学习、人工智能为代表的新技术能以一种全新的模式去进行科研工作。其中一种被称为生成模型的方法,能从对观测数据的诸多解释中找到最可信的理论,更为重要的是,该方法在研究中无需预先编入对于系统可能起作用的物理过程。其拥护者认为,生成模型的创新程度足可以被视为理解宇宙的潜在的“第三种方法”。
在传统上,我们是通过 观测 来了解自然的。回想一下,开普勒就是通过研究第谷的行星位置表,辨识潜在的行星运行模式,才得以推断出行星是沿椭圆轨道运行的。同样的,科学可通过 模拟 来获得进步。一位天文学家可能会模拟银河系及其邻近的仙女座星系的运动,并预测它们将在几十亿年后碰撞。观测和模拟都有助于科学家生成假设,然后用进一步的观测来检验假设,而生成模型不同于这两种方法。
瑞士联邦理工学院的天文物理学家 Kevin Schawinski 也是一位生成模型的积极支持者。他认为:“ 生成模型是介于观测和模拟之间的第三种方法, 这是解决问题的另一种方式。”
Kevin Schawinski 是一名天体物理学家,他经营着一家名为 Modulos 的人工智能公司,他认为一种名为生成模型的技术提供了第三种了解宇宙的方式。
一些科学家仅仅把生成模型及其它新技术当作传统科研中的工具,但是大多数研究者都认为 AI 的影响力巨大,并且在科学研究领域会发挥越来越大的作用。费米国家加速器实验室的天体物理学家 Brian Nord 使用人工神经网络来研究宇宙。他担心没有什么是不能通过自动化完成的事情,“这个推测倒是有点令人恐慌。”
来自“生成”的 探索
从研究生毕业时起,Schawinski 就因用数据驱动科学研究而闻名。在攻读博士学位期间,他面对的任务是,根据星系的外观数据对数千个星系进行分类。因为没有什么现成的软件能帮助他完成这项工作,他决定用众包的方式完成这项工作——于是,银河动物园(Galaxy Zoo)公民科学项目诞生了。
从 2007 年开始,普通的电脑用户只要记录下他们推测的星系最佳归类,就能帮助到天文学家。通过多数票胜出来判定,通常能带来正确的分类结果。
这是一个成功的项目,但 Schawinski 也注意到, AI 让这个模式过时了——今天,一个具有机器学习和云计算背景的天才科学家只需要花费一个下午就能完成这个工作。
在 2016 年,Schawinski 把目光投向了生成模型,这个强大的新工具。本质上来说,生成模型是在求解,当给定条件 X 和观测结果 Y 时,概率 P(X,Y) 有多大。这个方法已经被证明是非常有效的。
生成模型中最为著名的就是生成对抗网络(GAN)。经过充分的训练后,GAN 模型能够修复损坏和像素缺失的图像,也能让模糊的图像变得清晰。该模型通过竞争(对抗)来学习推断缺失的信息,这个神经网络的一部分被称作生成模型(generator):生成虚拟的数据;另一部分被称为判别模型(discriminator):把生成出来的虚假数据和真是数据分割开来。两个部分交替训练,逐步优化(类似于博弈)。
或许,你已经看过最近流传甚广的GAN生成的假面孔。正如那个标题所言“这些人并不存在却又真实得吓人”。
上面看到的脸孔都不是真实的,上面的 A 列,和左侧的 B 列都是由生成对抗网络(GAN)使用真实的面部元素构建的。然后,GAN 将 A 中的面部的基本特征(性别,年龄和脸形)与 B 中的面部的精细特征(头发颜色、眼睛颜色)相结合,构建出了上图表格中的所有人脸图像。
潜在空间
概括地说,生成模型获得数据(大多数是图像),并把他们分解成抽象的基本要素——科学家将其称为数据的“潜在空间”。算法能控制潜在空间中的元素,以此来探究这些元素如何影响原始的数据。这个方法有助于揭示该系统运作的物理过程。
潜在空间是一个抽象的难以想象的概念。不过我们可以做一个类比:当你在试图确定一个人脸的性别时,你的大脑可能在做什么呢?也许会注意到人的发型、鼻子的形状,甚至在运用一些你无法用言语描述的判断模式。同样的,计算机程序也在数据中寻找显著的特征。即便计算机并非不知道什么是性别,什么是小胡子,但如果我们提供给机器学习系统的数据集标注了“男性”和“女性”,并且一部分人还有一个标签叫“小胡子”,计算机能快速地推断出其中的关联性。
生成模型与星系演化
12月发表在《天文学与天体物理学》(Astronomy & Astrophysics)上的一篇论文中,Schawinski 与他在苏黎世联邦理工学院的同事 Dennis Turp 和 Ce Zhang 使用生成模型来研究星系在演化过程中所经历的物理变化。
因为他们使用的软件与 GAN 相似,但其在对潜在空间处理的技术与 GAN 有所差异,所以从技术角度来说这不是 GAN。他们的模型创建了人工数据集,去测试假设的物理过程。比如说,他们想知道恒星形成的“淬熄”(形成速率快速下降)与星系环境密度的增加之间的关系。
对 Schawinski 来说,关键问题是仅从数据中能挖掘出多少和恒星与星系演变相关的信息。“让我们忘却所有的关于天体物理学的知识。仅依靠数据本身,我们能在多大程度上重新发现这些知识?”
首先,星系的图片被压缩至他们的潜在空间,然后 Schawinski 在这个空间中调整元素,使其能对应上星系的特定环境变化,比如周围物质的密度。这样就有了一个假设生成器。通过重构这个星系,让大量原本处于低密度环境中的星系处于高密度环境中以此来看看带来了什么不同。
这三位研究者注意到随着星系从低密度环境走向高密度环境,它们的颜色会变得更红,恒星也变得更加集中。Schawinski 指出这一点与现有的星系观测相吻合,问题是,为什么会这样?
Schawinski 说,后续的工作还没有实现自动化,“人类必须参与其中,那么,什么样的物理原理可以解释这种效应?”对于这个过程,可能有两种解释,一是在高密度环境中,星系更红是因为其中包含了更多的尘埃;或者是因为恒星的形成减少了(换句话说,恒星更老了)。
现在有了生成模型,这两种思路都能接受检验。改变与与尘埃和恒星形成率相关的潜在空间元素,就能观测这种改变对星系颜色的影响。Schawinski 说:“答案很显然,星系更红是因为恒星形成率在下降,而不是因为尘埃。因此,我们应该采纳这个解释。”
利用生成模型,天体物理学家可以研究星系如何从低密度环境走向高密度环境,以及这些变化背后的物理原理。
生成模型相较于传统方式的优势
这种方法与传统的模拟方法相近,但与之有关键的差别。Schawinski 表示:“模拟本质上是由假设驱动的。也就是说,我们自认为已经洞悉了观测现象背后的物理法则。所以,我们把恒星形成规律、暗物质行为的原理等等这些我们自认为正确的假设放在一起,模拟运行。但是,模拟环境真的与实际情况吻合吗?”。他用生成模型所做的事情与模拟完全相反,“我们不知道任何事情,不做任何假设,我们希望数据本身能告诉我们可能会发生什么。”
生成模型在这项研究中取得的成功并不意味着天文学家和研究者就是多余的。但这似乎提醒研究者们——仅仅掌握了大量数据的人工智能系统就能够完成对天体物理学的学习。Schawinski 说:“这不是完全自动化的科学,但这意味着我们至少有能力去构建部分工具,使科学过程自动化。”
虽然生成模型非常强大,但这是否真的代表了一种新的科学研究方法还有待商榷。
对于纽约大学和 Flatiron 研究所的宇宙学家 David Hogg 来说,这项技术令人印象深刻,但充其量也只是一种从数据中提取模式特征的复杂方法——这是天文学家几个世纪以来都在做得事情。换而言之,这是观测、分析的高级形式。
和 Schawinski 相同,Hogg 的工作也充分应用人工智能;他一直在利用神经网络来对恒星进行基于光谱特征的分类,并使用数据启动的模型来推断恒星的其他物理属性。但是他认为他的工作和 Schawinski 的一样,都是经过检验的科学。Hogg 表示:“我不认为这是第三种方法。只是我们这个社群在对数据处理的方法上更加复杂而已。特别的是,我们越来越善于将数据与数据进行比较。但是依我看来,我的工作仍然是在做观测。”
人工智能:
勤奋而“难以捉摸”的科研助手
无论在概念上是否有创新性,人工智能和神经网络已经显然在当代天文学和物理学研究中发挥了关键作用。在海德堡理论研究所工作的物理学家 Kai Polsterer 领导着一个天体信息学小组,这个小组主要关注以数据为中心的天体物理学研究新方法。从星系数据集中提取红移信息曾经是一项艰巨的任务,而现在他们小组使用机器学习算法就能解决这个问题。
Polsterer 认为这些基于基于人工智能的新系统是“勤奋的助手”,可以连续处理数据数个小时而不抱怨单调无聊,不抱怨工作条件。这些系统可以完成所有枯燥乏味的繁重工作,研究者就能脱身去做“又酷又有趣的科学工作”。
Polsterer 警告说,这些系统并不是完美的,算法只能去做他们被训练过的事情,系统对输入的数据是“无感觉的”。给 AI 系统一张星系图片它可以估算其红移和年龄,但是你给同一个系统一张自拍照或者一张臭鱼烂虾的照片,它也会照方抓药估算出一个(错误的)年龄。Polsterer 认为,人类科学家的监督工作非常重要。工作还是要回到研究者身上,研究者才是要负责解释这些现象的人。
就这一点而言,费米实验室的 Nord 警告道,神经网络不仅要给出结果,也要给出相关的误差线,如果在科学研究中,你做了一个测量但没有报告相关的误差估计,就没有人会认真对待这个结果。
就像许多的人工智能研究员一样,Nord 也关注神经网络给出的结果的可解释性,通常来说,一个 AI 系统在给出结果时无法明确地表示出这个结果是如何获得的。
然而,并不是每个人都觉得结果不透明是一个必须关注的问题,法国CEA Saclay理论物理研究所的研究员 Lenka Zdeborová 指出,人类的直觉同样难以捉摸,给你看一张猫的图片,你能立刻认出这是一只猫,但是你并不知道你是怎样做到这一点的,从这个角度上来说,人的大脑就是个黑盒。
并不仅仅是天体物理学家和宇宙物理学家在向人工智能助力、数据驱动的科学研究发展。Perimeter 理论物理研究所和安大略滑铁卢大学的量子物理学家 Roger Melko 已经使用神经网络来解决该领域中的一些最棘手最重要的问题,例如多粒子系统的波函数的数学表示。
因为波函数的数学形式可能会随着它所描述的系统中的粒子数量呈指数级增长,这被 Melko 称为是“指数维度诅咒”,在这样的工作中 AI 就是不可缺少的组成部分了。
这个困难类似于在国际象棋和围棋中找到最好的走法:玩家会试图多看一步,想想对手会出什么招,然后再选择自己的最佳应对策略。但是随着思考步数的增加,复杂性也大为增加。
当然, AI 已经攻克了这两个领域。 1997 年 5 月 11 日, 深蓝计算机在国际象棋领域战胜了人类;2017年4月10日 ,AlphaGo 战胜了柯洁,AI 在围棋领域战胜了人类。Melko 认为,量子物理学也面临同样的问题。
机器的思想
无论是 Schawinski 所声称的他找到的是科学研究的“第三方法”,还是如 Hogg 所说的这“仅仅是传统上的观测和数据分析”。我们可以明确的是, AI 正在改变科学 探索 的方式并且在加速科学发现,值得探讨的是,这场 AI 革命在科学领域能走多远?
有时候,人们会对“人工智能科学家”的成就大肆褒奖。十年前,一个名叫亚当的 AI 机器人化学家研究了面包师傅的酵母的基因组,并找出了负责制造某种特定氨基酸的是哪些基因。(亚当观察缺少某些特定基因的酵母菌落,并与拥有这些基因的菌落的行为进行比较,由此找到差异完成研究。)
当时Wired杂志的标题是:机器人独立完成科学发现。
最近,格拉斯哥大学的化学家 Lee Cronin 在使用机器人去随机混合化学物质,由此来观测会形成什么样的化合物,并通过质谱仪、核磁共振机和红外分光计实时监控反应,这个系统最终能学会预测哪些组合的化学反应最为剧烈。Cronin 表示即使这个系统不能带来新的发现,机器人系统也能让化学家的研究效率提高 90%。
去年,苏黎世联邦理工学院的另一组科学家们在训练神经网络从数据中推导物理定律。他们的系统类似于“机器人开普勒”,利用从地球上观测到的太阳和火星的位置信息,重新发现了日心说;并且通过观测小球碰撞模型发现了动能守恒。因为物理定律通常会有多种表述形式,科学家们想知道这个系统能否提供种更简洁的方法来思考已知的物理定律。
这些都是 AI 启动、助力科学 探索 的例子。尽管在每一个例子中,这些新方法的革命性都会收到争议。但在这个信息浩如烟海且高速增长的时代,最值得商榷的问题可能是:仅从数据中,我们能获得多少信息?
在 《The Book of Why: The New Science of Cause and Effect》一书中,计算机科学家 Judea Pearl 和科学作家 Dana Mackenzie 断言到:数据“愚蠢至极”。他们写到: 关于因果性的问题“永远不能仅凭数据去寻找答案”。
“每当你看到以无模型的方式分析数据的论文或研究时,你可以肯定的是这项研究成果仅仅是总结,或许做了转述,但绝对不是在解释数据。”Schawinski 对 Pearl 的观点抱有同感,“只使用数据”这个想法有点类似于“稻草人”。他也从未生成以这样的方式做因果推断。他想说的是:“和我们通常的工作相比,我们可以用数据多做点事。”
另一个经常听到的观点是: 科学需要创造力。
可是到目前为止,我们还不知道,如何将创造力编入计算机。(Cronin 的机器人化学家只是在简单地尝试科研工作,似乎不能算是特别有创造力)Polsterer 认为:“创建一套理论,有理有据的理论,我认为需要创造力,而创造力离不开人类。”
然而,创造力来自何方呢?Polsterer 怀疑这和 不喜欢无聊 有关,这恐怕是机器所没有的体验。“要拥有创造力,你必须厌恶无聊,然而我认为电脑就永远不会感受到无聊。”然而,“创造力”、“灵感”却常常用来描述深蓝、AlphaGo 这样的 AI 程序。我们在描述机器的思想时的困难映射出我们在描述自己思维过程时的困难。
Schawinski 最近离开了学术界,去了私人企业。他现在经营着一家名为 Modulos 的初创公司,该公司雇佣了许多联邦理工学院的科学家。根据该公司的网站介绍,该公司位于“人工智能和机器学习这股风潮的风眼中”。无论当前人工智能技术和成熟的人工智能之间存在多大的差距,他和其他专家都认为机器已经准备好了去完成更多的科学家的工作。不过,AI 的局限性还有待考证。
Schawinski 畅想道:“在可以预见的未来,有没有可能去制造出一台能过发现物理定律、数学原理的机器,甚至超越当今最聪明的人类的能力极限?科学的未来终将被人力所不能及的机器所掌握么?这是一个好问题,但我不知道答案。”
推荐阅读
Nature机器智能:破解因果推断难题
物理学家要失业?机器学习能自学量子力学!
做科研做到绝望是一种什么样的体验?
科研投入越来越多,重大成果的产出却越来越少?
要不要加入我们?一起影响世界!
集智俱乐部QQ群|877391004
商务合作及投稿转载|
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!
辛巴在深圳
摘要:介绍快速成型技术的原理,重点讨论了与快速成型相关的技术,并试图将此技术充分应用于产品设计评价,以期缩短产品的开发周期。 关键词:快速成型;RP;反求工程引言随着科技进步和全球市场一体化的形成,现在工业正面临产品的生命周期越来越短的代写论文问题,作为一种新产品开发的重要手段,快速成型能够迅速将设计思想转化为产品的现代先进制造技术。它为零件原型制作、新设计思想的校验等方面提供了一种高效低成本的实现手段,提高产品研发的效率。1快速成型技术原理在工业产品设计过程中,设计师往往希望能快速由三维CAD模型,得到产品的实物模型,快速成型技术可以满足这种需求。快速成型(Rapid Prototyping,RP)技术是一种基于离散/堆积成型思想的新型成型技术,它根据零件或物体的三维模型数据,快速、精确地制造出零件或物体的实体模型。2关键技术制造工艺目前,世界上已有几十种不同的快速成型工艺方法,比较成熟的就有十余种。其中光固化成型法(Stereo Lithography Apparatus,SLA)、叠层实体制造法(Laminated Object Manufactur-ing,LOM)、熔融沉积法(Fused Deposition Model-ing,FDM)、选择性激光烧结法(Selective LaserSintering,SLS)和3DP(Three DimensionalPrinting and Gluing,也称3DPG)五种方法,在世界范围内应用最为广泛。对于RP制造工艺的研究,一方面是在原有技术基础上进行改进,另一方面是研究新的成型技术。新的成型方法,如三维微结构制造、生物活性组织的工程化制造、激光三维内割技术、层片曝光方式等。成型材料成型材料是决定快速成型技术发展的基本要素之一,它直接影响到原型的精度、物理化学性能以及应用等。与RP制造的4个目标(概念型、测试型、模具型、功能零件)相适应,使用的材料不同,概念型对材料成型精度和物理化学特性要求不高,主要要求成型速度快。如对光固化树脂,要求较低的临界曝光功率、较大的穿透深度和较低的粘度。测试型对于材料成型后的强度、刚度、耐温性、抗蚀性等有一定要求,以满足测试要求。如果用于装配测试,则对于材料成型的精度还有一定要求。模具型要求材料适应具体模具制造要求,如对于消失模铸造用原型,要求材料易于去除。快速功能零件要求材料具有较好的力学性能和化学性能。从解决的方法看,一个是研究专用材料以适应专门需要;另一个是根据用途分类,研究几类通用材料以适应多种需要。加工精度影响成型件精度的主要因素有两方面:一是由CAD模型转换成STL格式文件以及随后的切片处理所产生的误差;二是成型过程中制件翘曲变形,成型后制件吸入水分,以及由于温度和内应力变化等所造成的无法精确预计的变形。为了解决第一类问题,正在研制直接切片软件和自适应切片软件。所谓直接切片是不将CAD模型转换成STL格式文件,而直接对CAD模型进行切片处理,得到模型的各截面层轮廓信息,从而可以减少三角面近似化带来的误差,所谓自适应切片是快速成型机能根据成型零件表面的曲率和斜率自动调整切片的厚度,从而得到高品质的光滑表面。为解决第二类问题,正在研究、开发新的成型方法、新的成型材料及成型件表面处理方法,使成型过程中制件的翘曲变形小,成型后能长期稳定不变形。与RP技术相关软件软件是RP系统的灵魂,其中作为CAD到RP接口的数据转换和处理软件是其关键。不同CAD系统所采用的内部数据格式不同,RP系统无法一一适从,这就要求有一种中间数据格式既便RP系统接受又便于不同CAD系统生成,STL(Stereo Lithography)格式应运而生了,STL文件是用大量空间小三角形面片来近似逼近实体模型。由于STL格式具有易于转换、表示范围广、分层算法简单等特点,为大多数商用快速成形系统所采用,现己成为快速成形行业的工业标准。但是,STL模型也存在许多不足之处:精度不足。由于STL模型用大量小三角形面片来近似逼近CAD模型表面,造成STL模型对产品几何模型的描述存在精度损失,并且在对多张曲面进行三角化时,在曲面的相交处往往产生裂缝、孔洞、覆盖及相邻面片错位等缺陷。数据冗余度大。STL模型不包含拓扑信息,三角形面片的公用点、边单独存储,数据的冗余度大。随着网络时代的到来,STL模型数据冗余大的不足也使其不利于远程RF的数据传输,难以有效支持远程制造。3快速成型技术的应用在外观及人机评价中的应用新产品开发的设计阶段,虽然可借助设计图纸和计算机模拟,但并不能展现原型,往往难以做出正确和迅速的评价,设计师可以通过制作样机模型达到检验的目的。传统的模型制作中主要采用的是手工制作的方法,制作工序复杂,手工制作的样机模型不仅工期长,而且很难达到外观和结构设计要求的精确尺寸,因而其检查外观及人机设计合理性的功能大打折扣。快速成型设备制作的高精度、高品质样机与传统的手工模型相比较可以更直观地以实物的形式把设计师的创意反映出来,方便产品的外观造型和人机特性评价。现在的快速成型加工得到的成型件都是单一颜色,颜色主要由材料决定,为了对产品色彩外观进行评价,有时需要手工涂色,随着彩色成型技术的发展,这方面的问题可以解决。人机评价主要包括成型件尺寸及操作宜人性,快速成型可以很好地满足这方面的要求。在产品结构评价中的应用通过快速成型制成的样机和实际产品一样是可装配的,所以它能直观地反映出结构设计合理与否,安装的难易程度,使结构工程师可以及早发现和解决问题。由于模具制造的费用一般很高,比较大的模具往往价值数十万乃至几百万,如果在模具开出后发现结构不合理或其他问题,其损失可想而知。而应用快速成型技术的样机制作可以把问题解决在开出模具之前,大大提高了产品开发的效率。与反求工程结合反求工程(Reverse Engineering,RE)也称逆向工程,就是用一定的测量手段对实物或模型进行测量,然后根据测量数据通过三维几何建模方法重建实物的CAD数字模型,从而实现产品设计与制造过程。对于大多数产品来说,可以在通用的三维CAD软件上设计出它们的三维模型,但是由于对某些因素,如对功能、工艺、外观等的考虑,一些零件的形状十分复杂,很难在CAD软件上设计出它们的实体模型,在这种情况下,可以通过对模型测量和数据处理,获得三维实体模型。作为一种新产品开发以及消化、吸收先进技术的重要手段,反求工程和快速成型技术可以胜任消化外来技术成果的要求。对于已存在的实体模型,可以先通过反求工程,获取模型的三维实体,经过对三维模型处理后,使用快速成型技术,实现产品的快速复制,缩短了产品开发周期,大大提高产品的开发效率。结束语快速成型技术可以大大缩短产品的开发周期,满足产品的个性化、多样化需求,在工业设计中得到广泛应用。但由于该技术的制作精度、强度和耐久性还不能满足工程实际的需要,加之设备的运行及制作成本高,一定程度上制约着RP技术的普遍推广。随着研究的不断深入,制约快速成型发展的因素会逐步解决,应用领域会不断得到拓展。参考文献[1]孙秀英.面向RP的VRML模型浏览与分层研究[D].西安科技大学,2006.[2]丘宏扬,谢嘉生,刘斌.快速成型技术研究中的若干关键问题[J].锻造机械,2001.[3]徐江华,张敏.快速成型技术在工业设计中的应用[J].包装工程,2004
不简单。var模型不简单,需要深入学习研究。VaR模型即在险价值模型,经常用来衡量风险的,VaR模型正是这样一种定量分析工具,已受到业内人士的广泛认可的。
毕业论文是大学重要的实践教学环节,对于锻炼大学生运用专业知识解决实际问题具有重要意义,毕业论文的选题应具有创新性,内容具有实践意义。那么汽修专业的论文应该怎么写
电子商务毕业论文选用模型写法步骤如下:1、电子商务毕业论文的目的。2、毕业论文的选题。3、毕业论文的基础要求。4、需要对毕业论文进行说明的各种图表,附加说明,数
摘要:介绍快速成型技术的原理,重点讨论了与快速成型相关的技术,并试图将此技术充分应用于产品设计评价,以期缩短产品的开发周期。 关键词:快速成型;RP;反求工
不会。大部分的专家盲审对于学生的毕业论文是不会进行原始数据查询的,当然作为专家来说,如果发现学生所提交的论文当中所有的数据都是编造的,并不是通过实验获得的,那么