是芬妮呀
开年以来 ChatGPT、GPT-4 的相继面世再度掀起计算机科学领域通用人工智能(AGI)研究热潮,也不断刷新我们对 AI 的认知。
作为具有人类水平表现的大型多模态模型,GPT-4 被视为迈向 AGI 的重要一步,标志着创新范式的深度变革和生产力的重新定义,也必将带来更多元的产品迁移。
截至目前,全球已经有超百万家初创公司声称使用这一秘密武器来创造新产品,而这些产品将彻底改变从法律到股票交易,从游戏到医疗诊断的近乎一切领域。
尽管其中很多是营销泡沫,但与所有技术突破一样,总会存在炒作周期和意想不到的远期效果。
事实上在另一边,进入 2023 年智能汽车领域同样十分热闹。
智能化已然成为上海车展全场关注的最大焦点,除了激光雷达等关键传感器的单点式突破,各大巨头也纷纷展示智能驾驶全产品矩阵,城市场景辅助驾驶量产落地加速推进。
更加值得注意的是,BEV、大模型、超算中心等计算机热词正在与自动驾驶、行泊一体、城市 NOA 等智驾焦点火速排列组合,颇有相互交融、双向奔赴的味道。
在这背后,一方面是近年来智驾、智舱持续升级对 AI 在汽车场景落地的数据、算法、算力不断提出更高要求,另一方面,AGI 的重大突破也已将触角伸向智能汽车,将其视为实现闭环应用的重要场景,很多企业布局已经相当高调。
日前,商汤科技 SenseTime 举办技术交流日活动,分享了以「大模型+大算力」推进 AGI 发展的战略布局,并公布该战略下的「日日新 SenseNova」大模型体系。
在「大模型+大算力」加持下,本次上海车展商汤绝影驾、舱、云一体产品体系已全栈亮相,近 30 款合作量产车型集中展出,商汤也再度分享了智能汽车时代的 AGI 落地新思考。
本次上海车展亮相的部分绝影合作车型展示
01、算法:AI 正式步入大模型时代
如商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚所言,「AGI 催生了新的研究范式,即基于一个强大的多模态基模型,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。」
通用大模型并非为自动驾驶而生,或为满足自动驾驶的特定任务需求而设计。但智能驾驶开发的诸多新需求已在推动算法从专用小模型向通用大模型快速演进。
首先是应对海量数据处理和 Corner Case 问题的迫切需求。
对于感知系统低频出现但至关重要的小目标及带来的潜在安全隐患,算法开发需要面对海量数据,传统的 AI 小模型将难以同时处理大数据量和高复杂度的任务。通用大模型则可用在长尾目标的初筛过程,并叠加语料文字处理得到很好的效果。
再比如智驾算法开发对自动化数据标注、降低人工成本的诉求。相比于人工标注,通用大模型将自动化对海量数据完成标注任务,大幅降低标注数据获取的时间成本和本身的金钱成本,从而缩短研发周期、提升成本效益。
处于类似的考量,近年来国内外巨头企业已围绕大模型纷纷展开各自智驾布局。
继 Google 于 2017 年提出将 Transformer 结构应用在 CV 领域图像分类,大模型已在 GPT-2、GPT-3、BERT 等当中不断证明实力,特斯拉率先站台 Transformer 大模型征战图像视觉。
国内企业也紧随其后:
毫末智行已宣布自动驾驶认知大模型正式升级为 DriveGPT,百度表示利用大模型来提升自动驾驶感知能力并将大模型运用到数据挖掘,华为也已宣布加入大模型争霸赛,自研「盘古」即将对外上线。
作为行业领先的人工智能公司,商汤在大模型领域可谓乘风破浪,过去一两年则全面将大模型能力在各业务线 20 多个场景落地,包括智能驾驶。
商汤「日日新 SenseNova」大模型体系背后是大模型研发中深厚的积累。商汤有自己的全栈大模型研发体系,其中就包括针对大模型的底层训练及实施过程中的各种系统性优化。
例如,商汤近期向社区发布的用于真实感知、重建和生成的多模态的数据集 OmniObject3D 中包含 190 类 6000 个物体,数据质量非常高。
再比如,商汤在 2019 年就已首次发布 10 亿参数的视觉大模型,到 2022 年参数规模已达到 320 亿,这也是世界上迄今为止最大的视觉模型。
此外,商汤也在智驾领域持续展示大模型能力。2021 年开发的 BEV 感知算法在 Waymo 挑战赛以绝对优势取得冠军,2021 年 BEV Former 的 Transformer 结构至今仍是行业最有影响力的 BEV 工作,今年开发的 UniAD 是业内首个感知决策一体化的端到端自动驾驶解决方案。
在技术实力的另一端是量产进度。商汤也给出了自己的智能驾驶量产公式:
自动驾驶技术能力=场景数据 x 数据获取效率 x 数据利用效率² =场景数据 x 数据获取效率 x 先进算法 x 先进算力。
而先进的算法大模型不仅将通过跨行业数据汇聚提升驾驶场景数据资源,通过数据闭环开发模式和自动数据标注提升数据获取效率,更将大幅提升感知精度和感知丰富度进而成倍提升数据利用效率。
依托原创 AI 算法和模型积累,商汤领先的 BEV 感知算法推进国内首批量产应用,并采用 Domain Adaption 算法有效解决跨域泛化问题。商汤首创的自动驾驶 GOP 感知体系将目标数据获取的人力成本降低 94%,实现低成本的车端模型开发,目前也已投入量产应用。
02、算力:智能汽车时代的重要基础设施
随电子电气架构技术由分布式不断向集中式演进,大算力芯片成为新型电子电气架构实现的物理基础。
近年来车端芯片算力发展突飞猛进,如英伟达规划中的 Atlan 单颗芯片算力超 1000TOPS,THOR 单颗算力超 2000TOPS,将大幅提升单车感知决策能力。
而在云端,AGI 在自动驾驶、网联等场景的泛化应用将提出比车端指数级更高的算力要求——从数据标注到模型训练,从场景仿真到算法迭代。
算力将是智能汽车时代的新型基础设施。
在此背景下,近年来主流企业纷纷开启双线并行探索,车端自研算力平台,云端建立超算中心。而进入大模型时代后,数据量随着多模态的引入也将大规模增长,因此必然也会导致 AGI 对算力需求的剧增。
可以看到,英伟达车端云端同步布局并将提供端到端的全栈式 AI 加速计算解决方案,特斯拉也早在 2021 年 8 月发布自研云端超算中心 Dojo。
据近期报道,埃隆·马斯克也将成立一家人工智能公司来与 OpenAI 竞争,已购买数千个英伟达 GPU 并一直招募 AI 研究人员和工程师。
国内方面,吉利、蔚来、特斯拉、毫末智行、小鹏等企业也已跟进布局云端算力集群,投入巨大以提升智驾开发算力储备。
对于商汤来说,如果说大模型将是支撑智能驾驶的上层建筑,那么大算力就是数字基座。
商汤科技董事长兼 CEO 徐立表示,目前大模型对基础算力、基础设施的需求非常旺盛,基础算力对并行效率的要求也非常高,但真正好用的基础设施其实十分稀缺。
出于这一原因,商汤历时五年自建了业界领先的 AI 大装置 SenseCore,完成 万块 GPU 的部署并实现 exa FLOPS 的算力输出能力,是亚洲目前最大的智能计算平台之一,可同步支持 20 个千亿规模参数量的超大模型同时训练。
位于上海临港的 AIDC 人工智能计算中心将为智能汽车的数据存储、标注、脱敏、仿真训练、算法迭代到部署的闭环提供算力支持,打通基于数据驱动的算法生产全流程,加速高级别智能驾驶技术的 AI 模型生产和持续迭代,推动实现规模化量产。
在 AIDC 的基础上,AI 大装置也将提供支持大模型生产的一系列服务:
如此规模的算力设施即使特斯拉同期也尚难以望其项背,也必将推动大模型的高效闭环。
03、「大模型+大算力」推动智能汽车行业整体进程
汽车行业正在面临百年未有之大变革。尽管此次以「大模型+大算力」推进 AGI 发展是商汤提出的战略布局,但事实上,这一理念早已在行业层面达成共识。
基于感知、决策规控和 AI 云三大核心能力,商汤「大模型+大算力」已赋能绝影驾、舱、云三位一体产品体系量产落地:
除智能驾驶领域的全栈能力和行泊一体量产解决方案外,「大模型+大算力」也正在助力商汤打造智能座舱跨场景生态。
车展期间,与商汤「日日新 SenseNova」大模型体系深度融合的绝影未来展示舱升级亮相,语言大模型「商汤商量 SenseChat」以及 AIGC 文生图平台「商汤秒画 SenseMirage」也已上车,多点融合重构人车交互方式,打造第三空间。
以「商量」为例,作为千亿级参数的自然语言处理模型,其使用大量数据训练并充分考虑中文语境,展示出出色的多轮对话和超长文本的理解能力。
商汤也展示了语言大模型支持的诸多汽车场景创新应用,如在行车过程中化身「邮件助手」自动提炼关键信息,作为「会议助理」自动生成会议纪要,大大节省用户行车时处理工作的时间和精力,为未来出行的应用场景拓展带来丰富的想象空间。
此外,以人工智能大模型开发、生产、应用为核心,一站式
【本文来自易车号作者汽车之心,版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点,与易车无关】
为爱浪漫1
今年的上海车展据说有148场发布会,数量相当恐怖。但要我说,最让我感到惊喜的,还属地平线的发布会。
在这场发布会上,重磅信息接连而出,包括但不限于:
• 发布了新一代BPU架构——纳什;
• 官宣了与比亚迪、采埃孚等头部企业的合作。
更让我意外的是这组数据:2022年,中国乘用车市场中标配L2+NOA功能市场里,地平线征程芯片份额达到了!
这是什么概念?
2022年每卖出两辆具备NOA功能的新车,其中就有一辆搭载了地平线的芯片!
从伯努利、贝叶斯、到如今的纳什,地平线正在用一片片搭载BPU的智驾芯片“征服”市场,并在事实上建立汽车智驾计算的新格局。
地平线是如何做到的?BPU为何能够获得车企们的一致认可?
要解答这个问题,还要从需求端说起。
消费者需要怎样的智驾?
在智能驾驶方面,中国是事实上的“主战场”:自主车企、海外车企、集成商、软件商,各路英雄豪杰齐聚于此,L2/L2+NOA辅助驾驶、L3/L4自动驾驶、甚至Robotaxi无人驾驶等等,各种智驾路线在这片大地上争相竞逐。
但如果从消费者角度来看,他们最真实的需求是什么?他们最需要的智驾系统又是什么?
是L3/L4自动驾驶甚至无人驾驶的Robotaxi吗?我相信未来一定是,但目前,甚至说近10年内,可能都不会是。
这取决于多方面因素,包括技术、法规、伦理、公众接受度等等。
因此,无论是地平线的CEO余凯、还是比亚迪的董事长王传福,都表达了类似的观点:“无人驾驶离我们还很遥远,辅助驾驶将在很长时间内存在并保持主流地位。”
这里所说的辅助驾驶,不只是说LKA车道居中辅助,只有这种L2基础功能并不能完全满足消费者们的日常需求,它并称不上“够用”。
在我的理解中,真正“好用”的,应该是一套包括LKA、高速NOA、城市NOA、泊车等在内的全场景的高阶辅助驾驶。一定要足够稳定、高效、省心,而且具备合理的成本,具备普适性,让更多的消费者对智驾的能力产生足够的信心,并让更高阶的智驾技术在这一过程中获得长久的验证,从而在未来的某一天,让智驾走向真正的自动化。
这可能会是一个相当漫长的过程。因此,如何在合理的成本下,为消费者提供足够好用且稳定的辅助驾驶体验,将成为绝大多数车企未来几年内的研发主进程。
而这,恰好是地平线BPU的强项。
BPU:车企智驾“最优解”
BPU全称“Brain Processing Unit”,是地平线自研的智能驾驶专用处理器架构。因为是专用架构,BPU在智驾系统的运行效率上有相当大的优势。
例如,微软有一个名为“COCO”的数据集,其中包含了超过30万张图片,常被用来训练模型或者验证不同系统的图片处理能力。
基于贝叶斯架构的征程5芯片,在这个数据集的目标检测测试中,在128TOPS算力的前提下,可以实现1718帧每秒的图像处理速度,在目前已量产的自动驾驶芯片中处于头部水平。与之相比,成本高出数倍、目前端侧理论算力最强的量产GPU在运行同样的测试时,图像处理速度仅为每秒千帧出头。
可以说,正是由于这种高能效、高真实性能的特性,让基于贝叶斯BPU架构的征程5成为了许多车企首发搭载NOA功能的首选。
而在车展上,地平线推出的新一代BPU架构“纳什”,又在效能上再次迎来了跃升。
目前,基于Transformer网络的大模型正成为业界主流研发方向,很多厂商都在尝试把Transformer引入到视觉任务中来,其中ViT,SwinTransformer等都是视觉Transformer的典型代表。但这种模型参数量很大,即便是推理模型,所调取的数据量也非常大,这就对处理器的带宽提出了更高的要求。
因此,在纳什架构中首次采用了三级片上缓存设计,分为L0近存、L1高性能缓存以及L2大容量缓存,不仅大幅提高了片上带宽,优化了高参数量下的性能表现,同时三级缓存与大并发的数据桥相互配合,还可以实现片上不同计算核之间的灵活多向的数据流动,提高了计算效率。
同时,在纳什架构中,还引入了多脉动立方加速引擎和数据排布变换引擎,前者可以使得引擎间数据流动更高能效、低带宽占用;后者则可以更好地应对以Transformer为代表的这种新形态算法对于数据的data layout进行更灵活的更高效的转换需求。
要知道,目前大火的算法无论是BEV还是Occupancy占用网络,均是以Transformer为核心。纳什架构这种针对性的设计,无疑将大大提高智驾模型的性能表现。
但这并非全部。目前,高阶辅助驾驶能力已开始成为部分车企打造壁垒的一种方式,因此“自研”很重要。
但对于很多车企来说,现在开始自研,困难重重。大量的资金投入是肯定的,同时还不可避免地将面临“踩坑”和“重复造轮子”等情况。
基于这种现状,地平线作为“最懂算法的计算提供商”,选择通过多种开放灵活的模式帮助客户更快开发。
首先,在本次发布会上地平线推出了专门服务于智能驾驶专业开发者,面向量产、生态协同共建的嵌入式应用开发套件——踏歌(TogetheROS™·Auto),通过多模块协同开发,解决行业多供应商协同开发的困难,可将开发、集成、验证效率提升200%,让合作伙伴更高效地利用地平线开发的算法,基础设施和算力。
同时,地平线还推出了天工开物算法工具链、包含训练、测试、管理一条龙在内的艾迪开发平台等开发工具,可以帮助客户实现快速开发和部署。
在避免“重复造轮子”方面,地平线则是直接提供了“参考算法开发加速包”,其中不乏主干网络Swin-Transformer、BEV时序多任务感知算法Bev_mt_ipm_temporal等SOTA算法,大幅降低了算法开发门槛,加速产品原型的开发与迭代。
更关键的一点是,得益于越来愈多的车企选择地平线,有越来越多来自不同厂商的智驾方案运行在相同的征程芯片上。地平线作为上游,可以根据不同算法在征程芯片上的运行表现,并针对行业的显著趋势进行优化。
例如前面提到的MScoco数据集测试成绩,目前征程5已达到1718帧每秒,而在前不久,这一数字还是1531帧每秒。
短短几个月的时间,在芯片本身没有变化的前提下,实现了如此大的性能提升,正是因为地平线针对场景和需求,将一些算子进行整合或者独立封装,优化了编译器,让编译器在部署过程中获得最佳性能。
高效能、高性价比、高开发效率,无疑可以大大提高智能驾驶的量产和普及速度,帮助车企更快抢占市场。这也是为什么,地平线征程5能够获得理想、比亚迪、广汽埃安、上汽集团、一汽红旗等众多车企量产定点的原因。
符合当下,满足未来
在会后的专访环节上,地平线联合创始人、CTO黄畅博士向电动知士介绍到,基于纳什架构的BPU芯片,算力相比征程5可提升数倍。同时,该架构具备“可伸缩”的能力,也就是可以根据需求,调整芯片的规模,把算力控制在几十TOPS,从而控制成本。
他还表示,基于纳什架构,在征程5芯片相当的晶体管规模下,可以进一步提升性能同时降低成本。
这又带给了我无限的遐想!
人们常说,IT行业是每年“发布一代、研发一代、预研一代”,芯片行业也是如此,但研发周期又要长得多。
例如贝叶斯架构IP核概念设计于2019年,在2020年完成了设计,并在2021年实现了一次性流片成功。这次发布的纳什架构则是早在2021年就开始了规划,并且经过两年的时间才完成了IP核的设计。
可见,芯片的研发要在项目初期就对行业的需求和技术发展有足够的判断,否则就会与市场需求脱节。
显然,此次发布的“纳什”架构就是地平线对行业发展的一次精准判断,目前的主流技术和研发方向统统命中。
更高效的BPU架构加上“可伸缩”的能力,意味着地平线将来极有可能基于纳什架构推出不止一款新品,其中既可以有算力增长数倍的“豪宅”,面向更高阶的智能驾驶;还可以有算力为100~200TOPS的“经济适用房”,以更低的成本面向主流乘用车市场。
符合当下需求,满足未来趋势,这就是地平线BPU的最大优势!
正如前文所述,中国NOA车型中,征程芯片的市占率已经达到了惊人的数字,而这次发布会上,地平线又官宣了与比亚迪和采埃孚的深度合作,都基于征程5。
前者是全球领先的新能源汽车品牌,后者则是全球领先的Tier1之一,毫无疑问,地平线征程系列芯片的出货量又将迎来一次“跃升”,将重构智驾芯片市场格局。从CPU到GPU,从PC到智能手机到云计算,正如黄畅博士所言,一个时代有一个时代的计算架构,面向全新智驾机器人时代,地平线BPU凭借对场景的洞察和针对性设计,正加速成为智能驾驶时代计算终局之选。
【本文来自易车号作者电动知士,版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点,与易车无关】
毕业论文方案设计 写作毕业论文是学生在校学习期间的重要实践环节之一,是实现培养目标的必不可少的实践环节;是对学生学业水平和研究、分析、解决问题能力的综合检验;也
数据库系统设计毕业论文 第一章 概述 1.1课题背景 随着计算机智能化、人性化和Internet 技术的不断发展,为了使教学、培训能满足不同地点和不同学习
管理会计在大数据时代的发展论文 摘要 :互联网为海量的大数据提供媒介,大数据使人们生活和工作方式悄然改变。在经济体制转型期,市场机遇与挑战并存,企业价值管理已是
本科学位论文是侧重于动手能力的,所以称为毕业设计,大数据处理类的,如果真的去搭建云平台是稍微有些不太好做,毕竟咱们个人的计算机终端是不够的,所以我觉得侧重于大数
随着社会的进步,工业的发展,我国机械制造业得到了巨大的发展。下文是我为大家整理的关于机械设计方面毕业论文例文参考的内容,欢迎大家阅读参考! 浅析大型机械驾驶室减