2021年7月22日,由全球知名电子科技媒体<电子发烧友>主办的2021第四届人工智能大会在深圳成功举办,本届大会主题为“智创天下,应用为王”,邀请到来自新思科技、爱德万测试、飞腾、Imagination、英飞凌、安谋科技、Vicor、德州仪器、英伟达等全球知名企业领导和行业专家进行精彩分享。
迎辉在致辞中表示,人工智能技术发展日新月异,落地应用也愈发广泛,人工智能大会,从创立第一届开始,便秉承“以创新技术促AI应用落地”的宗旨,邀请人工智能领域的头部企业技术专家,分享AI技术从IP到芯片到应用的各个层面的创新。
在快速发展的过程中,AI行业的发展也遇到了一定的问题,例如数据安全保障、更多应用突破、成本如何下降、技术与需求的对接,以及像智能驾驶、智能监控那种产业商业模式的创新等。这些问题都只能通过实践来解决,通过产业更多方的加入来解决。这也是我们需要更接地气的活动场景,需要有人工智能的行业大会的原因。
新思科技王伟:从硅IP开始构建一个由AI驱动的世界
人工智能时代,人、事物、数据、场景通过网络技术紧密地结合在一起。随着技术的发展,智能化在我们的生活中随处可见,在包括智能手机、安防摄像、数据中心和汽车等领域发挥着重要作用。而芯片是实现云端智能、边端智能和终端智能的关键所在。
据OpenAI预估,自2012年开始人工智能对于算力的需求每3~4个月便翻一倍,通用处理、器的性能增加显然已经跟不上人工智能算法的发展,专用的人工智能芯片从此诞生了,从架构创新到先进封装这样全新的芯片制造方式越来越引起人们的重视。
新思科技TSM王伟指出,在新的SoC设计中,AI加速无处不在,应用于边端智能的IP创新将跨越架构、集成、处理器、协处理器、存储和传感互联等多个领域。同时,这些创新背后也伴随着巨大的设计挑战,比如连接方面如何保证芯片与芯片之间的低延迟,还有异构计算的缓存一致性;安全方面的数据保护、算法保护和信息保护都是大问题。
图:新思科技TSM王伟
王伟表示,IP解决方案能够最大限度地提升高性能计算、人工智能和网络连接SoC中内核间的连接效率,新思科技凭借业界最低延迟的Die-to-Die控制器IP扩大了Multi-Die解决方案的领先地位,DesignWare Die-to-Die IP解决方案是包括常用协议的控制器、PHY和验证IP、模拟IP、嵌入式存储器、逻辑库、处理器以及子系统组成的全面接口IP解决方案,帮助加速人工智能芯片的设计。
爱德万测试葛樑:高性能计算处理器的测试趋势和未来展望
HPC(高性能运算)通常是指利用聚集起来的计算能力来处理标准工作站无法完成的数据密集型计算任务。在人工智能技术不断发展的今天,HPC也成为一个新的芯片类型,为人工智能应用的运转提供强大的运算支撑。在HPC芯片的实现上,一些厂商选择将多个硅芯片封装在一起,以实现高密度计算。
HPC芯片是一个快速增长的市场。统计数据显示,HPC芯片的市场总额从2019年的100亿美元到2025年将超过700亿美元。市场的快速增长也带来全新的挑战,对于测试同样如此。爱德万测试业务发展高级经理葛樑指出,新的工艺技术实现了更低的VDD,但也伴随着新的设计缺陷出现;巨大的芯片规模产生高效率的同时也带来了巨大的测试数据量;采用2.5D/3D芯片制造技术以及Chiplet模式,KGD(已知合格芯片)能否正常运作,对于测试而言也是大问题;此外,还有对于PAM4和新IP实现高速IO的测试。
图:爱德万测试业务发展高级经理葛樑
新挑战孕育新需求,也带动了新的趋势。葛樑谈到,HPC芯片测试将会有四大趋势。首先是结构测试接口的演进需要更高的扫描带宽,测试设备要具备更高的数据速率;其次,更低的VDD能够让测试设备对IC性能更敏感,低压降和快速阶跃响应可防止良率损失,因此需要超动态性能的电源仪器;第三,HPC芯片需要更快的热控制响应;最后,HPC芯片中的HSIO测试要求更高的测试覆盖率。他在此介绍说,这些趋势来自爱德万测试的V93000 EXA Scale能够满足。
飞腾朱大勇:CPU发力高性能计算,AI解决方案落地多个行业应用
7月22日,由电子发烧友主办的2021第四届人工智能大会在益田威斯汀酒店召开,在会议现场,飞腾解决方案高级总监朱大勇带来了《飞腾助力能源行业智能升级》的精彩演讲。
图:飞腾解决方案高级总监朱大勇
AI产业落地应用是业界关注的焦点。从2015年到2022年,中国、美国、欧洲各国数字经济占比持续提升,2024年,以美国为首的发达国家计划数字经济在GDP的占比将达到62.4%。去年4月,中国信息通讯院发布的白皮书显示,2020年中国数字经济在GDP占比38%,还有很大的提升空间。飞腾作为一家CPU厂商,致力于为中国数字化转型打造算力基石。
朱大勇分析说,数字化转型对于芯片支撑能力提出了更高要求,包括多样化算力、高性能、低功耗和高安全性。仅仅依靠CPU是不够的,飞腾以两大基础点切入:一、以CPU为代表的算力是数字经济发展核心动力;二、GPU、AI提供数字化经济的异构算力支持。围绕着这个技术路线,飞腾会打造一个国际化的AI和5G生态,助力中国万物互联时代加速落地。
2020年,飞腾公司营收达到13亿,业绩取得6.8倍增长,芯片出货量超过150万片,数字政府市场占有率达到45%,全年签约量达到200万片。飞腾产品覆盖端侧、边缘侧、云端的应用。
腾锐D2000集成了8个飞腾自主研发的高性能处理器内核FTC663,兼容64位ARMv8指令集,主频2.3-2.6GHz,TDP功耗25W,支持高性能笔记本、网关设备、5G RRU基站、金融终端、工控机。2020年12月29日,在飞腾生态大会上,浪潮、清华同方、长城、中科曙光等十多家厂商联合发布采用腾云S2500的整机产品。
为了应对AI场景应用,飞腾构建了完整的能力栈,采用ARM架构,支持所有主流的软件栈,提供高效虚拟化的方式,在基础语音和图像算法上,飞腾提供适配和解决方案。在产业生态上,飞腾建立人工智能实验室,我们和百度昆仑、比特大陆、云天励飞等众多厂商进行合作。基于飞腾国产CPU的安全可信算力和生态伙伴的“人工智能+“案例逐步落地,比如飞腾与百度在手机部件良品检测方案,生产效率提升10倍以上;飞腾与OpenAILab的解决方案,完成多目标人脸、人体关键点实时检测。
Imagination黄音:GPU+专用AI解决方案赋能智能物联网和智能交通
在第三次半导体浪潮中,半导体IP公司快速成长,在GPU IP领域中,Imagination地位举足轻重。在2021第四届人工智能大会上,Imagination高级市场经理黄音重点介绍了imagination如何通过先进的GPU和AI加速技术赋能智能物联网、智能交通、智慧城市等应用。
图:Imagination高级市场经理黄音
产业数字化升级中面临的一项重要挑战就是需要处理海量的数据,包括手机等智能设备产生的数据,也包括逐步投入使用的智慧城市、智能家居、智慧办公等应用中的数据。显然CPU已无法满足数据爆发式的应用需求,GPU和专用AI相结合的加速方案开始越来越受青睐。
黄音说,IMG Series4 NNA采用了全新的多核架构,能提供高达500 TOPS的算力,从而为ADAS和自动驾驶等应用提供高效支持。Imagination的GPU和NNA几乎都以每年一代的速度向前演进,目前最新一代IMG B系列GPU和Series4NX NNA都支持多核架构,具备极佳的算力扩展性。其中,B系列旗舰款BXT GPU的四核部件可提供6 TFLOPS的图形处理性能和24 TOPS的AI算力,而4NX NNA通过多核集群扩展方式可提供600 TOPS甚至更高的算力。
黄音表示,采用imagination IP出货的芯片已经超过110多颗,Imagination在AI领域的基础专利已经超过1000多项。公司在移动互联和手机方向的出货量占比大概是35.5%,在车载方面的出货量占比43%。
Imagination为Soc芯片提供了一系列产品组合。包括图像处理IP、Power VR光线追踪、Power VR神经网络加速器、以太网包处理器EPP。
以亚马逊无人零售店为例,通过一系列购买流程有一个虚拟购物车跟随用户,直到你刷卡离开亚马逊商店,这是一个无感零售流程。黄音表示无人零售商店采用了端侧高性能人工智能计算,高清摄像头和3D摄像头10多个,包括商品的旁边也有部署,整个商店计算量范围从几T甚至可能到10T以上。她还介绍了GPU+AI技术在智慧城市、智慧工厂的应用。
英飞凌郑国青:人工智能数字DC/DC电源解决方案
英飞凌作为一家全球前十的半导体企业,目前员工超过4万人,在汽车半导体、电源分立模块、安全芯片等领域都排在世界第一。在2021第四届人工智能大会上,英飞凌高级市场经理郑国青分享了人工智能数字DC/DC电源解决方案。
目前在DC/DC电源上面临着一些技术挑战,如过去主要电压只在5V以下,如今有许多产品电压已经提升至48V,这就面临着一些转换的问题。
图:英飞凌高级市场经理郑国青
在转换上,如在基本降压拓扑结构上,可以采用单相和单轨1+0的配置。在系统通信架构上,如与电源管理主机进行I2C/PMBus通信/(监测/编程/升级),与GUI的I2C/PMBus通信(用于在线优化/调试),与CPU/GPU/ASIC的SVID/PMBus/AVS通信,需要更好的调试才行。
英飞凌可以满足各家不同厂商的接口需求,而企业客户也看重效率、瞬态性能、功率密度、功能点等方面,最终企业需要保证客户产品达到一个更佳的质量。
同时,英飞凌还推出了用于高电流AI应用的数字控制器,如Intel VR13.HC,AMD SVI2、Intel VR14 µC控制器、AMD SVI3 µC控制器等。
那么为什么要选择英飞凌呢?郑国青表示英飞凌是一家已经经过全球数字控制系统市场验证的领导者,有超过20年的质量记录,具备稳健的系统解决方案,在整个开发过程中整合了质量,尽可能降低解决方案的风险,拥有强大的全球FAE/客户支持网络,实时提供优质服务。
同时英飞凌可以帮助用户降低系统成本和总拥有成本,而功能丰富的数字控制器在低静态电流下能够提供最高的灵活性和瞬态性能。英飞凌提供广泛的电源级,从中等功率水平到最高电流密度,创新的封装技术,在十多年来不断为MOSFET技术树立行业标杆,是遥测功能和高效率的智能PoL领域的领导者。
未来,英飞凌将对自有工厂进行持续投资16亿欧元进一步提升MOSFET的产能,同时所有产能都是自主生产。
安谋科技吴彤:周易AIPU的创新与演进
当前正处于第五波计算浪潮,而这波浪潮主要推动力是AI,IoT和5G技术,并且这些技术开始快速融合。在2021第四届人工智能大会上,安谋科技AI技术高级市场经理吴彤分享了赋能全场景,构建“芯”生态——“周易”AIPU的创新与演进。
吴彤表示,在第五波计算浪潮中,发现了一个新的机会,即从过去以人为主的数据采集产存分析过程,演变成机器和机器之间的数据采集、存储、分析和服务。这一波技术革命中,不仅仅是芯片需求多样化,整个计算架构和网络架构、智能化应用服务都在发生变化。
图:安谋科技AI技术高级市场经理吴彤
其中,AI芯片领域专用架构(DSA)开始兴起,DSA将弥补软硬件的性能鸿沟,DSA还将硬件架构进行定制并使其具备特定领域应用特征,使该领域的一系列应用任务都能高效执行。
判断AI芯片通常要在六个维度,如模型运行评分、工具链、TOPS/W、灵活性、成本、非AI功能等。
安谋科技推出了“周易”AIPU,可以应用在多样性场景,让通用与专用有效结合,同时这也是安谋中国字眼的AI IP,自主可控,可以在多个领域大规模商用,具备深度学习功能,统一指令集实现各类AI计算功能,拥有完整生态链,在PPA上,也兼具灵活性与安全性。
在“周易”系列中,Z1是面向TinyML场景的更佳解决方案,比如在人体关键点检测,Z2主要是面向智能座舱及中高端安防的解放方案,如驾驶员疲劳监测(DMS),未来还将推出ZX,主要面向高级别自动驾驶的解决方案。
最后,吴彤表示,安谋科技的主旨就是全球标准,本土创新,目前安谋科技推出了4款方案,“周易”是面向安防、车载、移动和AIoT场景的AI处理器;“山海”是面向物联网设备的全栈式信息安全解决方案;“星辰”是面向智能、互联、安全IoT应用需求的处理器,“玲珑”为包括ISP、VPU等在内的多媒体处理器。
Vicor吴际:OAM加速卡核心供电挑战及解决方案
Vicor是一家领先的全球电源模块技术公司,始终致力于为电源系统设计人员提供高级、高性能模块化解决方案,帮助他们应对最艰巨的电源设计挑战。在2021第四届人工智能大会上,Vicor高级现场应用工程师吴际分享了OAM加速卡核心供电挑战及解决方案。
图:Vicor高级现场应用工程师吴际
随着新一代CPU、GPU和AI处理器的推出,AI服务器的系统功率需求也在稳步增长。在机架母线设计上,从12V走向48V这样更高的电压已经显现出不可阻挡的趋势。新的PCIe卡也开始增加48V供电的支持,OCP也给出了48V的高功率方案。然而这种迁移也为设计带来了挑战和机遇。AI服务器从12V升级到48V,可以减少电缆数量、重量和占用空间,并降低TCO。传输损耗可以降低16倍,电容数量可以减少4倍。
与传统的多项VR供电方案相比,Vicor提供的分布式电源架构(FPA)48V直接给CPU核电压供电,减少了CPU/GPU 50%以上的PCB面积,简化了CPU I/O布线。此外,传统电源架构将电压转换和稳压功能集成在一个模块里设计,而FPA采用了独立的稳压和电压变换单元,在整个系统上减少了大电流传输损耗,在DC-DC转换过程中减少了不必要的重复设计,降低了负载点的功率损失,提高了整个系统的效率。
Vicor提供标准和可配置的PRM模块,标准PRM是一个完整的分离稳压电源模块,可作为一个单独Buck-Boost电源模块或与VTM搭配使用。而可配置的RPM支持SiP、SM Chip Package等多个封装,可根据需要灵活配置本地和远程检测,或是自适应回路。
在VTM产品上,Vicor既有隔离架构的第一代产品,也有适用于数据中心场景的非隔离架构第二代产品。FPA技术可以让VTM(MCM)模块做到非常小,小到可以放在距离XPU最近的位置,实现更高功率密度和效率的稳压调节方案。
德州仪器蒋宏:德州仪器嵌入式处理器助力您的边缘计算与AI应用
针对边缘计算和AI应用,德州仪器在感知、连接、安全和工业4.0等领域对嵌入式系统做出了应用创新。在2021第四届人工智能大会上,德州仪器嵌入式产品系统与应用总监蒋宏为大家分享了“德州仪器嵌入式处理器助力您的边缘计算与AI应用”。
图:德州仪器嵌入式产品系统与应用总监蒋宏
随着智能摄像头、自动化机器和机器人的出现,AI和边缘计算变得无处不在。TI推出了Jacinto、Sitara和部分DSP等应用处理器,以及毫米波传感器来应对边缘计算和AI的挑战。
Jacinto 7 SoC / TI
Jacinto为面向高性能计算的处理器,Sitara为高度整合的合理成本SoC。边缘AI系统如今面临能耗比,成本等挑战。为了打造实用的边缘AI系统,必须要对性能、功耗、成本和开发周期做出改善。Jacinto 7就是这样一个满足以上要求的高度整合且可扩展的异构处理器平台,专为视觉处理和传感器融合的边缘AI应用设计。Jacinto-7 TDA4x将ISP、MCU和DSP等整合到一个SoC中,还纳入了业界领先的深度学习加速器、机器视觉加速器等。
德州仪器借助C7x DSP和MMA打造了一个高效的深度学习加速器,可以实现8 TOPs的算力。在影响和机器视觉的硬件加速器上,TDA4x可实时加速10个2MP 30fps的相机,替代FPGA和定制的ISP芯片,解放CPU频率。利用这一硬件加速器,也降低了系统功耗、延迟和BOM成本。保证性能的同时,德州仪器也没有忘记功能安全。借助安全MCU和安全加速器,Jacinto 7最高可以达到SIL-3级别的功能安全。
德州仪器也提供了云方案TI Edge AI Cloud,方便工程师对边缘AI应用进行快速评估。借助这套云方案,工程师可以在数分钟内获取延迟、FPS、精度和DDR BW等参数。
德州仪器也针对工业4.0,推出了IWR1443、IWR1642和IWR6843三款工业级毫米波传感器。IWR6843不仅包括毫米波传感器,还集成了硬件加速器和DSP,可以实现精准的动作检测、点云硬件加速和用于高级算法的片上DSP。
英伟达:初创加速计划与创新生态
英伟达不仅提供芯片,也提供算法,现已发展成一家全栈式计算公司。在2021第四届人工智能大会上,英伟达初创加速计划经理朱敏作《英伟达初创加速计划与创新生态》主题分享
英伟达初创加速计划经理朱敏
在高性能计算时代,英伟达在2006年推出了的CUDA®编程模型和GPU数据中心,为通用计算带来并行处理的能力。朱敏表示,世界前十的超级计算中心有8个应用了英伟达的GPU技术。
在加速计算方面,英伟达为当代700多个应用提供技术支持,在过去4年中,算力提升了11倍。英伟达不仅提供视频和图像处理的能力,在大数据处理方面,英伟达推出了Apache Spark平台,将数据中心变成计算引擎,利用GPU作数据处理和模型分析、推理等。在防疫过程中,科学家利用英伟达的计算能力做病毒的排序、成像等,找到新的治疗方式
在数据时代,英伟达推出了新的计算逻辑:新的计算单元是在数据本身做计算,也就是说数据在哪就在哪做计算。这需要三个方面做协同处理:CPU的通用计算处理、GPU的加速计算处理、DPU为数据中心的数据交互提供能力。
作为一家注重创新理念的公司,2016年,英伟达发起了“NVIDIA初创加速计划”。朱敏介绍,英伟达初创加速计划是加速人工智能创业公司发展的全球生态项目,旨在培养颠覆行业格局的优秀AI初创公司,利用AI技术重新定义行业发展,解决关键挑战。目前,全球拥有超过5000名会员单位;在中国拥有超过600家会员企业,覆盖30多个行业。
AI落地应用在2021年得到显著提升
黄晶晶在分享“2021年AI技术与应用落地报告”中指出,2021年AI应用的情况得到了明显提升。她表示,这是电子发烧友网连续第三年输出独立、专业、深度的AI调研报告。
该调研得到了AI产业链来自芯片原厂、算法、EDA工具、IP、模组、方案和终端厂商的大力支持,其中研发岗位占比达7成以上,广泛覆盖到各应用领域和不同规模的公司。基本能够真实反映出当前AI技术和应用落地情况。
其中AI采用的处理器架构和IP呈现了多元化的发展,ARM、X86架构仍然是处理器的主流选择,但为了适应AI设计更大的灵活性、智能化和自主性,eFPGA、RISC-V也成为用户较多的选择。此外还有GPU、NPU IP也得到更多采用。
调研数据显示,CPU、FPGA、MCU+DSP、GPU是采用AI芯片类型中较多的选择。针对算力需求的调研显示,10TOPS以下的算力占比最高。其中3-6TOPS占比20%,6-10TOPS占比19%,1-3TOPS占比16%,0-1TOPS占比12%。
在应用领域方面,消费电子、智能家居和智能安防位列用户选择的前三位,而在看好哪些AI应用中,安防、互联网、医疗健康位列前三。
和2020年相比,今年AI大幅落地的驱动力仍然集中在开放的数据平台、算法继续优化和算力进一步提升这三大因素,不过开放的数据平台不再是第一选择,取而代之的是算法继续优化。表明今年对于算法优化的意愿更强。
此外,AI项目的成功部署情况在2021年也得到了明显改善。而目前采用AI芯片的困难主要集中在研发难度大、成本偏高和技术支持不到位。
黄晶晶还提到,国际厂商逐渐趋向CPU+GPU+FPGA的整合,国内厂商也从ASIC向GPU、DPU延伸,在当前数据安全成为AI发展需要考虑的关键问题,而加快AI生态建设、寻找更深的AI应用也是原厂、方案商、终端客户需要共同努力的方向。
大会现场精彩展示