阿里首款AI芯片含光800重磅发布,全球最强AI推理芯片如何练成?

2019年10月05日 13:10 雷锋网

2019年杭州云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋发布了阿里的首款AI芯片含光800,该芯片是一款云端AI芯片,也是全球最高性能的AI推理芯片。含光800主要应用于视觉场景,已经在阿里巴巴集团内多个场景大规模应用,其它企业可以通过阿里云获得含光NPU的算力。

据悉,含光为上古三大神剑之一,该剑含而不露,光而不耀,正如含光800带来的无形却强劲的算力。

含光800为何能打破记录?

根据张建锋的说法,在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。

含光800不仅Resnet50的成绩打破记录,从设计到商用的速度也很快。张建锋表示,平头哥用大概一年半的时间实现了含光800从设计到商用。雷锋网了解到,平头哥用7个月完成了前端设计,之后用3个月就成功流片。仅成立一年的平头哥半导体为何这么快就能设计出云端AI芯片?

要知道,芯片作为典型的长周期产品,想加速芯片的商用,在硬件和软件方面都需要有很强的实力,特别是在AI时代,软硬一体化的重要性更加突显。平头哥就得益于阿里在软硬件方面的积累,算法方面,阿里巴巴达摩院机器智能实验室过去两年构建了完整的算法体系,涵盖语音智能、语言技术、机器视觉、决策智能等方向,并且取得多个世界领先水平的成果;硬件方面,阿里巴巴此前已在服务器、FPGA以及存储等领域拥有多年研发经验,此外,平头哥团队在体系结构、编译技术等领域拥有深厚的技术储备。

含光800性能的突破得益于软硬件的协同创新,芯片架构方面,含光800采用创新的架构,针对深度学习中使用的大量权重参数和张量数据,在支持稀疏压缩与量化处理的基础上,通过独特设计的数据访存与流水线处理技术,大大减低了I/O需求和数据的搬移。NPU同时深度优化了卷积,矩阵乘,向量计算和各种激活函数,通过高有效的硬件资源调度和全并行的数据流处理,把AI运算的性能和能效都推向极致。

其中,性能的提升必须解决内存墙问题。所谓的内存墙,是指采用采用冯诺依曼结构的处理器,存储和运算处理分离,当进行深度神经网络处理时,算力得到了提升,但大量读写运行操作会受到带宽限制,芯片的整体性能提升也同时受到限制。

平头哥的做法是通过自研架构大幅减少对内存的访问,在保证性能的情况下,把芯片功耗降到最低水平。具体而言,含光800会根据神经网络推理运算特征,设计特定的硬件、高速连接的存储结构以及专用指令集,对内存和计算单元实现高效组织管理,实现单条指令完成多个操作,提高计算效率和内存访问效率。

3个月发3款芯片新品,阿里“硬”了

阿里首款AI芯片发布之后,其从云端到终端的产品布局已经十分明确。这些产品也都密集在最近几个月发布,今年7月的阿里云上海峰会上,阿里巴巴集团副总裁戚肖宁发布了高性能RISC-V架构处理器玄铁910。玄铁910集成16个核心,主频2.5GHz,采用12级乱序流水线,最大支持8MB二级缓存,搭载AI增强的向量计算引擎,可用在人工智能加速器、网络通信和自动驾驶等领域。现场公布的数据显示,玄铁910较业界主流芯片性能提高40%,较标准指令性能高出20%。

8月,平头哥又发布SoC芯片平台“无剑”,无剑平台由SoC架构、处理器、各类IP、操作系统、软件驱动和开发工具等模块构成,面向AIoT提供的集芯片架构、基础软件、算法与开发工具于一体的整体解决方案。根据官方的说法,无剑能够帮助芯片设计企业将设计成本降低50%,设计周期压缩50%。

需要指出,7月发布的玄铁910是基础单元处理器IP,无剑是芯片设计平台,所以含光800是阿里的首款AI芯片。这也意味着,阿里的C-Sky系列、玄铁系列AIoT终端芯片IP,一站式芯片设计平台无剑,以及最新发布的云端AI芯片构建了阿里端云一体的芯片生态,平头哥端云一体全栈芯片产品家族雏形已现。

更值得关注的是,端侧的7款C-Sky系列嵌入式CPU IP核已得到大规模量产验证,授权客户超100家,累计销售超十亿颗,应用于机器视觉、工业控制、车载终端、移动通信和信息安全等领域。

RISC-V架构的玄铁处理器以及无剑SoC平台也已有客户,包括人工智能企业云天励飞、老牌芯片公司炬芯科技等。

含光800也已经实现了大规模应用,应用于阿里巴巴集团内多个场景,例如视频图像识别/分类/搜索、城市大脑等,未来还可应用于医疗影像、自动驾驶等领域。同时,阿里云作为全球前三的云服务提供商,含光的能力将通过云服务对外提供。张建锋现场宣布,基于含光800的AI云服务也正式上线。

另外,在生态建设方面,平头哥还将成立芯片开放社区。

不仅如此,平头哥还在研发用于阿里云神龙服务器的SoC专用芯片。未来,阿里还将进一步完善产品形态,推出包括云端AI训练芯片和终端AI推理芯片,满足更多场景的算力需。

自研AI芯片的终极目的是什么?

阿里从云端到终端AI芯片的布局已经明确,并且也已经有不少客户,这是否意味未来阿里不仅不需要购买芯片,还可能替代其它芯片公司?答案是否定的。在这一轮的AI浪潮中,我们看到无论是国外的谷歌、Amazon、Facebook还是国内的阿里,这些强于软件的科技巨头们都在积极研发AI芯片。

至于其中的原因,Cadence首席执行官、华登国际创始人陈立武此前接受雷锋网采访时表示:“科技巨头积极布局AI是因为他们不希望落后,因为他们都有大量的数据。当然,科技公司开始做芯片并不意味着传统的芯片厂商会被取代,科技公司希望在一些应用上用自主研发的芯片来提升效率。”

事实也确实如此,就拿阿里来说,其业务横跨电商、金融、物流、云计算、大数据、全球化等场景,用户规模庞大,对算力的需求更高,挑战也更大。传统CPU、GPU和FPGA难以满足所有需求,并且面临成本和功耗挑战。定制化的ASIC芯片能够实现更高的性能同时兼具更低功耗,因此科技巨头们基于对自身业务和需求的了解,纷纷开始自主研发AI芯片,希望在保持领先性的同时,降低整体计算成本。

从全球范围看,谷歌TPU是全球科技企业从软变硬的代表。此次含光800的发布及商用,表明阿里的优势也不再只是在软件领域,在AI芯片的加持下,未来阿里的优势也将是软硬一体的优势。

为了实现这一目标,阿里几年前就开始了布局。2017年云栖大会上,阿里成立达摩院,这是阿里在全球多点设立的科研机构,立足基础科学、颠覆性技术和应用技术的研究。达摩院由全球建设的自主研究中心、高校联合实验室,全球开放研究计划三大部分组成,涵盖量子计算、机器学习、基础算法、网络安全、视觉计算、自然语言处理、下一代人机交互、芯片技术、传感器技术、嵌入式系统等,涵盖机器智能、智联网、金融科技等多个产业领域。

平头哥得到达摩院和阿里云的软实力加持,基于达摩院的算法能力,才能打破了算法和硬件之间的鸿沟,基于阿里云飞天云平台的优势,得以快速形成了端云一体芯片生态。

如今,阿里自主研发芯片的目标也已经部分达成。根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。

显然,平头哥的目的并非是卖芯片,平头哥还会延续了母体阿里巴巴集团“让天下没有难做生意”的愿景,开辟了全新的商业模式,即平头哥模式(以无剑平台为核心),为企业提供普惠算力。

另据介绍,针对AIoT市场有强应用驱动和场景碎片化等特点,芯片公司按照传统的方式设计芯片很难去适应未来的需求,平头哥希望通过端云一体芯片生态为各行业提供普惠算力。

张建锋说:“在全球芯片领域,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步,我们还有很长的路要走。”

阅读标签:阿里AI芯片含光
延伸阅读
华为:年内没有推出搭载鸿蒙操作系统手机的计划
10月13日消息,日前,法国媒体报道称,华为已经向法国媒体发出邀请参加10月17日的全新手机发布会。法媒指出,华为在给媒体的邀请邮件中提到,"一种新的智能手机系列即将问世"。法媒认为该机不太可能搭载鸿蒙操作系统,应当还是安卓系统。
2019年10月13日华为鸿蒙安卓
苹果iOS 13疯狂弹出窗口 部分用户受到影响
从用户的反馈来看,这次iOS 13的弹窗影响范围非常的广,而弹窗的信息是:“The iTunes Store is unable to process purchases at this time. Please try again later(iTunes Store目前无法执行购买请求。请稍后再试。)”
2019年10月09日iOS苹果
5G手机大战爆发:华为领跑仍处险境 小米OV升级赛道
九月,中国手机市场一年中最活跃的时刻。伴随着Mate 30系列的发布,头部手机厂商的5G产品均已全部亮相。这也意味着从此刻开始,5G手机大战真正全面爆发。
2019年09月28日5G华为小米鸿蒙
苹果A14或首发台积电5nm 2020年上半年量产
在芯片工艺制程上,台积电并没有停下飞速发展的步伐。目前台积电已经可以大规模量产7nm,而且7nm+也在路上了。另外在季度财报会议上,台积电明确表示明年上半年将会实现5nm工艺量产,最快会于2020年9月上市。 苹果A14或首发台积电5nm 2020年上半年量产
2019年09月27日苹果A14芯片
小米MIX Alpha环绕屏概念手机发布:售价19999元,屏占比180.6%
MIX Alpha是一款采用环绕屏设计的概念手机,屏占比达到了180.6%。包括机身的正面、两侧以及背面的大部分区域都覆盖了显示屏。MIX Alpha的环绕屏采用了分层环绕贴合技术,并且拥有360°保护材料贴合屏幕,通过旋入式组装技术实现了环绕屏的效果。另外,MIX Alpha还采用了创新性的柔性环绕屏下指纹识别技术。
2019年09月26日小米环绕屏MIX Alpha
vivo NEX 3探索5G手机极致新形态:99.6%瀑布屏让左右无界 未来无限
在这个颜值即正义的时代,大家都不由自主以「看脸」方式,来判断对陌生人的第一印象,尽管这个方法可能略显武断,却很真实。在手机领域,这两年厂商们为了维护自家产品「脸面」,一直明争暗斗。毕竟当点亮手机屏幕那刻起,就已经开始决定潜在用户对手机第一印象。
2019年09月21日vivo NEX 3瀑布屏5G
微信7.0.7 iOS正式版更新,5大变化,是方便还是复杂?
微信7.0.7 iOS正式版悄悄更新,这次带来了5大变化,到底是更方便了还是更复杂了?让我们一起看一下!
2019年09月18日腾讯微信iOS
华为海思发布全球首颗基于AVS3视频标准的8K/120fps解码芯片Hi3796CV300
荷兰当地时间9月13日,在阿姆斯特丹举办的IBC2019上,上海海思技术有限公司、AVS产业联盟、当虹科技、广东省超高清视频创新中心和鹏城实验室联合发布了首个基于AVS3标准的8K端到端解决方案,同时推出全球首颗基于AVS3标准的支持8K分辨率、120fps的超高清芯片Hi3796CV300。
2019年09月17日华为海思解码芯片
5G芯片“三国杀”:三星华为对高通形成威胁
据国外媒体报道,上周,韩国三星电子和华为技术有限公司轮流在柏林举行的IFA技术展上发布了新的移动处理器,而这些新芯片最大的共同点是集成了5G调制解调器,能够接入5G通信网络。
2019年09月15日5G芯片三星华为高通
苹果App Store应用商店针对儿童类应用放宽审查指南
苹果公司对App Store应用商店的审查指南做出更新,此次更新主要包括对儿童应用中的第三方广告和分析原则的更改。
2019年09月14日App Store苹果应用商店
客服QQ:393564652 业务合作
鲁ICP备17047113号-1
Copyright 2017 站长联盟 All Rights Reserved Powered by LYCM.NET.CN
本站所有素材均收集至网络,如有侵权请联系QQ:393564652,我们将尽快处理!
TOP