当前位置:首页 » 算力简介 » 阿里云gpu的算力

阿里云gpu的算力

发布时间: 2023-06-07 14:44:41

❶ 阿里AI芯片“含光800”问世,性能相当10颗GPU

序言

虽然世界上AI芯片品种不少,但性能特别出众的却是寥寥无几,中国阿里20来年发展史上自主研发的首款国产芯片“含光800”在实测现场以出色的表现脱颖而出。它与传统的GPU比,具有 “以1当10” 的卓越优势。这就是1颗“含光800”的性能堪比传统的10颗GPU,具有突出的性价比。

1 何谓“含光”?

“含光”是上古三大神剑之一,即该剑含而不露,光而不闪。此喻“含光800”所具有的隐其形强其里的算力。含光800是一款云端AI推理芯片,重点应用于视觉场景。就其性能,含光800刷新了现有AI芯片记录,性能及能效堪比全球第一。

该AI架构由两部分组成:硬建系统的核心是“芯片”,好比人的驱体,软件的核心就是“操作系统”,好比躯体的灵魂;灵魂即所谓的智能(AI)。所以,大凡世界上所有的高 科技 产品概莫能外,均由硬件与软件构成。

2 “含光800”的卓越表现

芯片被称为工业之母,要想掌控世界的高 科技 ,首先必须拥有自己的芯片!含光800是阿里20来年发展史上自主研发的首款国产芯片。

含光800将通过阿里云对外输出AI算力。基于含光800的AI云服务当前已正式上线,相比传统GPU算力,性价比提升100%。

在业界标准ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高出4倍;能效比是500 IPS/W参与测评第二名的3.3倍。

3 “含光800”的作用

在杭州城市大脑业务测试结果表明,1颗“含光800”的算力功能朝过目前10颗常规功能GPU。

在云栖会现场演示其性能同样出彩,比如城市大脑中的实时处理,对杭州主城区交通视频,采用40颗传统GPU,时延为300ms,而采用含“含光800”只需要4颗,其时延降至150ms。

在用于处理淘宝商品库每天新增10亿张商品图片,使用传统GPU算力识别需要至少1小时,而使用“含光800”后处理时间缩短至仅5分钟。

❷ 阿里第一颗芯片问世,为何第一个AI芯片就登顶全球

含光一出,不服来干!

阿里将芯片命名为平头哥,一种生活在非洲的蜜罐,号称全球胆子最肥的动物。其性格“不服就干”也成了阿里芯片的代名词。

含光是我国传说中上古三大神剑之一,该剑含而不露,光而不耀,光听名字就能想象到此剑强劲的威力。而含光就是平头哥旗下的小弟,将来还会有更多芯片产品。含光800的出现,真正体现了平头哥的特色:短、平、快。再加上上古神剑,天下无敌,听这名字就相当的霸气。

三、为企业输出普惠算力,好东西让更多企业使用。

阿里产品铁三角:AI+芯片+云计算,从技术和硬件都没有问题,阿里是服务企业起家的,未来这些应用的目标还是广大企业用户。依靠阿里巴巴“让天下没有难做生意”的愿景,将会打造全新的商业模式——平头哥模式,为企业提供性价比更高的普惠算力,让更多企业都能享受科技带来的价值。

❸ 阿里云架构师解读四大主流游戏架构

游戏 行业是阿里云最早聚焦的行业之一,近年来 游戏 行业的变化、云计算产品技术的变化都与日俱进。随着行业业务的变化、技术架构的演进以及阿里云产品的迭代演进,整体的产品技术选型在不同的 游戏 场景、业务场景也不尽相同。本文将聚焦阿里云弹性计算产品在 游戏 行业的方案实践经验。

当前, 游戏 行业的各种场景和行业发展密不可分。简单回顾电子 游戏 的发展,80年代的黑白机,90年代的PC单机 游戏 ,00年代前夕随着互联网的发展网络 游戏 开始盛行,2010年后随着移动设备的逐渐普及,手游在国内开始兴起。

从 游戏 终端来区别,主要有:主机 游戏 (往往是3A 游戏 )、PC 游戏 、移动 游戏 和网页 游戏 等。目前出现跨平台多端 游戏 ,以及云 游戏 化的趋势。

关于 游戏 的品类区别会有非常多的维度:RPG(角色扮演)、MOBA类、竞技类、FPS(射击类)、休闲类、卡牌类、棋牌类、SLG(策略类)等等。目前有多品类融合玩法裂变的趋势。

随着国内防沉迷、版号因素,近年来 游戏 行业诞生了越来越多的精品 游戏 ,出海全球化乃至区域化,以及整体存量用户增速放缓,长线运营、精细运营以及私域社区等运营方式也在悄然变化。

不同的业务场景技术架构不尽相同,如竞技类 游戏 和卡牌类 游戏 对计算的需求就有所区别,云 游戏 与常规的网络 游戏 架构也有所区别。这里主要从 游戏 服和 游戏 平台、大数据、云 游戏 这四个目前常见的场景简单介绍其架构。

游戏 服,从 游戏 类型来看有RPG、FPS、MOBA、SLG、棋牌、休闲等等;从 游戏 平台来看通常有主机、手机、PC等;从业务发行来看有全球、国内、海外,从部署架构来看有集中部署和分区部署;从技术架构来看, 游戏 行业也有逐渐分层解耦的趋势,但与互联网应用相比,有一定其独特性。

因为 游戏 的强交互性特点, 游戏 技术架构与其他互联网应用相比有一定独特性。 游戏 需要保持会话连接,也就是从一个客户端到服务端的长连接,便于对客户端中玩家的操作、行为等进行及时的反馈以及推送给共同 游戏 或对战的其他玩家,所以 游戏 普遍对网络质量更加敏感,网络质量较差的情况会使长连接断开或重连,引起玩家掉线。 游戏 也需要保持会话的状态,既服务端会保持一份玩家的实体,当玩家进行操作时,下次通信的数据会依赖之前的通信的数据,这也是一些MMO(多人在线)大型 游戏 对网络吞吐性能要求较高的原因之一。再比如FPS、MOBA类等多人对战类 游戏 ,交互性更强,对网络延迟容忍度更低,要求低延迟。因为 游戏 需要比较高密度的记录玩家的操作以及结果,所以有频繁写入数据的特点,这类场景需要较强的IO性能。因为 游戏 强交互性、低延迟的特点,其技术架构也和互联网应用不同,在逐渐分层解耦的同时,需要保证 游戏 玩家的交互效果,同时也会依赖到底层服务器的计算能力。

这些都是 游戏 场景普遍存在的特点:长连接保持会话、保持状态、低延迟网络、高IO吞吐、高计算性能。

游戏 的部署架构会结合 游戏 业务特点、 游戏 运营需求来制定 游戏 服务,有分区分服、全区全服业务逻辑,分区分服还是全区全服,最大的架构差异在于数据是不是一套。而从部署方式看,主要是集中式部署和分区域部署。

集中部署就是不论 游戏 玩家在哪里, 游戏 服务集中在一个区域,适合对网络延迟要求通常不高的 游戏 类型,如休闲类;分区部署是指 游戏 服务器根据 游戏 玩家地域分布,分区域部署,方便就近接入,适合对网络延迟要求较高的 游戏 类型,如MOBA、FPS类。

典型架构

MMO类有高并发特点,大量玩家并发的高计算量负载对服务器的计算能力和稳定性有着极高的要求。同时MMO类 游戏 有着比较强的PVE或PVP特性,对网络延迟的容忍度较低。

其中网关服务器负责所有网络数据包的转发,通常是网络负载较集中的点,对于网络吞吐能力要求较高。单个 游戏 区承载玩家数量高,逻辑服务器通常按照场景地图来划分,规模再大会通过分区的方式实现。

数据中心服务器负责缓存玩家数据并异步入库,保障玩家客户快速获取和写入数据,对于可用性要求较高,需要配合应用层实现数据容错机制。

日志服务器承载了大区所有业务行为的日志收集及处理的压力,对磁盘写入性能要求较高,通常采用多台分组方式实现。

(1)MMO 游戏 服性能与稳定需求,建议使用最第7代ECS实例,根据实际需求选型c计算型(CPU与内存配比1:2)/g通用型(1:4)/r内存型(1:8),Intel Ice Lake 2.9GHz基频3.5GHz睿频提供超高性能,能更好地优化 游戏 体验。

(2)异步落库以及日志服务器,对于磁盘读写性能要求高的场景,建议云上使用ESSD PL 0/1/2/3根据业务性能需要选择,避免磁盘读写瓶颈。

(3)在 游戏 日常版本更新中,需要各个地域Region镜像的快速复制,基于ESSD快照异地复制的能力,能够提升镜像复制效率。

(4)分区分服等场景往往需要快速地开服滚服合服,通过CADT云速搭、ESS弹性伸缩、OOS运维编排、ROS资源编排等云上运维工具搭配产品使用,能够提升云上运维效率。

ii. FPS、MOBA类 游戏 架构介绍

MOBA类 游戏 主要包括PVP系统、PVE系统、 游戏 平台等几个主要部分,其中PVP战斗是MOBA/FPS 游戏 的核心。

PVP、PVE、 游戏 平台功能部署于同一VPC中,构成 游戏 大区;战斗服务器(往往)单独跨地域部署。

游戏 客户端首先接入到登录服务器中,完成登录认证、计费等 游戏 平台逻辑。为避免单点问题,所以 游戏 平台服务往往需要高可用方案。可利用云上高可用方案,包括便捷的运维工具满足业务高可用需求。

FPS/MOBA竞技 游戏 ,往往对延迟特别敏感,可以想象,竞技类 游戏 中对战的 游戏 场景:玩家操控人物,在地图里步伐飘逸,枪声密集,每一颗子弹都是一次时间加上空间的矢量计算,而且需要在主进程中完成计算,那么算力需求就随着房间玩家数量上升而指数爆炸,5V5的房间和大房间100人(吃鸡)对算力的需求完全不同。

游戏 这部分重算力场景,推荐阿里云7代高主频或七代实例,更高的单核性能提供更好的战斗效果。

战斗房间类 游戏 ,因为业务本身峰谷特性,灵活地使用云上资源的弹性能力,往往会较好地优化整体的资源使用成本。阿里云弹性计算本身提供了非常灵活的付费方式,包括常规的按量实例、包月包年实例、以及通过节省计划/预留实例券去抵扣按量实例资源,兼顾资源灵活使用的同时达到更优的成本。

此外,为更进一步释放开发运维的效率,当前一些 游戏 也采用了容器化技术架构,阿里云的ACK+ECS/ECI弹性容器实例组合搭配使用,更进一步释放了基础资源的灵活性和弹性能力。

业务场景

游戏 平台(不限于FPS、MOBA类)主要提供的服务:官网、客服、注册、登录、充值、兑换、商城、推送、公告、社区、SDK及邮件、短信等公共服务;包括内容审核、视频录制、弹幕、转码、剪辑、RTC这些业务需要的基础服务,以及运维监控、发布平台、测试平台这些运维等平台服务。

这部分更接近于通用的互联网技术架构,以服务为颗粒度解耦,接入->网关->应用->数据库。

技术特点

这往往通常需要构建高可用基础架构来提升稳定性,业务突发期往往需要一定的弹性能力。相比于 游戏 服务这部分容器化就更加普及,也更容易通过云上的比如弹性容器实例去应对流量峰值场景。在视频录制场景,对实时性要求较高时,往往会基于GPU能力构建,这部分阿里云也提供了vGPU/cGPU能力,释放GPU的灵活性。

大数据是当前 游戏 业务经营、 游戏 运营主要的技术手段,主要面向平台数据运营、 游戏 数据分析、广告转化分析、安全运营分析等 游戏 核心运营场景。不同的场景对实时性要求不同,实时查询检索通常是经营分析、客户受理、玩家监测、在线等场景;离线报表通常是玩家行为分析、用户画像、特征挖掘等场景。

总体而言,实时性业务更多是业务查询类、简单计算类任务,比如买量转化的分析;离线类基本是分析类、预测类任务,比如 游戏 玩法分析。

从技术架构来看,得益于开源社区技术栈的高丰富度,大数据具体的技术选择非常之多,整体从存算一体到存算分离,也诞生像数据仓库、数据湖乃至湖仓一体等概念。

从数据架构流程来看,从数据源->数据采集、传输->数据计算、存储->数据应用,其中可选看技术方案也需要因地制宜。

从部署架构来看,不同的 游戏 公司处在不同的数据建设阶段,会有不同的选择倾向,包括完全自建、基于云自建大数据、基于云上托管、以及利用更多云上成熟的产品技术去丰富整体的大数据能力集,而后者也成为越来越多客户的选择。

拿云上大数据方案举例来讲,比如实时计算部分,选择SLS采集、Kafka数据网关通道,通过Flink做数据计算,通过ES或CK做数据分析,通过ADB以及QuickBI做数据应用展示。离线方案通过OSS做冷数据存储,Spark、Hive、HDFS等组件做数据计算存储,通过CK汇聚分析,通过Dataworks做数据应用。

具体计算存储的产品选型,主要根据不同的业务特性以及大数据应用特性来区分,根据数据容量、IOPS、吞吐、读写特点以及性价比来选择。

如刚刚举例的实时计算/近实时计算场景,Flink具备高性能、低延迟特点,所以是计算密集、网络性能高场景,推荐选型七代ECS实例或6代增强实例;如HDFS需要超大存储容量,高吞吐,推荐D系列本地盘实例,如D2S存储型本地盘实例。Remote Shuffle Service等处理结果多的场景,读写处理频繁如大量的join计算,需要综合来看计算、网络、存储性能以及综合成本来选择通用实例(如第7代ECS实例)或i系列本地盘实例。所以,最终在云上的资源选型,在性能满足的前期下,需要评估通过网络传输数据成本高(云盘),还是就地取材计算成本高(本地盘),不同模型、不同量级选择不同。

从内存处理(成本最高、性能最好、存储容量最小)、SSD本地盘、HDD本地盘、ESSD云盘、OSS对象存储(成本最优、性能一般、存储容量最大),逐渐分层解耦,还带来一个好处:充分释放了云上弹性的能力,可以利用更轻巧的弹性计算产品(如SPOT抢占式实例方式,或ECI容器实例)进行大数据计算,达到更好的弹性能力去满足业务需求的同时也能节约更多的成本。

云 游戏 主要分终端和云端。终端部分基于Windows、iOS、Linux等操作系统的终端设备包括手机、平板、电脑、电视机、VR一体机等。云端架构主要是 游戏 应用层、云 游戏 平台层、IaaS基础资源层,应用层包括PC 游戏 、手游、VR 游戏 、H5 游戏 等多种类型的 游戏 应用;平台层云 游戏 必须的运营平台、支撑平台、流化技术平台等;IaaS基础资源层包括基础网络、基于X86架构以及ARM架构的GPU服务器。

云 游戏 落地,在技术上也经历了诸多挑战,为满足端到端高性能低时延,网络调度、指令串流、编解码、多终端的SDK适配等等都是云 游戏 场景中不可避免的技术问题。

对于云端算力来讲,阿里云解决了云端渲染、串流以及编解码问题,并通过全系列GPU产品来满足云手游、端游、VR乃至企业级视觉渲染场景的需求。

总结来讲,阿里云弹性计算通过云上的串流、编码加速、渲染加速等全套的技术帮助 游戏 客户给云 游戏 玩家提供更好的性能体验,通过基于阿里云全球数据中心可以帮助云 游戏 客户覆盖更多的用户,通过GPU多种产品形态和整体的弹性能力,也帮助到 游戏 客户去更快捷更灵活的构建其云 游戏 业务。

阿里云通过多年的技术积累和持续的运营,提供了大规模的基础设施云服务,目前在全球部署了26个地域、82个可用区,通过优异稳定的性能表现帮助 游戏 客户高效稳定地运行 游戏 业务,为玩家提供极致顺滑的 游戏 体验,并通过技术手段不断地帮助 游戏 客户优化用云成本。

国内的业务出海、 游戏 出海也是现阶段大的趋势之一,很多 游戏 公司已经把出海从业务可选项变成了必选项之一。在2022年3月,阿里云上线了韩国和泰国两大Region,能够为本地化的 游戏 业务提供更流畅、更稳定的 游戏 体验,以此希望能在 游戏 客户出海的业务领域,提供更多的帮助。

当然,作为内容与 科技 两大热门领域的交叉领域, 游戏 产业日新月异,架构也随着前端业务的需要不断改变。阿里云弹性计算也针对 游戏 厂商的不同架构,陆续推出了不同的云服务器类型和付费方式,以及云上运维套件,以帮助客户降本增效。

原文链接:http://click.aliyun.com/m/1000336551/

❹ 全球推理性能之王!阿里终于出手了 发布第一颗芯片!

在阿里内部的体系中,“平头哥”并不是只是战斗能力超群的动物代表,而是一家技术实力超强的半导体公司。

今日召开的云栖大会上,“平头哥”并没有辜负大家的期待,带来了阿里巴巴首款AI芯片——含光800。

据称,这款AI芯片刷新了全球推理性能最高纪录。有业内评论认为,平头哥凭借芯片领域一系列产品,阿里有望在AIoT赛道上占尽优势,抢先站上了万亿市场的风口。

那么,这款全球最强AI芯片到底牛在哪里?平头哥的芯片版图又会是怎样的布局?

不妨和基金君一起来看一下。

平头哥“亮剑”: 含光800来了!

从去年成立平头哥半导体公司开始,外界对阿里巴巴在芯片方面的布局动作始终关注颇高。在今日的云栖大会上,平头哥果然交出了漂亮的答复。

9月25日,阿里巴巴旗下平头哥半导体公司正式发布首款芯片——含光800。

为什么要用“含光”命名?

含光为上古三大神剑之一,该剑含而不露,光而不耀。阿里巴巴用它来作为公司首款芯片的命名,体现了他们在这个领域的雄心与谦逊。

那么,这款性能超强的AI芯片的能力值到底如何呢?

据阿里巴巴方面介绍,含光800虽然是阿里巴巴第一款芯片,但却是全球性能最强的AI芯片。作为一款主要用于云端视觉处理场景的芯片,含光800的性能打破了现有AI芯片记录,在性能及能效比方面统领全球第一。

在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。

据阿里巴巴方面的专家介绍,这款芯片能够达成这样的表现,得益于软硬件的协同创新。

据悉,含光800采用自研架构,针对深度学习中使用的大量权重参数和张量数据,在支持稀疏压缩与量化处理的基础上,通过独特设计的数据访存与流水线处理技术,大大减低了I/O需求和数据的搬移;同时深度优化了卷积,矩阵乘,向量计算和各种激活函数,通过高有效的硬件资源调度和全并行的数据流处理,把AI运算的性能和能效双双推向极致。

“平头哥突破了算法和硬件之间的鸿沟,基于阿里巴巴丰富的场景和达摩院算法能力,自研芯片架构,并且设计了完整软件栈”,阿里巴巴专家强调。这样的设计理念也让整个芯片的效果立竿见影。

对于“平头哥”的首款芯片,外界更惊艳在它超短的研发周期。据悉,平头哥用最短的时间完成了芯片的设计、流片整个过程。其中7个月完成了前端设计,之后仅用了3个月就成功流片。

一般而言,芯片行业属于投入大、周期长、突破慢的领域,但成立才刚刚满一年的平头哥半导体公司,却在短时间内能够这么快推出首款芯片,而且芯片一推出,就能够在性能上达到世界尖端水平,只能说,阿里旗下平头哥的实力,着实不能小觑。

芯片落地: 含光800实现大规模应用

很多AI芯片公司,推出研发芯片后往往没有下文,这是因为他们尚属于芯片打造和场景设计阶段,而平头哥带出的“含光800”从诞生开始就能够实现大规模的场景应用。

据了解,阿里经济体拥有包括图像视频分析、搜索和推荐在内的丰富人工智能应用场景,这都需要AI专用芯片提供算力。这也让AI芯片诞生后就存在应用的场景。

在阿里巴巴内部体系中,含光800能够实现多个场景:包括视频图像识别/分类/搜索、城市大脑等。在未来,这个芯片甚至还可被应用于医疗影像、自动驾驶等领域。

那么,除了阿里内部之外,在实际的生活应用中,这颗芯片又能够做什么呢?

云栖大会现场演示了该芯片在交通状况识别及拍立得商品识别上的两个具体应用。

1、交通状况识别

以杭州城市大脑实时处理1000路视频为例,过去使用GPU需要40块,延时为300ms,单路视频功耗2.8W;使用含光800仅需4块,延时150ms,单路视频功耗1W。

在杭州交通状况识别的视频中,含光可以在极短时间内对车的路况做出及时准确的识别,只需要用到以前1/10的硬件就可完成通用GPU能够完成的任务。

2、拍立得商品识别

据了解,拍立淘商品库每天新增10亿商品图片,为了让用户快速从海量图片中精准搜索到商品,需要强大的计算力支撑,使用含光800搜索效率可提升12倍,时间从传统通用GPU的1小时缩减至5分钟。

此外,目前基于含光800的AI云服务已正式上线。未来,含光800不仅服务阿里内部场景,还将全面通过云服务开放。

阿里巴巴方面的专家表示,在人工智能场景中,含光800是传统异构计算很好地补充,通过阿里云可以为企业提供更多的选择,未来他们还会推出更多形态的人工智能芯片,在终端、云数据中心都会有更大规模的部署和应用。

阿里巴巴芯片版图浮出水面

如果以为平头哥推出一款性能超高的芯片就结束使命,那你就错了!

过去,阿里巴巴集团一直强调“让天下没有难做的生意”,而在平头哥这里,这一愿景改为“让天下没有难造的芯片”。

得益于含光800的发布,阿里巴巴的端云芯片布局基本成型。据悉,在端侧,平头哥已拥有成熟的生态体系,7款自研嵌入式CPU IP核均已得到大规模量产的验证,授权客户超100家,累计销售超十亿颗,广泛应用于机器视觉、工业控制、车载终端、移动通信和信息安全等领域。

在云端,阿里云为平头哥服务企业提供了绝佳平台,未来企业可以通过阿里云轻松获取含光800的极致算力。

此前,平头哥就发布了面向AIoT时代的一站式芯片设计平台无剑,提供集芯片架构、基础软件、算法与开发工具于一体的整体解决方案,能帮芯片设计企业将设计成本降低50%,周期压缩50%。

平头哥介绍称,“在这个平台研发芯片的企业,只需专注于20%的专用设计工作量,并让这20%的工作产生80%的价值”。

根据阿里巴巴在芯片上的定位,那就是端上做芯片基础设施,云端为企业提供普惠算力。例如,处理器是所有高端系统芯片都需要的产品,它是最核心的基础设施产品,AI芯片是人工智能场景最高效的算力单元,阿里将投入重金打造好这些技术,同时构建应用生态。

“芯片、AI和云计算三位一体、协同发展——人工智能算法逐渐集成到芯片,集成算法的专用芯片为云服务提供了更强的性能,而云计算本身则加速了人工智能应用的大规模落地。”阿里巴巴相关专家表示。

阿里巴巴集团副总裁戚肖宁表示:“传统通用芯片的模式越来越难适应碎片化AIoT场景的需求,开源、开放是大势所趋,平头哥致力于做AIoT时代的芯片基础设施提供者,让芯片更普惠。”

平头哥到底是谁?

如此硬核的技术能力,果然已经让众人见识到了平头哥的不凡。

不过话说回来,平头哥和阿里到底是有怎样的渊源?为什么一家高科技公司有这么“社会”的代称?

2018年云栖大会上,阿里巴巴宣布整合中天微与达摩院芯片团队,成立“平头哥”半导体公司。

据了解,“平头哥”由阿里此前收购的芯片公司——中天微系统有限公司,以及达摩院的自研芯片业务整合而来,阿里巴巴董事局主席马云亲自将其命名为“平头哥半导体有限公司”,旨在推进云端一体化的芯片布局。

而这位“平头哥”,实际上是来自非洲大草原一种动物,叫做非洲蜜獾,头顶一片白毛,宛如被剃了平头,外表看起来杀伤力像个青铜,实际上是个王者。

在动物世界中,平头哥几乎是拥有最强大的好战基因,虽然体态小巧,却不畏比之庞大十数倍的猛兽毒虫,骁勇善战,常常能够以小博大,成功反制。平头哥强大的杀伤力,已经被网友票选为“实力票选为”除了人类以外,基本没有天敌的动物。

阿里将平头哥命名为旗下半导体公司,颇有深意,诸如江湖的说法,“生死看淡,不服就干”,这种大胆的动物也和阿里巴巴始终秉持的“不服输、不怕折腾”的精神一脉相承。而在芯片开发领域,人们正需要像平头哥这样不畏艰难、不畏辛苦、敢于挑战的人才投入进去。

2019年7月25日,平头哥成立后发布了第一个成果,基于RISC-V的处理器IP核玄铁910。据介绍,玄铁的性能比公开的RISC-V最好处理器还要提升40%,主频功耗仅为0.2瓦。

阿里巴巴集团副总裁戚肖宁表示,其可用于设计制造高性能端上芯片,应用于5G、人工智能以及自动驾驶等领域。使用该处理器可使芯片性能提高一倍以上,同时芯片成本降低一半以上。

也有通俗的解释称,玄铁910不是英特尔一样完全整合的CPU,而是ARM类似的CPU IP形态,华为麒麟需要用,高通骁龙需要用,三星苹果的手机芯片也离不开。

从处理器到AI芯片,阿里的平头哥公司凭借一系列产品切入芯片领域,而且一做就做到了极致,这也让很多人看到了中国在芯片产业未来的希望。

对于平头哥想打造的芯片生态,我们可以用平台思维去理解:平头哥先解决芯片技术比较难的部分,然后用算法和集成的方法,让更多的企业参与到其中,根据自己所需要的应用和场景进行开发,打造起平台生态。

据悉,平头哥还将将成立芯片开放社区,进一步为芯片产业提供开放协作的平台;公司还将继续开发操作系统,软硬件融合的算法,核心的IP等。把这些共性的技术能够做好做精做出竞争力,并形成生态,然后开放给其合作伙伴,让他们基于高质量的基础设施打造芯片产品,有助于提升整体的产业竞争力。

阿里巴巴集团CTO、达摩院院长张建锋说:“在全球芯片领域,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步,我们还有很长的路要走。”

(文章来源:中国基金报)

❺ 小鹏汽车与阿里云联合建成自动驾驶智算中心

小鹏汽车与阿里云联合建成自动驾驶智算中心

小鹏汽车与阿里云联合建成自动驾驶智算中心,该智算中心由小鹏汽车与阿里云在乌兰察布合建,算力可达600PFLOPS(每秒浮点运算60亿亿次),小鹏汽车与阿里云联合建成自动驾驶智算中心。

小鹏汽车与阿里云联合建成自动驾驶智算中心1

8 月 2 日,小鹏汽车与阿里云共同宣布在内蒙古乌兰察布建成中国最大的自动驾驶智算中心 " 扶摇 ",用于自动驾驶模型训练。

" 扶摇 " 基于阿里云智能计算平台,算力可达 600PFLOPS(每秒浮点运算 60 亿亿次),将小鹏汽车自动驾驶核心模型的训练速度提升了近 170 倍,并且未来还具备 10~100 倍的算力提升空间。双方表示,模型训练速度的大幅提升,将有力推动自动驾驶技术的发展,让汽车的智能化程度和安全性都迈入新的阶段。

同时," 扶摇 " 结合乌兰察布当地天然的气候优势,采用风冷、AI 调温、模块化设计等绿色技术,可实现全年超过 80% 时间全新风运行,年平均 PUE(PUE 指数据中心能耗电力电源使用效率,越接近 1,表明数据中心对电能的利用效率越高,越绿色)小于 1.2。目前," 扶摇 " 正用于小鹏城市 NGP 智能导航辅助驾驶的算法模型训练。

凭借地理位置带来的能源、气候等区位优势,乌兰察布是中国数据中心产业联盟评选为最适合发展数据中心的地区,也是全国一体化算力网络枢纽节点之一。目前有华为、阿里、苹果等 26 个数据中心项目落地在此,总计有 419 万台服务器。

整体来看,今年 1-7 月,小鹏汽车累计交付超过 8 万台,为去年同期的 2.1 倍。自交付以来,小鹏汽车历史累计交付量已接近 22 万台。

此外,小鹏汽车首款面向全球的智能旗舰 SUV小鹏 G9 将于 8 月开放预订,并于 9 月正式上市。

小鹏汽车与阿里云联合建成自动驾驶智算中心2

8月2日,“东数西算”内蒙古枢纽节点中国最大的自动驾驶智算中心建成。该智算中心由小鹏汽车与阿里云在乌兰察布合建,算力可达600PFLOPS(每秒浮点运算60亿亿次),用于小鹏汽车的自动驾驶模型训练。“草原云谷”乌兰察布也迎来首座智算中心。

“东数西算”工程是实现算力规模化、集约化和绿色化的全国一体化布局。西部地区通过承接东部算力需求,像“南水北调”“西电东送”一样优化算力资源配置,提升算力资源使用效率。

位于内蒙古的.乌兰察布就在八大国家算力枢纽节点上。依托独特的区位优势和气候优势,包括阿里巴巴、苹果在内的12大数据中心已落户乌兰察布。这里也因此被称为“草原云谷”。

随着人工智能应用的井喷式发展,专用于智能计算的智算成为发展最快的一种算力形式。智算因其“专用性”,在面向AI场景时性能和能耗更优。据工信部统计,目前我国已建和在建的智算中心有20余座,遍布甘肃、京津冀、长三角、粤港澳大湾区、成渝等国家算力枢纽。

为响应国家“东数西算”战略,小鹏汽车与阿里云选择在乌兰察布建设智算中心“扶摇”,算力规模达600PFLOPS,可将自动驾驶模型训练提速近170倍。模型训练速度的大幅提升,将有力推动自动驾驶技术的发展,让汽车的智能化程度和安全性都迈入新的阶段。

同时,“扶摇”也是更绿色低碳的智算中心,结合乌兰察布当地天然的气候优势,采用风冷、AI调温、模块化设计等绿色技术,可实现全年超过80%时间全新风运行,年平均PUE小于1.2。

小鹏汽车与阿里云联合建成自动驾驶智算中心3

8月2日,小鹏汽车宣布在乌兰察布建成中国最大的自动驾驶智算中心“扶摇”,用于自动驾驶模型训练。“扶摇”基于阿里云智能计算平台,算力可达600PFLOPS(每秒浮点运算60亿亿次),将小鹏自动驾驶核心模型的训练速度提升了近170倍。

小鹏汽车董事长、CEO何小鹏表示,“随着自动驾驶模拟训练的需求变化,我们需要一个强大的本地+云端的算力来支持。我非常有信心和阿里云在一起合作,我们能够更快更强去实现自动驾驶的研发。小鹏汽车期待,与阿里云一起携手共进,共创未来出行时代的美好明天。”

数据驱动是自动驾驶发展的公认方向,也让自动驾驶模型训练成为一头“吃算力”的巨兽。自动驾驶的视觉检测、轨迹预测与行车规划等算法模型,有赖于机器学习海量数据集,但算力的不足让研发速度仍远远赶不上数据量增长的速度。随着传感器的进一步增加,算力的挑战越来越大。

近年来,专用于机器学习的AI智算成为发展最快的一种算力形式。包括谷歌、微软、Meta、阿里巴巴在内的顶尖科技公司都纷纷建造了智算中心。

自动驾驶算法模型训练是机器学习的典型场景之一。在乌兰察布,小鹏汽车建造了一个算力规模达600PFLOPS的自动驾驶专用智算中心“扶摇”,来进一步提高模型训练的效率。

通过与阿里云合作,“扶摇”以更低成本实现了更强算力。首先,对GPU资源进行细粒度切分、调度,将GPU资源虚拟化利用率提高3倍,支持更多人同时在线开发,效率提升十倍以上。在通讯层面,端对端通信延迟降低80%至2微秒。整体计算效率上,实现了算力的线性扩展。

存储吞吐比业界20GB/s的普遍水准提升了40倍,数据传输能力相当于从送快递的微型面包车,换成了20多米长的40吨集装箱重卡。此外,阿里云机器学平台PAI提供了模型训练部署、推理优化等AI工程化工具,比开源框架训练性能提升30%以上。

“扶摇”支持小鹏自动驾驶核心模型的训练时长从7天,缩短至1小时内,大幅提速近170倍。目前,“扶摇”正用于小鹏城市NGP辅助驾驶系统的算法模型训练。和高速道路相比,城市路段的交通状况更为复杂,自动驾驶特殊场景(corner case)的数据集规模增加了上百倍。

❻ 阿里第一颗自研芯片正式问世,为何被誉为全球最强AI

9月25日,在2019云栖大会上,阿里巴巴集团首席技术官、阿里云智能总裁张建锋宣布,平头哥发布全球最高性能AI推理芯片含光800。含光800是阿里巴巴第一颗自研芯片,其称是全球性能最强的AI芯片,主要用于云端视觉处理场景。

热点内容
bitz怎么玩比特币 发布:2024-09-27 21:43:24 浏览:631
元宇宙下一个风口 发布:2024-09-27 21:42:45 浏览:556
深圳usdt支付 发布:2024-09-27 20:59:18 浏览:605
神马m3矿机固件 发布:2024-09-27 20:53:38 浏览:935
xmr欧洲矿池 发布:2024-09-27 20:34:26 浏览:608
比特币市值蒸发多少钱一个 发布:2024-09-27 20:29:06 浏览:507
doge币行情美元 发布:2024-09-27 20:20:49 浏览:8
为什么usdt会涨 发布:2024-09-27 19:39:50 浏览:188
监管数字货币去中心化 发布:2024-09-27 19:31:01 浏览:636
ok比特币指数交易区 发布:2024-09-27 19:00:59 浏览:95