加入收藏 | 设为首页 | 会员中心 | 我要投稿 惠州站长网 (https://www.0752zz.com.cn/)- 办公协同、云通信、物联设备、操作系统、高性能计算!
当前位置: 首页 > 移动 > 正文

全球十大AI训练芯片大盘点

发布时间:2019-10-16 21:16:10 所属栏目:移动 来源:乾明
导读:副标题#e# 本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 AI芯片哪家强?现在,有直接的对比与参考了。 英国一名资深芯片工程师James W. Hanlon,盘点了当前十大AI训练芯片。 并给出了各个指标的横向对比,也是目前对AI训练芯片最新

IO数据:

  • 4x 提供32 GB的HBM2-2000 DRAM 堆栈, 整体达1 TBps
  • 芯片上集成10x 100GbE 接口,支持融合以太网上的 RDMA (RoCE v2)
  • PCIe-4 x16主机接口

Huawei Ascend 910

华为昇腾910,同样直接对标英伟达V100,于今年8月份正式商用,号称业内算力最强的AI训练芯片。主打深度学习的训练场景,主要客户面向AI数据科学家和工程师。

全球十大AI训练芯片大盘点

其核心数据为:

  • 7nm+EUV工艺,456平方毫米
  • 集成4个96平方毫米的 HBM2栈和 Nimbus IO处理器芯片
  • 32个达芬奇内核
  • FP16性能峰值256TFLOPs (32x4096x2) ,是 INT8的两倍
  • 32 MB的片上 SRAM (L2缓存)
  • 功耗350W

互联和IO数据:

  • 内核在6 x 4的2d网格封包交换网路中相互连接,每个内核提供128 GBps 的双向带宽
  • 4 TBps的L2缓存访问
  • 1.2 TBps HBM2接入带宽
  • 3x30GBps 芯片内部 IOs
  • 2 x 25 GBps RoCE 网络接口

单个达芬奇内核数据:

  • 3D 16x16x16矩阵乘法单元,提供4,096个 FP16 MACs 和8,192个 INT8 MACs
  • 针对 FP32(x64)、 FP16(x128)和 INT8(x256)的2,048位 SIMD 向量运算
  • 支持标量操作

拓展阅读:

华为算力最强AI芯片商用:2倍于英伟达V100!开源AI框架,对标TensorFlow和PyTorch

Intel NNP-T

这是Xeon Phi之后,英特尔再次进军AI训练芯片,历时4年,壕购4家创业公司,花费超过5亿美元,在今年8月份发布。

神经网络训练处理器NNP-T中的“T”指Train,也就是说这款芯片用于AI推理,处理器代号为Spring Crest。

NNP-T将由英特尔的竞争对手台积电(TSMC)制造,采用16nm FF+工艺。

(编辑:惠州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读