寒武纪的劲敌来了！这家人工智能深度学习AI芯片公司很神秘——可能是今年最大的机会_逆风发型不乱

逆风发型不乱

+关注

博主要求身份验证

登录用户ID：

这家神秘的AI芯片公司很多人还都不了解，但他们的技术和产品足以震撼整个AI芯片行业。相比最近搭载华为MATE10手机赚足眼球注意力的寒武纪公司而言，GTI公司2017年9月流片的28nm芯片LightspeeurTM光矛2801S更胜一筹，基于其强悍性能，可轻松实现图片、视频和语音的手持设备本地学习和识别！这是Google和nVidia也没能做到的。韩国某一线手机大厂和美国某领先无人驾驶公司已经开始和GTI合作。

美国GYRFALCON TECHNOLOGY INC.(简称GTI)是由美国硅谷资深人工智能科学家及半导体芯片行业专家团队创立。成员来自业内知名公司，包括AMD, Spansion, TDK, Legendslicon, Ominivison, Cadence, C-Cube Microsystems, C2 Microsystems and Amazon Lab126等，团队在半导体与储存技术方面有超过50个成功项目经历，在卷积网络、分布数据与存储技术领域发表超过40篇期刊，获得100多项专利;被其他论文引用超过5000篇。

LightspeeurTM光矛系列人工智能芯片是全球首款可同时支持图像与视频，语音与自然语言处理的卷积神经网络及深度机器学习的与用处理器方案，无论是在训练或是推理模式下，均可提供超高密度的计算性能与卓越的能耗效率。

这家神秘的公司将在12月7日-8日在无锡举办的CEDA技术创新峰会和人工智能，物联网，新能源，工控安防，医疗养老领域的行业专家们深入探讨。

我们从其官网上的论述来体验一下：

Lightspeeur™ is the first Neural Processor over the world to run speech, Natural Language Processing (NLP), image and video processing with Convolutional Neural Networks (CNN).

With superior Energy Efficiency (TOPS/w) level, we have accelerated AI Edge Computing and Datacenter Machine Learning up to several orders of magnitude faster than the competition. Regardless of whether the implementation is in training or inference mode, our unique, proprietary architecture provides massive high-density processing power. Our design supports true, on-chip parallelism, in situ computing, and eliminates memory bottlenecks.

The Lightspeeur™ Neural Processor supports neural networks like CNN, RNN and LSTM. It also supports standard, open frameworks such as Caffe, TensorFlow, and MXNet. Software Development Kits include turn-key designs, system verification hardware, software and tools.

Lightspeeur™光矛系列是全球首款可同时支持图像与视频、语音与自然语言处理的智能神经网络专用处理器芯片方案。Lightspeeur™芯片以其卓越的能耗效率比表现，在人工智能边缘计算与数据中心机器学习领域相比市场上其他方案高出几个数量级（敲黑板，划重点）。无论是在训练模式或是推理模式下，Lightspeeur™芯片均可提供超高密度计算性能，成功克服了由存储器带宽而导致的性能瓶颈，支持真正的片上并行与原位计算。Lightspeeur™芯片支持CNN，RNN和LSTM等网络模型，同时支持标准的开源框架，如Caffe, TensorFlow和MXNet。软件开发包提供一站式开发套件。

图片来自官网（绿柱子代表性能效率）

看图表，光矛的效能比高出市场主流方案（哪家？）、DSP方案、GPU方案（nVidia）一大截，用官方的话叫做“几个数量级”。

光矛(R) 2801S采用28nm工艺，并已进入量产阶段，实测功能如下：

1，效率能耗比为9.3Tops/W

2，单芯片峰值运算能力5.6Tops，运行VGG网络可到130FPS

3，在功耗180毫瓦下，运行VGG网络可达30FPS;运行AlexNet网络可达48FPS.

4， ImageNet 图像分类运行网络精度：VGG为66%，Alexnet为58%，

令人感到恐怖的性能！

该芯片无需外挂DDR，多芯片可无缝连接，支持更强大计算要求的AI应用如AI服务器、自动驾驶、智慧安防和复杂条件下工业应用等不同场景。对比这些天吊炸天的寒武纪，据论文数据，DianNao的功耗、频率和吞吐率数据为485mW，1GHz，450GOps/s，即效率能耗比大概0.928Tops/W，寒武纪的这一数据已经秒杀了市场上大多数AI芯片方案而引起了全行业的广泛关注，而Lightspeeur™2801S的效率能耗比达到了令人恐怖的9.3Tops/W，是寒武纪DianNao的整整10倍！而下一代更强大的光矛将于2018年2月诞生，这速度。。。。

让我们关注这家神秘且强大的AI芯片公司——GTI，Gyrfalcon Technology Inc。

-------------------------------------------------------

附上刘杰博士刚刚发表的文章，让我们一窥GTI光矛的威力：

人工智能究竟能为我们带来什么?

我最近看到这样一颗AI芯片，在一个简单的开发板上，没有外置的存储器，通过训练每秒能识别150张图标。该芯片的联合创始人董琪先生说，这颗AI芯片的一个功能，可以把手机变成寻宝器，鉴别奇珍异宝。比如说，你把冬虫夏草的特征数据存储在手机中，到西部地区有人给你兜售冬虫夏草，那里是没有网络信号的偏远地区，你对着产品拍照，手机马上就会告诉你冬虫夏草的真伪和品质等级，即时处理，非常快。
联想到现在公安部门追捕罪犯时运用的人脸识别，需要后台计算识别，结果延时造成嫌疑人已经离开摄像机覆盖区域。未来通过这款芯片强大的声音和图像处理能力，无需再把图片传送到后台，即时识别，犯人再也无处可逃。

GTI带来人工智能芯片的革命

这款芯片由GTI 出品!GTI，全称是Gyrfalcon Technology Inc.，由一批有创新情怀的硅谷华人人工智能科学家和半导体芯片行业的资深工程专家及企业家组成的团队， Gyrfalcon(海东青)是一种以飞行速度迅疾著称的鸟。公司的使命是将“云+人工智能”的力量延展到本地设备上并使其获得更大的性能和效率，专注开发低功耗、高性能人工智能处理器的芯片。

我过去曾担任EETImes总编12年，造访无数硅谷领先的半导体公司，GTI的团队依然让我惊艳。这是一群硅片上的冲浪高手组合，他们精通芯片工艺和算法，整合全球领先的技术，像工匠一样精心雕琢出产品。“我们希望用高性能和低功耗的产品服务中国智造和创新，加速中国人工智能的产业化进程。”董先生告诉我, “我们未来将为中国的工程师和开发者提供技术支持，让中国的开发者用我们的芯片开发出更酷的创新产品。“

GTI与NVidia和寒武纪的区别

现在活跃在AI芯片领域的，形成影响力的有Nvidia和华为麒麟970 带红的寒武纪等中国新星，他们也有不少创新。但是大部分品牌能做到在终端产品内大容量本地计算，不用后台计算机支撑吗?功耗方面，他们和GTI同级别的产品显然有很大的差距。
GTI的芯片能真正实现图片，视频和语音在手持设备的本地学习和识别!
我看到了真实的开发板演示，才敢相信这是真实存在的。
人工智能是对人类能力的增强!董先生的想法是让GTI的芯片给更多有才华的工程师和开发者带来新的创新空间。低功耗和高性能同时具备是GTI的核心竞争力。据董先生介绍，未来GTI的第二代芯片产品的功耗将做到更低，明年上半年将会出品。我认为这样的超低功耗配合GTI强大的声音和图像处理能力这些将为智能终端领域带来颠覆性的改变!更多个性化的产品，更多基于SDK的二次开发，不仅仅是产品的改变，新的商业模式也会出现，值得大家共同期待!

人工智能发展阶段和革命点

人工智能发展40年，经历两个维度和两个阶段技术路线。
第一个维度是早期基于专家系统的人工智能，是建立在人的经验基础上，根据专家决策思路来判断。它不能超越人的智慧，但也通过计算机超算能力把只有专家才能解决的问题，变成机器辅助决策系统。
第二个阶段是基于神经元理论的深度学习人工智能路线，它是人告诉机器特征要素，机器根据特征要素去自己学习。就像妈妈教孩子，这一只鸟，机器记住鸟的特征，下次见到鸟的图片就知道是鸟。机器学多了就能区别麻雀、鹦鹉和老鹰，变的聪明起啦。第二个维度是AI芯片的技术路线，早期是用CPU计算能力实现，发展到基于GPU的AI芯片，在图形处理效率上改善计算效率，它的特点是把图片存储起来，通过比对来识别和学习。它的特点是存储量大，需要后台计算机支撑、计算量大、决策时间长和功耗大。
我认为，中国要抢占人工智能的至高点，走产业化的道路，要解决的关键问题就是芯片的低功耗和高性能的平衡!
那么，有没有一种不用存储图片，占有几百K-几兆字节存储空间，而仅存储图片特征值，从而减少存储，减少计算量，完全本机实现学习和决策的芯片途径?
人工智能领域的竞争就是一场芯片革命!我看到董先生沿着卷积神经网络的路线，实现深度学习的AI处理器。他的团队由一批有情怀的硅片人组成，真正做到低功耗、计算快和无需芯片外数据交换的终端应用，这颗芯片实现了革命性的创新!

GTI的芯片性能

GTI的AI处理器芯片- “光矛”Lightspeeur(R) 2801S 已于2017年9月成功流片，该芯片拥有高达9.3 TOPS/Watt 的卓越效率能耗比表现，在人工智能边缘计算与数据中心机器学习领域相比目前市场上的其他方案高出几个数量级。它有二低二高特点，低功耗低存储，高并行和原位计算，能有效推动各种人工智能应用在终端侧及云端的产业化落地。
光矛(R) 基于APiM架构，该架构使用内存作为人工智能处理单元，能够消除在其他架构中的大量数据移动，极大降低功耗。这一架构支持真正的片上并行和原位计算，成功克服了由存储器带宽而导致的性能瓶颈。它有28000个并行计算核，不需要使用外部存储单元用于人工智能推断。

光矛(R) 支持卷积神经网络，其分布式内存块结构对CNN计算相当友好并且支持多层结构，每层的尺寸可以不同，内置模型压缩算法能够实现快速且低功耗的CNN计算。此外，Lightspeeur(R) 还同时支持Caffe、TensorFlow等主流开源深度学习系统。

光矛(R) 2801S采用28nm工艺，并已进入量产阶段，实测功能如下：
1，效率能耗比为9.3Tops/W
2，单芯片峰值运算能力5.6Tops，运行VGG网络可到130FPS
3，在功耗180毫瓦下，运行VGG网络可达30FPS;运行AlexNet网络可达48FPS.
4， ImageNet 图像分类运行网络精度：VGG为66%，Alexnet为58%，
该芯片无需外挂DDR，多芯片可无缝连接，支持更强大计算要求的AI应用如AI服务器、自动驾驶、智慧安防和复杂条件下工业应用等不同场景。

GTI芯片的产业化进程

GTI在美国已经与著名的自动驾驶公司启动无人驾驶深度学习的产品合作，与韩国手机品牌开始AI手机方案合作、与日本知名企业合作专用AI服务器、与中国制造业领军企业联合启动AI产品表面检测、以及与国内安防企业筹划真正具备本地AI识别能力的摄像头等等。
在云计算中，光矛(R) 可用于人工智能推理服务器;在边缘计算中，该设备则可以支持人工智能监控/视频摄像头、智能玩具/机器人、智能家居设备、AR/VR产品、语言/语音识别、自然语言处理等多个应用领域。据悉，目前已有多家国内和国际一线工业和科技巨头计划将Lightspeeur(R) 用于其包括服务器、手机、家用IoT、工业智能制造、智慧城市产品和监控摄像头等在内的不同应用中。
在落实几个典型行业应用案例后，GTI未来将在我爱方案网-快包上启动AI处理器应用方案开发中心。这个中心采用互联网众包模式发展AI应用方案，为各行业IOT服务。快包是AI和物联网的开发众包平台，汇聚数千个AI和物联网应用方案，数百万的工程师和开发者团队，能有效促进物联网领域人工智能发展。

GTI将出席我爱方案网承办的12月7日-8日在无锡举办的CEDA技术创新峰会和供应链领袖峰会，与人工智能，物联网，新能源，工控安防，医疗养老领域的行业专家们深入探讨，共同服务国家创新战略，推动人工智能的产业化进程!

打开淘股吧APP