據(jù)相關(guān)媒體報道 ,中國芯片 90% 依賴進口,過去十年累計耗資高達 1.8 萬億美元。即便按照較低的匯率折算,也已經(jīng)遠超 10 萬億元人民幣。然而,這幾年中國的創(chuàng)業(yè)者和投資者都逐漸開始關(guān)注 AI 芯片,有觀點認為在這個新的芯片領(lǐng)域,中國可以說和世界已經(jīng)在同一個起跑線上了。
據(jù)相關(guān)媒體報道 ,中國芯片 90% 依賴進口,過去十年累計耗資高達 1.8 萬億美元。即便按照較低的匯率折算,也已經(jīng)遠超 10 萬億元人民幣。然而,這幾年中國的創(chuàng)業(yè)者和投資者都逐漸開始關(guān)注 AI 芯片,有觀點認為在這個新的芯片領(lǐng)域,中國可以說和世界已經(jīng)在同一個起跑線上了。
那么,中國 AI 芯片中的玩家到底都有誰呢?我們今天就來盤點一下。
中星微
早在 2016 年, 中星微 便宣布他們的中國首款“星光智能一號”嵌入式 NPU 已經(jīng)在當年 3 月 6 日實現(xiàn)了量產(chǎn)。
據(jù)介紹,“星光智能一號”VC0758 采用了“數(shù)據(jù)驅(qū)動”并行計算的架構(gòu),可以支持 Caffe、TensorFlow 等多種神經(jīng)網(wǎng)絡(luò)框架,支持 AlexNet、GoogleNet 等各類神經(jīng)網(wǎng)絡(luò)。單顆 NPU(28nm) 能耗僅為 400 mW,極大地提升了計算能力與功耗的比例,可以廣泛應(yīng)用于智能駕駛輔助、無人機、機器人等嵌入式機器視覺領(lǐng)域。
不過,業(yè)內(nèi)也有觀點稱這不是一個專為加速 Neural Network 而開發(fā)的處理器,該觀點認為其內(nèi)部集成了多個 DSP 核(其稱為 NPU core),通過 SIMD 指令的調(diào)度來實現(xiàn)對 CNN、DNN 的支持,以這個邏輯,似乎很多芯片都可以叫 NPU。
地平線機器人
Horizon Robotics(地平線機器人)由前百度深度學(xué)習研究院負責人 余凱 創(chuàng)辦,致力于打造基于深度神經(jīng)網(wǎng)絡(luò)的人工智能“大腦”平臺-包括軟件和芯片,可以做到低功耗、本地化的解決環(huán)境感知、人機交互、決策控制等問題。
2017 年底,該公司已經(jīng)發(fā)布了 面向智能駕駛的征程 (Journey)1.0 處理器和面向智能攝像頭的旭日 (Sunrise)1.0 處理器 。這是完全由地平線自主研發(fā)的人工智能芯片,采用地平線的第一代 BPU 架構(gòu)——高斯框架,具有全球領(lǐng)先的性能: 可實時處理 1080p@30 視頻,每幀中可同時對 200 個目標進行檢測、跟蹤、識別,典型功耗 1.5W,每幀延時小于 30ms。
寒武紀
2016 年,寒武紀科技于北京中關(guān)村和上海臨港注冊成立,這一年里,寒武紀科技面向產(chǎn)業(yè)界發(fā)布了商用深度學(xué)習處理器 IP 產(chǎn)品寒武紀 1A。為了讓芯片處理速度變得更快,寒武紀還專門為 1A 設(shè)計了專門的存儲結(jié)構(gòu),并設(shè)計了完全不同于通用 CPU 的指令集,在 1GHz 主頻下理論峰值性能為每秒 5120 億次半精度浮點運算,對稀疏化神經(jīng)網(wǎng)絡(luò)的等效理論峰值高達每秒 2 萬億次浮點運算。在若干關(guān)鍵人工智能應(yīng)用上實測,寒武紀 1A 達到了傳統(tǒng)的四核通用 CPU 25 倍以上的性能和 50 倍以上的能效。
2017 年,集成了寒武紀技術(shù)的華為 Kirin970 手機芯片和 Mate 10 手機 全球發(fā)布,實測結(jié)果表明寒武紀科技與華為的聯(lián)合研發(fā)成果在圖片識別速度上超越了搭載 A11 芯片的 iPhone X。
而去年底,寒武紀又公布了 3 款新一代 AI 處理器:面向低功耗場景視覺應(yīng)用的寒武紀 1H8(能效比為 1A 的 2.3 倍);擁有更廣泛通用性和更高性能的寒武紀 1H16 以及面向智能駕駛領(lǐng)域的寒武紀 1M。
另外,寒武紀還發(fā)布了面向云端的高性能智能處理器產(chǎn)品線:寒武紀高性能機器學(xué)習處理器芯片“寒武紀 MLU100”和“寒武紀 MLU200”,這兩款芯片分別偏重推理和訓(xùn)練兩個用途。
此外,寒武紀還表示其未來的芯片產(chǎn)品將全面支持多樣化的機器學(xué)習應(yīng)用,而不僅僅是常見的深度學(xué)習。
深鑒科技
深鑒科技成立于 2016 年,致力于成為國際先進的深度學(xué)習加速方案提供者。該公司號稱具備世界頂尖的神經(jīng)網(wǎng)絡(luò)壓縮、編譯、體系結(jié)構(gòu)與指令集結(jié)構(gòu)設(shè)計、FPGA 開發(fā)和系統(tǒng)集成的完整開發(fā)能力。
目前,深鑒科技已經(jīng)自主研發(fā)了亞里士多德架構(gòu)的 DPU (Deep Learning Processor Unit) 。據(jù)了解,DPU 是面向深度學(xué)習 (DL) 應(yīng)用的可編程通用計算平臺,可以處理諸如圖像和視頻的分類 、分割、檢測 、跟蹤 等任務(wù)。DPU 定義和實現(xiàn)了一套用于映射深度神經(jīng)網(wǎng)絡(luò) (DNN) 算法的高度優(yōu)化可編程指令集,在實現(xiàn)高性能、高能效比目標的同時兼顧通用型和靈活性,不僅支持現(xiàn)有絕大部分流行的卷積神經(jīng)網(wǎng)絡(luò) (AlexNet、VGG,、GoogLeNet、ResNet,F(xiàn)aster-RCNN, SSD, YOLO 等),同時具備高度可擴展性,在 DPU 指令集提供支持的基礎(chǔ)上可以無縫運行其它用戶自行擴展或衍生的神經(jīng)網(wǎng)絡(luò)。
目前,深鑒科技也已經(jīng)推出了多款人工智能加速模塊,2018 年還將推出首款 SoC 系列芯片——聽濤 Tingtao。
西井科技
西井科技 成立于 2015 年 5 月,是一家開發(fā)“類腦神經(jīng)元芯片+算法”的科技公司,致力構(gòu)造一種完全跳脫于馮諾依曼結(jié)構(gòu)的神經(jīng)形態(tài)的芯片結(jié)構(gòu)——即模擬人腦神經(jīng)元工作原理而制造出的芯片,它既具備人腦的學(xué)習能力,又具備強大的特定運算能力,僅需一塊郵票大小的芯片,就能模仿人類大腦在短時間內(nèi)處理海量的感官信息。據(jù)稱該芯片具有低功耗,高效率,無需聯(lián)網(wǎng)等優(yōu)勢。
目前,西井科技已經(jīng)推出了兩款芯片:
可模擬 5000 萬級別“神經(jīng)元”的仿生類腦神經(jīng)元芯片——deepsouth(深南),功耗為傳統(tǒng)芯片在同一任務(wù)下的幾十分之一到幾百分之一。
擁有 12800 萬個神經(jīng)元,通過專屬指令集調(diào)整芯片中神經(jīng)元資源分配的深度學(xué)習類腦神經(jīng)元芯片——deepwell(深井)。
云天勵飛
云天勵飛創(chuàng)始人陳寧曾是中興通訊 IC 技術(shù)總監(jiān),帶領(lǐng)過 400 多人的芯片研發(fā)團隊。此外,他還是國家 ” 千人計劃 ” 特聘專家,國僑辦 ” 重點華僑創(chuàng)業(yè)團隊 ” 帶頭人。2014 年 8 月,陳寧創(chuàng)立云天勵飛,主打智能視頻與圖像識別。
該公司一大特色便是其設(shè)計開發(fā)了一款名叫 IPU (intelligent Processing Unit) 的芯片,專門面向深度學(xué)習的多層神經(jīng)網(wǎng)絡(luò)的計算并將它的運算效率提升到 100 倍以上,通過重新定義一套指令值,使它運行和計算深度神經(jīng)網(wǎng)絡(luò)可以更加高效。
有消息顯示,該芯片將于今年出貨。
Think Force
Think Force 成立于 2017 年,據(jù)介紹其團隊核心成員主要來自 IBM,AMD,INTEL, ZTE 等業(yè)界龍頭芯片企業(yè),且都具備十年以上的專業(yè)芯片研發(fā)設(shè)計經(jīng)歷。該公司主要設(shè)計融合一流 AI 算法和先進制成工藝的智能芯片,并以此構(gòu)建人工智能硬件平臺,提供一站式行業(yè)應(yīng)用解決方案。
據(jù)稱,該芯片采用自主研發(fā)的微內(nèi)核 ManyCore 架構(gòu),能完成 AI 云虛擬化調(diào)度在芯片級的實現(xiàn),芯片虛擬化技術(shù)在需要彈性計算的場景中能夠成倍提高芯片使用率。另外,結(jié)合自主研發(fā)的固件和相關(guān) SDK 能夠?qū)崿F(xiàn)對于各類神經(jīng)網(wǎng)絡(luò)模型的計算加速,加速單元實際效率在 90% – 95% 之間,相對于 Nvidia 的主流計算卡能達到 5 倍以上的功耗和成本節(jié)省。
比特大陸
近年來比特幣大火,而這也帶來了挖礦行業(yè)的繁榮,而 比特大陸 便是在這次挖礦行業(yè)爆發(fā)中迅速崛起的企業(yè),該公司憑借自己設(shè)計的比特幣挖礦專用 ASIC 芯片,一舉躍入 2017 年中國 IC 設(shè)計公司前五的行列。據(jù)稱,目前全球 80% 甚至 90% 的礦機都由該公司提供。
而去年 11 月底比特大陸則發(fā)布了一款名叫 BM1680 的 TPU 張量加速計算芯片,正式進軍 AI 芯片領(lǐng)域。據(jù)了解,該芯片可適用于 CNN、RNN 和 DNN 等多種神經(jīng)網(wǎng)絡(luò)的預(yù)測和訓(xùn)練,其加速核采用了改進型 Systolic 架構(gòu)技術(shù),與 Google TPU 體系架構(gòu)類似。
數(shù)據(jù)處理方面,該芯片浮點運算能力峰值可達 2TFlops,而峰值功耗則為 41 瓦,平均功耗為 25 瓦。
啟英泰倫
成都 啟英泰倫 科技有限公司是一家專注于人工智能芯片設(shè)計及配套智能算法引擎開發(fā)的公司,它于 2016 年 9 月推出了專用的基于 ASIC 架構(gòu)深度神經(jīng)網(wǎng)絡(luò)智能語音識別芯片 CI1006,并已實現(xiàn)了量產(chǎn)和出貨。
CI1006 是基于 ASIC 架構(gòu)的人工智能語音識別芯片,包含了腦神經(jīng)網(wǎng)絡(luò)處理硬件單元,能夠完美支持 DNN 運算架構(gòu),進行高性能的數(shù)據(jù)并行計算,可極大的提高人工智能深度學(xué)習語音技術(shù)對大量數(shù)據(jù)的處理效率。
據(jù)介紹,這是一款 專用于智能語音識別芯片方案,包含了腦神經(jīng)網(wǎng)絡(luò)處理硬件單元,能夠完美支持 DNN 運算架構(gòu),性能相當于數(shù)十個 CPU 核的并行計算能力,成本不到通用芯片方案成本的 1/2,功耗則在 1/10 以下 。目前,基于該芯片的單/雙麥克風方案均可以實現(xiàn)十米識別距離,識別精度在 90% 以上。
耐能科技
耐能 (Kneron) 于 2015 年由臺灣人創(chuàng)立于美國圣地牙哥,創(chuàng)始人劉峻誠表示,公司的核心競爭力在于主打輕量級的 NPU,能耗比可以做到 100mW 到 300mW,最新的一款產(chǎn)品甚至可以到 10mW 以下。
而且其芯片尺寸也比較小,比如耐能(Kneron)于 2016 年推出終端裝置專用的人工智慧芯片——神經(jīng)網(wǎng)路處理器(Neural Processing Unit,NPU),相較于主流的神經(jīng)網(wǎng)絡(luò)芯片,體積可以縮小至 1/40。
深思考科技
深思考 是一家專注于類腦人工智能與深度學(xué)習核心科技的高科技公司。核心團隊由來自于中科院自動化所、軟件所、計算所、微電子所等中科院院所人工智能、機器學(xué)習方向的資深科學(xué)家組成。
公司目前已經(jīng)推出了 ARGUS DPU 深度學(xué)習處理器,可為專用領(lǐng)域(如智能視頻處理、安防監(jiān)控、ADAS、醫(yī)療圖像處理等)的人工智能與深度學(xué)習計算提供高性能硬件加速,賦予智能終端高性能、高可靠、實時的深度學(xué)習計算能力。除各類深度學(xué)習算法外,也支持各類傳統(tǒng)算法框架(如 OpenCV),并提供豐富的接口滿足客戶產(chǎn)品的應(yīng)用需求。ARGUS DPU 支持處理模組級聯(lián),以成倍提高實時算力。不過,目前該公司并沒有透露具體的性能參數(shù)。
異構(gòu)智能
異構(gòu)智能 是由著名人工智能專家、計算機博弈專家、異構(gòu)智能專家吳韌博士掛帥,帶領(lǐng)一批人工智能、深度學(xué)習和異構(gòu)計算領(lǐng)域頂尖的技術(shù)人才組成團隊,于 2015 年 8 月在硅谷創(chuàng)立的公司,專注于提供“ASIC 芯片+訓(xùn)練模型”的全棧式 AI 解決方案。
今年 CES 期間,該公司發(fā)布了其第一款高性能、低功耗的 AI 芯片 NovuTensor。
異構(gòu)智能方面表示這是截至目前世界上唯一一款能夠?qū)嶋H運行的、性能達到主流 GPU/TPU 水平而性能/功耗比卻遠超主流 GPU/TPU 的芯片——在功耗 12w 的情況下,NovuTensor 每秒可識別 300 張圖像,每張圖像上,最多可檢測 8192 個目標,相比目前最先進的桌面服務(wù)器 GPU(250W,每秒可識別 666 張圖像),僅使用 1/20 電力即可達到其性能的 1/2;而相比目前最先進的移動端或嵌入式芯片,相同用電的情況下,性能是其三倍以上。
寫在最后
需要提及的是,號稱“世界首款手機 AI 芯片”的華為麒麟 970 并未收錄到本文中,因為麒麟 970 使用的是寒武紀的神經(jīng)網(wǎng)絡(luò)處理單元(NPU),在物體識別方面的一整套嵌入式 AI 解決方案則來自 中科創(chuàng)達 。
無論如何,AI 芯片領(lǐng)域發(fā)展得相當快,未來也勢必將有更多的 AI 芯片企業(yè)入局。中國的這些企業(yè)能否破除中國芯片高度依賴進口的魔咒呢?我們拭目以待。
文章編輯:CobiNet(寧波)
本公司專注于電訊配件,銅纜綜合布線系列領(lǐng)域產(chǎn)品研發(fā)生產(chǎn)超五類,六類,七類線,屏蔽模塊,配線架及相關(guān)模塊配件的研發(fā)和生產(chǎn)。
?2016-2019寧波科博通信技術(shù)有限公司版權(quán)所有浙ICP備16026074號