日本a√视频在线,久久青青亚洲国产,亚洲一区欧美二区,免费g片在线观看网站

<style id="k3y6c"><u id="k3y6c"></u></style>

<mark id="k3y6c"></mark>

<mark id="k3y6c"></mark>

<nobr id="390yq"></nobr>

"); //-->

博客專欄

EEPW首頁 > 博客 > 綜述：輕量級CNN架構(gòu)設(shè)計(jì)（2）

綜述：輕量級CNN架構(gòu)設(shè)計(jì)（2）

發(fā)布人：計(jì)算機(jī)視覺工坊時間：2021-09-14 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

發(fā)布文章

· 空洞卷積 (Dilated Convolution)

空洞卷積是針對圖像語義分割問題中下采樣會降低圖像分辨率、丟失信息而提出的一種卷積思路。通過間隔取值擴(kuò)大感受野，讓原本3x3的卷積核，在相同參數(shù)量和計(jì)算量下?lián)碛懈蟮母惺芤?。這里面有個擴(kuò)張率(dilation rate)的系數(shù)，這個系數(shù)定義了這個間隔的大小，標(biāo)準(zhǔn)卷積相當(dāng)于dilation rate為1的空洞卷積，下圖展示的是dilation rate為2的空洞卷積計(jì)算過程，可以看出3×3的卷積核可以感知標(biāo)準(zhǔn)的5×5卷積核的范圍，還有一種理解思路就是先對3×3的卷積核間隔補(bǔ)0，使它變成5×5的卷積，然后再執(zhí)行標(biāo)準(zhǔn)卷積的操作。

空洞卷積

· 轉(zhuǎn)置卷積 (Transposed Convolutions)

轉(zhuǎn)置卷積又稱反卷積(Deconvolution)，它和空洞卷積的思路正好相反，是為上采樣而生，也應(yīng)用于語義分割當(dāng)中，而且他的計(jì)算也和空洞卷積正好相反，先對輸入的feature map間隔補(bǔ)0，卷積核不變，然后使用標(biāo)準(zhǔn)的卷積進(jìn)行計(jì)算，得到更大尺寸的feature map。

· 可變形卷積 (deformable convolution)

以上的卷積計(jì)算都是固定的，每次輸入不同的圖像數(shù)據(jù)，卷積計(jì)算的位置都是完全固定不變，即使是空洞卷積/轉(zhuǎn)置卷積，0填充的位置也都是事先確定的。而可變性卷積是指卷積核上對每一個元素額外增加了一個h和w方向上偏移的參數(shù)，然后根據(jù)這個偏移在feature map上動態(tài)取點(diǎn)來進(jìn)行卷積計(jì)算，這樣卷積核就能在訓(xùn)練過程中擴(kuò)展到很大的范圍。而顯而易見的是可變性卷積雖然比其他卷積方式更加靈活，可以根據(jù)每張輸入圖片感知不同位置的信息，類似于注意力，從而達(dá)到更好的效果，但是它比可行變卷積在增加了很多計(jì)算量和實(shí)現(xiàn)難度，目前感覺只在GPU上優(yōu)化的很好，在其他平臺上還沒有見到部署。

其他算子

· 池化(pooling)

池化這個操作比較簡單，一般在上采樣和下采樣的時候用到，沒有參數(shù)，不可學(xué)習(xí)，但操作極為簡單，和depthwise卷積類似，只是把乘累加操作替換成取最大/取平均操作。

· 最大池化和平均池化

最大池化和平均池化

· 全局平均池化

全局平均池化的操作是對一個維度為(C,H,W)的feature map，在HW方向整個取平均，然后輸出一個長度為C的向量，這個操作一般在分類模型的最后一個feature map之后出現(xiàn)，然后接一個全連接層就可以完成分類結(jié)果的輸出了。早期的分類模型都是把最后一個feature map直接拉平成C×H×W的向量，然后再接全連接層，但是顯然可以看出來這個計(jì)算量極大，甚至有的模型最后一個全連接層占了整個模型計(jì)算量的50%以上，之后由研究人員發(fā)現(xiàn)對這個feature map做一個全局平均池化，然后再加全連接層可以達(dá)到相似的效果，且計(jì)算量降低到了原來的1/HW。

· 最大向上池化

這個操作在前面基本概念一節(jié)上采樣段落中有描述，故不贅述。

· 全連接計(jì)算(Full Connected)

這個本質(zhì)其實(shí)就是矩陣乘法，輸入一個(B, iC)的數(shù)據(jù)，權(quán)重為(iC, oC)，那么輸出為(B, oC)，在多層感知機(jī)和分類模型最后一層常常見到。

全連接結(jié)構(gòu)

· Addition / Concatenate分支

Addition和Concatenate分支操作統(tǒng)稱為shortcut，如下圖所示，操作極為簡單。Addition是在ResNet中提出，兩個相同維度的feature map相同位置點(diǎn)的值直接相加，得到新的相同維度feature map，這個操作可以融合之前的特征，增加信息的表達(dá)，Concatenate操作是在Inception中首次使用，被DenseNet發(fā)揚(yáng)光大，和addition不同的是，它只要求兩個feature map的HW相同，通道數(shù)可以不同，然后兩個feature map在通道上直接拼接，得到一個更大的feature map，它保留了一些原始的特征，增加了特征的數(shù)量，使得有效的信息流繼續(xù)向后傳遞。

Add &amp;amp; Concat

· Channel shuffle

channel shuffle是ShuffleNet中首次提出，主要是針對分組卷積中不同組之間信息不流通，對不同組的feature map進(jìn)行混洗的一個操作，如下圖所示，假設(shè)原始的feature map維度為(1,9,H,W)，被分成了3個組，每個組有三個通道，那么首先將這個feature map進(jìn)行reshape操作，得到(1,3,3,H,W)，然后對中間的兩個大小為3的維度進(jìn)行轉(zhuǎn)置，依然是(1,3,3,H,W)，最后將通道拉平，變回(1,9,H,W)，就完成了通道混洗，使得不同組的feature map間隔保存，增強(qiáng)了信息的交互。

channel shuffle

常用激活函數(shù)

激活函數(shù)的非線性是神經(jīng)網(wǎng)絡(luò)發(fā)揮作用最重要的因素之一，而對于實(shí)際部署，激活函數(shù)的實(shí)現(xiàn)也是很重要的一個方面，實(shí)現(xiàn)的不好對加速效果影響很大，這里主要講幾個部署當(dāng)中常見的激活函數(shù)。

· ReLU系列

這里主要指常用的ReLU，ReLU6和leaky ReLU。ReLU比較好部署，小于0的部分為0，大于0的部分為原始值，只需要判斷一下符號位就行；ReLU6與ReLU相比也只是在正向部分多了個閾值，大于6的值等于6，在實(shí)現(xiàn)時多了個比較也不算麻煩；而leaky ReLU和ReLU正向部分一樣，都是大于0等于原始值，但負(fù)向部分卻是等于原始值的1/10，浮點(diǎn)運(yùn)算的話乘個0.1就好了，如果因?yàn)榱炕獙?shí)現(xiàn)整數(shù)運(yùn)算，這塊可以做個近似，如0.1用13>>7來代替，具體實(shí)現(xiàn)方法多種多樣，還算簡單。

ReLU &amp;amp; LeakyReLU

· Sigmoid系列

這里主要指sigmoid，還有和他相關(guān)的swish:

可以看出，如果按照公式來實(shí)現(xiàn)sigmoid對低性能的硬件來說非常不友好，因?yàn)樯婕暗酱罅康膃xp指數(shù)運(yùn)算和除法運(yùn)算，于是有研究人員針對此專門設(shè)計(jì)了近似的硬件友好的函數(shù)h-sigmoid和h-swish函數(shù)，這里的h指的就是hardware的意思：

可視化的對比如下圖所示，可以看出在保證精度的同時又能大大方便硬件的實(shí)現(xiàn)，當(dāng)然要直接實(shí)現(xiàn)sigmoid也是可以的，畢竟sigmoid是有限輸出，當(dāng)輸入小于-8或大于8的時候，輸出基本上接近于-1和1，可以根據(jù)這個特點(diǎn)設(shè)計(jì)一個查找表，速度也超快，且我們實(shí)測對精度沒啥影響。

經(jīng)典輕量化模型

早期比較經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)，如AlexNet，VGG，GoogleNet(或Inception)，ResNet，DenseNet都是以提升模型在ImageNet數(shù)據(jù)集上的分類精度為主了，很少考慮參數(shù)量和計(jì)算量的問題，他們的主要結(jié)構(gòu)解析起來也比較簡單，基本都是由標(biāo)準(zhǔn)卷積(7×7，5×5，3×3和1×1)，Pooling和shortcut操作(Addition / Concatenate)構(gòu)成，而且以3×3及其以上的卷積核為主，通道數(shù)也是動輒上千，所以參數(shù)量和計(jì)算量巨大。后續(xù)研究人員慢慢發(fā)現(xiàn)兩個3×3卷積可以代替一個5×5卷積的效果，三個3×3卷積可以代替一個7×7卷積的效果，大量使用1×1卷積，使用3×3 depthwise conv + pointwise conv(1×1標(biāo)準(zhǔn)卷積)可以代替3×3普通卷積......一系列操作可以減少參數(shù)量和計(jì)算量，所以下面講述一下一些輕量級神經(jīng)網(wǎng)絡(luò)發(fā)展的歷史，因?yàn)檫@塊很多人都講過，所以我會簡單一些，挑重點(diǎn)說說。

· SqueezeNet

SqueezeNet是公認(rèn)的輕量級模型設(shè)計(jì)最早期的工作之一，作者提出了三種策略來實(shí)現(xiàn)在保持精度的情況下大大減少當(dāng)時主流模型(以AlexNet為例)的計(jì)算量和參數(shù)量：

1.將模型中一部分的3×3卷積用1×1來代替，1×1卷積是3×3參數(shù)量和計(jì)算量的1/9，所以可以大大減少參數(shù)量和計(jì)算量；

2.減少3×3卷積的輸入通道數(shù)，這個可以通過在進(jìn)入3×3卷積之前加一個1×1卷積來實(shí)現(xiàn)通道數(shù)量的減少；

3.將下采樣層的位置往后推，使得模型可以在更大的feature map上進(jìn)行更多的學(xué)習(xí)，這一步雖然會在增加計(jì)算量，但是和上面兩個策略結(jié)合可以在維持模型精度的情況下仍大大減少參數(shù)量和計(jì)算量；

fire module

根據(jù)上面的策略，作者提出了fire module的子結(jié)構(gòu)，如下圖所示，然后整個模型由這樣的子結(jié)構(gòu)堆疊而成。這個fire module由squeeze部分和expand部分構(gòu)成，squeeze部分是1×1的卷積層，而expand部分是1×1的卷積和3×3的卷積拼接起來的，每次feature map輸入這個fire module會在squeeze層降低通道數(shù)，然后在expand通道增加通道數(shù)，從而在參數(shù)量更少的情況下仍然可以得到充分的學(xué)習(xí)。最后結(jié)合一些模型壓縮的方法可以使得SqueezeNet在達(dá)到AlexNet同等精度的情況下，參數(shù)量減少到后者的1/50，計(jì)算量減少到后者的1/510。

這篇論文使用大量1×1的卷積核代替3×3卷積，并且利用1×1卷積改變大尺度卷積層輸入feature map的通道數(shù)從而減少計(jì)算量的思想是非常有意義的，后續(xù)的很多輕量級網(wǎng)路的論文都沿用了這種套路。

MobileNet系列

MobileNet系列一共有V1,V2和V3三篇論文，簡要的講：

1.MobileNet V1主要思想是提出了一種新的結(jié)構(gòu)—深度可分離卷積(Depthwise Separable Convolution)來代替標(biāo)準(zhǔn)3×3卷積，從而大大減少模型的參數(shù)量和計(jì)算量；

2.MobileNet V2在V1的基礎(chǔ)上提出了一種倒置殘差的模塊，這個模塊有三個卷積，第一個部分是一個1×1標(biāo)準(zhǔn)卷積，用來升維，第二個部分是由3×3深度卷積+1×1標(biāo)準(zhǔn)卷積構(gòu)成的深度分離卷積，用來學(xué)習(xí)特征和降維，模塊的輸出和輸入再進(jìn)行一個Addition的操作，由于和ResNet中維度升降方式相反，所以稱為倒置殘差。中間升維的作用是讓深度可分離卷積得到更充分的學(xué)習(xí)，計(jì)算量相對于標(biāo)準(zhǔn)卷積來說也不大，而且這種升降維的方式非常靈活，可以大大減少計(jì)算量。本文還從流形學(xué)的角度探究了輸入深度可分離卷積上一層的ReLU6對信息傳遞的影響，理論證明去掉上一個1×1標(biāo)準(zhǔn)卷積的ReLU激活函數(shù)能更有利于后面的深度可分離卷積對特征的學(xué)習(xí)。

MobileNet V2

3. MobileNet V3感覺相對于前兩篇沒有那么大的結(jié)構(gòu)創(chuàng)新了，主要思想是神經(jīng)架構(gòu)搜索(NAS)和硬件友好結(jié)構(gòu)，總的來看V3的結(jié)構(gòu)是在V2的基礎(chǔ)上進(jìn)行了一些修改，如增加了SE block這種已被提出的注意力機(jī)制，激活函數(shù)換成了H-swish，last stage減少了幾層計(jì)算，針對語義分割提出了Lite R-ASPP的head(不在討論之列)，整個論文看著像是堆tricks，重點(diǎn)不是很突出，有點(diǎn)年底沖業(yè)績的嫌疑。

MobileNet V3

根據(jù)我自己的比賽和項(xiàng)目經(jīng)驗(yàn)來看，還是MobileNet V1和V2的結(jié)構(gòu)比較實(shí)用，參數(shù)量和計(jì)算量小，可拓展性好，SE block這種模塊對延時影響還是不小，而且我們發(fā)現(xiàn)其他各種花里胡哨的激活函數(shù)跟ReLU/ReLU6相比都差不多，對精度沒有很大的影響，還不如直接部署ReLU/ReLU6來的方便。

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點(diǎn)，如有侵權(quán)請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI

相關(guān)推薦

WTC-AI型太陽能熱水器電路圖

設(shè)計(jì)方案電子電路圖，WTC-AI 太陽能熱水器電路熱水器 | 2012-07-30

加大調(diào)整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計(jì)算教育 AI 集成電路 | 2024-07-25

繼上次海聯(lián)達(dá)Ai-ap100拆機(jī)之電源改造

zhuwei0710 | 2013-04-03

瑞薩電子AI單元解決方案成功提高GE醫(yī)療（日本）日野工廠的生產(chǎn)力

winni945 | 2018-09-12

電子元件培訓(xùn)教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護(hù) | 2008-09-20

如何快速搭建手寫體識別演示系統(tǒng)

視頻 digikey AI 手寫體識別 | 2022-07-29

萬家樂JSYZ5-AI燃?xì)鉄崴麟娐穲D

設(shè)計(jì)方案電路圖熱水器 JSYZ5-AI 萬家樂 | 2013-01-17

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來頭？

視頻 AI 機(jī)器人 | 2021-02-26

AI驅(qū)動的嵌入式聲音和振動識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

大嘴業(yè)話-AI目前市場分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計(jì)算 AI 智能計(jì)算深圳 | 2024-07-30

Nvidia的CEO談AI的未來：“我們將需要三臺電腦... 一臺來創(chuàng)建AI... 一臺來模擬AI... 一臺來運(yùn)行AI”

智能計(jì)算 AI | 2024-07-31

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

釋說芯語16：硬科技：構(gòu)建企業(yè)未來之路（附PPT）

jackwang | 2018-10-22

蘋果表示其AI模型是在谷歌的定制芯片上訓(xùn)練的

智能計(jì)算 AI | 2024-07-30

iCAN-4017 AI功能模塊

資源下載周立功單片機(jī) 功能模塊 iCAN-4017 AI | 2007-03-30

蘋果承認(rèn)：AI模型使用谷歌定制芯片訓(xùn)練

智能計(jì)算蘋果 AI 谷歌定制芯片 | 2024-07-30

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過 Meta AI 模型安全系統(tǒng)

智能計(jì)算 Meta AI | 2024-07-31

國際奧委會：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計(jì)算 AI 奧運(yùn)會體育 | 2024-07-26

CSR8670CSR8675智能語音Alexa藍(lán)牙方案開發(fā)

資源下載 AI 智能語音 | 2017-12-14

AI+機(jī)器視覺成趨勢，圖文詳解N大應(yīng)用場景

智能計(jì)算安森美 AI 機(jī)器視覺 | 2024-07-31

iPhone 16將不會預(yù)裝AI功能？計(jì)劃通過iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

“破局AI開發(fā)，釋放邊緣算力開發(fā)者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

WTC-AI太陽能熱水器電路圖

設(shè)計(jì)方案 WTC-AI 太陽能熱水器電路圖 | 2012-07-24

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計(jì)算 GB200 AI 英偉達(dá) GPU | 2024-07-26

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

海聯(lián)達(dá)（Aigale）Ai-HD1 無線全高清套件拆解

zhuwei0710 | 2013-04-28

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專區(qū)

<meter id="pcvr6"></meter>

<style id="pcvr6"><pre id="pcvr6"><th id="pcvr6"></th></pre></style>

<th id="pcvr6"><pre id="pcvr6"><sup id="pcvr6"></sup></pre></th>

<style id="pcvr6"></style>