使用TensorFlow從頭開始實現這個架構
在此之前,我已經討論了MobileNet的體系結構
接下來,我們將看到如何使用TensorFlow從頭開始實現這個架構。
實現:
MobileNet架構:
圖顯示了我們將在代碼中實現的MobileNet體系結構。網絡從Conv、BatchNorm、ReLU塊開始,并從其上跟隨多個MobileNet塊。它最終以一個平均池和一個完全連接的層結束,并激活Softmax。
我們看到該體系結構有一個模式——Conv-dw/s1,后跟Conv/s1,依此類推。這里dw是深度層和步幅數,然后是Conv層和步幅數。這兩條線是MobileNet區(qū)塊。
“Filter Shape”列給出了核大小和要使用的濾波器數量的詳細信息。列的最后一個數字表示濾波器的數量。我們看到濾波器數量從32逐漸增加到64,從64逐漸增加到128,從128逐漸增加到256,以此類推。
最后一列顯示了隨著我們深入網絡,圖像的大小是如何變化的。輸入大小選擇為224*224像素,有3個通道,輸出層分類為1000類。
正常CNN架構塊之間的差異(左),與MobileNet架構(右):
構建網絡時需要記住的幾件事:
所有層之后都是批量標準化和ReLU非線性。
與具有Conv2D層的普通CNN模型不同,MobileNet具有Depthwise Conv層,如圖所示。
工作流
從TensorFlow庫導入所有必要的層
為MobileNet塊編寫輔助函數
構建模型的主干
使用helper函數構建模型的主要部分
導入圖層
import tensorflow as tf
# 導入所有必要的層
from tensorflow.keras.layers import Input, DepthwiseConv2D
from tensorflow.keras.layers import Conv2D, BatchNormalization
from tensorflow.keras.layers import ReLU, AvgPool2D, Flatten, Dense
from tensorflow.keras import Model
Keras已經內置了一個DepthwiseConv層,所以我們不需要從頭開始創(chuàng)建它。
MobileNet塊
MobileNet塊的表示
要為MobileNet塊創(chuàng)建函數,我們需要以下步驟:
函數的輸入:
a.張量(x)
b.卷積層的濾波器數量(濾波器)
c.卷積層的步長(步長)
運行:
a.應用3x3分步卷積層,然后是批量標準化層和ReLU激活
b.應用帶有1x1卷積層的濾波器,然后是批量標準化層和ReLU激活
返回張量(輸出)
這3個步驟在下面的代碼塊中實現。
# MobileNet block
def mobilnet_block (x, filters, strides):
x = DepthwiseConv2D(kernel_size = 3, strides = strides, padding = 'same')(x)
x = BatchNormalization()(x)
x = ReLU()(x)
x = Conv2D(filters = filters, kernel_size = 1, strides = 1)(x)
x = BatchNormalization()(x)
x = ReLU()(x)
return x
構建模型的主干
如圖2所示,第一層為Conv/s2,濾波器形狀為3x32。
模型的主干
# 模型的主干
input = Input(shape = (224,224,3))
x = Conv2D(filters = 32, kernel_size = 3, strides = 2, padding = 'same')(input)
x = BatchNormalization()(x)
x = ReLU()(x)
模型的主要部分:
# 模型的主要部分
x = mobilnet_block(x, filters = 64, strides = 1)
x = mobilnet_block(x, filters = 128, strides = 2)
x = mobilnet_block(x, filters = 128, strides = 1)
x = mobilnet_block(x, filters = 256, strides = 2)
x = mobilnet_block(x, filters = 256, strides = 1)
x = mobilnet_block(x, filters = 512, strides = 2)
for _ in range (5):
x = mobilnet_block(x, filters = 512, strides = 1)
x = mobilnet_block(x, filters = 1024, strides = 2)
x = mobilnet_block(x, filters = 1024, strides = 1)
x = AvgPool2D (pool_size = 7, strides = 1, data_format='channels_first')(x)
output = Dense (units = 1000, activation = 'softmax')(x)
model = Model(inputs=input, outputs=output)
model.summary()
模型摘要的一個片段

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數智主辦酒仙橋論壇,探索AI產業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?