訂閱
糾錯
加入自媒體

使用TensorFlow從頭開始實現這個架構

在此之前,我已經討論了MobileNet的體系結構

接下來,我們將看到如何使用TensorFlow從頭開始實現這個架構。

實現:

MobileNet架構:

圖顯示了我們將在代碼中實現的MobileNet體系結構。網絡從Conv、BatchNorm、ReLU塊開始,并從其上跟隨多個MobileNet塊。它最終以一個平均池和一個完全連接的層結束,并激活Softmax。

我們看到該體系結構有一個模式——Conv-dw/s1,后跟Conv/s1,依此類推。這里dw是深度層和步幅數,然后是Conv層和步幅數。這兩條線是MobileNet區(qū)塊。

“Filter Shape”列給出了核大小和要使用的濾波器數量的詳細信息。列的最后一個數字表示濾波器的數量。我們看到濾波器數量從32逐漸增加到64,從64逐漸增加到128,從128逐漸增加到256,以此類推。

最后一列顯示了隨著我們深入網絡,圖像的大小是如何變化的。輸入大小選擇為224*224像素,有3個通道,輸出層分類為1000類。

正常CNN架構塊之間的差異(左),與MobileNet架構(右):

構建網絡時需要記住的幾件事:

所有層之后都是批量標準化和ReLU非線性。

與具有Conv2D層的普通CNN模型不同,MobileNet具有Depthwise  Conv層,如圖所示。

工作流

從TensorFlow庫導入所有必要的層

為MobileNet塊編寫輔助函數

構建模型的主干

使用helper函數構建模型的主要部分

導入圖層

import tensorflow as tf

# 導入所有必要的層

from tensorflow.keras.layers import Input, DepthwiseConv2D

from tensorflow.keras.layers import Conv2D, BatchNormalization

from tensorflow.keras.layers import ReLU, AvgPool2D, Flatten, Dense

from tensorflow.keras import Model

Keras已經內置了一個DepthwiseConv層,所以我們不需要從頭開始創(chuàng)建它。

MobileNet塊

MobileNet塊的表示

要為MobileNet塊創(chuàng)建函數,我們需要以下步驟:

函數的輸入:

a.張量(x)

b.卷積層的濾波器數量(濾波器)

c.卷積層的步長(步長)

運行:

a.應用3x3分步卷積層,然后是批量標準化層和ReLU激活

b.應用帶有1x1卷積層的濾波器,然后是批量標準化層和ReLU激活

返回張量(輸出)

這3個步驟在下面的代碼塊中實現。

# MobileNet block

def mobilnet_block (x, filters, strides):

x = DepthwiseConv2D(kernel_size = 3, strides = strides, padding = 'same')(x)

x = BatchNormalization()(x)

x = ReLU()(x)

x = Conv2D(filters = filters, kernel_size = 1, strides = 1)(x)

x = BatchNormalization()(x)

x = ReLU()(x)

return x

構建模型的主干

如圖2所示,第一層為Conv/s2,濾波器形狀為3x32。

模型的主干

# 模型的主干

input = Input(shape = (224,224,3))

x = Conv2D(filters = 32, kernel_size = 3, strides = 2, padding = 'same')(input)

x = BatchNormalization()(x)

x = ReLU()(x)

模型的主要部分:

# 模型的主要部分

x = mobilnet_block(x, filters = 64, strides = 1)

x = mobilnet_block(x, filters = 128, strides = 2)

x = mobilnet_block(x, filters = 128, strides = 1)

x = mobilnet_block(x, filters = 256, strides = 2)

x = mobilnet_block(x, filters = 256, strides = 1)

x = mobilnet_block(x, filters = 512, strides = 2)

for _ in range (5):

x = mobilnet_block(x, filters = 512, strides = 1)

x = mobilnet_block(x, filters = 1024, strides = 2)

x = mobilnet_block(x, filters = 1024, strides = 1)

x = AvgPool2D (pool_size = 7, strides = 1, data_format='channels_first')(x)

output = Dense (units = 1000, activation = 'softmax')(x)

model = Model(inputs=input, outputs=output)

model.summary()

模型摘要的一個片段

1  2  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號