一本大道东京热一区,精品国产电影在线看免…,精品三级av无码一区

<nav id="bb50p"><tfoot id="bb50p"></tfoot></nav>

<nav id="bb50p"><strike id="bb50p"></strike></nav>

當(dāng)前位置： OFweek 人工智能網(wǎng) > 其他 > 正文

NLP ——從0開始快速上手百度 ERNIE

2020-12-17 10:53

程序媛驛站

三、具體實(shí)現(xiàn)過程

開始寫代碼！

ChnSentiCorp任務(wù)運(yùn)行的shell腳本是 ERNIE／ernie／run＿classifier．py，該文件定義了分類任務(wù)Fine－tuning 的詳細(xì)過程，下面我們將通過如下幾個(gè)步驟進(jìn)行詳細(xì)剖析：

環(huán)境準(zhǔn)備。導(dǎo)入相關(guān)的依賴，解析命令行參數(shù)；

實(shí)例化ERNIE 模型，優(yōu)化器以及Tokenizer，并設(shè)置超參數(shù)

定義輔助函數(shù)

運(yùn)行訓(xùn)練循環(huán)

1．環(huán)境準(zhǔn)備

import相關(guān)的依賴，解析命令行參數(shù)。

import syssys．path．a(chǎn)ppend（＇．／ERNIE＇）import numpy as npfrom sklearn．metrics import f1＿scoreimport paddle as Pimport paddle．fluid as Fimport paddle．fluid．layers as Limport paddle．fluid．dygraph as D
from ernie．tokenizing＿ernie import ErnieTokenizerfrom ernie．modeling＿ernie import ErnieModelForSequenceClassification2．實(shí)例化ERNIE 模型，優(yōu)化器以及Tokenizer，并設(shè)置超參數(shù)

設(shè)置好所有的超參數(shù)，對(duì)于ERNIE任務(wù)學(xué)習(xí)率推薦取 1e－5／2e－5／5e－5，根據(jù)顯存大小調(diào)節(jié)BATCH大小，最大句子長(zhǎng)度不超過512．

BATCH＝32MAX＿SEQLEN＝300LR＝5e－5EPOCH＝10
D．guard（）．＿＿enter＿＿（）＃為了讓Paddle進(jìn)入動(dòng)態(tài)圖模式，需要添加這一行在最前面
ernie ＝ ErnieModelForSequenceClassification．from＿pretrained（＇ernie－1．0＇， num＿labels＝3）optimizer ＝ F．optimizer．Adam（LR， parameter＿list＝ernie．parameters（））tokenizer ＝ ErnieTokenizer．from＿pretrained（＇ernie－1．0＇）3．定義輔助函數(shù)

（1）定義函數(shù) make＿data，將文本數(shù)據(jù)讀入內(nèi)存并轉(zhuǎn)換為numpy List存儲(chǔ)。

def make＿data（path）： data ＝［］ for i， l in enumerate（open（path））： if i ＝＝ 0： continue l ＝ l．strip（）．split（＇＇） text， label ＝ l［0］， int（l［1］） text＿id，＿＝ tokenizer．encode（text）＃ ErnieTokenizer 會(huì)自動(dòng)添加ERNIE所需要的特殊token，如［CLS］，［SEP］ text＿id ＝ text＿id［：MAX＿SEQLEN］ text＿id ＝ np．pad（text＿id，［0， MAX＿SEQLEN－len（text＿id）］， mode＝＇constant＇）＃對(duì)所有句子都補(bǔ)長(zhǎng)至300，這樣會(huì)比較費(fèi)顯存； label＿id ＝ np．a(chǎn)rray（label＋1） data．a(chǎn)ppend（（text＿id， label＿id）） return data
train＿data ＝ make＿data（＇．／chnsenticorp／train／part．0＇）test＿data ＝ make＿data（＇．／chnsenticorp／dev／part．0＇）

（2）定義函數(shù)get＿batch＿data，用于獲取BATCH條樣本并按照批處理維度stack到一起。

def get＿batch＿data（data， i）： d ＝ data［i＊BATCH：（i ＋ 1）＊ BATCH］ feature， label ＝ zip（＊d） feature ＝ np．stack（feature）＃將BATCH行樣本整合在一個(gè)numpy．a(chǎn)rray中 label ＝ np．stack（list（label）） feature ＝ D．to＿variable（feature）＃使用to＿variable將numpy．a(chǎn)rray轉(zhuǎn)換為paddle tensor label ＝ D．to＿variable（label） return feature， label4．運(yùn)行訓(xùn)練循環(huán)

隊(duì)訓(xùn)練數(shù)據(jù)重復(fù)EPOCH遍訓(xùn)練循環(huán)；每次循環(huán)開頭都會(huì)重新shuffle數(shù)據(jù)。在訓(xùn)練過程中每間隔100步在驗(yàn)證數(shù)據(jù)集上進(jìn)行測(cè)試并匯報(bào)結(jié)果（acc）。

for i in range（EPOCH）： np．random．shuffle（train＿data）＃每個(gè)epoch都shuffle數(shù)據(jù)以獲得最佳訓(xùn)練效果；＃train for j in range（len（train＿data）／／ BATCH）： feature， label ＝ get＿batch＿data（train＿data， j） loss，＿＝ ernie（feature， labels＝label）＃ ernie模型的返回值包含（loss， logits）；其中l(wèi)ogits目前暫時(shí)不需要使用 loss．backward（） optimizer．minimize（loss） ernie．clear＿gradients（） if j ％ 10 ＝＝ 0： print（＇train ％d： loss ％．5f＇％（j， loss．numpy（）））＃ evaluate if j ％ 100 ＝＝ 0： all＿pred， all＿label ＝［］，［］ with D．base．＿switch＿tracer＿mode＿guard＿（is＿train＝False）：＃在這個(gè)with域內(nèi)ernie不會(huì)進(jìn)行梯度計(jì)算； ernie．eval（）＃控制模型進(jìn)入eval模式，這將會(huì)關(guān)閉所有的dropout； for j in range（len（test＿data）／／ BATCH）： feature， label ＝ get＿batch＿data（test＿data， j） loss， logits ＝ ernie（feature， labels＝label） all＿pred．extend（L．a(chǎn)rgmax（logits，－1）．numpy（）） all＿label．extend（label．numpy（）） ernie．train（） f1 ＝ f1＿score（all＿label， all＿pred， average＝＇macro＇） acc ＝（np．a(chǎn)rray（all＿label）＝＝ np．a(chǎn)rray（all＿pred））．a(chǎn)stype（np．float32）．mean（） print（＇acc ％．5f＇％ acc）

訓(xùn)練過程中單次迭代輸出的日志如下所示：

train 0： loss 0．05833acc 0．91723train 10： loss 0．03602train 20： loss 0．00047train 30： loss 0．02403train 40： loss 0．01642train 50： loss 0．12958train 60： loss 0．04629train 70： loss 0．00942train 80： loss 0．00068train 90： loss 0．05485train 100： loss 0．01527acc 0．92821train 110： loss 0．00927train 120： loss 0．07236train 130： loss 0．01391train 140： loss 0．01612

包含了當(dāng)前 batch 的訓(xùn)練得到的Loss（ave loss）和每個(gè)Epochde 精度（acc）信息。訓(xùn)練完成后用戶可以參考快速運(yùn)行中的方法使用模型體驗(yàn)推理功能。

其它特性

ERNIE 還提供了混合精度訓(xùn)練、模型蒸餾等高級(jí)功能，可以在 README 中獲得這些功能的使用方法。

圖片標(biāo)題

<上一頁(yè) 1 2 3

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫，觀點(diǎn)僅代表作者本人，不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

登錄登錄即可訪問所有OFweek服務(wù)

用戶名/郵箱/手機(jī)：
密碼：
忘記密碼？
用其他賬號(hào)登錄： QQ | 微信 | 新浪微博

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

暫無評(píng)論

暫無評(píng)論

圖片新聞

最新發(fā)布

最新活動(dòng)更多

6月20日
立即下載>> 【白皮書】精準(zhǔn)測(cè)量安全高效——福祿克光伏行業(yè)解決方案
7月3日
立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
7月22-29日
立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
7.30-8.1
火熱報(bào)名中>> 全數(shù)會(huì)2025（第六屆）機(jī)器人及智能工廠展
7月31日
免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
免費(fèi)參會(huì)
立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展

一周熱點(diǎn) 月點(diǎn)擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報(bào)告

人工智能獵頭職位更多

掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯(cuò)

x

_*文字標(biāo)題：

_*糾錯(cuò)內(nèi)容：

聯(lián)系郵箱：

_*驗(yàn) 證碼：

看不清，點(diǎn)擊換一張

粵公網(wǎng)安備 44030502002758號(hào)

感谢您访问我们的网站，您可能还对以下资源感兴趣：

精品剧情v国产在线观看

精品一区二区三区在线观看视频肉体奉公hd中文字幕看片在线男女h视频

<nav id="wpvf0"><strike id="wpvf0"></strike></nav>