gogo人体高清大胆,久久久久久久99视频,经典亚洲美女在线播放

<input id="vkwid"><optgroup id="vkwid"></optgroup></input>

當(dāng)前位置： OFweek 人工智能網(wǎng) > 其他 > 正文

Python數(shù)據(jù)科學(xué)：線性回歸

2019-01-24 09:31

Python進(jìn)階學(xué)習(xí)交流

變量分析：

①相關(guān)分析：一個連續(xù)變量與一個連續(xù)變量間的關(guān)系。

②雙樣本t檢驗：一個二分分類變量與一個連續(xù)變量間的關(guān)系。

③方差分析：一個多分類分類變量與一個連續(xù)變量間的關(guān)系。

④卡方檢驗：一個二分分類變量或多分類分類變量與一個二分分類變量間的關(guān)系。

本次介紹：

線性回歸：多個連續(xù)變量與一個連續(xù)變量間的關(guān)系。

其中線性回歸分為簡單線性回歸和多元線性回歸。

／ 01 ／數(shù)據(jù)分析與數(shù)據(jù)挖掘

數(shù)據(jù)庫：一個存儲數(shù)據(jù)的工具。因為Python是內(nèi)存計算，難以處理幾十G的數(shù)據(jù)，所以有時數(shù)據(jù)清洗需在數(shù)據(jù)庫中進(jìn)行。

統(tǒng)計學(xué)：針對小數(shù)據(jù)的數(shù)據(jù)分析方法，比如對數(shù)據(jù)抽樣、描述性分析、結(jié)果檢驗。

人工智能／機(jī)器學(xué)習(xí)／模式識別：神經(jīng)網(wǎng)絡(luò)算法，模仿人類神經(jīng)系統(tǒng)運(yùn)作，不僅可以通過訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí)，而且還能根據(jù)學(xué)習(xí)的結(jié)果對未知的數(shù)據(jù)進(jìn)行預(yù)測。

／ 02 ／回歸方程

01 簡單線性回歸

簡單線性回歸只有一個自變量與一個因變量。

含有的參數(shù)有「回歸系數(shù)」「截距」「擾動項」。

其中「擾動項」又稱「隨機(jī)誤差」，服從均值為0的正態(tài)分布。

線性回歸的因變量實際值與預(yù)測值之差稱為「殘差」。

線性回歸旨在使殘差平方和最小化。

下面以書中的案例，實現(xiàn)一個簡單線性回歸。

建立收入與月均信用卡支出的預(yù)測模型。

import numpy as np

import pandas as pd

import statsmodels．a(chǎn)pi as sm

import matplotlib．pyplot as plt

from statsmodels．formula．a(chǎn)pi import ols

＃消除pandas輸出省略號情況及換行情況

pd．set＿option（＇display．max＿columns＇， 500）

pd．set＿option（＇display．width＇， 1000）

＃讀取數(shù)據(jù)，skipinitialspace：忽略分隔符后的空白

df ＝ pd．read＿csv（＇creditcard＿exp．csv＇， skipinitialspace＝True）

print（df．head（））

讀取數(shù)據(jù)，數(shù)據(jù)如下。

對數(shù)據(jù)進(jìn)行相關(guān)性分析。

＃獲取信用卡有支出的行數(shù)據(jù)

exp ＝ df［df［＇avg＿exp＇］．notnull（）］．copy（）．iloc［：， 2：］．drop（＇age2＇， axis＝1）

＃獲取信用卡無支出的行數(shù)據(jù)，NaN

exp＿new ＝ df［df［＇avg＿exp＇］．isnull（）］．copy（）．iloc［：， 2：］．drop（＇age2＇， axis＝1）

＃描述性統(tǒng)計分析

exp．describe（include＝＇all＇）

print（exp．describe（include＝＇all＇））

＃相關(guān)性分析

print（exp［［＇avg＿exp＇，＇Age＇，＇Income＇，＇dist＿h(yuǎn)ome＿val＇］］．corr（method＝＇pearson＇））

輸出結(jié)果。

發(fā)現(xiàn)收入（Income）和平均支出（avg＿exp）相關(guān)性較大，值為0．674。

使用簡單線性回歸建立模型。

＃使用簡單線性回歸建立模型

lm＿s ＝ ols（＇avg＿exp ～ Income＇， data＝exp）．fit（）

print（lm＿s．params）

＃輸出模型基本信息，回歸系數(shù)及檢驗信息，其他模型診斷信息

print（lm＿s．summary（））

一元線性回歸系數(shù)的輸出結(jié)果如下。

從上可知，回歸系數(shù)值為97．73，截距值為258．05。

模型概況如下。

其中R值為0．454，P值接近于0，所以模型還是有一定參考意義的。

使用線性回歸模型測試訓(xùn)練數(shù)據(jù)集，得出其預(yù)測值及殘差。

＃生成的模型使用predict產(chǎn)生預(yù)測值，resid為訓(xùn)練數(shù)據(jù)集的殘差

print（pd．DataFrame（［lm＿s．predict（exp）， lm＿s．resid］， index＝［＇predict＇，＇resid＇］）．T．head（））

輸出結(jié)果，可與最開始讀取數(shù)據(jù)時輸出的結(jié)果對比一下。

使用模型測試預(yù)測數(shù)據(jù)集的結(jié)果。

＃對待預(yù)測數(shù)據(jù)集使用模型進(jìn)行預(yù)測

print（lm＿s．predict（exp＿new）［：5］）

輸出結(jié)果。

1 2 下一頁>

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請聯(lián)系舉報。

發(fā)表評論

共0條評論，0人參與

登錄登錄即可訪問所有OFweek服務(wù)

用戶名/郵箱/手機(jī)：
密碼：
忘記密碼？
用其他賬號登錄： QQ | 微信 | 新浪微博

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

最新發(fā)布

最新活動更多

一周熱點月點擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報告

人工智能獵頭職位更多

掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯

x

_*文字標(biāo)題：

_*糾錯內(nèi)容：

聯(lián)系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網(wǎng)安備 44030502002758號

感谢您访问我们的网站，您可能还对以下资源感兴趣：

精品剧情v国产在线观看

精品一区二区三区在线观看视频肉体奉公hd中文字幕看片在线男女h视频

<input id="0y0yx"></input>

<tfoot id="0y0yx"></tfoot>

<input id="0y0yx"><cite id="0y0yx"></cite></input>