日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

R語言多元線性回歸實例詳解_R語言

作者:clarkjs ? 更新時間: 2022-08-25 編程語言

一、模型簡介

一元線性回歸是一個主要影響因素作為自變量來解釋因變量的變化,在現實問題研究中,因變量的變化往往受幾個重要因素的影響,此時就需要用兩個或兩個以上的影響因素作為自變量來解釋因變量的變化,這就是多元回歸亦稱多重回歸。當多個自變量與因變量之間是線性關系時,所進行的回歸分析就是多元線性回歸。

二、求解過程

這里我使用的數據是包里面自帶的數據,我們導入并進行查看:

可以看到第一列是我們的數據標簽(無數學含義),后面五列分別為對應的五個特征即相應的數值。我的任務是使用后四個變量來擬合第一個變量"Murder"

在進行多元線性回歸之前,通常需要對變量進行相關性分析,例如:我們想用x, y 兩個變量來擬合變量 z, 如果x, y相關性過強,則我們只需要其中一個變量就可以擬合z,這就是我們學的多重共線性。因此,我使用 cor 函數查看相關性,如下圖所示:

由于相關性矩陣并不直觀,因此我使用散點矩陣圖來可視化此關系,R語言代碼及可視化結果如下(其中我使用了smoother平滑方法):

下面使用 lm 函數進行多元線性回歸,代碼及運行截圖如下:

可以發現運行結果中有兩個變量被打了 “”, 分別為"Population" 和 “Illiteracy”,其中""越多表示越顯著,即 p 值越小,R-squared為0.567,效果不是特別理想,說明可能存在多重共線性或者變量間存在交互作用,接下來我使用mtcars數據集來進行實現(在R語言中使用冒號表示將兩個因變量交互):

然后我是用plot函數對多個參數進行可視化,代碼及運行截圖如下:

可見,wt越大,mpg和hp的線性關系越來越小(在上例中),因此我們可以認為設定多個值,尋找最佳的擬合方程。

總結

原文鏈接:https://blog.csdn.net/m0_51339444/article/details/124590708

欄目分類
最近更新