欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

r語言線性回歸實(shí)例分析

本篇內(nèi)容主要講解“r語言線性回歸實(shí)例分析”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“r語言線性回歸實(shí)例分析”吧!

專注于為中小企業(yè)提供成都網(wǎng)站建設(shè)、網(wǎng)站設(shè)計(jì)服務(wù),電腦端+手機(jī)端+微信端的三站合一,更高效的管理,為中小企業(yè)棗強(qiáng)免費(fèi)做網(wǎng)站提供優(yōu)質(zhì)的服務(wù)。我們立足成都,凝聚了一批互聯(lián)網(wǎng)行業(yè)人才,有力地推動了上1000家企業(yè)的穩(wěn)健成長,幫助中小企業(yè)通過網(wǎng)站建設(shè)實(shí)現(xiàn)規(guī)模擴(kuò)充和轉(zhuǎn)變。

回歸分析是一種廣泛使用的統(tǒng)計(jì)工具,利用已有的實(shí)驗(yàn)數(shù)據(jù),通過一個(gè)方程來定量的描述變量之間的關(guān)系,其中的變量可以分為兩類

  1. 自變量,也稱之為預(yù)測變量

  2. 因變量,也稱之為響應(yīng)變量

自變量可以有多個(gè),而因變量只有一個(gè),回歸的本質(zhì)就是構(gòu)建因變量和自變量之間的方程。回歸分析有兩個(gè)經(jīng)典的用法,第一個(gè)就是建模預(yù)測,通過構(gòu)建的回歸方程來對新的數(shù)據(jù)集進(jìn)行預(yù)測,第二個(gè)就是用于定量描述變量間的相關(guān)性,在GWAS中,就是利用了回歸分析的這一用法,本文首先來看下線性回歸。

顧名思義,線性回歸用線性方程來描述變量之間的關(guān)系,根據(jù)自變量的個(gè)數(shù),又可以劃分為一元線性回歸和多元線性回歸。這里的一元和多元指的就是自變量的個(gè)數(shù)。以一元線性回歸為例,其方程如下

y = ax + b + c

其中x是自變量,y是因變量,a稱之為回歸系數(shù),b稱之為回歸常數(shù). c稱之為誤差,也叫做殘差,a和b合稱為回歸參數(shù),線性回歸的目的就是求解回歸參數(shù)。以探討身高和體重間的線性關(guān)系為例,數(shù)據(jù)如下

r語言線性回歸實(shí)例分析

其分布如下所示

r語言線性回歸實(shí)例分析

從圖上可以直觀的感覺到,二者是一個(gè)線性關(guān)系,線性回歸的本質(zhì)就是根據(jù)實(shí)際的數(shù)據(jù)來擬合出一條最佳的直線,這里的最佳非常的重要,對于相同的數(shù)據(jù),可以擬合出多條直線,示意如下

r語言線性回歸實(shí)例分析

圖中兩條直線的效果看著差不多,那么如何來定量的比較不同直線的擬合效果,從而選擇最優(yōu)的呢?

通常有兩種方法,第一種稱之為最小二乘法,利用實(shí)際值和擬合值之間的差值,也就是殘差值來構(gòu)建衡量擬合效果的統(tǒng)計(jì)量,圖示如下

r語言線性回歸實(shí)例分析
圖中的散點(diǎn)是實(shí)際觀測值,直線上為擬合值,實(shí)際觀測值和擬合值之間的線段代表的就是殘差。對應(yīng)的統(tǒng)計(jì)量為殘差平方和,英文如下

residual sum of squares (RSS)
sum of squared estimate of errors (SSE)
sum of squared residuals (SSR)

計(jì)算公式如下
r語言線性回歸實(shí)例分析

可以看做是一個(gè)歐式距離的求解,最小二乘法將殘差平方和最小的直線作為最佳直線。第二種稱之為最大似然法,似然其實(shí)就是概率,對于擬合出的直線,計(jì)算實(shí)際觀測值出現(xiàn)的概率,將這個(gè)概率值作為擬合效果的標(biāo)記量,概率最大的直線就認(rèn)為擬合效果最佳。

其中,最小二乘法可以看做是最大似然的一個(gè)特例,可以由最大似然推導(dǎo)出來,在簡單的線性回歸中,最小二乘法應(yīng)用廣泛。以R語言為例,進(jìn)行一元線性回歸的代碼如下

r語言線性回歸實(shí)例分析

其中intercept稱之為截距,對應(yīng)回歸方程中的回歸常數(shù),對于height這個(gè)自變量,其回歸系數(shù)為0.6746。這里我們直接得到了最終的回歸參數(shù),其實(shí)在這里還有很多的細(xì)節(jié),通過summary可以進(jìn)行查看

r語言線性回歸實(shí)例分析

第一個(gè)是殘差的分布情況,用五個(gè)數(shù)字來表示,分別是最小值,第一四分位數(shù),中位數(shù),第三四分位數(shù),最大值。在R中,可以通過quantile這個(gè)函數(shù)來進(jìn)行計(jì)算

r語言線性回歸實(shí)例分析

第二個(gè)是對回歸參數(shù)的檢驗(yàn),通過t檢驗(yàn)來分析回歸方程中每個(gè)變量和因變量之間的相關(guān)性,對應(yīng)Pr(>|t|)的部分, p值小于0.01認(rèn)為是相關(guān)的。

第三個(gè)殘差標(biāo)準(zhǔn)誤,residual standard error,  標(biāo)準(zhǔn)誤是衡量總體離散程度的統(tǒng)計(jì)量,計(jì)算公式如下

r語言線性回歸實(shí)例分析

殘差平方和除以自由度再開根號即可得到殘差標(biāo)準(zhǔn)誤,所以最佳的擬合直線其對應(yīng)的殘差標(biāo)準(zhǔn)誤的值應(yīng)該也是最小的。

第四個(gè)是R2,R-squared, 計(jì)算公式如下

r語言線性回歸實(shí)例分析

SST是實(shí)際觀測值的方差,SSR是擬合值的方差,R2為擬合值的方差占實(shí)際觀測值方差的比例,取值范圍為0-1。R2也稱之為擬合優(yōu)度,數(shù)值越接近1,說明擬合效果越好。對于一個(gè)回歸方程的解而言,其差標(biāo)準(zhǔn)誤和R2值是確定的,對于最佳的擬合直線而言,其殘差標(biāo)準(zhǔn)誤一定是最小,R2值一定是最大。

R2除了表征擬合效果外,還有一個(gè)用途,那就是表征自變量和因變量相關(guān)性的大小,只適用于一元線性回歸,此時(shí)R2的值為自變量x和因變量y的相關(guān)系數(shù)的平方,所以在單位點(diǎn)的關(guān)聯(lián)分析中,可以根據(jù)R2的值篩選相關(guān)性強(qiáng)的位點(diǎn)。

這里還有一個(gè)校正之后的R2, 計(jì)算公式如下

r語言線性回歸實(shí)例分析

最后一個(gè)是整體方程的顯著性檢驗(yàn),通過F檢驗(yàn)來判斷顯著性。在GWAS中,利用線性回歸可以分析SNP位點(diǎn)和連續(xù)型的表型性狀之間的關(guān)聯(lián),利用pvalue來確定顯著關(guān)聯(lián)的位點(diǎn),進(jìn)一步可以根據(jù)R2來篩選關(guān)聯(lián)性強(qiáng)的snp位點(diǎn)。

到此,相信大家對“r語言線性回歸實(shí)例分析”有了更深的了解,不妨來實(shí)際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

新聞標(biāo)題:r語言線性回歸實(shí)例分析
當(dāng)前路徑:http://chinadenli.net/article8/giihop.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站排名、企業(yè)網(wǎng)站制作網(wǎng)站策劃、網(wǎng)站內(nèi)鏈外貿(mào)網(wǎng)站建設(shè)、建站公司

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

成都seo排名網(wǎng)站優(yōu)化