本篇內(nèi)容主要講解“PCA中的誤差表示方法是什么”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“PCA中的誤差表示方法是什么”吧!
我們提供的服務有:成都網(wǎng)站制作、網(wǎng)站建設(shè)、微信公眾號開發(fā)、網(wǎng)站優(yōu)化、網(wǎng)站認證、江夏ssl等。為上千企事業(yè)單位解決了網(wǎng)站和推廣的問題。提供周到的售前咨詢和貼心的售后服務,是有科學管理、有技術(shù)的江夏網(wǎng)站制作公司
給定n個m維樣本X-(1), X(2),…,X(n),假設(shè)我們的目標是將這n個樣本從m維降低到k維,并且盡可能保證這種降維的操作不會產(chǎn)生很大的代價(重要信息的丟失)。換句話說,我們要把n個樣本點從m維空間投影到k維空間。對于每一個樣本點,我們都可以用下式表示此投影過程:
Z=ATX (1)
其中X是m維樣本點, Z是投影后得到的k維樣本點,A是一個 m * k 的矩陣。
回顧一下,如果采用主成分分析法(PCA)來進行降維的話,我們首先求出樣本的均值:
再求出散布矩陣(scatter matrix):
(2)
例子:為了更直觀地從幾何上理解式(1)的含義,我們以一組2維數(shù)據(jù)作為例子,在這個例子當中,我們使用PCA的方法將這組2維數(shù)組降到1維。矩陣A所存儲的這些特征向量,實際上降維后的是新坐標軸,而在這個例子當中,我們得到的是一個新的1維坐標軸。如圖1所示,圖中的紅色叉點代表2維樣本點垂直投影到這個新坐標軸上的點。對于每一個2維空間上的樣本點X,只要我們將它代入式(1)就可以計算出其降維后的表達(在這個例當中,則是一個1維的向量,即一個值):
圖1 10個樣本點在2維空間上的表達
而式(3)算出來的這個值,實際上是這些投影點離原點的距離。因此,我們可以畫出一個數(shù)軸來表示這個新的坐標軸,再根據(jù)式(3)算出來的這些值,在數(shù)軸上標出它們的位置,如圖2所示。
(4)
為了理解式(4),我們首先需要理解AATX(i)。回顧剛剛所說的,計算ATX(i)所得到的,實際上是樣本點在低維空間上的表達(參考圖2)。相對而言,X(i)是樣本點在高維空間上的表達。然而,我們知道不同緯度空間的點是無法做比較的,舉例來說,一個在2維空間上的點(x1, x2)是無法跟一個在1維空間上(y1)的點做比較的,因為它們緯度不一樣(它們的所存在的世界不一樣,它們不在同一個世界里)。
為了對2個不同緯度的樣本點作比較,我們需要將它們放在同一個緯度空間下。一種合理的做法是,將低維空間上的點投影到高維空間,并假設(shè)高緯度的值為0。AATX(i)所做的工作就是把降維后的樣本點反投影到高維空間上。以剛剛所舉的例子來說,ATX(i)是圖2上的叉點,而AATX(i)實際上是圖1中直線(新坐標軸)上的叉點。
值得注意的是,圖2和圖1上的這些叉點是一一對應的,無論在高維空間上還是在低維空間上,它們離原點的距離是不變的(仔細觀察圖1和圖2中叉點離原點的距離)。我們?nèi)匀豢梢試@這個例子,從理論上證明這一點,首先假設(shè)其中一個樣本點 X降維后的表達為 Z=[s1x1+s2x2],那么對它從低維到高維(在此例中,是從1維到2維)的反向投影為:
由于s經(jīng)過單位化,即||s||=s12+s22=1,所以||Xapproax||=(s1x1+s2x2)2=||Z||,證畢.
證明②:
首先要得到超平面的一般表達式,而要得到超平面的一般表達式,就要計算出超平面所對應的法向量n,在此例中,法向量滿足nTs=0,其中sT=[s1, s2]。我們可以得到n=[-s2/s1, 1],則超平面的一般表達式為(-s2/s1)x-1+x2=0。將XapproxT=[s1(s1x1+s2x2), s2(s1x1+s2x2)]代入(-s2/s1)x-1+x2,得到(-s2/s1)*s1(s1x1+s2x2)+s2(s1x1+s2x2)=-s2(s1x1+s2x2)+s2(s1x1+s2x2)=0,說對于任意的Xapprox,都在超平面上,證畢.
回到式(4)當中,L所計算的是每個樣本點在高維空間投影到低維空間后的距離總和。
到此,相信大家對“PCA中的誤差表示方法是什么”有了更深的了解,不妨來實際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進入相關(guān)頻道進行查詢,關(guān)注我們,繼續(xù)學習!
當前題目:PCA中的誤差表示方法是什么
網(wǎng)站路徑:http://chinadenli.net/article6/giecig.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站制作、企業(yè)建站、網(wǎng)站改版、網(wǎng)站設(shè)計、全網(wǎng)營銷推廣、定制開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)