3 GO富集分析 加載了注釋庫之后,讀取基因列表文件,并使用clusterProfiler的內(nèi)部函數(shù)enrichGO()即可完成GO富集分析。讀取基因列表文件,并使用clusterProfiler的內(nèi)部函數(shù)enrichKEGG()即可完成KEGG富集分析。

創(chuàng)新互聯(lián)專業(yè)為企業(yè)提供天水網(wǎng)站建設、天水做網(wǎng)站、天水網(wǎng)站設計、天水網(wǎng)站制作等企業(yè)網(wǎng)站建設、網(wǎng)頁設計與制作、天水企業(yè)網(wǎng)站模板建站服務,十載天水做網(wǎng)站經(jīng)驗,不只是建網(wǎng)站,更提供有價值的思路和整體網(wǎng)絡服務。
前景基因:指的是我們所要進行富集的基因,一般是基因的ID 背景基因:指的是前景基因在某個基因集合進行富集,這個基因集合就是背景基因 描述信息:每個GO的Term的屬性,或者是每個KO號或者map號的屬性。
安裝clusterProfiler:對于沒有轉(zhuǎn)換的gene ID,clusterProfiler也提供了 bitr 方法進行轉(zhuǎn)換ID:可以看到,這里轉(zhuǎn)換ID的對應文件來源于org.Hs.eg.db這個包。
把他設置成100,讓我們的標簽可以一行展示。是不是還是原來的配方,還是熟悉的味道 同樣的柱形圖,我們也能讓他恢復原來的容貌。
GO富集分析原理: 有一個term注釋了100個差異表達基因參與了哪個過程,注釋完之后(模式生物都有現(xiàn)成的注釋包,不用我們自己注釋),計算相對于背景它是否顯著集中在某條通路、某一個細胞學定位、某一種生物學功能。
例如,討論這些差異基因主要映射到哪些GO或KEGG分類條目中,以說明基因表達的改變會導致哪些調(diào)控途徑原有功能失調(diào),進而與表型聯(lián)系起來。通常稱這種分析為GO、KEGG富集分析。
KEGG指的是京都基因與基因組百科全書,通常我們使用KEGG中的pathway模塊,將基因映射到某些通路上,了解基因參與生物體中的代謝過程等。
盡管多重檢驗的校正可以減少假陽性,但并不能從根本上解決GO(或KEGG)富集的問題。GO富集的根本問題在于一個基因?qū)腉O term有多個,一個term對應多個gene,同時還有層級關系。
單細胞富集分析我最常用的是 分組GSVA ,但最近用到了GO分析,就復習一下GO和KEGG富集分析及繪圖。載入無比熟悉的pbmc.3k數(shù)據(jù)集 (已注釋好,數(shù)據(jù)準備見 monocle )pbmc3k數(shù)據(jù)集只有1個樣本,沒辦法區(qū)分HC和病例組。
功能富集分析: 功能富集需要有一個參考數(shù)據(jù)集,通過該項分析可以找出在統(tǒng)計上顯著富集的GO Term。該功能或者定位有可能與研究的目前有關。 GO功能分類是在某一功能層次上統(tǒng)計蛋白或者基因的數(shù)目或組成,往往是在GO的第二層次。
我們知道R的版本在不停的更新,相應的R包也在不停的更新。我把繪制氣泡圖和柱形圖相關的函數(shù)拿出來認真的研究了一下,終于發(fā)現(xiàn)的癥結所在。
好的,這樣差異基因的kegg注釋就完成了。
可能的原因:Xxx應該是實體類的名字,而不是表的名字。查看hibernate.cfg.xml文件,是否有添加“mapping resource”。
關鍵還在于感興趣點在哪了。粗略的看,可以先看KEGG或者GO功能分類,看差異基因具體富集在哪些通路或功能。比如關注的是細胞內(nèi)酸合成關鍵酶,可以重點看酸合成和碳流相關通路。具體如何看KEGG或者GO功能分類,請聽下回分解。
網(wǎng)站名稱:r語言gokegg R語言的包包括哪兩大部分?
文章出自:http://chinadenli.net/article14/dshsdde.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站設計、網(wǎng)站排名、、外貿(mào)網(wǎng)站建設、網(wǎng)站策劃、用戶體驗
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)