GO分析有三個(gè)過程,GO_CC細(xì)胞組分,GO_BP生物過程, GO_MP分析功能,首先轉(zhuǎn)換成 ENTREZID ,然后利用 clusterProfiler 函數(shù)。

成都創(chuàng)新互聯(lián)"三網(wǎng)合一"的企業(yè)建站思路。企業(yè)可建設(shè)擁有電腦版、微信版、手機(jī)版的企業(yè)網(wǎng)站。實(shí)現(xiàn)跨屏營銷,產(chǎn)品發(fā)布一步更新,電腦網(wǎng)絡(luò)+移動網(wǎng)絡(luò)一網(wǎng)打盡,滿足企業(yè)的營銷需求!成都創(chuàng)新互聯(lián)具備承接各種類型的網(wǎng)站設(shè)計(jì)、成都網(wǎng)站建設(shè)項(xiàng)目的能力。經(jīng)過十多年的努力的開拓,為不同行業(yè)的企事業(yè)單位提供了優(yōu)質(zhì)的服務(wù),并獲得了客戶的一致好評。
很明顯,這些差異的基因必然與功能改變密切相關(guān),例如,比較患病個(gè)體與正常個(gè)體的組織表達(dá)譜,不難想到這些表達(dá)顯著改變的基因參與了疾病或免疫相關(guān)的生物學(xué)過程、信號通路等,基因表達(dá)水平的失調(diào)與疾病肯定密不可分。
蛋白質(zhì)或者基因可以通過ID對應(yīng)或者序列注釋的方法找到與之對應(yīng)的GO號,而GO號可對于到Term,即功能類別或者細(xì)胞定位。 功能富集分析: 功能富集需要有一個(gè)參考數(shù)據(jù)集,通過該項(xiàng)分析可以找出在統(tǒng)計(jì)上顯著富集的GO Term。
進(jìn)行GO分析時(shí),需要考慮的一個(gè)基礎(chǔ)因素就是基因的GO注釋信息從何處獲取。
調(diào)查是科學(xué)探究常用的方法之一,是了解生物種類、生存環(huán)境和外部形態(tài)等常用的研究方法。調(diào)查法一般是在自然的過程中進(jìn)行的,通過訪問、座談、問卷、測驗(yàn)和查閱書面材料等方式去搜集反映研究對象的材料。
最近有粉絲反映說,利用clusterProfiler這個(gè)包繪制GO富集分析氣泡圖和柱形圖的時(shí)候,發(fā)現(xiàn)GO條目的名字都重疊在一起了。氣泡圖 柱形圖 這個(gè)圖別說美觀了,簡直不忍直視。經(jīng)過我的認(rèn)真研究,發(fā)現(xiàn)跟R版本有關(guān)。
但是該方法存在一個(gè)很大的問題,那就是當(dāng)x軸標(biāo)簽數(shù)量很多時(shí),那么就無法通過這樣的方法進(jìn)行解決了。方法二是方法一的逆向思路,既然可以調(diào)大畫布,那么反過來,我們也可以調(diào)小x軸標(biāo)簽字體。
最近小Q在做自然選擇分析,分析完之后簡單粗暴的對候選基因做了富集分析,并做了展示,比起氣泡圖,我模仿了另一種作圖方式,顯示效果更佳。所以想在此分享一下如何用R語言畫富集分析示意圖(非氣泡圖)。
在是否需要構(gòu)建的問題上,我看到徐洲更在 功能注釋后如何做富集分析 中提到 “你不需要構(gòu)建Orgdb,因?yàn)镺rgdb的用途是進(jìn)行基因編號和GO/KEGG的轉(zhuǎn)換。
單細(xì)胞富集分析我最常用的是 分組GSVA ,但最近用到了GO分析,就復(fù)習(xí)一下GO和KEGG富集分析及繪圖。載入無比熟悉的pbmc.3k數(shù)據(jù)集 (已注釋好,數(shù)據(jù)準(zhǔn)備見 monocle )pbmc3k數(shù)據(jù)集只有1個(gè)樣本,沒辦法區(qū)分HC和病例組。
1、先加載相關(guān)的package 然后提取想要的基因集,變成list 然后進(jìn)行富集分析 需要注意的點(diǎn):expr輸入的表達(dá)矩陣必須為:SummarizedExperiment或者SingleCellExperiment ExpressionSet 或者別的什么對象。
2、通過選擇菜單:程序包-安裝程序包-在彈出的對話框中,選擇你要安裝的包,然后確定。使用命令install.packages(package_name,dir)package_name:是指定要安裝的包名,請注意大小寫。dir:包安裝的路徑。
3、一般的VCF文件都很大,用手動提取里面的信息肯定不大現(xiàn)實(shí)。用 vcfR 就可以輕松實(shí)現(xiàn)。vcfR 自帶測試文件 vcfR_test 。就用這個(gè)文件來操作一下吧。
4、已經(jīng)很久沒有再用R語言跑過數(shù)據(jù)了,最近有朋友需要跑GSVA,順便重溫了下R,現(xiàn)將內(nèi)容分享如下。GSVA全名Gene set variation analysis(基因集變異分析),是一種非參數(shù),無監(jiān)督的算法。
5、Step 1: R 包安裝和數(shù)據(jù)輸入 首先是安裝必須 R 包,在這里我們需要用到 ggcorplot 和 ggthemes 這兩個(gè)R包。然后我們讀入R表達(dá)譜數(shù)據(jù)。
分享標(biāo)題:r語言提取go分析基因 r語言提取因子
標(biāo)題來源:http://chinadenli.net/article11/dspcsgd.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供搜索引擎優(yōu)化、建站公司、微信公眾號、服務(wù)器托管、網(wǎng)站排名、ChatGPT
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)