一直很好奇GO注釋文件中的信息是如何得到的,終于在《The Gene Ontology Handbook》中找到了答案。
目前創(chuàng)新互聯(lián)公司已為上千家的企業(yè)提供了網(wǎng)站建設(shè)、域名、網(wǎng)頁(yè)空間、網(wǎng)站托管、企業(yè)網(wǎng)站設(shè)計(jì)、商丘網(wǎng)站維護(hù)等服務(wù),公司將堅(jiān)持客戶(hù)導(dǎo)向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶(hù)和合作伙伴齊心協(xié)力一起成長(zhǎng),共同發(fā)展。
GO的原始文件可以分為兩部分:ontology和association files。
該文件以obo格式儲(chǔ)存,每個(gè)詞條都以樹(shù)狀結(jié)構(gòu)表示著和其他詞條的關(guān)系,具體內(nèi)容可以從 GO網(wǎng)站 中找到,其中的元素和邏輯關(guān)系可以簡(jiǎn)單參考上幾篇文章。主要編輯工具有g(shù)o-basic、go和go-plus三個(gè)。
這部分文件主要是關(guān)于GO詞條的具體功能信息,以及相關(guān)的支撐信息,以GAF或GPAD格式儲(chǔ)存。
目前對(duì)基因的注釋主要有兩種手段:人工注釋和機(jī)器注釋。
人工注釋由專(zhuān)業(yè)人士(biocurators)通過(guò)閱讀,提取和轉(zhuǎn)化文獻(xiàn)中的實(shí)驗(yàn)結(jié)果來(lái)對(duì)基因進(jìn)行注釋。人工注釋費(fèi)時(shí)費(fèi)力,但他們的努力非常重要,因?yàn)槿斯ぷ⑨尩臏?zhǔn)確性是其他注釋的基石,目前有20個(gè)團(tuán)隊(duì)為GO的人工注釋貢獻(xiàn)力量。
機(jī)器注釋主要兩大類(lèi)方法:根據(jù)序列進(jìn)行注釋和文本挖掘的方法注釋。
1、根據(jù)序列信息進(jìn)行注釋?zhuān)?/p>
annotation transfers from Homologous proteins
annotation transfers from Orthologous proteins
annotation transfers from Protein families
2、文本挖掘注釋
Automatic text categorization
Lexical approaches
k-Nearest neighbors
Properties of Lexical and k-NN categorizers
Inter-annotator agreement
每種方法的具體解釋參考《The Gene Ontology Handbook》的相關(guān)章節(jié)。
Linux內(nèi)核的配置系統(tǒng)由三個(gè)部分組成,分別是:
?Makefile:分布在 Linux 內(nèi)核源代碼中的 Makefile,定義 Linux 內(nèi)核的編譯規(guī)則;
?配置文件(config.in):給用戶(hù)提供配置選擇的功能;
?配置工具:包括配置命令解釋器(對(duì)配置腳本中使用的配置命令進(jìn)行解釋?zhuān)┖团渲糜脩?hù)界面(提供基于字符界面、基于 Ncurses 圖形界面以及基于 Xwindows 圖形界面的用戶(hù)配置界面,各自對(duì)應(yīng)于 Make config、Make menuconfig 和 make xconfig)。
這些配置工具都是使用腳本語(yǔ)言,如 Tcl/TK、Perl 編寫(xiě)的(也包含一些用 C 編寫(xiě)的代碼)。本文并不是對(duì)配置系統(tǒng)本身進(jìn)行分析,而是介紹如何使用配置系統(tǒng)。所以,除非是配置系統(tǒng)的維護(hù)者,一般的內(nèi)核開(kāi)發(fā)者無(wú)須了解它們的原理,只需要知道如何編寫(xiě) Makefile 和配置文件就可以。所以,在本文中,我們只對(duì) Makefile 和配置文件進(jìn)行討論。另外,凡是涉及到與具體 CPU 體系結(jié)構(gòu)相關(guān)的內(nèi)容,我們都以 ARM 為例,這樣不僅可以將討論的問(wèn)題明確化,而且對(duì)內(nèi)容本身不產(chǎn)生影響。
2. Makefile
2.1 Makefile 概述
Makefile 的作用是根據(jù)配置的情況,構(gòu)造出需要編譯的源文件列表,然后分別編譯,并把目標(biāo)代碼鏈接到一起,最終形成 Linux 內(nèi)核二進(jìn)制文件。
由于 Linux 內(nèi)核源代碼是按照樹(shù)形結(jié)構(gòu)組織的,所以 Makefile 也被分布在目錄樹(shù)中。Linux 內(nèi)核中的 Makefile 以及與 Makefile 直接相關(guān)的文件有:
?Makefile:頂層 Makefile,是整個(gè)內(nèi)核配置、編譯的總體控制文件。
?.config:內(nèi)核配置文件,包含由用戶(hù)選擇的配置選項(xiàng),用來(lái)存放內(nèi)核配置后的結(jié)果(如 make config)。
?arch/*/Makefile:位于各種 CPU 體系目錄下的 Makefile,如 arch/arm/Makefile,是針對(duì)特定平臺(tái)的 Makefile。
?各個(gè)子目錄下的 Makefile:比如 drivers/Makefile,負(fù)責(zé)所在子目錄下源代碼的管理。
?Rules.make:規(guī)則文件,被所有的 Makefile 使用。
用戶(hù)通過(guò) make config 配置后,產(chǎn)生了 .config。頂層 Makefile 讀入 .config 中的配置選擇。頂層 Makefile 有兩個(gè)主要的任務(wù):產(chǎn)生 vmlinux 文件和內(nèi)核模塊(module)。為了達(dá)到此目的,頂層 Makefile 遞歸的進(jìn)入到內(nèi)核的各個(gè)子目錄中,分別調(diào)用位于這些子目錄中的 Makefile。至于到底進(jìn)入哪些子目錄,取決于內(nèi)核的配置。在頂層 Makefile 中,有一句:include arch/$(ARCH)/Makefile,包含了特定 CPU 體系結(jié)構(gòu)下的 Makefile,這個(gè) Makefile 中包含了平臺(tái)相關(guān)的信息。
位于各個(gè)子目錄下的 Makefile 同樣也根據(jù) .config 給出的配置信息,構(gòu)造出當(dāng)前配置下需要的源文件列表,并在文件的最后有 include $(TOPDIR)/Rules.make。
Rules.make 文件起著非常重要的作用,它定義了所有 Makefile 共用的編譯規(guī)則。比如,如果需要將本目錄下所有的 c 程序編譯成匯編代碼,需要在 Makefile 中有以下的編譯規(guī)則:
%.s: %.c
$(CC) $(CFLAGS) -S $ -o $@
有很多子目錄下都有同樣的要求,就需要在各自的 Makefile 中包含此編譯規(guī)則,這會(huì)比較麻煩。而 Linux 內(nèi)核中則把此類(lèi)的編譯規(guī)則統(tǒng)一放置到 Rules.make 中,并在各自的 Makefile 中包含進(jìn)了 Rules.make(include Rules.make),這樣就避免了在多個(gè) Makefile 中重復(fù)同樣的規(guī)則。對(duì)于上面的例子,在 Rules.make 中對(duì)應(yīng)的規(guī)則為:
%.s: %.c
$(CC) $(CFLAGS) $(EXTRA_CFLAGS) $(CFLAGS_$(*F)) $(CFLAGS_$@) -S $ -o $@
2.2 Makefile 中的變量
頂層 Makefile 定義并向環(huán)境中輸出了許多變量,為各個(gè)子目錄下的 Makefile 傳遞一些信息。有些變量,比如 SUBDIRS,不僅在頂層 Makefile 中定義并且賦初值,而且在 arch/*/Makefile 還作了擴(kuò)充。
常用的變量有以下幾類(lèi):
1) 版本信息
版本信息有:VERSION,PATCHLEVEL, SUBLEVEL, EXTRAVERSION,KERNELRELEASE。版本信息定義了當(dāng)前內(nèi)核的版本,比如 VERSION=2,PATCHLEVEL=4,SUBLEVEL=18,EXATAVERSION=-rmk7,它們共同構(gòu)成內(nèi)核的發(fā)行版本KERNELRELEASE:2.4.18-rmk7
2) CPU 體系結(jié)構(gòu):ARCH
在頂層 Makefile 的開(kāi)頭,用 ARCH 定義目標(biāo) CPU 的體系結(jié)構(gòu),比如 ARCH:=arm 等。許多子目錄的 Makefile 中,要根據(jù) ARCH 的定義選擇編譯源文件的列表。
3) 路徑信息:TOPDIR, SUBDIRS
TOPDIR 定義了 Linux 內(nèi)核源代碼所在的根目錄。例如,各個(gè)子目錄下的 Makefile 通過(guò) $(TOPDIR)/Rules.make 就可以找到 Rules.make 的位置。
SUBDIRS 定義了一個(gè)目錄列表,在編譯內(nèi)核或模塊時(shí),頂層 Makefile 就是根據(jù) SUBDIRS 來(lái)決定進(jìn)入哪些子目錄。SUBDIRS 的值取決于內(nèi)核的配置,在頂層 Makefile 中 SUBDIRS 賦值為 kernel drivers mm fs net ipc lib;根據(jù)內(nèi)核的配置情況,在 arch/*/Makefile 中擴(kuò)充了 SUBDIRS 的值,參見(jiàn)4)中的例子。
4) 內(nèi)核組成信息:HEAD, CORE_FILES, NETWORKS, DRIVERS, LIBS
Linux 內(nèi)核文件 vmlinux 是由以下規(guī)則產(chǎn)生的:
vmlinux: $(CONFIGURATION) init/main.o init/version.o linuxsubdirs
$(LD) $(LINKFLAGS) $(HEAD) init/main.o init/version.o
--start-group
$(CORE_FILES)
$(DRIVERS)
$(NETWORKS)
$(LIBS)
--end-group
-o vmlinux
可以看出,vmlinux 是由 HEAD、main.o、version.o、CORE_FILES、DRIVERS、NETWORKS 和 LIBS 組成的。這些變量(如 HEAD)都是用來(lái)定義連接生成 vmlinux 的目標(biāo)文件和庫(kù)文件列表。其中,HEAD在arch/*/Makefile 中定義,用來(lái)確定被最先鏈接進(jìn) vmlinux 的文件列表。比如,對(duì)于 ARM 系列的 CPU,HEAD 定義為:
HEAD := arch/arm/kernel/head-$(PROCESSOR).o
arch/arm/kernel/init_task.o
表明 head-$(PROCESSOR).o 和 init_task.o 需要最先被鏈接到 vmlinux 中。PROCESSOR 為 armv 或 armo,取決于目標(biāo) CPU。 CORE_FILES,NETWORK,DRIVERS 和 LIBS 在頂層 Makefile 中定義,并且由 arch/*/Makefile 根據(jù)需要進(jìn)行擴(kuò)充。 CORE_FILES 對(duì)應(yīng)著內(nèi)核的核心文件,有 kernel/kernel.o,mm/mm.o,fs/fs.o,ipc/ipc.o,可以看出,這些是組成內(nèi)核最為重要的文件。同時(shí),arch/arm/Makefile 對(duì) CORE_FILES 進(jìn)行了擴(kuò)充:
# arch/arm/Makefile
# If we have a machine-specific directory, then include it in the build.
MACHDIR := arch/arm/mach-$(MACHINE)
ifeq ($(MACHDIR),$(wildcard $(MACHDIR)))
SUBDIRS += $(MACHDIR)
CORE_FILES := $(MACHDIR)/$(MACHINE).o $(CORE_FILES)
endif
HEAD := arch/arm/kernel/head-$(PROCESSOR).o
arch/arm/kernel/init_task.o
SUBDIRS += arch/arm/kernel arch/arm/mm arch/arm/lib arch/arm/nwfpe
CORE_FILES := arch/arm/kernel/kernel.o arch/arm/mm/mm.o $(CORE_FILES)
LIBS := arch/arm/lib/lib.a $(LIBS)
5) 編譯信息:CPP, CC, AS, LD, AR,CFLAGS,LINKFLAGS
在 Rules.make 中定義的是編譯的通用規(guī)則,具體到特定的場(chǎng)合,需要明確給出編譯環(huán)境,編譯環(huán)境就是在以上的變量中定義的。針對(duì)交叉編譯的要求,定義了 CROSS_COMPILE。比如:
CROSS_COMPILE = arm-linux-
CC = $(CROSS_COMPILE)gcc
LD = $(CROSS_COMPILE)ld
......
CROSS_COMPILE 定義了交叉編譯器前綴 arm-linux-,表明所有的交叉編譯工具都是以 arm-linux- 開(kāi)頭的,所以在各個(gè)交叉編譯器工具之前,都加入了 $(CROSS_COMPILE),以組成一個(gè)完整的交叉編譯工具文件名,比如 arm-linux-gcc。
CFLAGS 定義了傳遞給 C 編譯器的參數(shù)。
LINKFLAGS 是鏈接生成 vmlinux 時(shí),由鏈接器使用的參數(shù)。LINKFLAGS 在 arm/*/Makefile 中定義,比如:
# arch/arm/Makefile
LINKFLAGS :=-p -X -T arch/arm/vmlinux.lds
6) 配置變量CONFIG_*
.config 文件中有許多的配置變量等式,用來(lái)說(shuō)明用戶(hù)配置的結(jié)果。例如 CONFIG_MODULES=y 表明用戶(hù)選擇了 Linux 內(nèi)核的模塊功能。
.config 被頂層 Makefile 包含后,就形成許多的配置變量,每個(gè)配置變量具有確定的值:y 表示本編譯選項(xiàng)對(duì)應(yīng)的內(nèi)核代碼被靜態(tài)編譯進(jìn) Linux 內(nèi)核;m 表示本編譯選項(xiàng)對(duì)應(yīng)的內(nèi)核代碼被編譯成模塊;n 表示不選擇此編譯選項(xiàng);如果根本就沒(méi)有選擇,那么配置變量的值為空。
2.3 Rules.make 變量
前面講過(guò),Rules.make 是編譯規(guī)則文件,所有的 Makefile 中都會(huì)包括 Rules.make。Rules.make 文件定義了許多變量,最為重要是那些編譯、鏈接列表變量。
O_OBJS,L_OBJS,OX_OBJS,LX_OBJS:本目錄下需要編譯進(jìn) Linux 內(nèi)核 vmlinux 的目標(biāo)文件列表,其中 OX_OBJS 和 LX_OBJS 中的 "X" 表明目標(biāo)文件使用了 EXPORT_SYMBOL 輸出符號(hào)。
M_OBJS,MX_OBJS:本目錄下需要被編譯成可裝載模塊的目標(biāo)文件列表。同樣,MX_OBJS 中的 "X" 表明目標(biāo)文件使用了 EXPORT_SYMBOL 輸出符號(hào)。
O_TARGET,L_TARGET:每個(gè)子目錄下都有一個(gè) O_TARGET 或 L_TARGET,Rules.make 首先從源代碼編譯生成 O_OBJS 和 OX_OBJS 中所有的目標(biāo)文件,然后使用 $(LD) -r 把它們鏈接成一個(gè) O_TARGET 或 L_TARGET。O_TARGET 以 .o 結(jié)尾,而 L_TARGET 以 .a 結(jié)尾。
1、決策樹(shù)結(jié)構(gòu)
import numpy as np
from matplotlib import pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn import tree
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
#用iris數(shù)據(jù)集擬合訓(xùn)練樹(shù)分類(lèi)器
iris = load_iris()
X = iris.data
y = iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)
clf = DecisionTreeClassifier(max_leaf_nodes=3, random_state=0)
clf.fit(X_train, y_train)
#樹(shù)狀結(jié)構(gòu)
n_nodes = clf.tree_.node_count
children_left = clf.tree_.children_left
children_right = clf.tree_.children_right
feature = clf.tree_.feature
threshold = clf.tree_.threshold
node_depth = np.zeros(shape=n_nodes, dtype=np.int64)
is_leaves = np.zeros(shape=n_nodes, dtype=bool)
stack = [(0, 0)]? # 從根節(jié)點(diǎn)id(0)及其深度(0)開(kāi)始
while len(stack) 0:
#POP確保每個(gè)節(jié)點(diǎn)只訪問(wèn)一次
node_id, depth = stack.pop()
node_depth[node_id] = depth
# 如果一個(gè)節(jié)點(diǎn)的左子節(jié)點(diǎn)和右子節(jié)點(diǎn)不相同,將進(jìn)行拆分
is_split_node = children_left[node_id] != children_right[node_id]
# 如果是拆分節(jié)點(diǎn),將左子節(jié)點(diǎn)和右子節(jié)點(diǎn)以及深度追加到'Stack'
# 這樣就可以遍歷它們
if is_split_node:
? ? stack.append((children_left[node_id], depth + 1))
? ? stack.append((children_right[node_id], depth + 1))
else:
? ? is_leaves[node_id] = True
print(
"The binary tree structure has {n} nodes and has "
"the following tree structure:\n".format(n=n_nodes)
)
for i in range(n_nodes):
if is_leaves[i]:
? ? print(
? ? ? ? "{space}node={node} is a leaf node.".format(
? ? ? ? ? ? space=node_depth[i] * "\t", node=i
? ? ? ? )
? ? )
else:
? ? print(
? ? ? ? "{space}node={node} is a split node: "
? ? ? ? "go to node {left} if X[:, {feature}] = {threshold} "
? ? ? ? "else to node {right}.".format(
? ? ? ? ? ? space=node_depth[i] * "\t",
? ? ? ? ? ? node=i,
? ? ? ? ? ? left=children_left[i],
? ? ? ? ? ? feature=feature[i],
? ? ? ? ? ? threshold=threshold[i],
? ? ? ? ? ? right=children_right[i],
? ? ? ? )
? ? )
tree.plot_tree(clf)
plt.title("決策樹(shù)結(jié)構(gòu)")
plt.show()
分享標(biāo)題:Go語(yǔ)言代碼樹(shù)狀結(jié)構(gòu) golang 樹(shù)
標(biāo)題鏈接:http://chinadenli.net/article8/dogsjop.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供云服務(wù)器、網(wǎng)站建設(shè)、網(wǎng)頁(yè)設(shè)計(jì)公司、網(wǎng)站策劃、電子商務(wù)、動(dòng)態(tài)網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
網(wǎng)頁(yè)設(shè)計(jì)公司知識(shí)