1、點(diǎn)擊“開始”——“ArcGIS”——“ArcMap”,啟動(dòng)ArcMap程序,并添加兩個(gè)點(diǎn)要素類到地圖上。

為桃源等地區(qū)用戶提供了全套網(wǎng)頁(yè)設(shè)計(jì)制作服務(wù),及桃源網(wǎng)站建設(shè)行業(yè)解決方案。主營(yíng)業(yè)務(wù)為網(wǎng)站設(shè)計(jì)、成都網(wǎng)站制作、桃源網(wǎng)站設(shè)計(jì),以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠(chéng)的服務(wù)。我們深信只要達(dá)到每一位用戶的要求,就會(huì)得到認(rèn)可,從而選擇與我們長(zhǎng)期合作。這樣,我們也可以走得更遠(yuǎn)!
2、點(diǎn)擊“ArcToolbox”——“分析工具”——“鄰域分析”——“點(diǎn)距離”,打開點(diǎn)距離工具界面。
3、選擇輸入要素,即作為起點(diǎn)的要素類,可以選擇已添加到地圖上的要素類,也可以選擇外部要素類。
4、選擇鄰近要素,即作為終點(diǎn)的要素類,可以選擇已添加到地圖上的要素類,也可以選擇外部要素類。
5、選擇計(jì)算結(jié)果的存放位置和表名稱。
6、輸入搜索半徑,即要計(jì)算多大半徑范圍內(nèi)的鄰近點(diǎn)要素之間的距離,可以為空,如果為空,則計(jì)算起點(diǎn)到鄰近要素類中所有點(diǎn)要素之間的距離。點(diǎn)擊“確定”,開始計(jì)算起點(diǎn)要素到鄰近要素之間的距離。
7、計(jì)算完成后,計(jì)算結(jié)果表會(huì)自動(dòng)添加到地圖上,右鍵點(diǎn)擊結(jié)果表,點(diǎn)擊打開,可以查看計(jì)算結(jié)果。
L2距離就是二范數(shù),用norm試一下。
比如兩個(gè)1D向量分別為a,b,則歐式距離可以表示為:
norm(a-b), 相當(dāng)于
sqrt(sum((a-b).^2))
星空是無(wú)數(shù)人夢(mèng)寐以求想了解的一個(gè)領(lǐng)域,遠(yuǎn)古的人們通過肉眼觀察星空,并制定了太陰歷,指導(dǎo)農(nóng)業(yè)發(fā)展。隨著現(xiàn)代科技發(fā)展,有了更先進(jìn)的設(shè)備進(jìn)行星空的探索。本實(shí)驗(yàn)獲取了美國(guó)國(guó)家航空航天局(NASA)官網(wǎng)發(fā)布的地外行星數(shù)據(jù),研究及可視化了地外行星各參數(shù)、尋找到了一顆類地行星并研究了天體參數(shù)的相關(guān)關(guān)系。
輸入并執(zhí)行魔法命令 %matplotlib inline, 設(shè)置全局字號(hào),去除圖例邊框,去除右側(cè)和頂部坐標(biāo)軸。
本數(shù)據(jù)集來自 NASA,行星發(fā)現(xiàn)是 NASA 的重要工作之一,本數(shù)據(jù)集搜集了 NASA 官網(wǎng)發(fā)布的 4296 顆行星的數(shù)據(jù),本數(shù)據(jù)集字段包括:
導(dǎo)入數(shù)據(jù)并查看前 5 行。
截至 2020 年 10 月 22 日 全球共發(fā)現(xiàn) 4296 顆行星,按年聚合并繪制年度行星發(fā)現(xiàn)數(shù),并在左上角繪制 NASA 的官方 LOGO 。
從運(yùn)行結(jié)果可以看出,2005 年以前全球行星發(fā)現(xiàn)數(shù)是非常少的,經(jīng)計(jì)算總計(jì) 173 顆,2014 和 2016 是行星發(fā)現(xiàn)成果最多的年份,2016 年度發(fā)現(xiàn)行星 1505 顆。
對(duì)不同機(jī)構(gòu)/項(xiàng)目/計(jì)劃進(jìn)行聚合并降序排列,繪制發(fā)現(xiàn)行星數(shù)目的前 20 。
2009 年至 2013 年,開普勒太空望遠(yuǎn)鏡成為有史以來最成功的系外行星發(fā)現(xiàn)者。在一片天空中至少找到了 1030 顆系外行星以及超過 4600 顆疑似行星。當(dāng)機(jī)械故障剝奪了該探測(cè)器對(duì)于恒星的精確定位功能后,地球上的工程師們于 2014 年對(duì)其進(jìn)行了徹底改造,并以 K2 計(jì)劃命名,后者將在更短的時(shí)間內(nèi)搜尋宇宙的另一片區(qū)域。
對(duì)發(fā)現(xiàn)行星的方式進(jìn)行聚合并降序排列,繪制各種方法發(fā)現(xiàn)行星的比例,由于排名靠后的幾種方式發(fā)現(xiàn)行星數(shù)較少,因此不顯示其標(biāo)簽。
行星在宇宙中并不會(huì)發(fā)光,因此無(wú)法直接觀察,行星發(fā)現(xiàn)的方式多為間接方式。從輸出結(jié)果可以看出,發(fā)現(xiàn)行星主要有以下 3 種方式,其原理如下:
針對(duì)不同的行星質(zhì)量,繪制比其質(zhì)量大(或者小)的行星比例,由于行星質(zhì)量量綱分布跨度較大,因此采用對(duì)數(shù)坐標(biāo)。
從輸出結(jié)果可以看出,在已發(fā)現(xiàn)的行星中,96.25% 行星的質(zhì)量大于地球。(圖中橫坐標(biāo)小于 e 的紅色面積非常小)
通過 sns.distplot 接口繪制全部行星的質(zhì)量分布圖。
從輸出結(jié)果可以看出,所有行星質(zhì)量分布呈雙峰分布,第一個(gè)峰在 1.8 左右(此處用了對(duì)數(shù)單位,表示大約 6 個(gè)地球質(zhì)量),第二個(gè)峰在 6.2 左右(大概 493 個(gè)地球質(zhì)量)。
針對(duì)不同發(fā)現(xiàn)方式發(fā)現(xiàn)的行星,繪制各行星的公轉(zhuǎn)周期和質(zhì)量的關(guān)系。
從輸出結(jié)果可以看出:徑向速度(Radial Velocity)方法發(fā)現(xiàn)的行星在公轉(zhuǎn)周期和質(zhì)量上分布更寬,而凌日(Transit)似乎只能發(fā)現(xiàn)公轉(zhuǎn)周期相對(duì)較短的行星,這是因?yàn)閮煞N方法的原理差異造成的。對(duì)于公轉(zhuǎn)周期很長(zhǎng)的行星,其運(yùn)行到恒星和觀察者之間的時(shí)間也較長(zhǎng),因此凌日發(fā)現(xiàn)此類行星會(huì)相對(duì)較少。而徑向速度與其說是在發(fā)現(xiàn)行星,不如說是在觀察恒星,由于恒星自身發(fā)光,因此其觀察機(jī)會(huì)更多,發(fā)現(xiàn)各類行星的可能性更大。
針對(duì)不同發(fā)現(xiàn)方式發(fā)現(xiàn)的行星,繪制各行星的距離和質(zhì)量的關(guān)系。
從輸出結(jié)果可以看出,凌日和徑向速度對(duì)距離較為敏感,遠(yuǎn)距離的行星大多是通過凌日發(fā)現(xiàn)的,而近距離的行星大多數(shù)通過徑向速度發(fā)現(xiàn)的。原因是:近距離的行星其引力對(duì)恒星造成的擺動(dòng)更為明顯,因此更容易觀察;當(dāng)距離較遠(yuǎn)時(shí),引力作用變?nèi)酰瑪[動(dòng)效應(yīng)減弱,因此很難借助此方法觀察到行星。同時(shí),可以觀察到當(dāng)行星質(zhì)量更大時(shí),其距離分布相對(duì)較寬,這是因?yàn)殡m然相對(duì)恒星的距離變長(zhǎng)了,但是由于行星質(zhì)量的增加,相對(duì)引力也同步增加,恒星擺動(dòng)效應(yīng)會(huì)變得明顯。
將所有行星的質(zhì)量和半徑對(duì)數(shù)化處理,繪制其分布并擬合其分布。
由于:
因此,從原理上質(zhì)量對(duì)數(shù)與半徑對(duì)數(shù)應(yīng)該是線性關(guān)系,且斜率為定值 3 ,截距的大小與密度相關(guān)。
從輸出結(jié)果可以看出:行星質(zhì)量和行星半徑在對(duì)數(shù)變換下,具有較好的線性關(guān)系。輸出 fix_xy 數(shù)值可知,其關(guān)系可以擬合出如下公式:
擬合出曲線對(duì)應(yīng)的行星平均密度為:
同樣的方式繪制恒星質(zhì)量與半徑的關(guān)系。
從輸出結(jié)果可以看出,恒星與行星的規(guī)律不同,其質(zhì)量與半徑在對(duì)數(shù)下呈二次曲線關(guān)系,其關(guān)系符合以下公式:
同樣的方式研究恒星表面重力加速度與半徑的關(guān)系。
從輸出結(jié)果可以看出,恒星表面對(duì)數(shù)重力加速度與其對(duì)數(shù)半徑呈現(xiàn)較好的線性關(guān)系:
以上我們分別探索了各變量的分布和部分變量的相關(guān)關(guān)系,當(dāng)數(shù)據(jù)較多時(shí),可以通過 pd.plotting.scatter_matrix 接口,直接繪制各變量的分布和任意兩個(gè)變量的散點(diǎn)圖分布,對(duì)于數(shù)據(jù)的初步探索,該接口可以讓我們迅速對(duì)數(shù)據(jù)全貌有較為清晰的認(rèn)識(shí)。
通過行星的半徑和質(zhì)量,恒星的半徑和質(zhì)量,以及行星的公轉(zhuǎn)周期等指標(biāo)與地球的相似性,尋找諸多行星中最類似地球的行星。
從輸出結(jié)果可以看出,在 0.6 附近的位置出現(xiàn)了一個(gè)最大的圓圈,那就是我們找到的類地行星 Kepler - 452 b ,讓我們了解一下這顆行星:
數(shù)據(jù)顯示,Kepler - 452 b 行星公轉(zhuǎn)周期為 384.84 天,半徑為 1.63 地球半徑,質(zhì)量為 3.29 地球質(zhì)量;它的恒星為 Kepler - 452 半徑為太陽(yáng)的 1.11 倍,質(zhì)量為 1.04 倍,恒星方面數(shù)據(jù)與太陽(yáng)相似度極高。
以下內(nèi)容來自百度百科。 開普勒452b(Kepler 452b) ,是美國(guó)國(guó)家航空航天局(NASA)發(fā)現(xiàn)的外行星, 直徑是地球的 1.6 倍,地球相似指數(shù)( ESI )為 0.83,距離地球1400光年,位于為天鵝座。
2015 年 7 月 24 日 0:00,美國(guó)國(guó)家航空航天局 NASA 舉辦媒體電話會(huì)議宣稱,他們?cè)谔禊Z座發(fā)現(xiàn)了一顆與地球相似指數(shù)達(dá)到 0.98 的類地行星開普勒 - 452 b。這個(gè)類地行星距離地球 1400 光年,繞著一顆與太陽(yáng)非常相似的恒星運(yùn)行。開普勒 452 b 到恒星的距離,跟地球到太陽(yáng)的距離相同。NASA 稱,由于缺乏關(guān)鍵數(shù)據(jù),現(xiàn)在不能說 Kepler - 452 b 究竟是不是“另外一個(gè)地球”,只能說它是“迄今最接近另外一個(gè)地球”的系外行星。
在銀河系經(jīng)緯度坐標(biāo)下繪制所有行星,并標(biāo)記地球和 Kepler - 452 b 行星的位置。
類地行星,是人類寄希望移民的第二故鄉(xiāng),但即使最近的 Kepler-452 b ,也與地球相聚 1400 光年。
以下通過行星的公轉(zhuǎn)周期和質(zhì)量?jī)蓚€(gè)特征將所有行星聚為兩類,即通過訓(xùn)練獲得兩個(gè)簇心。
定義函數(shù)-計(jì)算距離
聚類距離采用歐式距離:
定義函數(shù)-訓(xùn)練簇心
訓(xùn)練簇心的原理是:根據(jù)上一次的簇心計(jì)算所有點(diǎn)與所有簇心的距離,任一點(diǎn)的分類以其距離最近的簇心確定。依此原理計(jì)算出所有點(diǎn)的分類后,對(duì)每個(gè)分類計(jì)算新的簇心。
定義函數(shù)預(yù)測(cè)分類
根據(jù)訓(xùn)練得到的簇心,預(yù)測(cè)輸入新的數(shù)據(jù)特征的分類。
開始訓(xùn)練
隨機(jī)生成一個(gè)簇心,并訓(xùn)練 15 次。
繪制聚類結(jié)果
以最后一次訓(xùn)練得到的簇心為基礎(chǔ),進(jìn)行行星的分類,并以等高面的形式繪制各類的邊界。
從運(yùn)行結(jié)果可以看出,所有行星被分成了兩類。并通過上三角和下三角標(biāo)注了每個(gè)類別的簇心位置。
聚類前
以下輸出了聚類前原始數(shù)據(jù)繪制的圖像。
最直接的方式當(dāng)然是用numpy.linalg.norm()來計(jì)算
參考:
這里想說的是axis參數(shù)問題:
axis為0的時(shí)候,對(duì)于二維矩陣是計(jì)算它的列向量的norm;
axis為1的時(shí)候,對(duì)于二維矩陣是計(jì)算它的行向量的norm。
這也很好理解,畢竟列是第一維,而行是第二維,故順序如此。
另外還有一個(gè)ord參數(shù),定義的是計(jì)算什么norm,參數(shù)列表如下:
python表示圓周率的方法:
使用“import”語(yǔ)句導(dǎo)入math包。“math.pi”函數(shù)可以獲取到圓周率,那么就可以用“math.pi”函數(shù)來表示圓周率
示例如下:
執(zhí)行結(jié)果如下:
更多Python知識(shí),請(qǐng)關(guān)注:Python自學(xué)網(wǎng)!!
本文目錄:
??定義在兩個(gè)向量(兩個(gè)點(diǎn))上:點(diǎn)x和點(diǎn)y的歐式距離為:
??常利用歐幾里得距離描述相似度時(shí),需要取倒數(shù)歸一化,sim = 1.0/(1.0+distance),利用numpy實(shí)現(xiàn)如下:
python實(shí)現(xiàn)歐式距離
??從名字就可以猜出這種距離的計(jì)算方法了。想象你在曼哈頓要從一個(gè)十字路口開車到另外一個(gè)十字路口,駕駛距離是兩點(diǎn)間的直線距離嗎?顯然不是,除非你能穿越大樓。實(shí)際駕駛距離就是這個(gè)“曼哈頓距離”。而這也是曼哈頓距離名稱的來源, 曼哈頓距離也稱為城市街區(qū)距離(City Block distance)。
??(1)二維平面兩點(diǎn)a(x1,y1)與b(x2,y2)間的曼哈頓距離
??(2)兩個(gè)n維向量a(x11,x12,…,x1n)與 b(x21,x22,…,x2n)間的曼哈頓距離
?? python實(shí)現(xiàn)曼哈頓距離:
??國(guó)際象棋玩過么?國(guó)王走一步能夠移動(dòng)到相鄰的8個(gè)方格中的任意一個(gè)。那么國(guó)王從格子(x1,y1)走到格子(x2,y2)最少需要多少步?自己走走試試。你會(huì)發(fā)現(xiàn)最少步數(shù)總是max( | x2-x1 | , | y2-y1 | ) 步 。有一種類似的一種距離度量方法叫切比雪夫距離。
??(1)二維平面兩點(diǎn)a(x1,y1)與b(x2,y2)間的切比雪夫距離
??(2)兩個(gè)n維向量a(x11,x12,…,x1n)與 b(x21,x22,…,x2n)間的切比雪夫距離
?? python實(shí)現(xiàn)切比雪夫距離:
??閔氏距離不是一種距離,而是一組距離的定義。
??兩個(gè)n維變量a(x11,x12,…,x1n)與 b(x21,x22,…,x2n)間的閔可夫斯基距離定義為:
??其中p是一個(gè)變參數(shù)。
??當(dāng)p=1時(shí),就是曼哈頓距離
??當(dāng)p=2時(shí),就是歐氏距離
??當(dāng)p→∞時(shí),就是切比雪夫距離
??根據(jù)變參數(shù)的不同,閔氏距離可以表示一類的距離。
??閔氏距離,包括曼哈頓距離、歐氏距離和切比雪夫距離都存在明顯的缺點(diǎn)。
??舉個(gè)例子:二維樣本(身高,體重),其中身高范圍是150 190,體重范圍是50 60,有三個(gè)樣本:a(180,50),b(190,50),c(180,60)。那么a與b之間的閔氏距離(無(wú)論是曼哈頓距離、歐氏距離或切比雪夫距離)等于a與c之間的閔氏距離,但是身高的10cm真的等價(jià)于體重的10kg么?因此用閔氏距離來衡量這些樣本間的相似度很有問題。
??簡(jiǎn)單說來,閔氏距離的缺點(diǎn)主要有兩個(gè):
??(1)將各個(gè)分量的量綱(scale),也就是“單位”當(dāng)作相同的看待了。
??(2)沒有考慮各個(gè)分量的分布(期望,方差等)可能是不同的。
??標(biāo)準(zhǔn)歐氏距離的定義
??標(biāo)準(zhǔn)化歐氏距離是針對(duì)簡(jiǎn)單歐氏距離的缺點(diǎn)而作的一種改進(jìn)方案。標(biāo)準(zhǔn)歐氏距離的思路:既然數(shù)據(jù)各維分量的分布不一樣,好吧!那我先將各個(gè)分量都“標(biāo)準(zhǔn)化”到均值、方差相等吧。均值和方差標(biāo)準(zhǔn)化到多少呢?這里先復(fù)習(xí)點(diǎn)統(tǒng)計(jì)學(xué)知識(shí)吧,假設(shè)樣本集X的均值(mean)為m,標(biāo)準(zhǔn)差(standard deviation)為s,那么X的“標(biāo)準(zhǔn)化變量”表示為:
??而且標(biāo)準(zhǔn)化變量的數(shù)學(xué)期望為0,方差為1。因此樣本集的標(biāo)準(zhǔn)化過程(standardization)用公式描述就是:
??標(biāo)準(zhǔn)化后的值 = ( 標(biāo)準(zhǔn)化前的值 - 分量的均值 ) /分量的標(biāo)準(zhǔn)差
??經(jīng)過簡(jiǎn)單的推導(dǎo)就可以得到兩個(gè)n維向量a(x11,x12,…,x1n)與 b(x21,x22,…,x2n)間的標(biāo)準(zhǔn)化歐氏距離的公式:
??如果將方差的倒數(shù)看成是一個(gè)權(quán)重,這個(gè)公式可以看成是一種加權(quán)歐氏距離(Weighted Euclidean distance)。
??有M個(gè)樣本向量X1~Xm,協(xié)方差矩陣記為S,均值記為向量μ,則其中樣本向量X到u的馬氏距離表示為:
??而其中向量Xi與Xj之間的馬氏距離定義為:
??若協(xié)方差矩陣是單位矩陣(各個(gè)樣本向量之間獨(dú)立同分布),則公式就成了:
??也就是歐氏距離了。
??若協(xié)方差矩陣是對(duì)角矩陣,公式變成了標(biāo)準(zhǔn)化歐氏距離。
??馬氏距離的優(yōu)缺點(diǎn):量綱無(wú)關(guān),排除變量之間的相關(guān)性的干擾。
??幾何中夾角余弦可用來衡量?jī)蓚€(gè)向量方向的差異,機(jī)器學(xué)習(xí)中借用這一概念來衡量樣本向量之間的差異。
??在二維空間中向量A(x1,y1)與向量B(x2,y2)的夾角余弦公式:
??兩個(gè)n維樣本點(diǎn)a(x11,x12,…,x1n)和b(x21,x22,…,x2n)的夾角余弦
??類似的,對(duì)于兩個(gè)n維樣本點(diǎn)a(x11,x12,…,x1n)和b(x21,x22,…,x2n),可以使用類似于夾角余弦的概念來衡量它們間的相似程度。
??即:
??夾角余弦取值范圍為[-1,1]。夾角余弦越大表示兩個(gè)向量的夾角越小,夾角余弦越小表示兩向量的夾角越大。當(dāng)兩個(gè)向量的方向重合時(shí)夾角余弦取最大值1,當(dāng)兩個(gè)向量的方向完全相反夾角余弦取最小值-1。
python實(shí)現(xiàn)余弦相似度:
??兩個(gè)等長(zhǎng)字符串s1與s2之間的漢明距離定義為將其中一個(gè)變?yōu)榱硗庖粋€(gè)所需要作的最小替換次數(shù)。例如字符串“1111”與“1001”之間的漢明距離為2。
??應(yīng)用:信息編碼(為了增強(qiáng)容錯(cuò)性,應(yīng)使得編碼間的最小漢明距離盡可能大)。
python實(shí)現(xiàn)漢明距離:
??兩個(gè)集合A和B的交集元素在A,B的并集中所占的比例,稱為兩個(gè)集合的杰卡德相似系數(shù),用符號(hào)J(A,B)表示。
??杰卡德相似系數(shù)是衡量?jī)蓚€(gè)集合的相似度一種指標(biāo)。
??與杰卡德相似系數(shù)相反的概念是杰卡德距離(Jaccard distance)。杰卡德距離可用如下公式表示:
??杰卡德距離用兩個(gè)集合中不同元素占所有元素的比例來衡量?jī)蓚€(gè)集合的區(qū)分度。
??可將杰卡德相似系數(shù)用在衡量樣本的相似度上。
??樣本A與樣本B是兩個(gè)n維向量,而且所有維度的取值都是0或1。例如:A(0111)和B(1011)。我們將樣本看成是一個(gè)集合,1表示集合包含該元素,0表示集合不包含該元素。
??p :樣本A與B都是1的維度的個(gè)數(shù)
??q :樣本A是1,樣本B是0的維度的個(gè)數(shù)
??r :樣本A是0,樣本B是1的維度的個(gè)數(shù)
??s :樣本A與B都是0的維度的個(gè)數(shù)
??這里p+q+r可理解為A與B的并集的元素個(gè)數(shù),而p是A與B的交集的元素個(gè)數(shù)。
??而樣本A與B的杰卡德距離表示為:
??皮爾遜相關(guān)系數(shù)即為相關(guān)系數(shù) ( Correlation coefficient )與相關(guān)距離(Correlation distance)
??相關(guān)系數(shù)的定義
??相關(guān)系數(shù)是衡量隨機(jī)變量X與Y相關(guān)程度的一種方法,相關(guān)系數(shù)的取值范圍是[-1,1]。相關(guān)系數(shù)的絕對(duì)值越大,則表明X與Y相關(guān)度越高。當(dāng)X與Y線性相關(guān)時(shí),相關(guān)系數(shù)取值為1(正線性相關(guān))或-1(負(fù)線性相關(guān))。
1. 機(jī)器學(xué)習(xí)中的相似性度量
2. 推薦算法入門(1)相似度計(jì)算方法大全
3. Python Numpy計(jì)算各類距離
4. 皮爾遜積矩相關(guān)系數(shù)
當(dāng)前標(biāo)題:關(guān)于歐式距離函數(shù)python的信息
標(biāo)題路徑:http://chinadenli.net/article18/hijodp.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供搜索引擎優(yōu)化、虛擬主機(jī)、網(wǎng)站建設(shè)、品牌網(wǎng)站建設(shè)、網(wǎng)站維護(hù)、關(guān)鍵詞優(yōu)化
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容