Elasticsearch與Python是如何對(duì)接實(shí)現(xiàn)的-創(chuàng)新互聯(lián)

創(chuàng)新互聯(lián)www.cdcxhl.cn八線動(dòng)態(tài)BGP香港云服務(wù)器提供商，新人活動(dòng)買多久送多久，劃算不套路！

成都創(chuàng)新互聯(lián)服務(wù)項(xiàng)目包括北侖網(wǎng)站建設(shè)、北侖網(wǎng)站制作、北侖網(wǎng)頁(yè)制作以及北侖網(wǎng)絡(luò)營(yíng)銷策劃等。多年來(lái)，我們專注于互聯(lián)網(wǎng)行業(yè)，利用自身積累的技術(shù)優(yōu)勢(shì)、行業(yè)經(jīng)驗(yàn)、深度合作伙伴關(guān)系等，向廣大中小型企業(yè)、政府機(jī)構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案，北侖網(wǎng)站推廣取得了明顯的社會(huì)效益與經(jīng)濟(jì)效益。目前，我們服務(wù)的客戶以成都為中心已經(jīng)輻射到北侖省份的部分城市，未來(lái)相信會(huì)繼續(xù)擴(kuò)大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任！

小編給大家分享一下Elasticsearch與Python是如何對(duì)接實(shí)現(xiàn)的，相信大部分人都還不怎么了解，因此分享這篇文章給大家參考一下，希望大家閱讀完這篇文章后大有收獲，下面讓我們一起去了解一下吧！

什么是 Elasticsearch

想查數(shù)據(jù)就免不了搜索，搜索就離不開搜索引擎，百度、谷歌都是一個(gè)非常龐大復(fù)雜的搜索引擎，他們幾乎索引了互聯(lián)網(wǎng)上開放的所有網(wǎng)頁(yè)和數(shù)據(jù)。然而對(duì)于我們自己的業(yè)務(wù)數(shù)據(jù)來(lái)說，肯定就沒必要用這么復(fù)雜的技術(shù)了，如果我們想實(shí)現(xiàn)自己的搜索引擎，方便存儲(chǔ)和檢索，Elasticsearch 就是不二選擇，它是一個(gè)全文搜索引擎，可以快速地儲(chǔ)存、搜索和分析海量數(shù)據(jù)。

為什么要用 Elasticsearch

Elasticsearch 是一個(gè)開源的搜索引擎，建立在一個(gè)全文搜索引擎庫(kù) Apache Lucene? 基礎(chǔ)之上。

那 Lucene 又是什么？Lucene 可能是目前存在的，不論開源還是私有的，擁有最先進(jìn)，高性能和全功能搜索引擎功能的庫(kù)，但也僅僅只是一個(gè)庫(kù)。要用上 Lucene，我們需要編寫 Java 并引用 Lucene 包才可以，而且我們需要對(duì)信息檢索有一定程度的理解才能明白 Lucene 是怎么工作的，反正用起來(lái)沒那么簡(jiǎn)單。

那么為了解決這個(gè)問題，Elasticsearch 就誕生了。Elasticsearch 也是使用 Java 編寫的，它的內(nèi)部使用 Lucene 做索引與搜索，但是它的目標(biāo)是使全文檢索變得簡(jiǎn)單，相當(dāng)于 Lucene 的一層封裝，它提供了一套簡(jiǎn)單一致的 RESTful API 來(lái)幫助我們實(shí)現(xiàn)存儲(chǔ)和檢索。

所以 Elasticsearch 僅僅就是一個(gè)簡(jiǎn)易版的 Lucene 封裝嗎？那就大錯(cuò)特錯(cuò)了，Elasticsearch 不僅僅是 Lucene，并且也不僅僅只是一個(gè)全文搜索引擎。它可以被下面這樣準(zhǔn)確的形容：

·一個(gè)分布式的實(shí)時(shí)文檔存儲(chǔ)，每個(gè)字段可以被索引與搜索

·一個(gè)分布式實(shí)時(shí)分析搜索引擎

·能勝任上百個(gè)服務(wù)節(jié)點(diǎn)的擴(kuò)展，并支持 PB 級(jí)別的結(jié)構(gòu)化或者非結(jié)構(gòu)化數(shù)據(jù)

總之，是一個(gè)相當(dāng)牛逼的搜索引擎，維基百科、Stack Overflow、GitHub 都紛紛采用它來(lái)做搜索。

Elasticsearch 的安裝

我們可以到 Elasticsearch 的官方網(wǎng)站下載 Elasticsearch：https://www.elastic.co/downloads/elasticsearch，同時(shí)官網(wǎng)也附有安裝說明。

首先把安裝包下載下來(lái)并解壓，然后運(yùn)行 bin/elasticsearch（Mac 或 Linux）或者 bin\elasticsearch.bat (Windows) 即可啟動(dòng) Elasticsearch 了。

我使用的是 Mac，Mac 下個(gè)人推薦使用 Homebrew 安裝：

brew install elasticsearch

Elasticsearch 默認(rèn)會(huì)在 9200 端口上運(yùn)行，我們打開瀏覽器訪問

http://localhost:9200/ 就可以看到類似內(nèi)容：

{
  "name" : "atntrTf",
  "cluster_name" : "elasticsearch",
  "cluster_uuid" : "e64hkjGtTp6_G2h2Xxdv5g",
  "version" : {
    "number": "6.2.4",
    "build_hash": "ccec39f",
    "build_date": "2018-04-12T20:37:28.497551Z",
    "build_snapshot": false,
    "lucene_version": "7.2.1",
    "minimum_wire_compatibility_version": "5.6.0",
    "minimum_index_compatibility_version": "5.0.0"
  },
  "tagline" : "You Know, for Search"
}

如果看到這個(gè)內(nèi)容，就說明 Elasticsearch 安裝并啟動(dòng)成功了，這里顯示我的 Elasticsearch 版本是 6.2.4 版本，版本很重要，以后安裝一些插件都要做到版本對(duì)應(yīng)才可以。

接下來(lái)我們來(lái)了解一下 Elasticsearch 的基本概念以及和 Python 的對(duì)接。

Elasticsearch 相關(guān)概念

在 Elasticsearch 中有幾個(gè)基本的概念，如節(jié)點(diǎn)、索引、文檔等等，下面來(lái)分別說明一下，理解了這些概念對(duì)熟悉 Elasticsearch 是非常有幫助的。

Node 和 Cluster

Elasticsearch 本質(zhì)上是一個(gè)分布式數(shù)據(jù)庫(kù)，允許多臺(tái)服務(wù)器協(xié)同工作，每臺(tái)服務(wù)器可以運(yùn)行多個(gè) Elasticsearch 實(shí)例。

單個(gè) Elasticsearch 實(shí)例稱為一個(gè)節(jié)點(diǎn)（Node）。一組節(jié)點(diǎn)構(gòu)成一個(gè)集群（Cluster）。

Index

Elasticsearch 會(huì)索引所有字段，經(jīng)過處理后寫入一個(gè)反向索引（Inverted Index）。查找數(shù)據(jù)的時(shí)候，直接查找該索引。

所以，Elasticsearch 數(shù)據(jù)管理的頂層單位就叫做 Index（索引），其實(shí)就相當(dāng)于 MySQL、MongoDB 等里面的數(shù)據(jù)庫(kù)的概念。另外值得注意的是，每個(gè) Index （即數(shù)據(jù)庫(kù)）的名字必須是小寫。

Document

Index 里面單條的記錄稱為 Document（文檔）。許多條 Document 構(gòu)成了一個(gè) Index。

Document 使用 JSON 格式表示，下面是一個(gè)例子。

同一個(gè) Index 里面的 Document，不要求有相同的結(jié)構(gòu)（scheme），但是最好保持相同，這樣有利于提高搜索效率。

Type

Document 可以分組，比如 weather 這個(gè) Index 里面，可以按城市分組（北京和上海），也可以按氣候分組（晴天和雨天）。這種分組就叫做 Type，它是虛擬的邏輯分組，用來(lái)過濾 Document，類似 MySQL 中的數(shù)據(jù)表，MongoDB 中的 Collection。

不同的 Type 應(yīng)該有相似的結(jié)構(gòu)（Schema），舉例來(lái)說，id 字段不能在這個(gè)組是字符串，在另一個(gè)組是數(shù)值。這是與關(guān)系型數(shù)據(jù)庫(kù)的表的一個(gè)區(qū)別。性質(zhì)完全不同的數(shù)據(jù)（比如 products 和 logs）應(yīng)該存成兩個(gè) Index，而不是一個(gè) Index 里面的兩個(gè) Type（雖然可以做到）。

根據(jù)規(guī)劃，Elastic 6.x 版只允許每個(gè) Index 包含一個(gè) Type，7.x 版將會(huì)徹底移除 Type。

Fields

即字段，每個(gè) Document 都類似一個(gè) JSON 結(jié)構(gòu)，它包含了許多字段，每個(gè)字段都有其對(duì)應(yīng)的值，多個(gè)字段組成了一個(gè) Document，其實(shí)就可以類比 MySQL 數(shù)據(jù)表中的字段。

在 Elasticsearch 中，文檔歸屬于一種類型（Type），而這些類型存在于索引（Index）中，我們可以畫一些簡(jiǎn)單的對(duì)比圖來(lái)類比傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)：

Relational DB -> Databases -> Tables -> Rows -> Columns
Elasticsearch -> Indices   -> Types  -> Documents -> Fields

以上就是 Elasticsearch 里面的一些基本概念，通過和關(guān)系性數(shù)據(jù)庫(kù)的對(duì)比更加有助于理解。

Python 對(duì)接 Elasticsearch

Elasticsearch 實(shí)際上提供了一系列 Restful API 來(lái)進(jìn)行存取和查詢操作，我們可以使用 curl 等命令來(lái)進(jìn)行操作，但畢竟命令行模式?jīng)]那么方便，所以這里我們就直接介紹利用 Python 來(lái)對(duì)接 Elasticsearch 的相關(guān)方法。

Python 中對(duì)接 Elasticsearch 使用的就是一個(gè)同名的庫(kù)，安裝方式非常簡(jiǎn)單：

pip3 install elasticsearch

官方文檔是：https://elasticsearch-py.readthedocs.io/，所有的用法都可以在里面查到，文章后面的內(nèi)容也是基于官方文檔來(lái)的。

創(chuàng)建 Index

我們先來(lái)看下怎樣創(chuàng)建一個(gè)索引（Index），這里我們創(chuàng)建一個(gè)名為 news 的索引：

from elasticsearch import Elasticsearch
es = Elasticsearch()
result = es.indices.create(index='news', ignore=400)
print(result)

如果創(chuàng)建成功，會(huì)返回如下結(jié)果：

{'acknowledged': True, 'shards_acknowledged': True, 'index': 'news'}

返回結(jié)果是 JSON 格式，其中的 acknowledged 字段表示創(chuàng)建操作執(zhí)行成功。

但這時(shí)如果我們?cè)侔汛a執(zhí)行一次的話，就會(huì)返回如下結(jié)果：

{'error': {'root_cause': [{'type': 'resource_already_exists_exception', 'reason': 'index [news/QM6yz2W8QE-bflKhc5oThw] 
already exists', 'index_uuid': 'QM6yz2W8QE-bflKhc5oThw', 'index': 'news'}], 'type': 'resource_already_exists_
exception', 'reason': 'index [news/QM6yz2W8QE-bflKhc5oThw] already exists', 'index_uuid': 'QM6yz2W8QE-bflKhc5oThw', 
'index': 'news'}, 'status': 400}

它提示創(chuàng)建失敗，status 狀態(tài)碼是 400，錯(cuò)誤原因是 Index 已經(jīng)存在了。

注意這里我們的代碼里面使用了 ignore 參數(shù)為 400，這說明如果返回結(jié)果是 400 的話，就忽略這個(gè)錯(cuò)誤不會(huì)報(bào)錯(cuò)，程序不會(huì)執(zhí)行拋出異常。

假如我們不加 ignore 這個(gè)參數(shù)的話：

es = Elasticsearch()
result = es.indices.create(index='news')
print(result)

再次執(zhí)行就會(huì)報(bào)錯(cuò)了：

raise HTTP_EXCEPTIONS.get(status_code, TransportError)(status_code, error_message, additional_info)
elasticsearch.exceptions.RequestError: TransportError(400, 'resource_already_exists_exception', 'index 
[news/QM6yz2W8QE-bflKhc5oThw] already exists')

這樣程序的執(zhí)行就會(huì)出現(xiàn)問題，所以說，我們需要善用 ignore 參數(shù)，把一些意外情況排除，這樣可以保證程序的正常執(zhí)行而不會(huì)中斷。

刪除 Index

刪除 Index 也是類似的，代碼如下：

from elasticsearch import Elasticsearch
es = Elasticsearch()
result = es.indices.delete(index='news', ignore=[400, 404])
print(result)

這里也是使用了 ignore 參數(shù)，來(lái)忽略 Index 不存在而刪除失敗導(dǎo)致程序中斷的問題。

如果刪除成功，會(huì)輸出如下結(jié)果：

{'acknowledged': True}

如果 Index 已經(jīng)被刪除，再執(zhí)行刪除則會(huì)輸出如下結(jié)果：

{'error': {'root_cause': [{'type': 'index_not_found_exception', 'reason': 'no such index', 'resource.type': 
'index_or_alias', 'resource.id': 'news', 'index_uuid': '_na_', 'index': 'news'}], 'type': 'index_not_found_exception', 
'reason': 'no such index', 'resource.type': 'index_or_alias', 'resource.id': 'news', 'index_uuid': '_na_', 'index': 
'news'}, 'status': 404}

這個(gè)結(jié)果表明當(dāng)前 Index 不存在，刪除失敗，返回的結(jié)果同樣是 JSON，狀態(tài)碼是 400，但是由于我們添加了 ignore 參數(shù)，忽略了 400 狀態(tài)碼，因此程序正常執(zhí)行輸出 JSON 結(jié)果，而不是拋出異常。

插入數(shù)據(jù)

Elasticsearch 就像 MongoDB 一樣，在插入數(shù)據(jù)的時(shí)候可以直接插入結(jié)構(gòu)化字典數(shù)據(jù)，插入數(shù)據(jù)可以調(diào)用 create() 方法，例如這里我們插入一條新聞數(shù)據(jù)：

from elasticsearch import Elasticsearch
es = Elasticsearch()
es.indices.create(index='news', ignore=400)
data = {'title': '美國(guó)留給伊拉克的是個(gè)爛攤子嗎', 'url': 'http://view.news.qq.com/zt2011/usa_iraq/index.htm'}
result = es.create(index='news', doc_type='politics', id=1, body=data)
print(result)

這里我們首先聲明了一條新聞數(shù)據(jù)，包括標(biāo)題和鏈接，然后通過調(diào)用 create() 方法插入了這條數(shù)據(jù)，在調(diào)用 create() 方法時(shí)，我們傳入了四個(gè)參數(shù)，index 參數(shù)代表了索引名稱，doc_type 代表了文檔類型，body 則代表了文檔具體內(nèi)容，id 則是數(shù)據(jù)的唯一標(biāo)識(shí) ID。

運(yùn)行結(jié)果如下：

{'_index': 'news', '_type': 'politics', '_id': '1', '_version': 1, 'result': 'created', '_shards': {'total': 2, 
'successful': 1, 'failed': 0}, '_seq_no': 0, '_primary_term': 1}

結(jié)果中 result 字段為 created，代表該數(shù)據(jù)插入成功。

另外其實(shí)我們也可以使用 index() 方法來(lái)插入數(shù)據(jù)，但與 create() 不同的是，create() 方法需要我們指定 id 字段來(lái)唯一標(biāo)識(shí)該條數(shù)據(jù)，而 index() 方法則不需要，如果不指定 id，會(huì)自動(dòng)生成一個(gè) id，調(diào)用 index() 方法的寫法如下：

es.index(index='news', doc_type='politics', body=data)

create() 方法內(nèi)部其實(shí)也是調(diào)用了 index() 方法，是對(duì) index() 方法的封裝。

更新數(shù)據(jù)

更新數(shù)據(jù)也非常簡(jiǎn)單，我們同樣需要指定數(shù)據(jù)的 id 和內(nèi)容，調(diào)用 update() 方法即可，代碼如下：

from elasticsearch import Elasticsearch
es = Elasticsearch()
data = {
    'title': '美國(guó)留給伊拉克的是個(gè)爛攤子嗎',
    'url': 'http://view.news.qq.com/zt2011/usa_iraq/index.htm',
    'date': '2011-12-16'
}
result = es.update(index='news', doc_type='politics', body=data, id=1)
print(result)

這里我們?yōu)閿?shù)據(jù)增加了一個(gè)日期字段，然后調(diào)用了 update() 方法，結(jié)果如下：

{'_index': 'news', '_type': 'politics', '_id': '1', '_version': 2, 'result': 'updated', '_shards': {'total': 2, 
'successful': 1, 'failed': 0}, '_seq_no': 1, '_primary_term': 1}

可以看到返回結(jié)果中，result 字段為 updated，即表示更新成功，另外我們還注意到有一個(gè)字段 _version，這代表更新后的版本號(hào)數(shù)，2 代表這是第二個(gè)版本，因?yàn)橹耙呀?jīng)插入過一次數(shù)據(jù)，所以第一次插入的數(shù)據(jù)是版本 1，可以參見上例的運(yùn)行結(jié)果，這次更新之后版本號(hào)就變成了 2，以后每更新一次，版本號(hào)都會(huì)加 1。

另外更新操作其實(shí)利用 index() 方法同樣可以做到，寫法如下：

es.index(index='news', doc_type='politics', body=data, id=1)

可以看到，index() 方法可以代替我們完成兩個(gè)操作，如果數(shù)據(jù)不存在，那就執(zhí)行插入操作，如果已經(jīng)存在，那就執(zhí)行更新操作，非常方便。

刪除數(shù)據(jù)

如果想刪除一條數(shù)據(jù)可以調(diào)用 delete() 方法，指定需要?jiǎng)h除的數(shù)據(jù) id 即可，寫法如下：

from elasticsearch import Elasticsearch
es = Elasticsearch()
result = es.delete(index='news', doc_type='politics', id=1)
print(result)

運(yùn)行結(jié)果如下：

{'_index': 'news', '_type': 'politics', '_id': '1', '_version': 3, 'result': 'deleted', '_shards': {'total': 2, 
'successful': 1, 'failed': 0}, '_seq_no': 2, '_primary_term': 1}

可以看到運(yùn)行結(jié)果中 result 字段為 deleted，代表刪除成功，_version 變成了 3，又增加了 1。

查詢數(shù)據(jù)

上面的幾個(gè)操作都是非常簡(jiǎn)單的操作，普通的數(shù)據(jù)庫(kù)如 MongoDB 都是可以完成的，看起來(lái)并沒有什么了不起的，Elasticsearch 更特殊的地方在于其異常強(qiáng)大的檢索功能。

對(duì)于中文來(lái)說，我們需要安裝一個(gè)分詞插件，這里使用的是 elasticsearch-analysis-ik，GitHub 鏈接為：https://github.com/medcl/elasticsearch-analysis-ik，這里我們使用 Elasticsearch 的另一個(gè)命令行工具 elasticsearch-plugin 來(lái)安裝，這里安裝的版本是 6.2.4，請(qǐng)確保和 Elasticsearch 的版本對(duì)應(yīng)起來(lái)，命令如下：

elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.4 
/elasticsearch-analysis-ik-6.2.4.zip

這里的版本號(hào)請(qǐng)?zhí)鎿Q成你的 Elasticsearch 的版本號(hào)。

安裝之后重新啟動(dòng) Elasticsearch 就可以了，它會(huì)自動(dòng)加載安裝好的插件。

首先我們新建一個(gè)索引并指定需要分詞的字段，代碼如下：

from elasticsearch import Elasticsearch
es = Elasticsearch()
mapping = {
    'properties': {
        'title': {
            'type': 'text',
            'analyzer': 'ik_max_word',
            'search_analyzer': 'ik_max_word'
        }
    }
}
es.indices.delete(index='news', ignore=[400, 404])
es.indices.create(index='news', ignore=400)
result = es.indices.put_mapping(index='news', doc_type='politics', body=mapping)
print(result)

這里我們先將之前的索引刪除了，然后新建了一個(gè)索引，然后更新了它的 mapping 信息，mapping 信息中指定了分詞的字段，指定了字段的類型 type 為 text，分詞器 analyzer 和搜索分詞器 search_analyzer 為 ik_max_word，即使用我們剛才安裝的中文分詞插件。如果不指定的話則使用默認(rèn)的英文分詞器。

接下來(lái)我們插入幾條新的數(shù)據(jù)：

datas = [
    {
        'title': '美國(guó)留給伊拉克的是個(gè)爛攤子嗎',
        'url': 'http://view.news.qq.com/zt2011/usa_iraq/index.htm',
        'date': '2011-12-16'
    },
    {
        'title': '公安部：各地校車將享最高路權(quán)',
        'url': 'http://www.chinanews.com/gn/2011/12-16/3536077.shtml',
        'date': '2011-12-16'
    },
    {
        'title': '中韓漁警沖突調(diào)查：韓警平均每天扣1艘中國(guó)漁船',
        'url': 'https://news.qq.com/a/20111216/001044.htm',
        'date': '2011-12-17'
    },
    {
        'title': '中國(guó)駐洛杉磯領(lǐng)事館遭亞裔男子槍擊 嫌犯已自首',
        'url': 'http://news.ifeng.com/world/detail_2011_12/16/11372558_0.shtml',
        'date': '2011-12-18'
    }
]
for data in datas:
    es.index(index='news', doc_type='politics', body=data)

這里我們指定了四條數(shù)據(jù)，都帶有 title、url、date 字段，然后通過 index() 方法將其插入 Elasticsearch 中，索引名稱為 news，類型為 politics。

接下來(lái)我們根據(jù)關(guān)鍵詞查詢一下相關(guān)內(nèi)容：

result = es.search(index='news', doc_type='politics')
print(result)

可以看到查詢出了所有插入的四條數(shù)據(jù)：

{
  "took": 0,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": 4,
    "max_score": 1.0,
    "hits": [
      {
        "_index": "news",
        "_type": "politics",
        "_id": "c05G9mQBD9BuE5fdHOUT",
        "_score": 1.0,
        "_source": {
          "title": "美國(guó)留給伊拉克的是個(gè)爛攤子嗎",
          "url": "http://view.news.qq.com/zt2011/usa_iraq/index.htm",
          "date": "2011-12-16"
        }
      },
      {
        "_index": "news",
        "_type": "politics",
        "_id": "dk5G9mQBD9BuE5fdHOUm",
        "_score": 1.0,
        "_source": {
          "title": "中國(guó)駐洛杉磯領(lǐng)事館遭亞裔男子槍擊，嫌犯已自首",
          "url": "http://news.ifeng.com/world/detail_2011_12/16/11372558_0.shtml",
          "date": "2011-12-18"
        }
      },
      {
        "_index": "news",
        "_type": "politics",
        "_id": "dU5G9mQBD9BuE5fdHOUj",
        "_score": 1.0,
        "_source": {
          "title": "中韓漁警沖突調(diào)查：韓警平均每天扣1艘中國(guó)漁船",
          "url": "https://news.qq.com/a/20111216/001044.htm",
          "date": "2011-12-17"
        }
      },
      {
        "_index": "news",
        "_type": "politics",
        "_id": "dE5G9mQBD9BuE5fdHOUf",
        "_score": 1.0,
        "_source": {
          "title": "公安部：各地校車將享最高路權(quán)",
          "url": "http://www.chinanews.com/gn/2011/12-16/3536077.shtml",
          "date": "2011-12-16"
        }
      }
    ]
  }
}

可以看到返回結(jié)果會(huì)出現(xiàn)在 hits 字段里面，然后其中有 total 字段標(biāo)明了查詢的結(jié)果條目數(shù)，還有 max_score 代表了大匹配分?jǐn)?shù)。

另外我們還可以進(jìn)行全文檢索，這才是體現(xiàn) Elasticsearch 搜索引擎特性的地方：

dsl = {
    'query': {
        'match': {
            'title': '中國(guó) 領(lǐng)事館'
        }
    }
}
es = Elasticsearch()
result = es.search(index='news', doc_type='politics', body=dsl)
print(json.dumps(result, indent=2, ensure_ascii=False))

這里我們使用 Elasticsearch 支持的 DSL 語(yǔ)句來(lái)進(jìn)行查詢，使用 match 指定全文檢索，檢索的字段是 title，內(nèi)容是“中國(guó)領(lǐng)事館”，搜索結(jié)果如下：

{
  "took": 1,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": 2,
    "max_score": 2.546152,
    "hits": [
      {
        "_index": "news",
        "_type": "politics",
        "_id": "dk5G9mQBD9BuE5fdHOUm",
        "_score": 2.546152,
        "_source": {
          "title": "中國(guó)駐洛杉磯領(lǐng)事館遭亞裔男子槍擊，嫌犯已自首",
          "url": "http://news.ifeng.com/world/detail_2011_12/16/11372558_0.shtml",
          "date": "2011-12-18"
        }
      },
      {
        "_index": "news",
        "_type": "politics",
        "_id": "dU5G9mQBD9BuE5fdHOUj",
        "_score": 0.2876821,
        "_source": {
          "title": "中韓漁警沖突調(diào)查：韓警平均每天扣1艘中國(guó)漁船",
          "url": "https://news.qq.com/a/20111216/001044.htm",
          "date": "2011-12-17"
        }
      }
    ]
  }
}

這里我們看到匹配的結(jié)果有兩條，第一條的分?jǐn)?shù)為 2.54，第二條的分?jǐn)?shù)為 0.28，這是因?yàn)榈谝粭l匹配的數(shù)據(jù)中含有“中國(guó)”和“領(lǐng)事館”兩個(gè)詞，第二條匹配的數(shù)據(jù)中不包含“領(lǐng)事館”，但是包含了“中國(guó)”這個(gè)詞，所以也被檢索出來(lái)了，但是分?jǐn)?shù)比較低。

因此可以看出，檢索時(shí)會(huì)對(duì)對(duì)應(yīng)的字段全文檢索，結(jié)果還會(huì)按照檢索關(guān)鍵詞的相關(guān)性進(jìn)行排序，這就是一個(gè)基本的搜索引擎雛形。

以上是Elasticsearch與Python是如何對(duì)接實(shí)現(xiàn)的的所有內(nèi)容，感謝各位的閱讀！相信大家都有了一定的了解，希望分享的內(nèi)容對(duì)大家有所幫助，如果還想學(xué)習(xí)更多知識(shí)，歡迎關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道！

標(biāo)題名稱：Elasticsearch與Python是如何對(duì)接實(shí)現(xiàn)的-創(chuàng)新互聯(lián)
標(biāo)題鏈接：http://chinadenli.net/article10/ceeggo.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供網(wǎng)站營(yíng)銷、網(wǎng)站制作、外貿(mào)網(wǎng)站建設(shè)、軟件開發(fā)、響應(yīng)式網(wǎng)站、外貿(mào)建站

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請(qǐng)盡快告知，我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如需處理請(qǐng)聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來(lái)源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

欧美一区二区三区老妇人-欧美做爰猛烈大尺度电-99久久夜色精品国产亚洲a-亚洲福利视频一区二区

Elasticsearch與Python是如何對(duì)接實(shí)現(xiàn)的-創(chuàng)新互聯(lián)