本篇內(nèi)容介紹了“怎么實(shí)現(xiàn)ES IK分詞器添加遠(yuǎn)程詞組”的有關(guān)知識(shí),在實(shí)際案例的操作過(guò)程中,不少人都會(huì)遇到這樣的困境,接下來(lái)就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
10年積累的網(wǎng)站設(shè)計(jì)制作、做網(wǎng)站經(jīng)驗(yàn),可以快速應(yīng)對(duì)客戶對(duì)網(wǎng)站的新想法和需求。提供各種問(wèn)題對(duì)應(yīng)的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡(luò)服務(wù)。我雖然不認(rèn)識(shí)你,你也不認(rèn)識(shí)我。但先網(wǎng)站設(shè)計(jì)后付款的網(wǎng)站建設(shè)流程,更有汨羅免費(fèi)網(wǎng)站建設(shè)讓你可以放心的選擇與我們合作。
<entry key="remote_ext_dict">URLS</entry> <entry key="remote_ext_stopwords">URLS</entry>
將URLS替換成遠(yuǎn)程字典地址,多個(gè)地址使用分號(hào) (;) 分隔.
每條url,比如http://127.0.0.1/dict/my.txt ,該請(qǐng)求只需滿足以下兩點(diǎn)即可完成分詞熱更新:
1)響應(yīng)需要返回兩個(gè)頭部(header),一個(gè)是Last-Modified,一個(gè)是ETag,這兩者都是字符串類(lèi)型,只要有一個(gè)發(fā)生變化,該插件就會(huì)去抓取新的分詞進(jìn)而更新詞庫(kù)。
2)返回的內(nèi)容格式是一行一個(gè)分詞,換行符用\n
即可。
滿足上面兩點(diǎn)要求可實(shí)現(xiàn)熱更新分詞,不需要重啟 ES 實(shí)例。
可以將需自動(dòng)更新的熱詞放在一個(gè) UTF-8 編碼的 .txt 文件里,放在 nginx 或其他簡(jiǎn)易 http server 下,當(dāng) .txt 文件修改時(shí),http server 會(huì)在客戶端請(qǐng)求該文件時(shí)自動(dòng)返回相應(yīng)的 Last-Modified 和 ETag,或者可以另外做一個(gè)工具來(lái)從業(yè)務(wù)系統(tǒng)提取相關(guān)詞匯,并更新這個(gè) .txt 文件。
http server的方式比較簡(jiǎn)單 下面舉一個(gè)通過(guò)SpringMVC響應(yīng)的方式的實(shí)現(xiàn)
// 字典文件所在文件路徑 private static final String EXT_DICT_PATH = "/data/soft/mydic"; @RequestMapping(value="/getCustomDict.htm") public void getCustomDict(HttpServletRequest request, HttpServletResponse response){ try { // 讀取字典文件 String path = EXT_DICT_PATH; File file = new File(path); String content = ""; if(file.exists()){ // 讀取文件內(nèi)容 FileInputStream fi = new FileInputStream(file); byte[] buffer = new byte[(int) file.length()]; int offset = 0, numRead = 0; while (offset < buffer.length && (numRead = fi.read(buffer, offset, buffer.length - offset)) >= 0) { offset += numRead; } fi.close(); content = new String(buffer, "UTF-8"); } // 返回?cái)?shù)據(jù) OutputStream out= response.getOutputStream(); // Head需要帶上 Last-Modified ETag 屬性 // 此處是輸出的文件內(nèi)容大小,不一定是這個(gè)樣子,只要保證當(dāng)文件發(fā)生變化時(shí),Last-Modified和ETag也是變化的就OK ,比如也可以是文件的MD5 response.setHeader("Last-Modified", String.valueOf(content.length())); response.setHeader("ETag",String.valueOf(content.length())); response.setContentType("text/plain; charset=utf-8"); out.write(content.getBytes("utf-8")); out.flush(); logger.info(content+"這是讀取數(shù)據(jù)值"); } catch (Exception e) { e.printStackTrace(); } }
“怎么實(shí)現(xiàn)ES IK分詞器添加遠(yuǎn)程詞組”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí)可以關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!
分享標(biāo)題:怎么實(shí)現(xiàn)ESIK分詞器添加遠(yuǎn)程詞組
本文來(lái)源:http://chinadenli.net/article22/iegpjc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供微信公眾號(hào)、微信小程序、云服務(wù)器、品牌網(wǎng)站建設(shè)、網(wǎng)站營(yíng)銷(xiāo)、建站公司
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)