#Elasticsearch中文分词器 #IK分词器 @FDDLC
发布日期:2021-06-30 20:58:35
浏览次数:3
分类:技术文章
本文共 459 字,大约阅读时间需要 1 分钟。
一、标准的英文分词器对中文的分词效果
从上图可知,标准的英文分词器会把英文拆分成单字。但标准的英文分词器却能把英文拆分成单词:
上面一对比就知道:标准分词器对中文不够友好!
二、中文分词器IK的下载安装
1、IK中文分词器下载链接:
自己选择版本:
2、下载完成后解压,放到Elasticsearch根目录下的plugins文件夹下:
3、重启Elasticsearch,ik分词器就会被加载。
三、ik分词器的简单使用(使用Kibana、Postman或head)
有关Kibana的介绍,可参考:【不好意思,待续~】
1、ik_smart:单个词语的长度最长,即得到的词语数量最少
用Postman或head也行:
2、ik_max_word:找出所有可能的词语,即得到的词语数量最多
从上图可知,冰箱、电冰箱均有出现。
四、在创建type类型表时指定分词器,再进行查询
1、创建索引库(注意:ES7.x无type类型表的概念!)
2、往表中添加记录
逐条添加:
添加完后是这样的:
3、查询
1)不拆分
2)拆分
转载地址:https://liuxingchang.blog.csdn.net/article/details/109544721 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
路过,博主的博客真漂亮。。
[***.116.15.85]2024年04月22日 19时51分51秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
Android使用Retrofit_00_Getting Started
2019-04-30
Android使用Retrofit_01_OAuth2 + GitHub
2019-04-30
Django + REST学习笔记
2019-04-30
【转载】将Ubuntu16.04 中gedit在仅显示一个文件时显示文件名tab
2019-04-30
fstream 对象多次使用时注意clear
2019-04-30
调试 LenaCV 3D Camera (Linux)
2019-04-30
OpenCV杂记 - Mat in C++
2019-04-30
lnmp部署
2019-04-30
location区段
2019-04-30
nginx访问控制、基于用户认证、https配置
2019-04-30
用zabbix监控nginx
2019-04-30
SaltStack
2019-04-30
Linux添加系统调用
2019-04-30
linux内存的寻址方式
2019-04-30
ubunut16.04的pip3出现问题,重新安装pip3
2019-04-30
how2heap-double free
2019-04-30