拼音分词扩展elasticsearch-analysis-pinyin安装
发布日期:2021-07-01 06:08:09
浏览次数:3
分类:技术文章
本文共 1435 字,大约阅读时间需要 4 分钟。
1、打开找到对应的版本
2、复制下载链接安装
例如:
我的elasticsearch是5.6.16./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-pinyin/releases/download/v5.6.16/elasticsearch-analysis-pinyin-5.6.16.zip
3、重启ES!
4、分词测试
GET _analyze{ "text": "学习", "analyzer": "pinyin"}
分词结果
{ "tokens": [ { "token": "xue", "start_offset": 0, "end_offset": 1, "type": "word", "position": 0 }, { "token": "xi", "start_offset": 1, "end_offset": 2, "type": "word", "position": 1 }, { "token": "xx", "start_offset": 0, "end_offset": 2, "type": "word", "position": 1 } ]}
自定义参数
参数 | 默认值 | 说明 |
---|---|---|
keep_first_letter | true | 刘德华>ldh |
keep_separate_first_letter | false | 刘德华>l,d,h |
limit_first_letter_length | 16 | set max length of the first_letter result |
keep_full_pinyin | true | 刘德华> [liu,de,hua] |
keep_joined_full_pinyin | false | 刘德华> [liudehua] |
keep_none_chinese | true | keep non chinese letter or number in result |
keep_none_chinese_together | true | true:DJ音乐家 -> DJ,yin,yue,jia; false:DJ音乐家 -> D,J,yin,yue,jia |
keep_none_chinese_in_first_letter | true | 刘德华AT2016->ldhat2016 |
keep_none_chinese_in_joined_full_pinyin | false | eg: 刘德华2016->liudehua2016 |
none_chinese_pinyin_tokenize | true | eg: liudehuaalibaba13zhuanghan -> liu,de,hua,a,li,ba,ba,13,zhuang,han |
keep_original | false | - |
lowercase | true | - |
trim_whitespace | true | - |
remove_duplicated_term | false | de的 > de |
ignore_pinyin_offset | true | - |
转载地址:https://pengshiyu.blog.csdn.net/article/details/103136799 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
第一次来,支持一个
[***.219.124.196]2024年05月06日 23时57分36秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
Hbase学习笔记(一)
2019-05-08
Hbase学习笔记(二)
2019-05-08
Hbase学习笔记(三)
2019-05-08
超实用学习必备搜索技能,教你如何用好搜索引擎!
2019-05-08
Linux学习资源推荐
2019-05-08
数据通信-网络的基础概念
2019-05-08
C++中替代sprintf的std::ostringstream输出流详解
2019-05-08
数据通信-TCP/IP
2019-05-08
数据通信-IP子网划分
2019-05-08
linux-软件包管理及RPM包管理(rmp命令管理)
2019-05-08
linux-rpm命令管理(查询,校验和文件管理)
2019-05-08
linux-RPM包管理-yum在线管理(IP地址配置和网络yum源,yum命令)
2019-05-08
linux-源码包管理
2019-05-08
linux-脚本安装包
2019-05-08
linux-用户和用户组管理-用户配置文件
2019-05-08
linux-用户配置文件-影子文件,组信息文件
2019-05-08
linux-用户管理相关文件
2019-05-08
数据通信-网络设备管理
2019-05-08
linux-用户管理命令
2019-05-08
linux-用户组管理命令
2019-05-08