博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Solr6.1 smartCN配置
阅读量:7212 次
发布时间:2019-06-29

本文共 584 字,大约阅读时间需要 1 分钟。

  hot3.png

下载solr时已经包含了smartCN的jar包,所以不需要额外的下载只需要简单的配置就可以使用smartCN中文分词。

1、在[coreName]目录下的configs目录里面修改solrconfig.xml添加如下

<lib dir="${solr.install.dir:../../../..}/contrib/analysis-extras/lucene-libs" regex="lucene-analyzers-smartcn-\d.*\.jar" />

2、在[coreName]目录下configs目录里面修改managed-schema,添加一个新的fieldType,这个fieldType使用 HMMChineseTokenizerFactory    来做分词。

<fieldType name="text_chinese" class="solr.TextField">

  <analyzer>

    <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>

  </analyzer>

</fieldType>

然后就可以在solr 管理页面查看分词结果了

145415_AkGQ_1860759.png

转载于:https://my.oschina.net/muziH/blog/712346

你可能感兴趣的文章
做门户网站 个人站长的新好出路
查看>>
sql中exists,not exists的用法
查看>>
CentOS6.5更改ssh端口问题
查看>>
11g默认审计选项
查看>>
Where Did That New Exchange 2010 Mailbox Go?
查看>>
CentOS 7 yum安装Zabbix
查看>>
Bash编程入门
查看>>
神器:REST测试工具[wiztools.org restclient]客户端Jar依赖Java安装环境
查看>>
生成keystore是报错拒绝访问(已测试)
查看>>
从一道题浅说 JavaScript 的事件循环
查看>>
每天进步一点点——Linux文件锁编程flock
查看>>
sqlserver锁机制详解(sqlserver查看锁)
查看>>
[公告]欢迎您加入WF技术研究团队
查看>>
5.10. Web Tools
查看>>
将Eclipse代码导入到Android Studio的两种方式
查看>>
ASP.Net4.0中新增23项功能
查看>>
HTML JS 数据校验
查看>>
Mysql中分页查询两个方法比较
查看>>
保存一下dedecms数据库表和字段说明,方便日后查询
查看>>
公众号群发文章支持添加小程序
查看>>