最新消息:XAMPP默认安装之后是很不安全的,我们只需要点击左方菜单的 "安全"选项,按照向导操作即可完成安全设置。

Solr之配置中文分词器

XAMPP下载 admin 1176浏览 0评论
 1、使用solr自带分词器
1.1、拷贝Jar包
cp /opt/solr/solr-7.3.1/contrib/analysis-extras/lucene-libs/lucene-analyzers-smartcn-7.3.1.jar /opt/tomcat/apache-tomcat-8.5.31/webapps/solr/WEB-INF/lib
1
1.2、修改managed-schema
修改/opt/solr/solrhome/new_core/conf/managed-schema文件,并添加如下内容:

<fieldType name=”text_ik_zd” class=”solr.TextField” positionIncrementGap=”100″>
<analyzer type=”index”>
<tokenizer class=”org.apache.lucene.analysis.cn

.smart.HMMChineseTokenizerFactory”/>
</analyzer>
<analyzer type=”query”>
<tokenizer class=”org.apache.lucene.analysis.cn

.smart.HMMChineseTokenizerFactory”/>
</analyzer>
</fieldType>

重启tomcat即可.

2、配置IK中文分词器
下载IK分词器jar包

2.1、拷贝
cp solr-analyzer-ik-5.1.0.jar ik-analyzer-solr5-5.x.jar /opt/tomcat/apache-tomcat-8.5.31/webapps/solr/WEB-INF/lib
cp IKAnalyzer.cfg.xml ext.dic stopword.dic /opt/tomcat/apache-tomcat-8.5.31/webapps/solr/WEB-INF/classes
1
2
2.2、修改managed-schema
修改/opt/solr/solrhome/new_core/conf/managed-schema文件,并添加如下内容:

<fieldType name=”text_ik” class=”solr.TextField”>
<analyzer type=”index”>
<tokenizer class=”org.apache.lucene.analysis.ik.IKTokenizerFactory” useSmart=”true”/>
</analyzer>
<analyzer type=”query”>
<tokenizer class=”org.apache.lucene.analysis.ik.IKTokenizerFactory” useSmart=”true”/>
</analyzer>
</fieldType>

转载请注明:XAMPP中文组官网 » Solr之配置中文分词器

您必须 登录 才能发表评论!