1.1、拷贝Jar包
cp /opt/solr/solr-7.3.1/contrib/analysis-extras/lucene-libs/lucene-analyzers-smartcn-7.3.1.jar /opt/tomcat/apache-tomcat-8.5.31/webapps/solr/WEB-INF/lib
1
1.2、修改managed-schema
修改/opt/solr/solrhome/new_core/conf/managed-schema文件,并添加如下内容:
<fieldType name=”text_ik_zd” class=”solr.TextField” positionIncrementGap=”100″>
<analyzer type=”index”>
<tokenizer class=”org.apache.lucene.analysis.cn
.smart.HMMChineseTokenizerFactory”/>
</analyzer>
<analyzer type=”query”>
<tokenizer class=”org.apache.lucene.analysis.cn
.smart.HMMChineseTokenizerFactory”/>
</analyzer>
</fieldType>
重启tomcat即可.
2、配置IK中文分词器
下载IK分词器jar包
2.1、拷贝
cp solr-analyzer-ik-5.1.0.jar ik-analyzer-solr5-5.x.jar /opt/tomcat/apache-tomcat-8.5.31/webapps/solr/WEB-INF/lib
cp IKAnalyzer.cfg.xml ext.dic stopword.dic /opt/tomcat/apache-tomcat-8.5.31/webapps/solr/WEB-INF/classes
1
2
2.2、修改managed-schema
修改/opt/solr/solrhome/new_core/conf/managed-schema文件,并添加如下内容:
<fieldType name=”text_ik” class=”solr.TextField”>
<analyzer type=”index”>
<tokenizer class=”org.apache.lucene.analysis.ik.IKTokenizerFactory” useSmart=”true”/>
</analyzer>
<analyzer type=”query”>
<tokenizer class=”org.apache.lucene.analysis.ik.IKTokenizerFactory” useSmart=”true”/>
</analyzer>
</fieldType>
转载请注明:XAMPP中文组官网 » Solr之配置中文分词器