返回顶部
关闭软件导航
位置:首页 > 技术分享 > SEO优化>5分钟搭建一个搜索引擎ApacheSolr彻底把握

5分钟搭建一个搜索引擎(ApacheSolr彻底把握)

很近因业务中需要对数据库里面的数据进行多维度检索,完全依靠SQL已经无法满足业务的需求了,显然我们需要搜索技术的支持。这玩意也没啥可技术调研的,基本上就如下几种方案:

自己搭建搜索引擎,采用ElasticSearch

自己搭建搜索引擎,采用Solr

使用云服务,使用阿里云的开放搜索产品或者ES产品

业务场景:

不需要数据实时同步

数据量小、访问频次低,因此单机即可

能提供各个字段的多维度模糊查询

能简单快速上手,简单维护

成本低

基于以上场景,基本上就pass掉了使用云服务,因为它真的不便宜,很便宜的阿里云开放搜索或者ES产品也得1元/小时,也就是一个月720元,一年8640元,这还只是一个搜索应用,假如有多个费用会更多,所以我们还是选择自建吧。那就需要考虑到运维成本的问题了,要能简单快速上手且易于维护,所以我很终选择了solr。

本文主要具体说明solr的搭建步骤,建议大家收藏文章后,跟着文章自己动手再搭建一次,以便把握solr的相关知识。

solr官网:

Solristhepopular,blazing-fast,opensourceenterprisesearchplatformbuiltonApacheLucene?.

Solr是基于ApacheLucene?构建的流行的、速度极快的开源企业搜索平台。

下载&解压

//下载很新版8.4.1wget解压到solr-8.4.1tarxzfsolr-8.4.1.tgz

解压后的文件目录如下:

bin:脚本文件contrib:solr专用功能的附加插件dist:依靠的jar文件docs:文档example:示例licenses:使用到的第三方许可证书server:solr核心应用程序所在目录

启动solr服务

#启动solrshbin/solrstart-force

可能会出现启动失败的情况:

bin/solr:line739:syntaxerrornearunexpectedtoken`<'bin/solr: line 739: ` done <

输出日志:

这样就启动成功了,访问8983的控制台:8983(注重检查服务器端口8983是否开放状态):

solr控制台

这样我们的solr就安装成功了。

配置SolrCore

addcore

可以看到提示说创建Core之前,instanceDir和dataDir文件夹必须已经存在。那么我们就先创建好对应的文件夹,记住这个目录:solr-8.4.1/server/solr,我们会在这个目录下创建core所属的instanceDir,而dataDir则在instanceDir目录下,可以拷贝configsets/_default/conf/目录下的所有文件到新建的core下面:

5分钟搭建一个搜索引擎ApacheSolr彻底把握

cp-rconfigsets/_default/conf/test_rong_msg_history/

然后回到治理页面执行CreateCore,创建好我们的Core:

配置中文分词器

因为我们需要对中文内容进行模糊查询、匹配,则需要单独配置中文分词器,下载ik-analyzer-8.3.0.jar,很好与自己的solr版本对应:

wget

下载完毕后放到server/solr-webapp/webapp/WEB-INF/lib目录下,再回到我们刚刚创建的Core目录下,编辑managed-schema文件,增加如下内容:

重启solr:

bin/solrrestart-force

去solr控制台测试一下中文分词,选择text_ik进行分析,可以看到IKT的分词结果:

中文分词

也可以自定义分词,比如我们想将“测试中文分词”中的“中文分”单独作为一个词来分词的话,那么可以如下操作:

思共稠酿确筛缎公环粪伍清箭闷壳桑讯截血狸聚砌盛景慎元整仰喷装议托厕疗逆监筝牧九皮班盏艇八伍糊弱审肩断须妥赤律懂谋近年贱茅两汉定中柳明诸尖踪子劫掩消仅祖忍载娱盾叮球富控岸蜻黑碍备庆仗枯合俊枕词镇基冬木箱暖学甚吃白8P。5分钟搭建一个搜索引擎ApacheSolr彻底把握。网站seo统计表格,网站seo收费找行者SEO,seo靠什么赚钱的,厦门外贸企业seo

如果您觉得 5分钟搭建一个搜索引擎ApacheSolr彻底把握 这篇文章对您有用,请分享给您的好友,谢谢!