机器上已安装 : Tomcat 6.0 jdk1.7 mysql 5.0
1 访问 http://www.apache.org/dyn/closer.cgi/lucene/solr , 在这个网址里选择一个路径 , 下载
solr 3.5 的版本
2 solr3.5 在本机解压缩以后 , 把 apache-solr-3.5.0\example\webapps 目录下的 solr.war
文件拷贝到 Tomcat 6.0 的webapps 目录下
3 在 Tomcat 6.0\webapps\solr 目录里 新建一个 文件夹 conf
4 把 solr3.5 本机解压缩文件夹 apache-solr-3.5.0\example 下的 multicore 文件夹 考本到
Tomcat 6.0\webapps\solr\conf 目录下
5 在 Tomcat 6.0\conf\Catalina\localhost 目录下新建一个 solr.xml 文件 , 里面的内容如下
<?xml version="1.0" encoding="UTF-8"?>
<Context
docBase="${catalina.home}/webapps/solr.war" debug="0" crossContext="true"
>
<!-- 这里配置的是 Solr 运行的 Home 目录 -->
<Environment name="solr/home" type="java.lang.String"
value="${catalina.home}/webapps/solr/conf/multicore" override="true" />
</Context>
6 访问你的 solr 项目 localhost:8080/solr 会显示出两个 core , solr 正常运行
7 配置分词 , 使用的是 mmseg4j 和 搜狗词库 ,
下载地址 : http://code.google.com/p/mmseg4j/ ,
http://code.google.com/p/mmseg4j/downloads/detail?name=data.zip&can=2&q
8 把本地下载的 mmseg4j 解压缩 , 把里面的mmseg4j-all-1.8.5.jar 文件 拷贝到 Tomcat
6.0\webapps\solr\WEB-INF\lib 目录下
9 在 Tomcat 6.0\webapps\solr 目录下新建一个 dic 文件夹 , 把 新下载的 词库 拷贝到 dic
目录下
10 在 \Tomcat 6.0\webapps\solr\conf\multicore\core0\conf\schema.xml 文件的
types 节点里 添加如下节点 :
<fieldtype name="textComplex" class="solr.TextField"
positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"
mode="complex" dicPath="E:/Program Files/Apache Software Foundation/Tomcat
6.0/webapps/solr/dic">
</tokenizer>
</analyzer>
</fieldtype>
<fieldtype
name="textMaxWord" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer
class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="maxword"
dicPath="E:/Program Files/Apache Software Foundation/Tomcat
6.0/webapps/solr/dic">
</tokenizer>
</analyzer>
</fieldtype>
<fieldtype
name="textSimple" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer
class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple"
dicPath="E:/Program Files/Apache Software Foundation/Tomcat
6.0/webapps/solr/dic">
</tokenizer>
</analyzer>
</fieldtype>
11 在 \Tomcat 6.0\webapps\solr\conf\multicore\core0\conf\schema.xml 文件的
fields 节点里 添加如下节点 :
<field name="simple" type="textSimple" indexed="true" stored="true"
multiValued="true" />
<field name="complex" type="textComplex"
indexed="true" stored="true" multiValued="true" />
<field name="text"
type="textMaxWord" indexed="true" stored="true" multiValued="true" />
12 因为 solr3.5 里有两个 core , 所以针对 core1 重复 10,11 两步
13 对分词进行测试 , 访问
http://localhost:8180/solr/core0/admin/analysis.jsp?highlight=on
13.1 Field[Name] 输入 : complex
13.2 Field Value(index) 输入 : 中国银行第一分行 , Field Value(index) 下面的
verbose outpu 点选
13.3 点击 Analyze 按钮 , 查看分词结果 : 中国银行 | 第一 | 分行
14 此时 Solr3.5 已经可以进行 分词 , 接下来配置 solr 3.5 连接 mysql 数据库 , 生成索引 , 进行分词
14.1 下载 java 的 mysql 驱动 , 本机解压 mysql-connector-java-5.1.18-bin.jar, 然后拷贝到
Tomcat 6.0\webapps\solr\WEB-INF\lib 目录下
14.2 在 \Tomcat 6.0\webapps\solr 目录下 新建 db 文件夹
14.3 在 \Tomcat 6.0\webapps\solr\db 文件夹下面新建一个 db-data-config.xml 文件 , 内容如下
:
<dataConfig>
<dataSource type="JdbcDataSource"
driver="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost:3306/test"
user="root" password="123" />
<document name="messages">
<entity name="message" transformer="ClobTransformer" query="select *
from test1">
<field column="ID" name="id" />
<field column="Val" name="text" />
</entity>
</document>
</dataConfig>
url="jdbc:mysql://localhost:3306/test" user="root" password="123" 这里配置了
mysql 的连接路径 , 用户名 , 密码
<field column="ID" name="id" /><field column="Val" name="text"
/> 这里配置的是 数据库里要索引的字段 , 注意name 是 11 步配置的
14.4 在 Tomcat 6.0\webapps\solr\conf\multicore\core0\conf 目录下的
solrconfig.xml 文件里 , 添加如下代码 :
<requestHandler name="/dataimport"
class="org.apache.solr.handler.dataimport.DataImportHandler">
<lst
name="defaults">
<str name="config">E:/Program Files/Apache
Software Foundation/Tomcat
6.0/webapps/solr/db/db-data-config.xml</str>
</lst>
</requestHandler>
“E:/Program Files/Apache Software Foundation/Tomcat
6.0/webapps/solr/db/db-data-config.xml” 是 14.3 配置文件的绝对路径
14.5 在Tomcat 6.0\webapps\solr\conf\multicore\core1\conf\solrconfig.xml
路径里重复 14.4
14.6 把本地下载解压的 solr3.5 文件里 , dist 目录下的
apache-solr-dataimporthandler-3.5.0.jar 和
apache-solr-dataimporthandler-extras-3.5.0.jar Tomcat
6.0\webapps\solr\WEB-INF\lib 目录下
14.7 solr3.5 连接 mysql 已经配置完成 , 测试读取 mysql 生成 索引 , 访问 :
http://localhost:8180/solr/core0/dataimport?command=full-import
14.8 测试分词查询 , 访问 http://localhost:8180/solr/core0/admin/
查询数据库里索引列里有的词
注意 , 这仅仅是配置 solr3.5 连接 mysql 生成索引 , 可以执行正常 词语 的查询 , 但是不能执行 对搜索短语的分词 查询
multicore 目录下面多个 core 文件夹 , 每一个都是一个接口 , 有独立的配置文件 , 处理某一类数据 。
multicore/core0/conf/ 目录下的 schema.xml 文件 相当于数据表配置文件 , 它定义了加入索引的数据的数据类型
。文件里有一个 <uniqueKey>id</uniqueKey> 的配置 , 这里将 id 字段作为索引文档的唯一标示符 , 非常重要
。
FieldType 类型 , name 是这个 FieldType 的名称 , class 指向了 org.apache.solr.analysis
包里面对应的 class 名称 , 用来定义这个类型的定义 。在 FieldType
定义的时候最重要的就是定义这个类型的数据在建立索引和进行查询的时候要使用的分析器analyzer,包括分词和过滤 。
Fields 字段 : 结点内定义具体的字段(类似数据库中的字段) , 就是 field , 包含 name ,
type(为之前定义过的各种FieldType) , indexed(是否被索引) , stored(是否被存储) ,
multiValued(是否有多个值)
copeField(赋值字段): 建立一个拷贝字段 , 将所有的全文字段复制到一个字段中 , 以便进行统一的检索 。
[转载文章:http://hi.baidu.com/duogemajia/blog/item/e222b1d0d57aec269a50275e.html]
分享到:
相关推荐
solr3.5开发教程solr3.5开发教程solr3.5开发教程solr3.5开发教程solr3.5开发教程
solr3.5配置及应用[借鉴].pdf
solr3.5与tomcat的部署配置步骤 文档中有截图说明
Solr3.5整合Tomcat的,在压缩包里面有一个readme,只需要修改三个地方就可以直接启动了。
solr 3.5 tomcat 整合可直接使用
初学者学习solr时,可以借助此文档入门,学习solr
Apache Solr 是一个开源的搜索服务器,Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache ...定制 Solr 索引的实现方法很简单,用 POST 方法向 Solr 服务器发送一个描述所有 Field 及其内容的 XML 文档就可以了。
solr3.5与tomcat的部署配置以及与java项目的集成 大部分步骤都有截图说明 一目了然
solr_3.5_配置及应用
基于Solr3.5的最新开发应用指导,文字加代码说明模式(Schedule.xml)、配置(solrconfig.xml)、索引,搜索等详细开发内容。
solr是最好的开源搜索引擎,3.5版本比较稳定。
solr 3.5 tomcat 整合可直接使用
solr4.4.0入门配置步骤 solr4.4手把手入门配置 solr4.4配置 solr4.4.0入门配置步骤 solr4.4手把手入门配置 solr4.4配置
Solr是一个独立的企业级应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的xml文件, 生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回...
solr 与 tomcat 集成的完整步骤
solr 安装与配置
在tomcat环境下搭建solr和mmseg4j搜索引擎 在tomcat环境下搭建solr和mmseg4j搜索引擎
Solr 3.5开发应用教程,偏实战
包涵apache-solr-core-3.5.0.jar和apache-solr-solrj-3.5.0.jar两个文件,搭建solr全文检索环境必须要添加的包
Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的...