Apache Solr的select的查询http接口相关参数语法说明

标签:solr,apache,语法,高亮发布时间:2016-11-09

通过solr接口http查询示例如下,点击预览效果

http://www.xwood.net/xwood-solr/subject/@b@select?q=title%3A%E8%A7%86%E9%A2%91+%7C%7C+keywords%3A%E8%A7%86%E9%A2%91+%7C%7C+zhaiyao%3A%E8%A7%86%E9%A2%91@b@&start=0&rows=50&fl=*%2Cscore&hl=true&hl.fl=title%2Ckeywords%2Czhaiyao&hl.simple.pre=%3Cfont+color%3D%22red%22%3E&hl.simple.post=%3C%2Ffont%3E&wt=xml&indent=true

参数说明：

1. q : *:* - 查询所有信息，如需根据指定字段进行查询，如用title，则格式“title:视频”，上面的例子是经过URLEncoder.encode中文转码后的（原来是 - title:视频 || keywords:视频 || zhaiyao:视频），如下

String qName = "title:"+TextEscaper.escape(kw)  + " || keywords:"+TextEscaper.escape(kw) + " || zhaiyao:"+TextEscaper.escape(kw);@b@...@b@URLEncoder.encode(queryName, "UTF-8")

2. fq - （filter query）过虑查询，对q查询结果过滤筛选，如：q=title:小木人&fq=create_time:[20081001 TO 20091031],找关键字小木人，并且create_time是20081001

3. fl - 指定返回那些字段内容，用逗号或空格分隔多个,如*,score（上面fl=*%2Cscore是经过URLEncoder.encode("*,score", "UTF-8")转码后的效果）

4. start - 返回第一条记录所有匹配结果中偏移位置，0开始，需分页时用。

5. rows - 页数（没页最大显示多少条记录，如上例的rows=50），配合start来实现分页。

6. sort - 排序，格式：sort=<field name>+<desc|asc>[,<field name>+<desc|asc>]… 。示例：（score desc, price asc）表示先 “score” 降序, 再 “price” 升序，默认是相关性降序。

7. wt - (writer type)指定输出格式，可以有 xml,json,php,phps ,如上例中的wt=xml

8. q.op - 覆盖schema.xml的solrQueryParser属性的defaultOperator（有空格时用"AND"还是用"OR"操作逻辑），一般默认指定 “OR” ,如下所示

 ...@b@ <!-- SolrQueryParser configuration: defaultOperator="AND|OR" -->@b@ <solrQueryParser defaultOperator="OR"/>@b@</schema>

9. hl - 是否高亮 ,如hl=true

10. hl.fl - 高亮field ,如上面是"hl.fl=title,keywords,zhaiyao"

11. hl.snippets - 默认是1,这里设置为3个片段

12. hl.simple.pre - 高亮前面的格式,如上hl.simple.pre=<font color="red">（%3Cfont+color%3D%22red%22%3E是经URLEncoder.encode转码）

13. hl.simple.post - 高亮后面的格式,如上hl.simple.post=</font>（%3C%2Ffont%3E是经URLEncoder.encode转码）

14. facet - 是否启动统计

15. facet.field - 统计field

16. indent - 返回的结果是否缩进，默认关闭，用 indent=true|on 开启，一般调试json,php,phps,ruby输出才有必要用这个参数。

运算符

1. “:” 指定字段查指定值，如返回所有值*:*

2. “?” 表示单个任意字符的通配

3. “*” 表示多个任意字符的通配（不能在检索的项开始使用*或者?符号）

4. “~” 表示模糊检索，如检索拼写类似于”roam”的项这样写：roam~将找到形如foam和roams的单词；roam~0.8，检索返回相似度在0.8以上的记录。

5. 邻近检索，如检索相隔10个单词的”apache”和”jakarta”，”jakarta apache”~10

6. “^” 控制相关度检索，如检索jakarta apache，同时希望去让”jakarta”的相关度更加好，那么在其后加上”^”符号和增量值，即jakarta^4 apache

7. 布尔操作符AND、||

8. 布尔操作符OR、&&

9. 布尔操作符NOT、!、- （排除操作符不能单独与项使用构成查询）

10. “+” 存在操作符，要求符号”+”后的项必须在文档相应的域中存在

11. ( ) 用于构成子查询

12. [] 包含范围检索，如检索某时间段记录，包含头尾，date:[200707 TO 200710]

13. {} 不包含范围检索，如检索某时间段记录，不包含头尾date:{200707 TO 200710}

14. / 转义操作符，特殊字符包括+ - && || ! ( ) { } [ ] ^ ” ~ * ? : /

注：①“+”和”-“表示对单个查询单元的修饰，and 、or 、 not 是对两个查询单元是否做交集或者做差集还是取反的操作的符号
　　比如:AB:china +AB:america ,表示的是AB:china忽略不计可有可无，必须满足第二个条件才是对的,而不是你所认为的必须满足这两个搜索条件
　　如果输入:AB:china AND AB:america ,解析出来的结果是两个条件同时满足，即+AB:china AND +AB:america或+AB:china +AB:america
　　总而言之，查询语法：修饰符字段名:查询关键词 AND/OR/NOT 修饰符字段名:查询关键词

>上一篇: 安装opensns成功后访问后台报“Call to undefined function Vendorcurl_init()...”错误 >下一篇: 因缺commons-pool.jar包报出"java.lang.NoClassDefFoundError: org/apache/commons/pool/impl/GenericObjectPool$Config"

<<热门下载>>