首页

Apache Solr的select的查询http接口相关参数语法说明

标签:solr,apache,语法,高亮     发布时间:2016-11-09   

通过solr接口http查询示例如下,点击预览效果

http://www.xwood.net/xwood-solr/subject/@b@select?q=title%3A%E8%A7%86%E9%A2%91+%7C%7C+keywords%3A%E8%A7%86%E9%A2%91+%7C%7C+zhaiyao%3A%E8%A7%86%E9%A2%91@b@&start=0&rows=50&fl=*%2Cscore&hl=true&hl.fl=title%2Ckeywords%2Czhaiyao&hl.simple.pre=%3Cfont+color%3D%22red%22%3E&hl.simple.post=%3C%2Ffont%3E&wt=xml&indent=true

参数说明:

1.   q : *:*  -  查询所有信息,如需根据指定字段进行查询,如用title,则格式“title:视频”,上面的例子是经过URLEncoder.encode中文转码后的(原来是 - title:视频 || keywords:视频 || zhaiyao:视频),如下

String qName = "title:"+TextEscaper.escape(kw)  + " || keywords:"+TextEscaper.escape(kw) + " || zhaiyao:"+TextEscaper.escape(kw);@b@...@b@URLEncoder.encode(queryName, "UTF-8")

2.   fq - (filter query)过虑查询,对q查询结果过滤筛选,如:q=title:小木人&fq=create_time:[20081001 TO 20091031],找关键字小木人,并且create_time是20081001

3.   fl - 指定返回那些字段内容,用逗号或空格分隔多个,如*,score(上面fl=*%2Cscore是经过URLEncoder.encode("*,score", "UTF-8")转码后的效果)

4.   start - 返回第一条记录所有匹配结果中偏移位置,0开始,需分页时用。

5.   rows - 页数(没页最大显示多少条记录,如上例的rows=50),配合start来实现分页。

6.   sort - 排序,格式:sort=<field name>+<desc|asc>[,<field name>+<desc|asc>]… 。示例:(score desc, price asc)表示先 “score” 降序, 再 “price” 升序,默认是相关性降序。

7.   wt - (writer type)指定输出格式,可以有 xml,json,php,phps ,如上例中的wt=xml

8.   q.op - 覆盖schema.xml的solrQueryParser属性的defaultOperator(有空格时用"AND"还是用"OR"操作逻辑),一般默认指定  “OR” ,如下所示

 ...@b@ <!-- SolrQueryParser configuration: defaultOperator="AND|OR" -->@b@ <solrQueryParser defaultOperator="OR"/>@b@</schema>

9.   hl -  是否高亮 ,如hl=true

10. hl.fl - 高亮field ,如上面是"hl.fl=title,keywords,zhaiyao"

11. hl.snippets - 默认是1,这里设置为3个片段

12. hl.simple.pre -  高亮前面的格式,如上hl.simple.pre=<font color="red">(%3Cfont+color%3D%22red%22%3E是经URLEncoder.encode转码)

13. hl.simple.post -  高亮后面的格式,如上hl.simple.post=</font>(%3C%2Ffont%3E是经URLEncoder.encode转码)

14. facet  - 是否启动统计

15. facet.field  -  统计field

16. indent - 返回的结果是否缩进,默认关闭,用 indent=true|on 开启,一般调试json,php,phps,ruby输出才有必要用这个参数。

运算符

1. “:” 指定字段查指定值,如返回所有值*:*

2. “?” 表示单个任意字符的通配

3. “*” 表示多个任意字符的通配(不能在检索的项开始使用*或者?符号)

4. “~” 表示模糊检索,如检索拼写类似于”roam”的项这样写:roam~将找到形如foam和roams的单词;roam~0.8,检索返回相似度在0.8以上的记录。

5.  邻近检索,如检索相隔10个单词的”apache”和”jakarta”,”jakarta apache”~10

6. “^” 控制相关度检索,如检索jakarta apache,同时希望去让”jakarta”的相关度更加好,那么在其后加上”^”符号和增量值,即jakarta^4 apache

7.   布尔操作符AND、||

8.   布尔操作符OR、&&

9.   布尔操作符NOT、!、- (排除操作符不能单独与项使用构成查询)

10. “+” 存在操作符,要求符号”+”后的项必须在文档相应的域中存在

11.  ( ) 用于构成子查询

12.  [] 包含范围检索,如检索某时间段记录,包含头尾,date:[200707 TO 200710]

13.  {} 不包含范围检索,如检索某时间段记录,不包含头尾date:{200707 TO 200710}

14.  / 转义操作符,特殊字符包括+ - && || ! ( ) { } [ ] ^ ” ~ * ? : /

 注:①“+”和”-“表示对单个查询单元的修饰,and 、or 、 not 是对两个查询单元是否做交集或者做差集还是取反的操作的符号
   比如:AB:china +AB:america ,表示的是AB:china忽略不计可有可无,必须满足第二个条件才是对的,而不是你所认为的必须满足这两个搜索条件
   如果输入:AB:china AND AB:america ,解析出来的结果是两个条件同时满足,即+AB:china AND +AB:america或+AB:china +AB:america
  总而言之,查询语法:  修饰符 字段名:查询关键词 AND/OR/NOT 修饰符 字段名:查询关键词