elasticsearch-DSL高级查询语法整理

DSL语句查询

查询字符串搜索便于通过命令行完成特定(ad hoc)的搜索,但是它也有局限性(参阅简单搜索章节)。Elasticsearch提供丰富且灵活的查询语言叫做DSL查询(Query DSL),它允许你构建更加复杂、强大的查询。
DSL(Domain Specific Language特定领域语言)以JSON请求体的形式出现

一、query context

主要特点:

  • 是否包含

确定文档是否应该成为结果的一部分

  • 相关度得分多少

除了确定文档是否匹配外,查询子句还计算了表示文档与其他文档相比匹配程度的_score

  • 得分越高,相关度越高

更相关的文件,在搜索排名更高

应用场景:

  • 全文检索——这种相关性的概念非常适合全文搜索,因为很少有完全“正确”的答案

文本查询语法:

match-模糊匹配:如 搜索"四大名著" 会查出包含 "四大" OR "名著" OR "四大名著"的记录

GET /megacorp/employee/_search
{
   "query" : {
       "match" : {
           "last_name" : "四大名著"
       }
   }
}

match_phrase-短语匹配:如 搜索"四大名著" 不会查出包含 "四大" OR "名著" 只会查出包含 "四大名著"的记录

GET /megacorp/employee/_search
{
   "query" : {
       "match_phrase" : {
           "last_name" : "四大名著"
       }
   }
}

multi_match-多字段匹配:如 搜索"孙悟空" 只要first_name或者about字段中包含 "孙悟空" OR "孙"等分词都会被查找出来;

GET /megacorp/employee/_search
{
     "query": {
          "multi_match": {
               "query": "孙悟空",
               "fields":["first_name","about"]
          }
     }
}

query_string-lucene查询语法查询(kibana查询语法)

GET /megacorp/employee/_search
{
     "query": {
          "query_string": {
               "query": "孙悟空 OR 张三"
          }
     }
}

query_string-多字段

GET /megacorp/employee/_search
{
     "query": {
          "query_string": {
                "fields":["about","last_name"],
               "query": "孙悟空 OR 张三"
          }
     }
}

高亮搜索

GET /megacorp/employee/_search
{
   "query" : {
       "match_phrase" : {
           "about" : "西游记"
       }
   },
   "highlight": {
       "fields" : {
           "about" : {}
       }
   }
}

结构查询语法:

term-将按照存储在倒排索引中的确切字词进行操作,这些查询通常用于数字,日期和枚举等结构化数据,而不是全文本字段。 或者,它们允许您制作低级查询,并在分析过程之前进行

GET /megacorp/employee/_search
{
     "query": {
          "term": {
                "age":"33"
          }
     }
}

range范围查询-如查询age大于等于20小于等于30的记录

GET /megacorp/employee/_search
{
     "query": {
          "range": {
                "age":{
                    "gte":20,
                    "lte":30
                }
          }
     }
}

二、fiter context

主要特点:

  • 是否包含

确定是否包含在检索结果中,回答只有“是”或“否”,精确搜索

  • 不涉及评分

在搜索中没有额外的相关度排名

  • 针对结构化数据

适用于完全精确匹配,范围检索

  • 更快

只确定是否包括结果中,不需要考虑得分。
为什么会更快?——经常使用的过滤器将被Elasticsearch自动缓存,以提高性能。

查询语法:

bool关键字

GET /megacorp/employee/_search
{
     "query": {
          "bool": {
                "filter":{
                    "term":{
                        "age":33
                    }
                }
          }
     }
}

复合查询

constant_score-将查询内部的结果文档得分都设定为1或者boost的值,多用于结合bool查询实现自定义得分

GET /megacorp/employee/_search
{
     "query": {
          "constant_score": {
                "filter":{
                    "match":{
                        "about":"张三"
                    }
                }
          }
     }
}

自定义分数

GET /megacorp/employee/_search
{
     "query": {
          "constant_score": {
                "filter":{
                    "match":{
                        "about":"张三"
                    }
                }
          },
          "boots":2
     }
}

should-至少满足一个条件

GET /megacorp/employee/_search
{
    "query": {
        "bool": {
            "should": [
                {
                    "match": {
                        "first_name": "孙悟空"
                    }
                },
                {
                    "match": {
                        "last_name": "张三"
                    }
                }
            ]
        }
    }
}

must-必须同时满足所有条件

GET /megacorp/employee/_search
{
    "query": {
        "bool": {
            "must": [
                {
                    "match": {
                        "first_name": "孙悟空"
                    }
                },
                {
                    "match": {
                        "about": "四大名著"
                    }
                }
            ]
        }
    }
}

must_not-必须不满足条件 如:查不等于33岁的记录

GET /megacorp/employee/_search
{
    "query": {
        "bool": {
            "must_not": 
                {
                    "term": {
                        "age": "33"
                    }
                }
        }
    }
}

组合查询

GET /megacorp/employee/_search 
{
    "query": {
        "bool": {
            "must": [
                {
                    "match": {
                        "first_name": "孙悟空"
                    }
                },
                {
                    "match": {
                        "about": "四大名著"
                    }
                }
            ],
            "filter":{
                "term":{
                    "age":35
                }
            }
        }
    }
}

聚合查询GROUP BY

//根据年龄字段分组
GET /megacorp/employee/_search
{
 "aggs": {
   "group_by_age": {
     "terms": { "field": "age" }
   }
 }
}

//根据条件分组
GET /megacorp/employee/_search
{
 "query": {
   "match": {
     "last_name": "孙悟空"
   }
 },
 "aggs": {
   "group_by_age": {
     "terms": { "field": "age" }
   }
 }
}

//分组并求平均值
GET /megacorp/employee/_search
{
 "aggs": {
   "group_by_age": {
     "terms": { "field": "age" },
     "aggs" : {
               "avg_age" : {
                   "avg" : { "field" : "age" }
               }
           }
   }
 }
}

你可能感兴趣的