当前位置:首页 > 开发 > 行业应用 > 正文

ElasticSearch 如何搜索

发表于: 2014-11-02   作者:aoyouzi   来源:转载   浏览次数:
摘要: ES不仅仅存储文档,还索引内容以便可搜索。   每个域都被索引,可以查询,不光这些, 在一个查询里,es可以使用所有的索引,以惊人的速度返回结果。   一个搜索可以: 1 )搜索具体字段,比如性别或者年龄,按照加入日期排序,跟sql一样。 2 )一个全文搜索,可以找到所有的匹配文档,按照相关性返回。 3 )两者结合。 你需
ES不仅仅存储文档,还索引内容以便可搜索。
 
每个域都被索引,可以查询,不光这些,
在一个查询里,es可以使用所有的索引,以惊人的速度返回结果。
 
一个搜索可以:
1 )搜索具体字段,比如性别或者年龄,按照加入日期排序,跟sql一样。
2 )一个全文搜索,可以找到所有的匹配文档,按照相关性返回。
3 )两者结合。
你需要了解三个主题:
1 )Mapping   数据的每个域如何解释
2 )Analysis  全文是如何处理以便搜索
3 )Query SDL 弹性的,强大的查询语言
 
 
 
1 最基本的搜索形式是空搜索,没有任何限制,仅仅是简单返回集群里的所有索引的所有文档。
 
GET /_search
响应的格式如下:
{
    "hits" : {
       "total" :       14 ,
       "hits" : [
         {
           "_index" :   "us" ,
           "_type" :    "tweet" ,
           "_id" :      "7" ,
           "_score" :   1 ,
           "_source" : {
              "date" :    "2014-09-17" ,
              "name" :    "John Smith" ,
              "tweet" :   "The Query DSL is really powerful and flexible" ,
              "user_id" : 2
           }
        },
         ... 9 RESULTS REMOVED ...
       ],
       "max_score" :   1
    },
    "took" :           4 ,
    "_shards" : {
       "failed" :      0 ,
       "successful" 10 ,
       "total" :       10
    },
    "timed_out" :      false
}
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
hits
最重要的就是hits,包含符合条件的文档总数。包含前 10 个,也就是只返回前面 10 个。
 
每个结果包含_index,_type,_id.还有_source字段。
这意味着整个文档立即可用。
不像其它搜索引擎只返回文档ID,需要你再次去拿到文档。
 
 
每个文档还包含有一个_score, 这个是相关性score,
 
默认情况下,总是返回相关度更高的文档,也就是说,按照_score逆序排列。
 
在这种情况下,我们不指定任何查询条件,所以所有的文档都是相关的,
max_score是最高分数。
 
 
took
这个字段告诉我们整个搜索花费了多少毫秒。
 
shards
这个字段告诉我们,此次查询涉及的分片的总数
多少成功,多少失败,
我们在正常条件下不期望分片失败,但是它还是可能发生的,
如果我们丢失了主分片和从分片,搜索就不会成功。
 
 
在这种条件下,es会报告说分片失败了,但是仍然从剩下的分片里搜索。
 
timeout
这个字段告诉我们查询是否超时,默认,搜索不会超时,
如果超时时间很重要,你可以指定超时时间,
 
GET /_search?timeout= 10 ms
这样es就会返回给 在超时时间之内搜到的文档。
http://my.oschina.net/qiangzigege/blog/264560
 
 
 
 
 
 
 
 
 
你是否意识到空搜索的结果包含不同的types,比如user,tweet,来自于两个不同的索引。
 
由于没有限制搜索特定的索引或者类型,我们搜索了集群里的所有文档,
 
ES并发的将搜索请求转发给每个分片的主分片或者是从分片,搜集结果,返回前10给客户。
 
 
通常,你将想在一个或者多个索引里搜索,或者一个或多个types里搜索,
我们可以在URL里指定这个。
 
/_search
搜索所有索引的所有类型
 
 
/gb/_search
搜索特定索引的所有类型
 
/gb,us/_search
搜索2个索引的所有类型
 
/g*,u*/_search
不用解释了吧
 
/gb/user/_search
搜索特定索引,特定类型的所有文档。
 
/gb,us/user,tweet/_search
不用解释了吧
 
/_all/user,tweet/_search
搜索所有索引的两个类型的所有文档。
 
当你在单个索引里搜索文档,es将搜索请求转发给索引里的每个分片的主分片或者从分片,
从每个分片里搜集结果,从多个索引里搜索是一样的。
 
理解下:一个索引,有5个主分片,在它里面搜索
完全等同于搜索5个索引,每个索引只有一个主分片。
这都不是事儿!http://my.oschina.net/qiangzigege/blog/264572
 
 
 
 
 
有14个文档,然后我们只返回了10个,剩下的怎么办?
sql使用limit关键字来指定页,es也是如此。
 
size
返回多少结果,默认10.
 
from
偏移量,默认0.
 
如果你想每页显示5个,如下:
GET /_search? size =5
GET /_search? size =5& from =5
GET /_search? size =5& from =10
 
注意到,搜索结果在返回前会被先存储起来,
记住,一个搜索通常涉及到多个分片,每个分片有自己的搜索排序结果,
然后集中起来再进行总的排序。
http://my.oschina.net/qiangzigege/blog/264584
 
 
 
 
 
 
 
 
 
 

ElasticSearch 如何搜索

  • 0

    开心

    开心

  • 0

    板砖

    板砖

  • 0

    感动

    感动

  • 0

    有用

    有用

  • 0

    疑问

    疑问

  • 0

    难过

    难过

  • 0

    无聊

    无聊

  • 0

    震惊

    震惊

编辑推荐
es如何知道哪个分片应该存储这个文档? <code class="c
oyhk 学习笔记... 1.首先下载elasticsearch 0.20.2 版...我暂时是用这个版本http://www.elasticsear
1.首先下载elasticsearch 0.20.2 版...我暂时是用这个版本 http://www.elasticsearch.org/download/
1.首先下载elasticsearch 0.20.2 版...我暂时是用这个版本 http://www.elasticsearch.org/download/
基本情况就是,媒体、试题、分类,媒体可能有多个试题,一个试题可能有多个分类,分类为三级分类加
单机安装 安装我就以自己的项目为主我自己本身就是一下小项目从部署向下 安装步骤: 1. 安装jdk或者
bigdesk是elasticsearch的一个集群监控工具,可以通过它来查看es集群的各种状态,如:cpu、内存使用
 1.下载ElasticSearch   a.下载Java环境JDK:http://www.oracle.com/technetwork/java/javase/do
标签: elasticsearch elasticsearch 搜索 原文地址: http://www.elasticsearch.org/blog/using-el
elasticsearch简称ES jest 好吧下面我介绍下jest(第三方工具),个人认为还是非常不错的...想对ES用来
版权所有 IT知识库 CopyRight © 2009-2015 IT知识库 IT610.com , All Rights Reserved. 京ICP备09083238号