search -- 9




聚合elasticsearch 通过 aggs 实现聚合功能聚合提供了分组统计的能力,类似于 SQL 的 GROUP BY 和 SQL 聚合在Elasticsearch中,你可以在一个响应中同时返回命中的数据和聚合结果 聚合查询 -- aggs下面的查询实现了按照州名的计数倒序排序:{ "size": 0, "aggs": { "group_by_state": { "terms": { "field": "state" } } } }  在 SQL 中,上面的聚合类似于:SELECT COUNT(*) from bank GROUP BY state ORDER BY COUNT(*) DESC  注:如果 size 不为 0,则查询的所有命中结果都会出现在查询结果中 分组查询下面的例子展示了按照年龄段分组(20-29,30-39,40-49),然后再用性别分组,然后为每一个年龄段的每一个性别计算出平均
#读书笔记    #技术帖    #龙潭书斋    #检索   
空搜索最基本的搜索就是空搜索,没有指定任何的查询条件,返回所有文档:GET /_search  响应内容为:{ "hits" : { "total" : 14, "hits" : [ { "_index": "us", "_type": "tweet", "_id": "7", "_score": 1, "_source": { "date": "2014-09-17", "name": "John Smith", "tweet": "The Query DSL is really powerful and flexible", "user_id": 2 } }, ... 9 RESULTS REMOVED ... ], "m
#技术帖    #龙潭书斋    #检索    #search   
分片为了能够查询数据,我们需要创建索引索引是指向一个或多个分片的逻辑命名空间一个分片是一个最小级别的工作单元,保存了数据的一部分,本身就是一个完整的搜索引擎,我们的程序通过索引与分片进行通信 复制分片复制分片是主分片的一个副本,用来防止数据丢失,只用来提供度请求,与 mysql 读写分离中的从库功能类似 分片的创建可以创建任意多个复制分片,且复制分片的数量可以随时调整,但主分片随着索引创建后,数量就是固定且不再可调整的了PUT /blogs { "settings" : { "number_of_shards" : 3, "number_of_replicas" : 1 } }  每个分片都可以存储任意多的数据 故障恢复由于复制分片中保存了主分片的全部数据,所以即使一个或多个主分片不再工作,只要至少还有一个主分片处于工作状态,整个集群就可以提供正常的数据服务然而,如果全部主分片都不再工作,复制分片无法处理写入请求,因此,整个集群将无法继续工作 var CODE_DIVS=[{"id":"editor_d","mode":"json"}];
#技术帖    #龙潭书斋    #search    #分布式   
集群一个节点是一个 Elasticsearch 实例,一个集群由一个或多个节点构成,他们具有相同的 cluster.name一个集群中的各节点协同工作,分项数据和负载 集群部署只要节点在同一网段下,设置一致的 cluster.name,启动的 Elasticsearch 即可互相检测到对方,组成集群 主节点选取集群中一个节点会被选举为主节点,主节点的职责是维护整个集群的状态,并且在节点加入或者离开集群时重新分片每次集群的状态改变会通知到集群中的其他节点(方式取决于discovery模块的具体实现)节点可以设置属性 node.master 为 false 来避免被选举为 master 节点,或者将节点设置为客户端节点(node.client 属性设置为 true)discovery.zen.minimum_master_nodes 用来设置一个集群中最少的合格 master 节点数,对于 2 个节点以上的集群,建议设置为大于 1 的值例如,如果有 5 个节点,discovery.zen.minimum_master_nodes 
#技术帖    #database    #技术分享    #集群   
概述上一篇日志中,我们对 elasticsearch 的检索做了最简单的介绍:Elasticsearch 文档的创建与查询本节我们进行更多的深入介绍 检索 ID 对应的一条数据通过请求:GET /megacorp/employee/1 可以获取到 index - type - ID 对应的唯一一条数据{ "_index" : "megacorp", "_type" : "employee", "_id" : "1", "_version" : 1, "found" : true, "_source" : { "first_name" : "John", "last_name" : "Smith", "age" : 25, "about" : "I love to go rock climbing", "int
#技术帖    #技术分享    #搜索引擎    #检索   

200x200


索引与数据抽象在 Elasticsearch 中存储数据被称为“索引”(indexing)在 Elasticsearch 中,文档归属于一种类型(type),而

#技术帖    #mysql    #database    #技术分享   
概述Elasticsearch 是一个实时分布式搜索引擎,可以以非常高的速度实现大数据处理一般用于全文搜索、结构化搜索与分析维基百科、英国卫报、stackoverflow、github 等多家大型企业都使用 Elasticsearch 作为大数据处理与实时分析的解决方案 安装及运行ubuntu 环境中 elasticsearch 的安装如果使用的是 ubuntu,那么可以执行:# 获取 elasticsearch 的公钥 wget -O - http://packages.elasticsearch.org/GPG-KEY-elasticsearch | sudo apt-key add - 然后执行:sudo echo "deb http://packages.elasticsearch.org/elasticsearch/1.1/debian stable main" >> /etc/apt/sources.list sudo apt-get update && sudo apt-get install elasticsearch  其他 linux 发行版的安装通过从官网上下载最新版的&
#技术帖    #database    #技术分享    #存储   
# # Minimal Sphinx configuration sample (clean, simple, functional) # source src_all { type = mysql sql_host = localhost sql_user = root sql_pass = zeyu2032 sql_db = zeyu_blog sql_port = 3306 # optional, default is 3306 sql_query = \ SELECT article_id, lower(draft) FROM article; sql_attr_uint = article_id } index all { source = src_all path = /usr/local/sphinx/var/data/zeyu_blog/all mlock = 0 morphology = none docinfo = extern min_word_len = 1 html_strip = 0 #stopwords = /path/to/stowords.txt的位置 charset_type = zh_cn.utf-8 ngram_len
#技术帖    #linux    #配置文件    #mysql   

200x200


二叉查找树 对于二叉树的任一节点,如果该节点的左子树都小于他,右子树都大于他,这棵树即被称为“二叉查找树”,又称“二叉排序树”因此,二叉查找树的中序遍历将产生一个由小到大的有序数列需要注意的

#读书笔记    #技术帖    #算法    #算法导论   



京ICP备15018585号