苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

分布式系统框架(V1.3) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper万能框架(V2.3-含.netcore) HttpHelper官方出品,无敌框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 最牛的爬虫类,没有爬不到只有想不到 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 435|回复: 2

[搜索引擎] 65-Elasticsearch祖辈与孙辈关系

[复制链接]
发表于 2019-1-13 15:44:11 | 显示全部楼层 |阅读模式
祖辈与孙辈关系

父子关系可以延展到更多代关系,比如生活中孙辈与祖辈的关系 — 唯一的要求是满足这些关系的文档必须在同一个分片上被索引。

让我们把上一个例子中的 country 类型设定为 branch 类型的父辈:
[C#] 纯文本查看 复制代码
PUT /company

{

  "mappings": {

    "country": {},

    "branch": {

      "_parent": {

        "type": "country" 

      }

    },

    "employee": {

      "_parent": {

        "type": "branch" 

      }

    }

  }

}



  • branch 是 country 的子辈。
  • employee 是 branch 的子辈。


country 和 branch 之间是一层简单的父子关系,所以我们的 操作步骤 与之前保持一致:

[C#] 纯文本查看 复制代码
POST /company/country/_bulk

{ "index": { "_id": "uk" }}

{ "name": "UK" }

{ "index": { "_id": "france" }}

{ "name": "France" }



POST /company/branch/_bulk

{ "index": { "_id": "london", "parent": "uk" }}

{ "name": "London Westmintster" }

{ "index": { "_id": "liverpool", "parent": "uk" }}

{ "name": "Liverpool Central" }

{ "index": { "_id": "paris", "parent": "france" }}

{ "name": "Champs élysées" }

parent ID 使得每一个 branch 文档被路由到与其父文档 country 相同的分片上进行操作。然而,当我们使用相同的方法来操作 employee 这个孙辈文档时,会发生什么呢?
[C#] 纯文本查看 复制代码
PUT /company/employee/1?parent=london

{

  "name":  "Alice Smith",

  "dob":   "1970-10-24",

  "hobby": "hiking"

}

employee 文档的路由依赖其父文档 ID — 也就是 london — 但是 london 文档的路由却依赖 其本身的 父文档 ID — 也就是 uk 。此种情况下,孙辈文档很有可能最终和父辈、祖辈文档不在同一分片上,导致不满足祖辈和孙辈文档必须在同一个分片上被索引的要求。

解决方案是添加一个额外的 routing 参数,将其设置为祖辈的文档 ID ,以此来保证三代文档路由到同一个分片上。索引请求如下所示:

[C#] 纯文本查看 复制代码
PUT /company/employee/1?parent=london&routing=uk 

{

  "name":  "Alice Smith",

  "dob":   "1970-10-24",

  "hobby": "hiking"

}



  • routing 的值会取代 parent 的值作为路由选择。


parent 参数的值仍然可以标识 employee 文档与其父文档的关系,但是 routing 参数保证该文档被存储到其父辈和祖辈的分片上。routing 值在所有的文档请求中都要添加。

联合多代文档进行查询和聚合是可行的,只需要一代代的进行设定即可。例如,我们要找到哪些国家的雇员喜欢远足旅行,此时只需要联合 country 和 branch,以及 branch 和 employee:
[C#] 纯文本查看 复制代码
GET /company/country/_search

{

  "query": {

    "has_child": {

      "type": "branch",

      "query": {

        "has_child": {

          "type": "employee",

          "query": {

            "match": {

              "hobby": "hiking"

            }

          }

        }

      }

    }

  }

}


发表于 2019-1-13 16:23:28 | 显示全部楼层
发表于 2019-1-13 17:58:14 | 显示全部楼层
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备17001017号-1)

GMT+8, 2019-8-26 15:05

© 2017-2018

快速回复 返回顶部 返回列表