在 MongoDB 的查询操作中使用管道

Mehvish Ashiq 2024年2月15日
  1. 什么是聚合管道
  2. 什么是 MongoDB 中的 $lookup 运算符
  3. $lookup 运算符中使用管道连接 MongoDB 中的条件
在 MongoDB 的查询操作中使用管道

本教程教授如何在 MongoDB 的 lookup 运算符中使用管道。在继续之前,必须对聚合管道和 $lookup 运算符有足够的了解,以便在使用 MongoDB 时了解 $lookup 运算符中管道的使用。

如果你已经了解这些概念,则可以快速转到本教程的最后两个代码示例。

什么是聚合管道

它是收集数据并返回计算结果的过程。这个过程从不同的文档中收集数据,按照指定的条件对它们进行分组,并对分组后的数据进行各种操作。

例如,平均值、总和、最大值和最小值。它就像 SQL 聚合函数一样。

在 MongoDB 中,我们可以通过以下三种方式使用聚合。

  1. 聚合管道 - 包含转换所提供文档的各个阶段。每个阶段都接受一组文档并生成另一组结果文档,这些文档进一步传递到下一个阶段,这个过程一直持续到最后阶段。

  2. Map-reduce 功能 - 我们使用此功能来大规模聚合结果。它有两个功能,mapreduce

    map 方法对所有文档进行分组,而 reduce 方法对分组数据执行操作。

  3. 单一用途的聚合——用于执行聚合任务的最简单的聚合形式,但与聚合管道方法相比缺乏一些特性。我们使用这种类型的聚合来执行特定文档中的任务,例如,计算特定文档中的不同值。

你还可以阅读 this 以更深入地了解聚合管道。

什么是 MongoDB 中的 $lookup 运算符

此运算符用于执行左外连接以将数据从一个文档合并到同一数据库中的另一个文档。它从连接的集合中过滤文档以进行进一步处理。

我们还可以使用此运算符向现有文档添加额外字段。

$lookup 运算符添加了一个新的数组属性(字段),其值(元素)与连接集合中的文档匹配。然后将这些转换后的文档传递到下一阶段。

$lookup 运算符具有三种不同的语法,我们可以根据项目要求使用。本教程使用 $lookup 语法来表示 Join conditions & Subqueries on the Joined Collection

为了练习示例代码,让我们用数据准备示例集合。

示例代码:

db.createCollection('collection1');
db.createCollection('collection2');

db.collection1.insertMany([
    {"shopId": "001", "shopPosId": "001", "description": "description for 001"},
    {"shopId": "002", "description": "description for 002"},
    {"shopId": "003", "shopPosId": "003", "description": "description for 003"},
    {"shopId": "004", "description": "description for 004"}
]);

db.collection2.insertMany([
    {"shopId": "001", "shopPosId": "0078", "clientUid": "474192"},
    {"shopId": "002", "shopPosId": "0012", "clientUid": "474193"},
    {"shopId": "003", "shopPosId": "0034", "clientUid": "474194"},
    {"shopId": "004", "shopPosId": "0056", "clientUid": "474195"}
]);

现在,我们可以执行以下命令来查看每个集合中插入的文档。

db.collection1.find();
db.collection2.find();

$lookup 运算符中使用管道连接 MongoDB 中的条件

要了解如何在 $lookup 运算符中使用管道,让我们连接两个集合中的文档,其中 collection1.shopId 等于 collection2.shopId,而 collection1 不包含 shopPosId 字段.

只有满足这两个条件的两个集合才会连接那些文档。请参阅下面给出的示例代码。

示例代码:

db.collection2.aggregate([
    {
        "$lookup": {
        "from": "collection1",
        "let": { "shopId": "$shopId" },
        "pipeline": [{
            "$match": {
                "$and": [
                    {"$expr": {"$eq": ['$shopId', '$$shopId'] }},
                    { "shopPosId": { "$exists": false } }
                ]
            }
         }],
         "as": "shopDescription"
        }
    }
]).pretty();

输出:

在 mongodb 的查找运算符中使用管道 - 输出 1

你是否仔细观察了上面给出的输出?只有那些文档从满足管道中两个条件的两个集合中加入(collection1.shopId 等于 collection2.shopId,并且 collection1 不包含 shopPosId 字段)。

此外,那些不符合这些条件的文档有一个名为 shopDescription 的空数组(参见上面结果中的红色框)。我们只能显示那些包含非空 shopDescription 数组的结果文档(请参阅以下查询)。

示例代码:

db.collection2.aggregate([
    {
        "$lookup": {
        "from": "collection1",
        "let": { "shopId": "$shopId" },
        "pipeline": [{
            "$match": {
                "$and": [
                    {"$expr": {"$eq": ['$shopId', '$$shopId'] }},
                    { "shopPosId": { "$exists": false } }
                ]
            }
         }],
         "as": "shopDescription"
        }
    },
    {
        "$match":{
            "shopDescription": { $exists: true, $not: {$size: 0} }
         }
    }
]).pretty();

输出:

在 mongodb 的查找运算符中使用管道 - output2

作者: Mehvish Ashiq
Mehvish Ashiq avatar Mehvish Ashiq avatar

Mehvish Ashiq is a former Java Programmer and a Data Science enthusiast who leverages her expertise to help others to learn and grow by creating interesting, useful, and reader-friendly content in Computer Programming, Data Science, and Technology.

LinkedIn GitHub Facebook