在 MongoDB 中使用查找运算符连接多个条件

Mehvish Ashiq 2023年1月30日
  1. 在 MongoDB 中使用 $lookup 运算符连接多个条件
  2. 创建新集合并使用 $group 聚合阶段加入多个条件
在 MongoDB 中使用查找运算符连接多个条件

今天,我们将了解如何在 MongoDB 中使用 $lookup 运算符连接多个条件。此外,我们还将探索一些示例来演示 $group 阶段和 $unionWidth 聚合阶段的使用。

在 MongoDB 中使用 $lookup 运算符连接多个条件

如果我们有 MongoDB 3.6 或更高版本,我们可以使用 $lookup 聚合 pipeline 运算符来连接多个条件。

为此,我们有两个名为 userssalaries 的集合。你也可以使用以下命令创建它。

创建集合的示例代码:

> db.createCollection('users')
> db.createCollection('salaries')

users 集合中插入文档的示例代码:

> db.users.insertMany(
    [
        {
            username: 'userone',
            age: 30,
            gender: 'Female',
            city: 'Lahore',
            country: 'Pakistan'
        },
        {
            username: 'usertwo',
            age: 35,
            gender: 'Male',
            city: 'Florida',
            country: 'United States'
        }
    ]
)

salaries 集合中插入文档的示例代码:

> db.salaries.insertMany(
    [
        {
            username: 'userone',
            salary: 3000
        },
        {
            username: 'usertwo',
            salary: 5000
        }
    ]
)

users 集合的显示数据:

> db.users.find().pretty()

输出:

{
        "_id" : ObjectId("628deb40c1e812eeeb311439"),
        "username" : "userone",
        "age" : 30,
        "gender" : "Female",
        "city" : "Lahore",
        "country" : "Pakistan"
}
{
        "_id" : ObjectId("628deb40c1e812eeeb31143a"),
        "username" : "usertwo",
        "age" : 35,
        "gender" : "Male",
        "city" : "Florida",
        "country" : "United States"
}

salaries 集合的显示数据:

> db.salaries.find().pretty()

输出:

{
        "_id" : ObjectId("628deb07c1e812eeeb311437"),
        "username" : "userone",
        "salary" : 3000
}
{
        "_id" : ObjectId("628deb07c1e812eeeb311438"),
        "username" : "usertwo",
        "salary" : 5000
}

创建集合并插入文档后,我们可以探索各种场景来加入多个条件。让我们从 $lookup 开始。

使用 $lookup 聚合 pipeline 运算符

示例代码:

> db.users.aggregate([
    {
        $lookup: {
            from: 'salaries',
            let: {
                user_name: '$username',
                user_salary: 3000
            },
            pipeline: [{
                $match: {
                    $expr: {
                        $and: [
                            { $eq: ['$username', '$$user_name'] },
                            { $gte: ['$salary','$$user_salary'] }
                        ]
                    }
                }
           }],
           as: 'usersalary'
        }
    }
]).pretty()

输出:

{
        "_id" : ObjectId("628deb40c1e812eeeb311439"),
        "username" : "userone",
        "age" : 30,
        "gender" : "Female",
        "city" : "Lahore",
        "country" : "Pakistan",
        "usersalary" : [
                {
                        "_id" : ObjectId("628deb07c1e812eeeb311437"),
                        "username" : "userone",
                        "salary" : 3000
                }
        ]
}
{
        "_id" : ObjectId("628deb40c1e812eeeb31143a"),
        "username" : "usertwo",
        "age" : 35,
        "gender" : "Male",
        "city" : "Florida",
        "country" : "United States",
        "usersalary" : [
                {
                        "_id" : ObjectId("628deb07c1e812eeeb311438"),
                        "username" : "usertwo",
                        "salary" : 5000
                }
        ]
}

在这里,我们得到满足两个条件的文档。

  1. username 字段在 userssalaries 集合中是相同的。
  2. salary 字段的值大于等于 3000

我们只得到满足这两个条件的文件。你可能已经注意到 usersalary 是一个元素数组,其中每个元素都是 salaries 集合的文档。

我们可以使用 $unwind$addFields$project 从两个集合(userssalaries)中获取特定字段并形成一个文档,如下例所示。

示例代码:

> db.users.aggregate([
    {
        $lookup: {
            from: 'salaries',
            let: {
                user_name: '$username',
                user_salary: 3000
            },
            pipeline: [{
                $match: {
                    $expr: {
                        $and: [
                            { $eq: ['$username', '$$user_name'] },
                            { $gte: ['$salary','$$user_salary'] }
                        ]
                    }
                }
           }],
           as: 'usersalary'
        }
    },
    {
        $unwind:'$usersalary'
    },
    {
        $addFields: {
            salary: '$usersalary.salary'
        }
    },
    {
       $project: {
           username: 1,
           salary: 1
       }
    }
]).pretty()

输出:

{
        "_id" : ObjectId("628deb40c1e812eeeb311439"),
        "username" : "userone",
        "salary" : 3000
}
{
        "_id" : ObjectId("628deb40c1e812eeeb31143a"),
        "username" : "usertwo",
        "salary" : 5000
}

使用 $unwind 运算符的目的是为每个具有相同名称的元素解构一个数组字段,从输入文档到输出一个文档。

如果数组中只有一个元素,则 $unwind 阶段运算符将对象展平,即元素本身。 $addFields 将对象或数组中的 salary 字段连接到文档的根级别。

在了解上面给出的示例中的用法之前,让我们先关注使用 $project 过滤器阶段的原因。如果我们不使用 $project,我们将获得文档根级别的 salary 字段和 usersalary 对象,这是不必要的。

这是我们使用 $project 过滤阶段并指定输出中应包含哪些字段的地方。

如果项目要求限制使用 $unwind$addFields$project,我们可以使用下面给出的替代解决方案。

示例代码:

> db.users.aggregate([
    {
        $lookup: {
            from: 'salaries',
            let: {
                user_name: '$username',
                user_salary: 3000
            },
            pipeline: [{
                $match: {
                    $expr: {
                        $and: [
                            { $eq: ['$username', '$$user_name'] },
                            { $gte: ['$salary','$$user_salary'] }
                        ]
                    }
                }
           }],
           as: 'usersalary'
        }
    },
       {
          $replaceRoot: {
             newRoot: {
                $mergeObjects:[
                   {
                      $arrayElemAt: [
                         "$usersalary", 0
                      ]
                   },
                   {
                      salary: "$$ROOT.salary"
                   }
                ]
             }
          }
       }
    ]
).pretty()

输出:

{
        "_id" : ObjectId("628deb07c1e812eeeb311437"),
        "username" : "userone",
        "salary" : 3000
}
{
        "_id" : ObjectId("628deb07c1e812eeeb311438"),
        "username" : "usertwo",
        "salary" : 5000
}

我们使用 let 字段(可选)将字段的值分配给变量。我们在 pipeline 阶段访问这些变量,我们指定 pipeline 在不同的集合上执行。

请注意,我们还使用 $match 阶段来利用名为 $expr 的评估查询运算符,它比较字段的值。

此外,$replaceRootpipeline 中的最后一个聚合 pipeline 阶段,我们使用 $mergeObjects 运算符将 $lookup 输出与 $$ROOT 文档的部分合并。

我们只使用了 $and 运算符来连接条件。你也可以使用 $or 或两个运算符。

创建新集合并使用 $group 聚合阶段加入多个条件

示例代码:

> db.users_salaries.insertMany(
    db.users.find({}, {"_id": 0})
    .toArray()
    .concat(db.salaries.find({}, {"_id": 0}).toArray())
)

db.users_salaries.aggregate([
    { "$group": {
        "_id": { "username": "$username" },
        "salary": { "$push": "$salary" }
    }}
])

输出:

{ "_id" : { "username" : "userone" }, "salary" : [ 3000 ] }
{ "_id" : { "username" : "usertwo" }, "salary" : [ 5000 ] }

对于这个代码示例,我们创建一个名为 users_salaries 的新集合,合并两个名为 userssalaries 的集合,然后将这些文档插入到新创建的集合中。然后,按用户名分组以获得所需的输出。

我们也可以在不创建新集合的情况下获得相同的输出(如上所示)。为此,我们使用 $unionWith 聚合阶段,它为两个集合执行联合。

示例代码:

> db.users.aggregate([
  { $set: { username: "$username" } },
  { $unionWith: {
    coll: "salaries",
    pipeline: [{ $set: { salary: "$salary" } }]
  }},
  { $group: {
    _id: { username: "$username"},
     "salary": { "$push": "$salary" }
  }}
])

输出:

{ "_id" : { "username" : "userone" }, "salary" : [ 3000 ] }
{ "_id" : { "username" : "usertwo" }, "salary" : [ 5000 ] }
作者: Mehvish Ashiq
Mehvish Ashiq avatar Mehvish Ashiq avatar

Mehvish Ashiq is a former Java Programmer and a Data Science enthusiast who leverages her expertise to help others to learn and grow by creating interesting, useful, and reader-friendly content in Computer Programming, Data Science, and Technology.

LinkedIn GitHub Facebook

相关文章 - MongoDB Operator