离线下载
PDF版 ePub版

极客学院团队出品 · 更新于 2018-11-17 12:00:37

正则表达式

正则表达式在所有语言当中都是经常会用到的一个功能,可以用来搜索模式或字符串中的单词。MongoDB 也提供了这一功能,使用 $regex 运算符来匹配字符串模式。MongoDB 使用 PCRE(可兼容 Perl 的正则表达式)作为正则表达式语言。

与文本搜索不同,使用正则表达式不需要使用任何配置或命令。

假如 posts 集合有下面这个文档,它包含着帖子文本及其标签。

{
   "post_text": "enjoy the mongodb articles on tutorialspoint",
   "tags": [
      "mongodb",
      "tutorialspoint"
   ]
}

使用正则表达式

使用下列正则表达式来搜索包含 tutorialspoint 的所有帖子。

>db.posts.find({post_text:{$regex:"tutorialspoint"}})

同样的查询也可以写作下列形式:

>db.posts.find({post_text:/tutorialspoint/})

使用不区分大小写的正则表达式

要想使搜索不区分大小写,使用 $options 参数和值 $i。下列命令将搜索包含 “tutorialspoint” 的字符串,不区分大小写。

>db.posts.find({post_text:{$regex:"tutorialspoint",$options:"$i"}})

该查询返回的一个结果文档中含有不同大小写的 “tutorialspoint” 文本。

{
   "_id" : ObjectId("53493d37d852429c10000004"),
   "post_text" : "hey! this is my post on TutorialsPoint", 
   "tags" : [ "tutorialspoint" ]
} 

使用正则表达式来处理数组元素

我们还可以在数组字段上使用正则表达式。在实现标签的功能时,这尤为重要。假如想搜索标签以 “tutorial” 开始(tutorial、tutorials、tutorialpoint 或 tutorialphp)的帖子,可以使用下列代码:

>db.posts.find({tags:{$regex:"tutorial"}})

优化正则表达式查询

  • 如果文档字段已经设置了索引,查询将使用索引值来匹配正则表达式,从而使查询效率相对于扫描整个集合的正则表达式而言大大提高。
  • 如果正则表达式为前缀表达式,所有的匹配结果都要在前面带有特殊的前缀字符串。比如,如果正则表达式为 ^tut,那么查询将搜索所有以 tut 开始的字符串。
上一篇: 全文检索 下一篇: Rockmongo 管理工...