离线下载
PDF版 ePub版

极客学院团队出品 · 更新于 2018-07-19 23:00:42

全文检索

MongoDB 从 2.4 版本起就开始支持全文索引,以便搜索字符串内容。文本搜索使用字干搜索技术查找字符串字段中的指定词语,丢弃字干停止词(比如 a、an、the等)。迄今为止,MongoDB 支持大约 15 种语言。

启用文本搜索

最初的文本搜索只是一种试验性功能,但从 2.6 版本起就成为默认功能了。但如果使用的是之前的 MongoDB,则需要使用下列代码启用文本搜索:

>db.adminCommand({setParameter:true,textSearchEnabled:true})

创建文本索引

假设在 posts 集合中的下列文档中含有帖子文本及其标签。

{
   "post_text": "enjoy the mongodb articles on tutorialspoint",
   "tags": [
      "mongodb",
      "tutorialspoint"
   ]
}

我们将在 post_text 字段上创建文本索引,以便搜索帖子文本之内的内容。

>db.posts.ensureIndex({post_text:"text"})

使用文本索引

现在我们已经在 post_text 字段上创建了文本索引,接下来搜索包含 tutorialspoint 文本内容的帖子。

>db.posts.find({$text:{$search:"tutorialspoint"}})

在返回的结果文档中,果然包含了具有 tutorialspoint 文本的帖子文本。

{ 
   "_id" : ObjectId("53493d14d852429c10000002"), 
   "post_text" : "enjoy the mongodb articles on tutorialspoint", 
   "tags" : [ "mongodb", "tutorialspoint" ]
}
{
   "_id" : ObjectId("53493d1fd852429c10000003"), 
   "post_text" : "writing tutorials on mongodb",
   "tags" : [ "mongodb", "tutorial" ] 
}

如果用的是旧版本的 MongoDB,则需使用下列代码:

>db.posts.runCommand("text",{search:" tutorialspoint "})

总之,与普通搜索相比,使用文本搜索可极大地改善搜索效率。

删除文本索引

要想删除已有的文本索引,首先要找到索引名称:

>db.posts.getIndexes()

从上述查询中获取了索引名称后,运行下列命令,post_text_text 是我们需要删掉的索引名称。

>db.posts.dropIndex("post_text_text")

上一篇: Map Reduce 下一篇: 正则表达式