mongoDB中聚合函数java处理示例详解-eolink官网

mongoDB中聚合函数java处理示例详解

1.问题

最近在做项目的时候碰到一个对mongoDB的数据处理，从MongoDB中拿到内嵌文档的时间排序的list。

一开始考虑到直接对mongoDB中的属性排序，后面发现属性存在内嵌文档中，所以处理中需要用到聚合函数。

思考

（key）解决这个问题的过程让我学到很多，发现自己在解决一个问题不仅查找问题的姿势不对，浪费太多时间。而且在碰到问题之后，应该多看看解决办法，甚至解决了之后要去思考问题，回顾问题。而不是像以前一样，解决问题了就万事大吉，抛之脑后。

2.解决

需要对document中的一个tweet_list 集合中的一个属性 timestamp_ms进行排序。组内排序

使用聚合框架，通过match，unwind，sort等不同的组件创建一个管道。

类似mysql中的多层嵌套子查询。

mongoDB中js代码

db.text.aggregate(

// Initial document match (uses index, if a suitable one is available)

[

{ $match: {

_id : ObjectId("5ca95b4bfb60ec43b5dd0db5")

}},

// Expand the scores array into a stream of documents

{ $unwind: '$tweet_list' },

{ $match: {

'tweet_list.timestamp_ms': '1451841845660'

}},

// Sort in descending order

{ $sort: {

'tweet_list.timestamp_ms': 1

}}

]

)

java实现此聚合函数

java中的Aggregation类，查询条件的顺序决定结果。

Aggregation agg = AggregriLEPation.newAggregation(

Aggregation.match(Criteria.where("_id").is(id)),

Aggregation.unwind("tweet_list"),

Aggregation.sort(Sort.Direction.ASC,"tweet_list.timestamp_ms"),

Aggregation.project("tweet_list.timestamp_ms","tweet_list.text","tweet_list.created_at")

);

AggregationResults results = mongoTemplate.aggregate(agg, "text", JSONObject.class);

//System.out.println("results"+results.getRawResults()); //获取到的结果是document

//String res = results.getRawResults();

String json = com.mongodb.util.JSON.serialize(results.getRawResults());

System.out.println("JSON serialized Document: " + json);

JSONObject jso= JSON.parseObject(json);

JSONArray resultss=jso.getJSONArray("results");

System.out.println(resultss);

3.扩展

管道pipeline

以下的管道操作符可以按照任意顺序组合在一起使用。每个操作符都会接受一连串文档，对这些文档做了类型转换后，将转换后的文档作为结果传递给下一个操作符。直到最后一个管道操作符，将结果返回给客户端。

筛选match

尽可能将帅选放在管道的前部。两个原因：

1.先过滤掉不需要的文档，减少管道的工作量。

2.如果在project和group之前执行match，查询可以用索引。

3.不能在match中使用地理空间操作符

投射project

类似select操作。可以用管道表达式，数学表达式，日期表达式，字符表达式，逻辑表达式等。

分组group

跟mysql中的分组比较像

排序sort

1 升序 -1 降序

限制limit

限制结果条数

跳过skip

丢弃结果中的前n个文档

拆分unwind

把数组中的每个值拆分为单独的文档，例如此问题中需要对一个document中的tweetlist进行排序，可以使用unwind把tweetlist中的不同map拆分成不同的文档。

结果返回

文档

MapReduce

如果聚合框架中查询语言不能不表达，需要用到MapReduce。

使用：把问题拆分为多个小问题，把各个小问题发送到不同的机器上，每台机器只负责完成一部分的工作，完成之后，再把零碎的解决方案合并。

步骤：

1.映射map：把操作映射到集合中每个文档

2.洗牌shuffle：按照键值分组，并将产生的键值组成列表放到对应的键中。

3.化简reduce：把列表中的值化简成一个单值，值被返回，继续shuffle，然后最终每个键的列表只有一个值，即最终结果，

应用：

1.找到集合中所有键

2.网页分类

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对我们的支持。

Flask接口签名sign原理与实例代码浅析

458 2023-01-08

mongoDB中聚合函数java处理示例详解

多平台统一管理软件接口，如何实现多平台统一管理软件接口

Flask接口签名sign原理与实例代码浅析

java中的接口是类吗

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

遇到百度网址安全中心提醒您该页面可能存在钓鱼欺诈信息

软件接口设计怎么做？前后端分离软件接口设计思路