分库分表后，分页查询怎么破？

当前位置：点晴教程→知识管理交流 →『技术文档交流』

admin

2025年12月25日 20:39 本文热度 2693

周三中午，下班刚一会，我们技术组点的几份外卖就到了，大家纷纷接过手中的快餐，然后开始扒拉着盒饭，此时这个只属于技术组的办公室里飘满了饭香菜香和咀嚼声，约摸半个小时，有人开始收拾饭盒，有人靠在椅背上刷手机，有人盯着屏幕发呆。

“反正现在没事干，不如小王继续分享上次的面试战况。”善于找话题的小李开口道。

“可以的，上次面试被问到那个分库分表的分页问题，把我问得够呛，现在可以继续和大家一起复盘复盘。你们先看看这个分库分表下的分页方案，然后咱们再聊聊这个话题。饭后多说话也是有助于消化的。”小王笑着答应道。

于是众人纷纷看了起来，不一会，有人说；“看完了，开始吧。”

“好的。那咱们开始。”于是小王开始了他的表演。

“面试官先让我分析，什么情况下分库分表会出现分页问题。我说，如果按用户ID取模分片，按创建时间全局排序分页，这就必须跨库跨表查询了。反之，如果是按时间范围分片，查询某个时间段的订单，而且排序字段就是这个时间字段，那其实还是在单分片内操作，分页没问题。”小王说道。

“接下来面试官让我给出解决方案。我先说了全局查找法。’从第0条开始找，然后找的范围也会更大，例如我们就会找到第0条到第4条的数据。’”小王模仿着面试时的语气继续讲道。“当然找到之后我们还需要在应用程序当中进行合并以及排序再分页，最终拿到我们当前页所需要的数据。’”

“但这样翻页越深性能会越差吧？”小李插话道。

“没错！”小王稍微提高了点音量，然后继续道：“‘到了这里，我相信你会认识到一个问题，也就是翻页越深性能会越差，因为我们是从第0条开始找，对不对？’那假如说我翻到了第10万条，所以就像我们之前所说的这种极端情况，它有可能都在一个节点当中，所以我们必须从第0条开始去找，所以这里涉及到的数据量就会很大了。’”

“所以我紧接着提出了禁止跳页查询法，”小王继续道，“‘我们可以拿到上一页的最大ID作为过滤的条件，这样我们就不用从第0条开始找了，只需要去过滤到当前这一页的数据即可。’”

“但这时面试官追问：‘如果产品坚持要支持随机跳页呢？有没有更好的架构方案？然后我说’此时ES和ShardingSphere该上场了。当分页查询变得复杂时，我们可以考虑换条路——把分页需求迁移到Elasticsearch。想象一下，ES天生就是分布式的，它把数据分片存储，查询时自动聚合结果。你不再需要手动在各个MySQL分片间协调。”小王说道。

“如果不愿意引入ES，ShardingSphere可以成为你的智能查询优化器。它会自动改写你的SQL，比如你写SELECT * FROM orders ORDER BY create_time LIMIT 10000, 20。ShardingSphere会帮你：SQL自动改写：在每个分片执行LIMIT 0, 10020；流式归并：采用归并排序算法，边拉取数据边排序；智能过滤：最终只返回第10000-10020条记录。“小王接着说道。

“如果以上方案都不行，”小王补充道，“最后的选择是业务妥协。”

“比如：”