[翻译]常见问题-使用MongoDB进行分片

数据库 Quarterback 78℃ 0评论

使用MongoDB进行分片

  • 新部署是否适合进行分片?
  • 在对集合进行分片后是否可以更改片键?
  • 为什么文档没有分布到各个分片?
  • mongos是如何检测到分片集群配置更改的?
  • 日志中出现的writebacklisten是什么意思?
  • mongos是如何使用连接的?

 

本文档回答了有关分片的常见问题。或者可以参考手册的分片章节,其提供了 分片的概述,包括如下细节:

新部署是否适合进行分片?

有时是适合的。但是,如果您的数据集适合放在单个服务器,则应该以非分片部署作为分开始,因为数据集很小,分片几乎没有优势。

在对集合进行分片后是否可以更改片键?

不可以。

MongoDB中没有对集合分片后更改片键的自动支持。这一现实情况强调了选择好的片的重要性。如果在集合分片后必须更改片键,最佳选择是:

  • 将MongoDB中的所有数据转储为外部格式。
  • 删除原始分片集合。
  • 使用更理想的片键配置分片。
  • 预分割(pre-split)片键范围以确保初始均匀分布。
  • 将转储的数据恢复到MongoDB中。

也可以参考:

片键

为什么文档没有分布到各个分片?

一旦数据块(chunk)的分布达到某个阈值,均衡器就开始在分片上迁移均衡数据。请参阅 迁移阈值

此外,如果块中的文档数超过一定数量,MongoDB将无法移动块。请参阅 每个要迁移的块的最大文档数不可分割的

mongos是如何检测到分片集群配置更改的?

mongos实例维护配置数据库(config)的缓存,该缓存包含分片集群的元数据。

mongos通过向分片发出请求并发现其元数据已过期来懒更新其缓存。要强制 mongos重新加载其缓存,可以对每个mongos 直接执行flushRouterConfig命令

日志中出现的writebacklisten是什么意思?

回写监听器(writeback listener)是一个进程,它打开一个长轮询,在迁移之后从mongodmongos将写入取回,以确保它们没有进入错误的服务器。如有必要,回写监听器会将写入发送回正确的服务器。

这些消息是分片的基础关键部分,不需要引起关注。
(译者理解:写入数据根据片键发送到对应分片mongod,但到达时发现对应chunk已经迁移到其他分片mongod了,回写监听器监听到这种情况,就会把数据取回到mongos,然后再发往正确的mongod。这一些列动作,对用户来说都是透明的,所以不用关注)

mongos是如何使用连接的?

每个mongos实例都维护一个与分片集群成员的连接池。客户端请求一次使用一个连接; 即请求不是多路复用或流水线化的。

客户端请求完成后,mongos将连接归回到连接池。当客户端数量减少时,这些池不会收缩。这可能导致未使用的mongos占用大量打开的连接。如果mongos不再使用,则可以安全地重新启动进程以关闭现有连接。

要返回mongos所使用的所有对外连接池相关的聚合统计信息,请将mongo shell 连接 到mongos,然后运行 connPoolStats命令:

复制

db.adminCommand “connPoolStats” ;

请参阅UNIX ulimit设置 文档的“ 系统资源利用率”部分。

/* 本文属于原创文章,转载请注明作者和出处 quarterback.cn,请勿用于任何商业用途 */




喜欢 (0)or分享 (0)
Quarterback.cn 打赏作者
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址