OMS / 撮合引擎最佳实践
在 Aeron Cluster 上构建 OMS 或撮合引擎,关键不在框架本身,而在围绕它的运维模式:如何部署、升级、 快照与恢复,并且永远不必告诉市场「我们打烊了」。本节收集这些模式。
计划中的主题
Section titled “计划中的主题”- Cluster 成员节点的滚动升级 —— 一次升级一个成员, 3/5 节点集群不停机升级。
- 确定性状态机 —— 让复制的服务可重放(业务逻辑里没有墙钟、没有随机数、没有外部 I/O)。
- 快照纪律 —— 何时打快照、恢复窗口的容量规划、演练恢复。
- 会话与 duty-cycle 设计 —— 入口/出口的背压处理。
- 故障演练 —— leader 失联、follower 失联、AZ 失联,以及各自的处置手册。