Coinbase Pro交易所事件发生后的事态:2021年5月19日

布莱恩特·考(Bryant Khau)和莱昂纳多·里扎(Leonardo Zizzamia)

概括

断电

根本原因分析

  1. 由于实例开始出现故障,并且花费了40多分钟才能恢复到正常状态,因此Logged Out的coinbase.com页面在很大程度上无法访问。请求的快速增加最终达到Nginx路由器连接的最大阈值,在事件发生时手动增加了该阈值。这最终解决了瓶颈。

2.我们看到了GraphQL服务的超时和增加的延迟,该服务聚集了来自基础服务的数据。超时是由于GraphQL自动缩放速度太慢所致。自动缩放最终陷入困境,错误消失了,从而将功能恢复到了移动应用程序和已登录的用户。

3.我们看到,为Coinbase Pro交换提供支持的数据库具有较高的延迟和CPU负载。此外,运行我们的市场数据供稿的API服务器处于高CPU负载下。我们提高了在数据库上配置的操作吞吐量,还配置了更多的API服务器。

4.在我们的非美国卡支付处理服务中,随着处理队列的积压,失败的支付数量增加了。我们增加了队列工作人员的数量,并且卡支付开始成功。

改进之处

我们非常重视基础架构的正常运行时间和性能,我们正在努力支持选择Coinbase来管理其加密货币的数百万客户。 如果您有兴趣解决此处提出的扩展挑战,请与我们合作。


事件发生后的事态:2021年5月19日最初发布在The Coinbase Blog on Medium上,人们通过突出并回应这个故事来继续对话。

END

原创文章,作者:探果吧,如若转载,请注明出处:https://www.tanguo8.com/815.html

联系我们

400-800-8888

在线咨询:

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息