토스는 지진, 화재 등 비상상황뿐 아니라 오류, 해킹 등의 상황에서도 안정적인 서비스 제공을 위해 2018년부터 인터넷데이터센터(IDC)를 이중화하여 액티브-액티브(active-active) 형태로 운영하고 있다. 액티브-액티브 형태는 두 데이터센터가 동일한 전산 자원을 가지고 운영되는 방식으로 서비스 중단을 최소화할 수 있기 때문에 백업 센터를 통해 복구 과정을 거치는 액티브-스탠바이(active-standby) 방식보다 복구 속도가 훨씬 빠르다는 것이 토스측 설명이다.
이번 재해복구훈련은 지난 26일 새벽 2시부터 5시까지 재해로 특정 IDC가 마비되는 상황을 가정하고 실시했다. 한쪽 IDC의 통신을 완전히 차단하고 단독 센터만 운영하는 실전 훈련 과정을 수행했으며, 이 과정에서 고객 서비스에는 전혀 영향이 없었다. 또한, 차단했던 데이터센터의 복구까지 성공적으로 마무리됐다.
토스 관계자는 “토스는 뱅크, 증권을 포함해 100여 가지의 서비스를 하나의 앱에서 제공하고 있어 안정성이 가장 중요하다"라며 “하나의 센터를 완전하게 차단하여 업무 연속성을 점검하는 훈련은 금융권에서는 쉽게 시도할 수 없는 일”이라고 전했다.
심준보 로이슈(lawissue) 기자 sjb@rawissue.co.kr