토스페이먼츠 PQC 도입기 공부 정리 | 지금 당장 문제없어도 바꿔야 할 때
20년 된 레거시와 수만 가맹점을 유지하면서 보안 프로토콜을 단계적으로 바꾼 의사결정 과정 메모
Toss Tech 블로그에 포스트퀀텀 암호화(PQC)를 도입한 과정을 다룬 글이 올라왔다. 처음엔 보안 엔지니어링 이야기라 좀 멀게 느껴졌다. 양자 컴퓨터, 암호화 알고리즘 같은 단어들이 튀어나왔으니까. 그런데 읽다 보니 달랐다.
수만 명의 가맹점을 유지하면서 20년 된 레거시 시스템을 어떻게 바꿨는지가 담겨 있었다. “작동하면 건드리지 말자”는 분위기를 팀 안팎에서 어떻게 깼는지, 그 의사결정 과정이 더 흥미로웠다.
1️⃣ 이게 뭐냐?
포스트퀀텀 암호화(PQC)는 양자 컴퓨터가 등장했을 때도 안전한 암호 방식이다. 아직 양자 컴퓨터가 실용화되진 않았지만, 지금 암호화된 데이터를 모아뒀다가 미래에 해독하는 “Harvest Now, Decrypt Later” 공격이 이미 위협으로 거론된다. 미래 기술을 기다리지 않고 지금 데이터를 모아두는 방식이다.
토스페이먼츠는 2022년부터 4년에 걸쳐 단계적으로 진행했다. HTTP/3 도입으로 TLS 1.3이 따라왔고, 취약한 암호화 조합을 하나씩 제거하면서, 올해 4월 PQC 구현에 도달했다. 단계가 명확해서 깔끔해 보이지만, 각 단계마다 수만 개 가맹점의 서버 환경을 고려해야 했다. 20년 이상 된 레거시 서버를 쓰는 가맹점도 섞여 있는 상황이었다.
2️⃣ 내가 든 생각
기술 결정 자체보다 가맹점 영향 관리 방식이 인상적이었다. 강제 전환 대신 6개월에서 1년 선행 공지를 주고, 기술 지원 팀이 소상공인까지 직접 상담을 했다. 최신 환경은 자동으로 올리고, 레거시는 호환성을 유지하면서 별도 지원을 병행했다.
👉🏻 “지금 당장 아무 문제없는 시스템을 왜 바꿔야 하는가”를 수만 개 이해관계자에게 어떻게 설득했을지가 궁금해졌다. 기술적으로 올바른 결정이라도, 이해관계자가 많으면 타이밍과 전달 방식이 결정 자체만큼 중요해지는 것 같다.
💡 여기서 드는 질문: “아직 닥치지 않은 위협”을 근거로 변화를 설득하는 게 얼마나 설득력이 있을까?
디자이너로서 보면, 이건 UX 변화를 설계할 때와 비슷한 구조이기도 하다. 사용자가 아직 불편함을 느끼지 않아도, 장기적으로 더 나은 경험을 위해 지금 인터페이스를 바꿔야 하는 상황. 그럴 때도 “왜 지금인가”에 답해야 한다.
3️⃣ 앞으로 어떻게 쓸까?
직접 암호화 프로토콜을 다룰 일은 없겠지만, 점진적 전환 방식은 참고할 만하다는 생각이 들었다. 앱 디자인에서도 큰 UX 변화를 롤아웃할 때 비슷한 고민이 생긴다. 써봐야 알겠지만, “최신 환경은 자동 적용, 레거시는 지원 병행” 같은 구조는 제품 변화 설계에서도 꽤 유용한 프레임인 것 같다.
⭐️ 마지막으로, 변화 설계에서 공부하며 느낀 점
이번에 공부하면서 이런 기술 전환에서 중요한 건 새로운 암호화 알고리즘 자체가 아니라 변화를 어떻게 설계해서 이해관계자들과 함께 이동하는가라는 감각인 것 같았다.
기술 결정은 엔지니어가 하겠지만, “언제, 어떻게 전달하고, 어떤 속도로 전환하는가”는 결국 사용자를 얼마나 이해하느냐의 문제에 가까운 것 같기도 했다.
참고 원문: Why We Adopted Post-Quantum Cryptography a Decade Before Quantum Computers Arrive