부산 백본라우터에서 잘못된 정보 전달, 전국으로 퍼져
"야간작업 싫어"…월요일 오전 장비 교체하다 대형 피해
과기정통부, 통신 네트워크 안정성 확보방안 마련키로

25일 발생한 라우터 오류 현상. (그림=과기정통부)
25일 발생한 라우터 오류 현상. (그림=과기정통부)

[딜라이트 장영일 기자] 지난 25일 전국적인 KT 유무선 통신장애는 라우팅 오류의 전국 전파 때문인 것으로 확인됐다.

29일 과학기술정보통신부는 정보보호, 네트워크 전문가들로 구성된 사고조사반과 함께 원인을 조사·분석한 결과를 발표했다.

과기정통부에 따르면 지난 25일 오전 11시16분부터 약 89분간 진행된 KT 통신장애는 부산에서 기업용 라우터 프로토콜을 새로 설치하는 과정에서 발생했다.

라우터는 인터넷 데이터 전달장치로, 라우터 프로토콜은 라우터끼리 경로 정보를 교환(업데이트)하는 역할을 한다.

부산 기업용 라우터 프로토콜 명령어를 마무리하는 과정에서 'exit' (종료) 명령어를 입력해야 했는데 이 부분이 누락됐다. 이로 인해 지역(부산)의 백본 라우터에 잘못된 정보가 전달되면서 부산의 백본 라우터는 모든 지역 백본 라우터와 연결돼 있는 서울 센터 라우터(혜화센터, 구로센터)에 잘못된 정보를 전달했다. 이후 서울 센터 라우터가 전 지역의 백본 라우터에 잘못된 정보를 전달하면서 라우팅 오류는 전국으로 확대됐다.

또 사고가 업무가 많은 월요일(25일) 오전에 발생한 것과 관련, 당초 장비교체 승인을 받은 시간은 26일 오전1시~오전6시 심야시간이었으나 KT측 관리자와 협력업체 작업자가 합의 하에 25일 오전으로 작업시간을 변경했다고 조사반은 밝혔다. 

과기정통부 홍진배 네트워크정책국장은 작업시간을 변경한 것과 관련해 "작업자들이 밤보다 낮에 작업하는 것을 선호하기 때문에 옮긴 것으로 파악됐다"고 밝혔다. 또 사고 발생 당시 KT 직원이 없는 상태에서 협력업체 직원들만 작업을 한 것에 대해서는 "잠시 다른 업무가 있어 자리를 비웠다"고 전했다. 

조사반은 시스템 자원 디도스(DDoS) 공격 가능성을 일축했다.

조사반은 "패킷분석 결과, 당시 개별 인터넷주소(IP)의 DNS 질의는 최대 15개 이내 수준(중앙 1차 DNS 기준)으로 다량의 도메인 질의는 없었으며, 네이버, 다음 등 정상적인 도메인 질의 이력만 존재했고, 존재하지 않는 비정상적인 도메인의 반복적인 질의도 없었던 것으로 파악돼 시스템 자원 디도스(DDoS) 공격은 없었던 것으로 분석됐다"고 밝혔다.

과기정통부는 이번 사고와 관련해 재방방지 대책과 관리감독 강화방안도 내놨다.

과기정통부는 통신3사에 네트워크 작업으로 인한 오류 여부를 사전에 진단할 수 있는 시뮬레이션 시스템을 도입하기로 했다. 통신3사가 라우팅 작업을 할 때 한 번에 업데이트 되는 경로정보 개수를 일정 수준 이하로 제한하기로 했다.

아울러 작업계획서의 내용과 절차가 준수되는지에 대해 네트워크관제센터에서 기술적 점검 체계를 구축할 예정이다.

조경식 과기정통부 제2차관은 "이번 조사결과를 바탕으로, 주요 통신사업자 네트워크의 생존성·기술적·구조적인 대책이 담긴 네트워크 안정성 확보방안을 마련할 계획"이라고 말했다.

관련기사

저작권자 © 딜라이트닷넷 무단전재 및 재배포 금지