로그인|회원가입|고객센터
Top
검색버튼 메뉴버튼

글로벌 기업들의 공급망 회복탄력성 전략

중복성, 표준화, 협업, 탐지, 중단 관리
불완전한 물류 세상 맞설 ‘5중 안전망’

류종기 | 392호 (2024년 5월 Issue 1)
Article at a Glance

코로나19발 팬데믹, 동일본 대지진, 러시아의 우크라이나 침공. 사실상 예측이 불가능한 사건들이 오늘날 공급망 안정성을 끊임없이 위협하고 있다. 수많은 불확실성 앞에서 기업에 필요한 것은 회복탄력성, 즉 ‘동적역량’이다. 조직이 운영 중단을 신속하게 복구하고, 핵심 성과를 다시 달성할 수 있는 능력을 뜻한다. 이를 위해 많은 글로벌 기업이 공급망 분야에서 크게 5가지 전략을 추진한다. 높은 재고 수준 유지로 안전판을 마련하는 중복성 전략, 표준화를 통한 유연성 확보 전략, 다른 이해관계자와의 협업을 통한 유연성 확대 전략, ‘워룸(War room)’ 개념에 입각한 중단 관리 시스템 확보, 마지막으로 최악의 상황에 대비한 ‘플레이북(대응 매뉴얼)’ 마련이다.



GettyImages-1387767357


일상적인 운영상 결함부터 발생 확률은 낮지만 한번 일어나면 신문 1면을 장식하는 매우 큰 이벤트(low-probability, high-impact events)에 이르기까지, 비즈니스에서 공급망 중단은 매우 다양한 형태로 나타난다. 공장 가동 중단이나 항만 폐쇄, 일부 부품의 예기치 않은 품질 문제, 운송 지연, 자재 및 상품에 대한 관세 인상 등 수많은 사례가 지금 이 시간에도 공급망 안정성을 위협한다. 그래서 기업도 손 놓고 있을 수만은 없다. 추가적으로 안전 재고(부품 및 완제품 모두)를 유지하고, 더 많은 공급업체를 확보하고, 더 신속한 배송 루트를 활용하면서 공급망 위기 상황에 대비한다. 하지만 예측이 매우 어려운, 발생 확률이 극히 낮은 사건에 대한 대응은 이것만으론 쉽지 않다.

회복탄력적 공급망 관리와 전략이 필요한 이유가 여기에 있다. 공급망 중단에 대한 대비는 주로 과거 경험에 대한 통계적 분석을 기반으로 한다. 통상 어떤 시그널이 있을 때, 어떤 위기 상황이 발생할 수 있으니 미리 대책을 마련하자는 식이다. 그러나 확률이 낮은 사건은 통계에서 벗어나 있다. 통계적 접근으로는 가능성을 계산할 수 없고 적절한 대응책을 마련하기도 어렵다. 이러한 사건의 예로는 2005년 뉴올리언스의 허리케인 카트리나, 2011년 일본 동일본 지진, 신종 코로나바이러스 감염증(코로나19)발 팬데믹, 러시아의 우크라이나 침공 등이 있다. 예측이 불가능하다고 해서 대처할 필요성이 사라지는 것도 아니다. 오히려 예측 가능한 소소한 사건보다 훨씬 큰 충격으로 다가오는 경우가 많아 빠르고 적절한 대응이 중요하다. 이런 불측의 사건을 효과적으로 관리하기 위한 열쇠가 바로 회복탄력성이다.


향후 10년 내 영향을 미칠 글로벌 리스크와 구조적 변화 동인

세계경제포럼(WEF)1 이 발표한 ‘글로벌리스크 2024’ 보고서는 향후 10년간 전 세계적으로 영향을 미칠 것으로 예상되는 리스크를 다음의 네 가지 구조적 힘으로 설명했다. 보고서는 각 영역에 걸쳐 일련의 글로벌 조건이 새롭게 형성되고 있다고 분석하고 앞으로 다가올 시대의 큰 특징으로 불확실성과 변동성을 꼽았다.

• 기후변화(Climate change): 지구온난화 궤적 및 환경 시스템 관련 영향과 결과

• 급격한 인구통계학적 변화(Demographic bifurcation): 전 세계 인구의 규모, 성장 및 구조의 변화(인구학적 분기)

• 기술 가속화(Technological acceleration): 인공지능 등 프런티어 기술의 발전 경로

• 지정학 기반 전략적 이동(Geostrategic shifts): 지정학적 힘의 집중과 원천에서의 물질적 변화

말하자면 ‘복합 리스크’의 시대다. 외부 환경에 대한 예측 가능성이 매우 낮고, 상황도 끊임없이 변하는 상시적 위기 상태다. 기업들은 어느 때보다 불확실성이 높은 경영 환경을 마주하고 있다. 전망 그 자체를 무력화할 만큼 불확실성이 높은 ‘뉴애브노멀(New Abnormal)’의 상황이 지속되고 있다.

20240422_093219


2024년 4월 2일 규모 7.2의 강진이 발생한 대만의 경우2 를 살펴보자. 블룸버그는 즉각 “애플과 엔비디아의 주요 칩 제조업체인 대만 TSMC가 직원을 재배치하고 피해 파악을 하고 있다”고 급보를 타진하며 “반도체 생산이 차질을 빚으면서 세계 기술 산업에 잠재적인 영향을 미칠 수 있다”고 보도했다. 로이터통신 역시 “고도로 정교한 반도체 팹은 진공상태에서 몇 주 동안 연중무휴로 원활하게 작동해야 하며 중단은 많은 국가의 전자제품 제조업을 포함해 일본, 한국의 업스트림(조달), 중국, 베트남의 다운스트림(유통) 등을 포함해 전체 반도체 공정에 문제를 일으킬 수 있고, 이러한 지연들은 결국 반도체 칩 가격의 상승으로 이어질 수 있다”고 분석했다. 이렇게 현대 공급망의 세계화된 특성은 많은 참여 기업을 자연재해, 정치적 불안정부터 전염병 및 노동 위기에 이르기까지 광범위한 위험에 상시적으로 노출시킨다.

이런 경영 환경에서 기업은 불확실성을 극복하고 생존력을 높일 수 있는 ‘동적 역량’ 확보에 주력해야 한다. 장기적으로 탁월한 성과를 달성하려면 핵심 역량과 유무형 자산을 그저 보유하는 것만으로는 충분하지 않다. 변화하는 경영 환경과의 적합성을 극대화하기 위해 내부 경쟁력을 지속적으로 발전시키고, 재결합하고, 효율적으로 사용할 수 있어야 한다. 이 관점에서 기업의 동적 역량은 상시적으로 시험대에 오르고 있다.

image00001


상시 위기 시대의 회복탄력적 공급망 전략

이해관계자들의 기대치가 높아지고 글로벌 경쟁이 심화함에 따라 기업은 회복탄력성에 훨씬 더 많은 관심을 기울이고 투자를 하고 있다. 기본적으로 회복탄력성(Resilience, 리질리언스)이란 재료과학에 뿌리를 둔 용어로 물질이나 물체가 변형 후 이전 모양을 되찾는 능력이다. 비즈니스 세계에서 회복탄력성은 조직이 운영 중단으로부터 신속하게 복구하고 이전 수준의 생산, 서비스 수준 또는 기타 중요한 범주의 성과를 다시 얻을 수 있는 능력을 의미한다.

많은 글로벌 기업이 공급망에서 회복탄력성을 구축하기 위해 사용하는 최근 전략과 운영 사례에 대해서 구체적으로 알아보자.

첫째, 중복성(Redundancy) 전략이다. 제품 부족에 대한 첫 번째 방어선으로 부품과 제품 모두 높은 재고 수준을 유지하는 것이다. 사실 모든 기업은 예상치 못한 공급망 중단이나 수요 증가에 대비해 공급망 가용성을 확보하기 위한 안전 재고(safety stock)를 보유한다. 그러나 모든 제품이 동일한 수준의 재고를 보유해야 하는 것은 아니다. 제품의 특징에 따라 안전 재고 정책이 달라진다는 사실을 깨달아야 한다.

마진이 허용하는 경우에만 많은 양의 안전 재고를 수익성 있게 유지할 수 있다. 이를테면 안전에 중요한(safety-critical) 시스템에는 병렬로 작동하는 중복된 내부 구성 요소가 있는 경우가 많다. 예를 들어, 여객기는 단일 부품의 고장이 추락을 야기할 수 있는 가능성을 크게 줄이기 위해 3중으로 중복된 유압 시스템을 갖추고 있다. 단일 시스템보다 비용이 3배 이상 더 비쌀 뿐만 아니라 항공기의 무게도 증가시켜 더 많은 연료를 필요로 한다. 하지만 안전이 중요하기 때문에 이러한 비용을 지불하고서라도 3중 유압 시스템을 적용한다.

공급망 관리에서도 핵심 부품 등에 대해선 이처럼 중복성을 활용할 수 있다. 회사는 전 세계에 여러 공장을 두어 내부 중복성을 만들 수 있다. 거대 화학 기업인 바스프(BASF)는 변화하는 요구 사항이나 갑작스런 공급 중단에 대응하기 위해 네트워크 내 생산 용량을 재배치할 수 있도록 공급망을 설계했다. 독일 라인강 인근 루트비히스하펜(Ludwigshafen)에 있는 BASF 주사업장은 스위스 국가 전체가 사용하는 양의 천연가스를 사용한다. 2022년 러시아의 우크라이나 침공 이후에 회사는 유럽 대륙의 높은 에너지 비용으로 인해 내부 중복성을 활용해 많은 사업장을 유럽 밖으로 이전했다.

월마트도 마찬가지다. 흩어져 있는 작은 중복성을 통합하고 관리함으로써 국지적인 유통 혼란이나 장애를 완화하도록 유통망을 설계했다. 월마트는 2023년 초 기준 미국 내 4742개 매장에 서비스를 제공하는 170개 이상의 물류센터(DC)를 운영하고 있다.

연례행사처럼 발생하는 허리케인과 같은 자연재해는 시설을 손상시키거나 재해 발생 전후의 수요를 급증시켜 한 지역의 유통을 마비시키곤 한다. 이에 따른 운영 중단 문제를 해결하기 위해 월마트는 재해의 영향을 받지 않는 지역 유통망을 활용한다. 소량의 계획된 중복 용량을 문제가 발생한 지역에 ‘이웃돕기’ 방식으로 공유한다. 인접한 물류센터는 영향을 받는 물류센터를 지원하고 인접 물류센터와 접점이 있는 센터는 운영 중단을 처리하는 데 가장 많이 관여하는 물류센터와 처리 용량 일부를 공유한다. 이 같은 단계를 거쳐 본질적으로 모든 물류센터는 영향을 받는 영역에 대해 지원을 실행한다.

둘째, 표준화(Standardization)를 통한 유연성 확보 전략이다. 공급망의 유연성은 운영을 신속하게 변경할 수 있는 관리자의 능력에 달려 있다. 유연성을 달성하는 비결은 표준 공장, 표준 부품, 표준 장비 및 프로세스를 포함하는 표준화 기반 ‘상호 호환성(interchangeability)’이다. 표준화를 통해 회사는 운영 중단에 효과적으로 대응할 수 있다. 일반적으로 표준 부품, 플랜트, 장비 및 프로세스의 사용은 변화에 대응하는 유연성과 특정한 목적 내지 현지 특성에 맞게 조정한 적합성 사이에서 절충점을 제시한다. 지금도 유효한 인텔(Intel)의 ‘카피 이그잭!(Copy Exact!)’3 은 표준화를 통한 공급망 위기 대응 전략의 대표 격이다. TSMC, 삼성 등 반도체 선도 회사들의 벤치마킹 대상이기도 하다. 각각의 반도체 제조 공장인 ‘팹(fabs)’을 정확히 동일한 사양으로 건설해 전 세계적으로 상호 교환 가능한 프로세스와 상호 호환이 가능한 설비를 구축한다. ‘카피 이그잭!’은 인텔의 글로벌 설비 포트폴리오를 거대한 하나의 가상 팹으로 바꿔놓는다. 웨이퍼는 하나의 팹에서 부분적으로 완성될 수 있으며 수율(생산 제품 중 고객, 소비자에 납품 가능한 비율)에 영향을 주지 않고 마무리를 위해 다른 팹으로 이송될 수 있다.

20240422_093236


사우스웨스트항공은 전 세계적으로 800대의 항공기를 운항하지만 모두 보잉 737 단일 모델이다. 단일 항공기 유형을 사용한다는 것은 날씨, 혼잡, 기계적 문제 등 다양한 문제로 인해 운영이 중단될 때 항공기를 교체하고 승무원을 쉽게 대체할 수 있음을 의미한다. 사우스웨스트의 표준화에 대한 열망은 아주 세부적인 사항까지도 확장된다. 이 회사는 관련 기술이 지난 수년간 크게 발전했음에도 불구하고 조종석을 표준화하고 있다. 교체 가능한 조종석은 교체 가능한 조종사와 교육비용 절감을 의미한다. 그리고 회복탄력성의 향상으로 이어진다. 다만 2019년 기체 결함 이슈로 보잉 737 맥스 기종의 항공기가 모두 공항에 발이 묶였던 것처럼 표준화한 대상 그 자체에 문제가 발생할 경우 전체 공급망은 취약해질 수 있다.

셋째, 협업(Collaboration)4 을 통한 유연성 확대 전략이다. 지난 코로나19 감염병 대유행 기간 동안 여러 차례 있었던 공급망 중단 위기를 잘 극복하고 글로벌 1위 자동차 제조사로 도약한 도요타의 JIT(Just-In-Time) 적시생산시스템은 얼핏 운영 중단에 상당히 취약해 보인다. 하지만 도요타에는 운영 중단 상황에서 빠르게 회복하는 데 도움이 되는 고유한 자산이 있다. 바로 공급업체들과의 강력한 신뢰 관계다. 도요타 차량 대부분에 사용하는 브레이크 밸브의 유일한 공급업체 아이신(Aisin Seiki Co.)에서 공장 화재가 일어나 장비 대부분이 소실됐던 사고가 대표적이다. 풀가동을 재개하기까지 6개월 이상 걸릴 것으로 파악됐지만 도요타와 아이신은 복구를 위해 공급업체 네트워크의 유연성과 생산 용량을 활용했다. 36개의 도요타의 공급업체와 22개 아이신의 협력사는 최대한 많은 브레이크 밸브를 만드는 데 협력했다. 아이신은 청사진(기계 설계도), 원자재, 손상되지 않은 생산 장비 및 직원을 각 업체에 파견해 긴급 상황을 지원했다. 결국 도요타는 단 5일 치의 생산 손실만 봤고 중단됐던 생산 물량을 만회하는 데 성공했다.

회복탄력성을 위한 최근의 기업 간 협력 사례가 있다. 미국 최대 규모 식료품 유통기업인 C&S홀세일 그로서스(C&S Wholesale Grocers)는 팬데믹 기간 동안 7000개 이상의 소매점으로 보낼 식료품 수요량이 급증해 더 많은 인력과 유통 자원이 필요했다. 하지만 일반적으로 기업의 채용에는 공고, 면접, 후보자 평가, 검증, 선발된 채용자에게 연락, 신입사원 대상 온보딩 훈련 등 많은 시간이 소요된다. 한편 레스토랑과 기관에 식품을 공급하는 US푸드(US Foods)는 팬데믹 기간 록다운으로 소비자들이 집에 머물면서 반대로 수요가 급감했다. 주 고객인 레스토랑, 교육기관 및 많은 사업체 등이 문을 닫아 고전하고 있었다. 두 회사는 US푸드 직원이 인근 C&S홀세일에 파견 나가 일하도록 일시적 재배치 계약을 체결했다. C&S 시설에서 US푸드 직원들이 장비에 대한 교육을 받았고, 이에 바로 다음 날부터 생산성이 곧바로 크게 높아졌다. 이후 C&S홀세일은 다른 외식업 및 기관 식품 유통업자들과 추가적으로 유사한 계약을 맺었다.

20240422_093246


넷째, 더 나은 탐지(Detection) 시스템의 운영 전략이다. 운영 중단에 대응하기 위한 첫 번째 단계는 중단 발생 시점과 장소를 최대한 빨리 파악하는 것이다. 문제를 빨리 파악할수록 부정적인 결과를 완화하고 고객 피해를 최소화하는 작업을 더 빨리 시작할 수 있다. 그러나 이러한 단순한 재난 감지 행위는 보이는 것보다 훨씬 더 복잡하다. 공급망의 특성, 즉 복잡하고 서로 멀리 떨어져 있는 구조 때문이다. 전 세계에 펼쳐진 수천 개의 시설과 서비스를 지속적으로 매핑하고 모니터링하는 것은 매우 어려운 일이다.

레질링크(Resilinc Corporation)라는 회사는 모든 회사와 공급업체의 모든 설비를 매핑하고 모니터링하는 것을 목표로 하고 있다. 이를 위해 고객사의 공급업체를 조사해 이들 정보를 지도화하고 공급업체 데이터를 최신으로 유지한다. 조사하는 체크리스트에는 공급자 시설 위치, 하위 공급업체 위치, 사업지속계획(business continuity plan), 복구 시간, 비상 연락 자료, 분쟁 광물 사용(ESG 공급망 실사 지침 대응 관련) 및 기타 우려 사항들이 포함된다.

또한 레질링크는 각 제품 명세서(BOM)에 대한 고객사의 부품 데이터를 수집해 공급업체의 중단으로 납품이 중단될 경우 고객사의 어떤 제품이 영향을 받을 수 있는지 사전에 분석한다. 그 결과를 토대로 각 공급업체 시설과 각 시설의 가동 중단으로 위험에 처한 고객사 제품을 연결하는 공급망 지도가 만들어진다. 레질링크는 고객사의 고객까지 그 모니터링 대상을 넓혀 한층 고도화한 공급망 지도를 만드는 데 한 걸음 더 다가섰다.

장애가 발생하면 레질링크의 시스템은 즉시 영향을 받을 제품은 물론 고객사와 고객사의 고객 중 누가 해당 제품을 사용하고 있는지를 곧바로 파악한다. 결과적으로 고객의 ‘최대예상손실액(Value at Risk)’, 즉 특정 제품을 만드는 데 필요한 부품이 없어 얼마나 많은 경제적 손실이 날 수 있는지를 매우 신속하게 파악하고 의사결정을 할 수 있게 해준다. 이는 회사가 공급망 중단에 대한 대응 우선순위를 빠르게 정하게 하는 것은 물론 타깃 고객에게 집중할 수 있게 돕는다.

20240422_093257


다섯째, 중단 관리(Managing Disruptions)에 집중해야 한다. 글로벌 대기업에서는 주요 업무 중단을 처리하기 위해 일반적으로 종합적인 통신 기술, 모니터 화면, 화이트보드, 네트워크 접근이 가능한 위기관리센터(CMC) 또는 비상운영센터(EOC) 같은 종합상황실을 운영한다. 이러한 센터들은 비상시 영향을 받은 부서와 관련해 사내 최고의사결정권자들이 모여 주요 문제들을 해결하기 위해 의견을 나누는 곳이다. 평상시에는 소수의 리스크 관리 직원이 상주하며 다양한 뉴스 피드, 날씨 정보, 조직의 내부 보안 활동을 모니터링하거나 문제가 발생할 수 있는 징후에 대한 경보 시스템을 모니터링한다. 종합상황실에서 파악하기 어려운 특정 지역의 심각한 위기 상황이나 문제가 발생할 수 있는데 존슨앤드존슨, 플렉스(Flex) 등 몇몇 글로벌 기업은 ‘타이거팀(tiger team)’을 운영하기도 한다. 타이거팀은 전 세계 주요 지역의 위기관리를 돕거나 자사 공급망의 핵심 부분에 대해 데이터를 수집하기도 하고, 실제 조치를 실행하는 조직이다. 무엇보다 이들 팀은 현지 이해관계자들과 현지 언어로 커뮤니케이션하는 소통 창구 역할을 한다. 기업이 현지 정부와의 접촉을 계속 유지하더라도 코로나19 위기 상황에서처럼 국가적 공황 상태를 피하려는 정부는 정보를 솔직하게 공개하지 않을 수 있다. 이럴 때 타이거팀의 역할이 중요하다. 상황을 정확하게 파악하려면 기존과는 다른, 예컨대 친분이 있는 병원 관계자와의 대화나 전 세계 소셜미디어 게시물을 추적하는 등 비공식 채널을 통해 정보를 확인하는 게 중요하다. 타이거팀은 현지 뉴스와 현지 자원을 통해 정보를 모으고, 이것이 함축하는 의미를 기업에 전달할 수 있다. 또한 타이거팀은 빠른 대응력으로 ‘직접 현장을 누비면서’ 활동한다. 그들은 현지 직원의 안전을 보장하고, 현지 공급업체나 고객사의 회복을 돕는다. 지방 정부와 협력해 중요한 화물을 이동시키거나 회사 시설 혹은 주요 공급업체 시설이 업무를 재개하도록 허가를 받을 수도 있다. 전반적인 글로벌 대응을 관리하는 비상관리센터가 이러한 팀들을 운영한다.

20240422_093307


30개국에서 20만 명의 직원이 근무하는 미국과 싱가포르 기반 전자 제조기업 플렉스의 경우 약 1만4000개의 공급업체를 보유하고 있다. 어떤 시점이든 적어도 그중 한두 곳은 좋은 성과를 내지 못하고 지연 등의 문제를 일으킬 수 있다. 이 작은 문제가 전체 공급망 시스템에 어떤 영향을 미칠지 미리 감지하기 위해선 지속적인 탐지와 모니터링이 필요하다. 그래서 플렉스는 공급망 시각화 시설인 플렉스 펄스 센터(Flex Pulse center)를 구축했다. 원형극장 같은 회의실에는 전면 벽 전체를 덮고 있는 22개의 대형 고해상도 대화형 터치스크린이 있는 리본 스타일의 거대한 디스플레이가 있다. 벽에는 재난 뉴스, 소셜미디어 스트림, 전 세계 운송 중 선적지도, 재고 수준 분포도 지도(heat map), 수익률 파이 차트, 예외 상황 및 리드 타임 그래프 등 사용자가 선택할 수 있는 다양한 실시간 정보가 제공되고 있으며 수백 가지 유형의 다양한 공급망 데이터를 활용할 수 있다.

20240422_093315


마지막으로, 최악의 상황에 대비(Preparing for the Worst)해야 한다. 회사는 일이 잘못되더라도 계속해서 업무를 수행할 수 있어야 한다. 기업은 최악의 상황에 대비하기 위해 비즈니스 연속성 계획(BCP)을 활용한다. ‘만약에(what if)’ 시나리오 훈련뿐만 아니라 공급망 중단에 대한 직간접적인 경험을 통해 다양한 종류의 재난에 대한 이른바 ‘플레이북(playbook, 대응 계획 또는 매뉴얼)’을 준비한다. 시나리오 플래닝이 기업에 제공하는 구체적인 장점은 두 가지다. 하나는 조직의 ‘스트레스 테스트’를 돕는 것이고, 다른 하나는 일종의 경보나 ‘감지 센서’를 만들 수 있다는 것이다. 각 시나리오를 이끄는 변화 동인을 분석하는 과정에서 어떤 시나리오가 점점 더 일어날 가능성이 커지는지를 확인할 수 있어서다. 이런 조기 경보를 통해 경영진은 임박한 변화를 신속하게 탐지하고 대비할 수 있다.

일부 기업은 조직의 중단 대비 훈련을 일상적인 업무 시스템(소프트웨어)으로 자동화하고 있다. 넷플릭스의 ‘카오스 몽키(Chaos Monkey)’5 는 회사 기반 시설을 임의로 비활성화시켜 인프라를 의도적으로 공격하는 애플리케이션이다.

카오스 몽키는 아마존웹서비스 인프라의 프로덕션 인스턴스를 무작위로 마비시키도록 고안됐다. 이를 통해 약점이 발견되면 엔지니어들이 자동 복구 메커니즘을 구축해 이를 제거하도록 하는 것이 목적이었다. ‘무기를 든 야생 원숭이가 데이터센터(또는 클라우드 영역)에 들어와 무작위로 인스턴스를 파괴하고 케이블이 끊기더라도 중단 없이 고객에게 서비스를 계속 제공한다는 개념’에서 재밌는 이름이 탄생했다.

GettyImages-1396611081_[변환됨]


이론상 넷플릭스의 자동화 시스템은 어떤 오류건 즉시 인식해 재부팅하거나, 재시작하거나, 문제가 발생한 부분을 리라우팅해야 한다. 만약 이 원숭이들이 성능이나 서비스에 실제로 영향을 준다는 걸 발견하면 소프트웨어를 개선하기 위해 엔지니어들이 뛴다.

회사가 자사 시스템을 공격한다는 게 억지스러워 보일지 모른다. 하지만 이는 궁극적으로 원숭이들에게 영향을 받지 않고, 회복탄력성을 지닌 코드를 갖게 하는 원동력이 된다. 넷플릭스는 카오스 몽키를 만들면서 카오스 엔지니어링 원리를 이용했다. 카오스 엔지니어링은 A-B 테스트와 방해에 저항하는 시스템을 방해하려는 실험에 의존한다. 시스템에 작은 혼란을 일으키고 그 혼란이 성능에 영향을 줄 때마다 이를 수정함으로써 시스템은 갈수록 더 튼튼해진다. 어떤 면에서 이는 군사 기획자와 사이버 보안 조직이 사용하는 ‘레드팀(red team)’ 훈련 혹은 워게임(war games)의 자동화 버전이라 할 수 있다.

물론 플레이북만으로 대비책이 만들어지지는 않는다. 플레이북을 연습하고 모의 중단을 시뮬레이션하면서 상황 자체에 대해 이해하고, 우리가 가진 문제점을 고쳐야 할 필요가 있다. 이러한 사후 조치 보고(After-action debriefing)는 계획의 결점을 식별하고, 플레이북의 문제를 수정할 뿐만 아니라 조직의 숨겨진 위험을 발견하고, 공급망 중단에 대한 관리자의 이해를 높이는 데 도움이 된다. 디지털 통신 기술 대기업인 시스코(Cisco)는 최소 14개의 공급망 사고 관리 플레이북을 개발했다. 이 플레이북에 대한 시스코의 기조는 ‘두 번 걸리면 부끄러운 줄 알아야 한다’이다. 이러한 준비는 기업에 회복탄력성을 높이는 원동력이 되고 불안정한 세상에서 더욱 높은 가치를 얻게 할 것이다.
  • 류종기 류종기 | EY한영 상무

    필자는 기업 리스크와 리질리언스, 지속가능 경영 분야에서 24년간 컨설팅을 했다. IBM 리질리언스 서비스 리더, 딜로이트 안진회계법인 기업리스크자문본부 디렉터를 역임하고, 울산과학기술원(UNIST) 도시환경공학과 겸임교수로 기후재난, 탄소중립, ESG를 연구, 강의했다. 현재 EY한영에서 지속가능금융(ESG)과 리스크 관리, 책무구조도 컨설팅을 담당하고 있으며 서강대 일반대학원 신문방송학과에서 겸임교수로 전략적 ESG 커뮤니케이션을 가르치고 있다.
    esilience@korea.ac.kr
    이 필자의 다른 기사 보기
인기기사