자세히 보기

By Kim Jin Cheol

김진철의 How-to-Big Data | 빅데이터의 미래 (3)

사이버 물리 시스템과 클라우드 컴퓨팅의 관계지난 서른여섯 번째 글에서 빅데이터를 포함하여 최근 주요 IT 기술 트렌드로 떠오르고 있는 5G,

이번 글에서는 최근 다시 중요한 기술로 부각되고 있는 클라우드 컴퓨팅이 사이버 물리 시스템에서 왜 중요한 기술이 되는지 같이 생각해보려고 한다. 서버리스 컴퓨팅과 클라우드 네이티브 프로그래밍이 최근 유행하면서 빅데이터 응용 소프트웨어 개발과 분석도 클라우드 컴퓨팅으로 많이 옮겨가는 추세지만, 클라우드 컴퓨팅 발전 초기에는 빅데이터 처리용 고성능 컴퓨팅 시스템에 베어메탈 하둡이나 스파크를 구축해서 빅데이터 처리를 하는 기업이나 조직이 많았지 클라우드 컴퓨팅을 빅데이터에 활용하는 기업이 생각보다 많지 않았다.

클라우드 컴퓨팅의 개념이 정립되어가던 2000년대 말부터 2010년대 중반까지 클라우드 컴퓨팅 발전 초반에는 컴퓨팅 자원 사용의 주문형 서비스화, 투자비(CapEx)가 아닌 운영비(OpEx)로의 IT 비용 전환을 통한 비용 절감의 측면에서 클라우드 컴퓨팅을 강조하는 경향이 많았다. 심지어 클라우드 컴퓨팅의 초창기에는, 현재는 대표적인 빅데이터 기술로 불리는 구글의 맵리듀스 기술을 클라우드 컴퓨팅의 대표적인 기술로 꼽는 사람들도 있었다. 클라우드 컴퓨팅 발전 초반에는 자원 활용의 탄력성(elasticity)이 크게 강조되지 않거나 서비스 지향(service-oriented) 유틸리티 컴퓨팅(Utility computing)의 개념과 혼용해서 혼란스럽게 사용하는 경우가 많았기 때문에 클라우드 컴퓨팅이 빅데이터 컴퓨팅에서 중요한 이유가 잘 전달되지 않았던 것 같다.

독자분들께서는 필자가 앞서 아홉 번째부터 열 네번째 글[2-7]에서 CERN에서 LHC 가속기 데이터 처리를 위해 클라우드 컴퓨팅 기술 개발을 시작한 배경에 대해 소개했던 것을 기억하고 계신지 모르겠다. CERN에서 LHC 가속기의 빅데이터를 처리하기 위해 구축한 LHC 컴퓨팅 그리드(LHC Computing Grid; LCG)에서, 그리드 자원의 이종성(heterogeneity)과 그리드 자원을 운영하는 연구기관들의 상이한 보안 정책과 서버 환경과 같은 문제로 인해 그리드에서 실행되는 분석 작업의 실패율이 높았고, 이 문제를 해결하기 위해 도입했던 것이 그리드 컴퓨팅 작업을 가상 머신에서 실행하도록 하는 것이었다. 이 과정에서 그리드 작업이 실행될 노드에 가상 머신 실행과 수명주기를 자동화하여 관리하는 기술이 필요하게 되었는데 이것이 클라우드 컴퓨팅 기술의 시작이라고 소개한 바 있다[2-7].

CERN의 LHC 가속기 빅데이터 처리의 사례에서 살펴본 것같이 원래 클라우드 컴퓨팅은 빅데이터 처리를 위해 필요한 자원을 필요한 때에 필요한 만큼 끌어다 쓰기 위해 만들어진 자원 관리 기술이다. 이런 이유로 사실 빅데이터와 클라우드 컴퓨팅 기술은 뗄래야 뗄 수 없는 밀접한 관계이다. 다만 클라우드 컴퓨팅이 다양한 기업의 워크로드들을 포용하고 자동화된 운영 기술로 발전하는 과정에서 빅데이터 처리와 계산 성능을 베어메탈 컴퓨팅의 수준으로 향상, 보상하는 기술의 발전이 상대적으로 더뎠기 때문에 빅데이터 활용에 클라우드 컴퓨팅의 도입이 상대적으로 늦어진 것이다.

이렇게 빅데이터 처리, 분석에 필요한 자원의 탄력적인 활용, 관리를 위해 필요했던 기술이 클라우드 컴퓨팅이었던 만큼, 사이버 물리 시스템에 필요한 빅데이터 처리와 엄청난 수와 종류의 컴퓨팅 자원을 흠없이(seamlessly) 관리하기 위해 필요한 자원 관리, 또는 운영 체제 기술의 관점에서 클라우드 컴퓨팅의 중요성을 생각해보아야 한다. 

클라우드 컴퓨팅의 서비스 지향적인 면은 인터넷 기반의 서비스 지향 컴퓨팅의 발전이 컴퓨팅 자원에 접근하는 방법에 영향을 준 것이지 사실 클라우드 컴퓨팅의 근본적인 필요 때문에 나타나는 특성은 아니다. (일례로 CERN의 LHC 컴퓨팅에서 사용한 그리드 컴퓨팅 기술도 XML 기반의 서비스 지향 컴퓨팅 모델을 이용해 원격의 컴퓨팅 자원에 접근하도록 개발되어 있다. 이런 이유로 오픈 그리드 포럼(Open Grid Forum)과 같은 그리드 컴퓨팅 서비스의 메시지 스키마 표준을 정의하는 단체가 생겨나 활발하게 활동하기도 했다.)

이제 사이버 물리 시스템을 지원하는 자원 관리와 운영 체제 기술로서 클라우드 컴퓨팅이 어떻게 연관이 있는지 살펴보도록 하자.

우리가 많이 사용하는 마이크로소프트의 윈도우 10과 같은 개인용 컴퓨터 운영체제와 구글의 안드로이드와 같은 모바일 디바이스용 운영 체제 소프트웨어를 사용하는 목적은 크게 두 가지가 있다. 먼저, 하드웨어를 다루는 저수준의 작업을 일련의 인터페이스(ABI(Abstract Binary Interface)와 API(Application Programming Interface))를 통해 추상화하여 컴퓨터 하드웨어에서 사용자의 목적을 만족시키는 응용 소프트웨어 작성을 쉽게 하는 것이다. 두번째로, 컴퓨터 하드웨어에서 계산을 위해 보유하고 있는 중앙처리장치(CPU), 메모리(RAM), 영구 저장 장치(persistent storage), 네트워크 인터페이스 등의 자원이 컴퓨터를 사용하는 여러 응용 소프트웨어와 사용자가 자신의 목적에 맞게 하드웨어 자원을 사용하면서 불편을 느끼지 않게끔 자원을 적절하게 할당, 관리해주는 것이다.

이런 운영 체제는 사이버 물리 시스템에서도 기본적인 소프트웨어 스택으로 중요한 역할을 한다. 예를 들어 대표적인 사이버 물리 시스템인 자동차에서 조향 장치, 엔진, 가감속기와 제동장치를 제어하는 전자제어기(Electronic Control Unit; ECU)의 제어 소프트웨어가 사용하는 실시간 운영체제가 전자제어기의 자원을 적절하게 활용하도록 지원하지 못해 제어 소프트웨어가 오작동을 일으키면 자동차가 본연의 기능을 다 할 수 없을 뿐만 아니라 경우에 따라서는 탑승객의 생명이 위험할 수 있다.

앞으로의 사이버 물리 시스템은 5G, 6G와 같은 무선 네트워크와 광대역 유선 네트워크를 통해 서로 연결되어 넓은 지역에서 다양한 자원을 사용해 지능화된 기능을 수행하게 될 것이다. 이때, 넓은 지역에 걸쳐 배치되어 있는 다양한 컴퓨팅 자원과 서비스(예를 들어 지능형 교통 정보 시스템(ITS), 고정밀 지도 서비스(High-Definition(HD) Map) 등)가 하나로 통합된 기능(예를 들어 자율주행 기반 모빌리티 서비스)을 흠없이 구현하고 실행하기 위해서는 이렇게 다양한 컴퓨팅 자원을 네트워크를 통해 서로 조율하고 관리하여 사이버 물리 시스템이 목적했던 기능과 서비스로 통합될 수 있도록 하는 저수준의 소프트웨어 스택이 필요하게 되는데, 클라우드 컴퓨팅이 바로 이런 역할을 하게 된다.

우리가 컴퓨터를 만들기 위해 사용하는 다양한 소자와 부품, 장치들은 물리적인 법칙에 의해 제약을 받기 때문에 그 자체로 물리적인 한계를 가지고 있다. 우리가 필요한 컴퓨팅 자원을 무한정 공급해주는 컴퓨터를 만들 수 없는 이유가 바로 컴퓨터 하드웨어가 근본적으로 물리 법칙의 지배를 받고 있기 때문이다. 이렇게 컴퓨터 하드웨어의 물리적 제약 때문에 컴퓨팅 자원은 그 조직 수준과 규모, 목적에 따라 다양한 계층을 이루며 조직될 수밖에 없다.

컴퓨터 하드웨어의 역사는 이런 하드웨어의 확장성과 성능에 영향을 끼치는 물리적인 제약을 넘어서는 기술의 발전과 맥을 같이 한다. 1990년대 중반까지만 해도 컴퓨터 하드웨어의 확장성과 성능을 높이는 방법은 단일 프로세서의 단위 면적에 가능하면 많은 계산 소자를 집적하고 단위 시간에 가능하면 많은 연산을 할 수 있도록 최대한 저지연으로 응답하는 회로를 만드는 것이었다.

이런 경향이 바뀌게 된 계기가 바로 네트워크로 연결된 컴퓨터를 이용한 병렬 컴퓨팅 기술인 베오울프 클러스터 기술의 개발이다. 베오울프 클러스터 기술의 개발 이후 컴퓨터의 성능은 소자수준의 기술과 여러 대의 컴퓨터를 흠없이(seamlessly) 안정적으로 엮어 대형 컴퓨터로 통합할 수 있는 분산 컴퓨팅 기술이 같이 발전하는 방식으로 꾸준하게 성능이 높아져 왔다.

앞으로 다가오고 있는 사이버 물리 시스템 시대에는 이런 경향이 극단적으로 발전하여 사이버 물리 시스템을 구성하는데 활용될 것으로 필자는 생각한다. 사이버 물리 시스템을 구성하는 단위 제어기나 부품에서의 지능형 엣지 컴퓨팅을 위해 고성능 컴퓨팅 프로세서와 이 프로세서의 성능과 자원을 효과적으로 활용하도록 돕는 운영 체제가 앞으로 더 중요해질 것이다. 이에 더해, 공간적인 제약을 넘어서는 대규모의 컴퓨팅 자원을 끌어와 활용하거나 서로 다른 하위 수준의 기능과 서비스가 사용자 수준에서 비즈니스 가치를 주는 기능과 서비스로 통합되기 위해 필요한 자원 조율과 관리에는 클라우드 컴퓨팅 기술이 운영체제의 역할을 하게 될 것이다.

대표적인 클라우드 컴퓨팅 오픈소스 소프트웨어인 “오픈스택(OpenStack)”이 한창 인기가 절정이었던 시절에 IT업계의 클라우드 컴퓨팅 전문가들이 “오픈스택”을 “클라우드 OS”라고 부른 것도 이런 맥락이라고 보면 될 것이다. 실제로 “오픈스택”의 코어 프로젝트들은 클라우드 컴퓨팅 시스템에서 리눅스의 커널과 같은 역할을 한다. 리눅스 커널을 개발하고 유지하는 리눅스 재단의 전무(executive director)인 짐 젬린(Jim Zemlin)이 “2014년 파리 오픈스택 서밋(OpenStack Summit Paris 2014)” 회의에서 “오픈스택”이 조만간 데이터센터 컴퓨팅에서 리눅스 커널과 같은 역할을 하는 중요한 프로젝트로 발전하게 될 것이라고 언급하면서 “오픈스택”의 빠른 성장이 부럽다는 취지의 연설을 한 것도 이런 추세를 잘 표현한 것으로 볼 수 있다.

사이버 물리 시스템이 사회 곳곳에 확산되는 미래에서 클라우드 컴퓨팅은 분산 컴퓨팅 시스템 자원이 필요한 사이버 물리 시스템의 기능을 구현하기 위해 데이터센터와 모바일 엣지 컴퓨팅(Mobile Edge Computing; MEC) 시스템 수준에서 자원을 관리하고 조율하는데 사용되는 운영체제의 역할을 하게 될 것이다. 좀더 이해하기 쉽도록 다른 방식으로 한 번 더 설명하자면, 하나의 컴퓨터 시스템의 자원 보유량을 넘는 컴퓨팅 자원이 필요한 사이버 물리 시스템의 기능을 구현하고 제공하기 위해 데이터센터 스케일로 운영되는 컴퓨팅 자원이, 현재 우리가 쓰고 있는 리눅스에서 CPU 명령 사이클과 메모리 등의 자원을 할당받아 이용하기 위해 리눅스 커널의 API를 이용하는 것과 마찬가지로, 클라우드 컴퓨팅 시스템으로 통합되어 하나의 컴퓨터와 같이 관리되면서 클라우드 컴퓨팅 서비스 API를 이용하여 사이버 물리 시스템의 기능을 구현하게 될 것이다.

이 얘기는 사이버 물리 시스템 입장에서는 데이터센터가 자동차의 전자제어장치(Electronic Control Unit; ECU)와 같은 단위 사이버 구성요소 또는 컴포넌트의 역할을 하게 되는 것이다. 사이버 물리 시스템을 구성하는 사이버 구성요소로서 데이터센터에 있는 컴퓨팅 자원들을 소프트웨어적으로 요청하고 프로그램하기 위해 클라우드 컴퓨팅 서비스가 운영체제와 같은 역할을 하게 된다는 것이다.

이렇게 데이터센터를 사이버 구성요소로 할 만한 사이버 물리 시스템의 기능이 과연 무엇이 있을까라고 독자 여러분들께서는 궁금해하실 수 있을 것 같다. 역시 자율주행과 모빌리티 서비스 분야의 예를 들어 같이 생각해보자.

자율주행 자동차가 안전하게 자율주행을 하기 위해서는 차량 주변에 안전을 위협하거나 주행에 영향을 주는 장애물이나 차량, 또는 보행자가 없는지 주행 환경을 정확하게 인지하고 주행 계획에 반영해야 할 필요가 있다. 자율주행 차량의 원가(cost)나 내부 공간 문제 때문에 자율주행 차량에 달 수 있는 센서의 수와 종류에 한계가 있고, 센서마다 다른 물리적 특성과 감지 능력의 차이, 생성하는 데이터의 양 때문에 센서 정보를 주행 계획 계산에 필요한 시간 안에 계산하여 주행 계획에 반영할 수 있도록 처리하기에는 현재 자동차 한 대에 설치되는 컴퓨팅 시스템의 자원만으로는 많이 부족할 것으로 예상된다.

이렇게 자동차 한 대에 장착할 수 있는 컴퓨팅 자원만으로 복잡한 주행 환경 인지와 판단을 모두 하기 어렵고, 센서의 물리적인 특성으로 인해 감지되지 못하는 위협 요소와 장애물들을 감지하고 판단하기 위해서는 교통 인프라와 다양한 사물들이 생성하는 정보들을 통합하여 자율주행 자동차의 주행 계획 계산에 활용하여야 한다. 이렇게 자율주행 자동차의 주행 계획 계산에 자동차의 센서 정보뿐만 아니라 교통 인프라와 사물이 가진 센서와 정보를 같이 활용하여 주행 환경 인지를 하는 것을 “확장된 인지(extended perception)”라고 한다.

이런 “확장된 인지”를 위한 데이터 수집과 처리를 위해서는 단위 사이버 물리 시스템인 자율주행 자동차가 가진 컴퓨팅 자원을 넘어서는 교통 인프라와 사물 인터넷 서비스를 제공하는 데이터센터의 자원을 활용하여야 할 필요가 생긴다.

예를 들어 자율주행 자동차가 가려고 하는 목적지까지의 경로에 사고나 차량이 많아 생기는 교통 체증이 있거나 하는 등의 실시간 교통 상황을 도로 인프라에 설치된 CCTV와 차량 각각에 설치된 C-V2X 통신 장치를 통해서 데이터를 수집하여 자율주행차에 제공하는 서비스를 생각해 보자. 

국토교통부의 중앙 교통 정보 시스템이 운영되는 데이터센터로 우선 자율주행차의 경로에 해당하는 도로구간마다 차량 숫자와 교통 상황에 대한 영상 및 차량 데이터를 수집하여야 할 것이다. 이후, 교통 정보를 요청하는 차량이 가려고 하는 경로상의 도로 위 차량 숫자 및 사고 상황에 대한 정보만을 도로 교통 인프라의 CCTV 영상에서 인공지능 기술로 인지, 추출하고, C-V2X 통신을 통해 도로 구간별 차량 숫자 통계를 내기 위해 각 차량의 위치 센서 정보를 차량 고유 식별 정보를 없애고 익명화하여 데이터센터로 전송하여 경로상의 도로 구간별 교통량을 데이터센터에서 자동으로 집계한다.

자율주행차는 C-V2X 통신을 통해 자신의 경로를 데이터센터로 전송하고, 데이터센터에서 운영 중인 중앙 교통 정보 시스템에서는 해당 경로상의 교통량과 사고 정보를 자율주행차에 전송해준다. 자율주행차는 이들 교통량 정보와 사고가 일어난 경로상의 위치 정보를 활용해서 현재의 속도와 경로로 목적한 시간 내에 목적지에 도착할 수 있을지 주행하면서 지속해서 판단하게 되고, 만약 목적한 시간 내에 목적지에 도착할 수 없을 것 같다고 판단하게 되면 대안이 되는 경로를 새로 탐색하여 새로운 경로 계획을 세우게 된다.

자율주행차가 계획한 경로를 이동하면서 사고가 일어난 지점 부근을 지나게 될 때는 차선 변경과 같은 단거리 경로 계획을 세우기 위해 다시 중앙 교통 정보 시스템에 사고 지점 부근의 정보를 요청하게 된다. 중앙 교통 정보 시스템은 해당 지점의 사고 상황 정보를 다시 교통 인프라의 CCTV를 이용해 수집하거나, 만약 CCTV가 설치되지 않았거나 있더라도 사고 상황에 대한 영상이 충분하게 확보될 수 없는 상황이라면, 사고 상황 주변에서 정체된 차량의 위치를 확인하여 해당 차량들의 영상 센서 데이터를 전송받아 처리하고, 사고가 일어난 지점의 차선 정보와 사고 상황이 담긴 영상과 같은 정보를 요청한 자율주행차에 전송하도록 한다.

이 과정에서 자율주행차로 영상 정보를 전송하기 위해 중앙 교통 정보 시스템의 영상을 보내기에는 C-V2X 네트워크 트래픽의 혼잡으로 서비스 지연이 많이 생길 것으로 판단한 중앙 교통 정보 시스템의 인공지능 시스템이 해당 영상의 전송을 자율주행차가 주행하는 지역에서 가장 가까운 모바일 엣지 컴퓨팅 시스템의 “시스루(see-through)” 서비스로 서비스 처리를 이양(handover)하기 위해 C-V2X 서비스를 제공하는 통신사업자의 “시스루(see-through)” 서비스에 V2V 영상 전송을 이양한다.

중앙 교통 정보 시스템으로부터 특정 지점의 자동차 센서 영상 V2V 전송 요청을 받은 자율주행 자동차의 위치 및 속도 정보를 이용해 C-V2X “시스루(see-through)” 서비스에서 영상을 목적하는 지연시간에 맞게 스트림할 수 있는 가장 가까운 기지국이나 모바일 엣지 컴퓨팅 센터를 C-V2X  시스템에서 실시간으로 스케줄링한다. C-V2X 인프라를 통해 스케줄링된 모바일 엣지 컴퓨팅 센터의 “시스루(see-through)” 서비스는 요청한 자율주행차로 사고 지점에 대한 영상 센서 데이터를 전송해준다. 이 “시스루(see-through)” 서비스 영상 데이터와 중앙 교통 정보 시스템에서 보내오는 차선 및 위치 정보, 고정밀 지도(HD Map) 서비스 사업자가 보내주는 자율주행용 고정밀 지도(HD Map)를 이용해서 차선 변경을 위한 단거리 경로 계획을 하고 사고 지점을 회피하는 주행을 실행한다.

위에서 설명한 자율주행차의 주행 상황에서 클라우드 컴퓨팅이 어떤 역할을 하는지 같이 살펴보면서 사이버 물리 시스템과 클라우드 컴퓨팅과의 연관성을 좀더 구체적으로 생각해보자. 먼저 “확장된 인지”를 위해 교통 인프라의 CCTV 영상 정보와 자율주행차가 아닌 다른 차량의 센서 데이터를 사용하여 교통량 예측 및 사고 지점 정보를 수집하고 활용하는 부분은 분명 자율주행차 내부에 있는 컴퓨팅 시스템의 능력을 넘어서는 일이기 때문에 클라우드 컴퓨팅 인프라에서 일어나게 된다. 

왜 교통 인프라 CCTV 영상 데이터와 다른 차량의 영상을 자율주행차가 직접 받아서 처리하지 않느냐고 묻는 독자분이 있을 수 있어 다시 부연 설명하자면, 현재의 컴퓨팅 기술로 자율주행차는 자신의 센서가 수집한 데이터와 자동차 내부의 자율주행 기능을 처리하는 데에도 컴퓨팅 용량이 크게 모자라기 때문에 교통 인프라 데이터 및 다른 차량의 정보를 처리하는 일은 클라우드 인프라에서 일어날 수밖에 없다.

위 시나리오에서 또 하나 눈여겨 봐야 할 부분은 클라우드 컴퓨팅 서비스로 운영되는 중앙 교통 정보 시스템의 인공지능 시스템이 자신이 처리하는 교통 인프라 영상 데이터와 함께 다른 차량의 영상을 자율주행차로 전송하는 작업이 자신의 컴퓨팅 용량을 넘어설 것으로 판단하고 모바일 엣지 컴퓨팅 인프라의 “시스루(see-through)” C-V2X 서비스로 이 작업을 이양하는 부분이다. 

현재 클라우드 컴퓨팅은 하이브리드 클라우드 컴퓨팅이 대세가 되어가고 있다. 사실 이런 트렌드는 기술적으로 자연스러운 결과일 수밖에 없는데, 하나의 클라우드 컴퓨팅 서비스 회사가 모든 산업의 모든 요구 사항을 커버하기가 쉽지 않기 때문이다. 실제로, 현재 아마존 웹 서비스(Amazon Web Services; AWS)가 클라우드 컴퓨팅 시장을 거의 독점하다시피 하기는 했지만, 아마존 웹 서비스가 커버하지 못하는 영역은 일부 클라우드 컴퓨팅 서비스 회사들이 틈새시장을 겨냥해서 서비스하기도 한다. 예를 들면 아직 클라우드 컴퓨팅 서비스가 많이 침투하지 못한 베어메탈 고성능 컴퓨팅(bare-metal HPC) 자원의 클라우드 컴퓨팅 서비스를 과거 프로핏브릭스(ProfitBricks)와 같은 회사가 차별화된 서비스로 내세워 유럽 클라우드 컴퓨팅 시장에서 포지셔닝하기도 했다.

앞으로의 클라우드 컴퓨팅 인프라와 서비스는 하나의 클라우드 컴퓨팅 서비스 회사의 서비스를 이용하기보다는 서비스와 워크로드의 특성과 요구 사항, 서비스에 필요한 데이터에 관련된 법규와 개인 정보 보안, 서비스 대상 지역별로 다른 법적 문제 때문에 여러 클라우드 컴퓨팅 서비스 회사의 서비스와 기업 조직 내 프라이빗 클라우드(private cloud) 컴퓨팅 인프라를 같이 통합해서 사용하는 하이브리드 클라우드 컴퓨팅으로 발전할 수밖에 없다. 이런 하이브리드 클라우드 컴퓨팅 인프라에서는 사이버 물리 시스템 구성 요소의 기능과 신뢰성 수준에 따라 서로 다른 클라우드 컴퓨팅 인프라에서 사이버 물리 시스템의 다양한 하위 시스템과 구성 요소들이 운영되면서, 이들 클라우드 컴퓨팅 인프라 간 자동화된 자원 조율과 스케줄링이 하이브리드 클라우드 컴퓨팅 인프라를 이용해 개발된 사이버 물리 시스템의 전체적인 통합에 중요한 역할을 할 수밖에 없다.

위의 자율주행차 주행 시나리오에서 세번째로 생각해봐야 할 것은 클라우드 컴퓨팅 자원의 멀티테넌시(multi-tenancy) 문제이다. 커넥티드 자율주행차와 같은 미션 크리티컬한 사이버 물리 시스템의 경우 멀티테넌시의 문제는 보안과 맞물려 까다롭고 어려운 문제로 바뀌게 된다. 실제로 안전에 민감한 시스템인 자율주행차를 위한 중앙 교통 정보 시스템을 운영하기 위해 국토교통부가 별도로 데이터센터를 구축하고 별도의 프라이빗 클라우드 컴퓨팅 시스템을 만들 수도 있을 것이다. 그렇지만, 미국 국방성의 국방정보 시스템을 퍼블릭 클라우드로 이전해 10년간 운영하는 “제다이(JEDI) 프로젝트”를 전 세계 시장 점유율 2위 퍼블릭 클라우드(public cloud) 사업자인 마이크로소프트가 최근 수주한 것과 같이 펴블릭 클라우드 서비스 사업자에 안전과 보안 요건에 대한 요구사항을 걸고 입찰을 하여 클라우드 컴퓨팅 인프라와 서비스를 받을 가능성이 더 높아 보인다.

먼저 정부통합전산센터와 같은 정부의 데이터센터에서 운영 중인 클라우드 컴퓨팅 시스템에 자율주행차량용 중앙 교통 정보 제공 시스템과 같은 교통 사이버 물리 시스템의 일부를 구축한다고 가정하자. 현재 정부통합전산센터의 클라우드 시스템에는 정부 각 부처의 다른 정보 시스템이 같이 운영되고 있고, 다양한 보안 요건과 워크로드 특성을 가진 정보 시스템이 운영되고 있다. 교통 사이버 물리 시스템과 같은 미션 크리티컬 워크로드를 운영하는 클라우드 컴퓨팅 시스템은 데이터 보안, 지연 및 데이터 처리 요구 사항 면에서 더 높은 기준을 요구할 가능성이 높으므로 당연히 이를 위한 클라우드 컴퓨팅 자원의 특성도 달라질 것이다.

이미 구축된 클라우드 컴퓨팅 시스템에서 교통 사이버 물리 시스템의 요구 사항을 만족할 수 있도록 높은 성능, 보안 요건, 네트워크 자원 점유율 및 품질(quality of service; QoS)을 만족시킬 수 있을 것인가? 다른 워크로드 특성과 보안 특성을 가진 정보 시스템 및 서비스와 같은 클라우드 자원을 이용할 경우 안전한 서비스 제공을 위한 보안과 응답 지연, 성능을 유지할 수 있도록 우선순위를 가지고 안전하고 안정적인 멀티테넌시가 보장될 수 있을 것인가? 

정부통합전산센터와 같은 정부 기관의 프라이빗 클라우드 자원을 같이 활용하더라도 미션 크리티컬한 교통 사이버 물리 시스템의 요건을 만족시킬 수 있는 유연성과 확장성이 제공되도록 앞으로 클라우드 컴퓨팅 기술이 발전하겠지만 현재는 기술적으로 쉬운 일은 아니다.

특정한 사이버 물리 시스템이나 사이버 물리 시스템 내 하부 시스템을 위한 전용 프라이빗 클라우드를 별도로 구성한다고 해도 요구사항과 운영조건을 만족시키기가 쉽지 않을 수 있는데, 아마존 웹 서비스(Amazon Web Services)나 마이크로소프트 애저(Microsoft Azure) 같은 퍼블릭 클라우드가 다양한 사이버 물리 시스템 전체에 대한 클라우드 컴퓨팅 서비스를 모두 제공한다는 건 경우에 따라 기술적으로 정말 어려운 일일 수 있다. 다만 퍼블릭 클라우드 사업자들이 규모의 경제에서 오는 이점을 살려 서비스를 비용효율적으로 제공할 수도 있겠지만, 현재 시점에서 이 또한 기술적으로 어렵다.

위에서 필자가 말하고 싶은 요점은, 공간적으로 넓은 지역에 걸친 서비스들이 네트워크를 통해 연결되어 실제 사용자들이 사용하는 서비스로 완결되는 사이버 물리 시스템의 경우 사이버 물리 시스템의 모든 단위 기능들이 하나의 클라우드 컴퓨팅 인프라에서 운영되기 어려울 수도 있다는 것이다. 

이런 이유로 사이버 물리 시스템을 위한 클라우드 컴퓨팅 시스템은 사이버 물리 시스템에서 필요한 하부 구성 요소의 특성에 맞는 다양한 퍼블릭 클라우드 시스템들과 일부 프라이빗 클라우드 시스템에서 서비스들이 연동되어 운영되며, 이것 때문에 사이버 물리 시스템을 위한 멀티테넌시를 보장하는 것이 어려운 기술적인 문제가 된다는 것이다. 여러 클라우드 컴퓨팅 인프라에 걸친 하이브리드 클라우드 환경에서 안전하게 멀티테넌시가 보장되어야 하기 때문이다.

앞으로 자세하게 소개하겠지만, 이렇게 사이버 물리 시스템에서 멀티테넌시가 보장되는 하이브리드 클라우드 환경 구성을 위해서는 사이버 물리 시스템을 통합하는 네트워크 인프라 수준에서 멀티테넌시를 지원하는 기술이 있어야 한다. 실제로 5G 및 미래의 6G 이동통신에서는 네트워크 가상화의 개념이 적극적으로 받아들여져 확장되고 있다.

5G 이동통신부터 표준에 반영된 “네트워크 슬라이싱(network slicing)”은 이동통신 서비스 인프라 자원을 이동통신을 이용하는 고객들의 산업별, 조직별, 또는 고객별로 가상화, 분할하여 독립된 모바일 네트워크 서비스 인프라를 고객별로 요구하는 특성에 따라 제공하면서 성능 수준과 품질을 관리할 수 있도록 하는 기술로, “네트워크 기능 가상화(Network Function Virtualization; NFV)”와 함께 5G 이동통신에서 클라우드 컴퓨팅의 개념이 반영된 대표적인 기술로 꼽힌다.

“네트워크 슬라이싱”에서는 고객별로 종단 간(end-to-end) 멀티테넌시가 부여되어 5G 이동통신 인프라 자원을 독점하는 것과 같이 분리하여 사용할 수 있도록 해주며, 이런 특성 때문에 고객별로 다른 지연(latency) 및 대역폭, 기타 서비스 요구사항에 맞게 5G 이동통신망을 활용할 수 있도록 한다. 

이 “네트워크 슬라이싱” 기술 덕분에 고객을 직접 대면하는 단말기나 자율주행차와 같은 “자율 에이전트(autonomous agent)”부터 5G 모바일 네트워크의 코어 네트워크(core network) 및 서비스 서버에 이르는 데이터센터 서비스 인프라에 이르기까지 모바일 네트워크 자원의 멀티테넌시 부여 및 관리가 가능해지기 때문에 사이버 물리 시스템에 필요한 하이브리드 클라우드 환경에서 멀티테넌시를 지원하기도 용이해진다. “네트워크 슬라이싱”을 이용해 우선 네트워크 자원이 가상화가 되어 있으면 네트워크로 연결된 하이브리드 클라우드 자원별로 멀티테넌시를 지원하면 상대적으로 쉽게 하이브리드 클라우드 환경에서 종단 간 멀티테넌시 부여가 가능해지기 때문이다.

하지만, 이동통신사에서 부여, 관리하는 멀티테넌시와 하이브리드 클라우드를 구성하는 클라우드 인프라 전체를 아우르는 멀티테넌시 및 클라우드 컴퓨팅 자원 관리를 어떻게 할 것인지에 대해서는 아직 산업계에서 분명한 해결책이 나와 있지 않기 때문에, 사이버 물리 시스템 기술과 서비스가 발전하면서 앞으로 하이브리드 클라우드 컴퓨팅 환경에서의 멀티테넌시 관리 및 보안 기술의 중요성이 더 높아질 것으로 보인다.

위와 같이 자율주행 모빌리티 서비스 시나리오를 예로 들어 사이버 물리 시스템에서 클라우드 컴퓨팅이 필요한 이유와, 사이버 물리 시스템을 구성하는 운영체제 인프라로서 클라우드 컴퓨팅 기술이 앞으로 해결해야 할 기술적인 문제도 간단하게 같이 짚어보았다. 사이버 물리 시스템의 지능화 정도에 따라 부족한 계산 자원을 활용하는 문제로 인해 생기는 계층적 클라우드 컴퓨팅 자원 간의 자원 조율 및 관리 문제, 미션-크리티컬한 요구 사항을 만족하기 위한 하이브리드 클라우드 컴퓨팅 자원 조율과 관리 문제, 그리고, 하이브리드 클라우드 환경에서 모바일 네트워크 및 네트워크 자원의 가상화를 포함한 멀티테넌시 부여 및 관리 문제 등이 우선적으로 해결해야 하는 기술적인 과제들이다.
 


지금까지 생각해본 기술적인 문제와 함께 사이버 물리 시스템의 발전에 동반해서 나타나게 될 사이버 물리 시스템과 클라우드 컴퓨팅 자원의 지능 제어 및 관리 문제를 좀더 생각해보도록 하자.

자율 컴퓨팅의 성숙, 대규모 지능형 자원 제어와 사이버 물리 시스템의 빅데이터 문제
클라우드 컴퓨팅 기술이 사이버 물리 시스템의 운영체제와 같이 발전하면서 앞으로 우리가 보게 될 가장 흥미로운 현상 중의 하나는 2000년대 초반에 그리드 컴퓨팅과 함께 IBM이 내세웠던 “자율 컴퓨팅(Autonomic Computing)” 기술이 드디어 성숙하게 되는 계기가 될 것이라는 점이다. “자율 컴퓨팅” 기술은 말 그대로 컴퓨팅 시스템이 목적한 기능을 수행하기 위해 필요한 자신의 환경을 스스로 설정, 최적화해 조율하고, 내, 외부의 침입과 위협 요소들로부터 자신을 방어할 수 있도록 스스로 고장과 이상을 진단하고 회복하는 기능을 가진 분산 컴퓨팅 시스템 기술을 말한다.

IBM이 “자율 컴퓨팅”이라는 개념을 주창하고 발전시키게 된 것은 당시 인터넷 서비스 시장의 급격한 성장으로 분산 컴퓨팅 시스템의 수요가 폭발적으로 늘어나던 것과 맞물려 있다. 분산 컴퓨팅 시스템의 규모와 복잡도가 급격하게 증가하면서 구축, 운영 비용의 증가와 함께 장애 발생에 따른 비용도 급격하게 증가하게 되었기 때문이다. 

사이버 물리 시스템에서 요구되는 전체 시스템 통합의 완결성과 신뢰성이 보장되기 위해서는 시스템의 종단 간(end-to-end) 많은 부분이 높은 수준으로 자동화되어야 한다. 사이버 물리 시스템을 구성하는 컴퓨팅 시스템의 운영과 관리에서도 이런 자동화가 이루어져야 하는데, 이런 자동화의 지향점과 IBM이 내세웠던 “자율 컴퓨팅”의 개념이 많은 부분 공통점을 가진다는 것이다.

사이버 물리 시스템을 구성하는 환경에 대한 정보의 수집과 가공, 그리고 이 정보를 이용해 사이버 물리 시스템을 제어, 조작하기 위한 피드백을 계산하고 전달하는 경로를 구성해서 전체 시스템의 자율성을 높이는 기술이 사이버 물리 시스템을 구성하는 컴퓨팅 시스템의 운영에도 똑같이 적용되는 것이다. 

클라우드 컴퓨팅의 등장과 함께 업계에서 화두가 된 말의 하나로 “데브옵스(DevOps)”가 있다. “데브옵스” 기술들은 분산 컴퓨팅 시스템을 운영하는 과정을 시스템 운영과 유지보수를 자동화하는 소프트웨어를 개발하고 유지보수하는 과정으로 만들고 지속해서 시스템 운영의 자동화율과 안정성을 높여갈 수 있도록 한다. 이런 “데브옵스” 기술들이 “자율 컴퓨팅”을 구현할 수 있는 기술의 대표적인 예로 볼 수 있다.

다만 “데브옵스” 기술은 “자율 컴퓨팅”의 자율성을 구현하기 위한 기술이라기보다는 분산 시스템의 구성과 운영을 프로그램할 수 있도록 만들고 소프트웨어 개발 사이클을 따를 수 있도록 하여 시스템 운영, 관리의 자동화 수준을 높이기 위한 기술이다. “데브옵스” 기술은 “자율 컴퓨팅”이 원래 목표로 하는 시스템이 주어진 목적에 맞게 스스로를 재구성하고 동작하며, 고장과 이상을 스스로 진단하고 회복하는 자율성(autonomy) 측면을 강조하는 기술은 아니다.

클라우드 컴퓨팅의 등장과 함께 주목받았고, 빅데이터의 대표적인 활용분야의 하나로 꼽히는 “운영 지능(Operation Intelligence; OI)”은 빅데이터를 수집, 처리, 가공, 분석하여 활용하는 대상이 정보 시스템 자신이 되는 기술이다. “운영 지능”을 통해 정보 시스템 운영 데이터를 수집, 활용하여 정보 시스템에서 발생하는 복잡한 문제를 빅데이터 처리, 분석 기법을 활용해 탐지하고 정보 시스템 운영의 효율화와 시스템 안정성 개선, 시스템 보안 수준 향상, 장애 예방과 예측 정비에 활용하게 된다.

현재 “운영 지능”을 통해 복잡한 시스템 장애와 문제를 운영 빅데이터 처리와 분석을 통해 조기에 효과적으로 탐지하여 운영 요원들에 의한 시스템 운영에 활용하고, “데브옵스” 기술을 통해 시스템 구성, 운영 및 정비 작업을 자동화할 수 있다. 그렇다면, 이 다음 단계는 무엇일까? 바로 “운영 지능”과 “데브옵스” 기술이 흠없이 연결되어 정보 시스템의 운영이 자동화된 사이버 물리 시스템화되는 것이다.

“운영 지능” 기술의 대표적인 사례인 “스플렁크(Splunk)”와 같은 소프트웨어나 “뉴 렐릭(New Relic)”이나 “클라우드 피직스(Cloud Physics)”와 같은 클라우드 서비스들 모두가 대부분 시스템의 운영 상황에 대한 데이터 수집, 처리를 자동화하고 장애와 문제 탐지, 해결 과정을 손쉽게 할 수 있도록 돕는 분석과 데이터 시각화 도구를 제공하는 데 초점을 맞추고 있다.  “운영 지능” 소프트웨어를 이용해 장애 여부를 판단하고 해결하는 역할은, 설사 “데브옵스” 기술을 활용해 어느 정도 자동화된 방식으로 해결한다고 해도, 아직은 시스템 운영자가 개입해서 장애 여부에 대한 판단과 문제의 실질적인 해결을 주도해야만 가능하다. 즉, 정보 시스템이 자율성을 가지고 스스로 문제를 진단하고 해결하는 단계는 아닌 것이다.

사이버 물리 시스템 기술과 서비스가 발전하게 되면서 사이버 물리 시스템 자체의 운영과 사이버 물리 시스템을 위한 컴퓨팅 및 정보 자원을 제공하고 관리하는 클라우드 컴퓨팅 시스템이 자율성을 가지고 자동화되는 단계로 곧 발전하게 될 것이다. 이 사이버 물리 시스템의 운영 자동화와 지능화에도 역시 인공지능 기술이 활용되게 된다.

사실 “운영 지능” 시스템에도 최근에는 시스템만의 특성을 학습하여 문제를 탐지하고 분류하는데 딥러닝과 통계적 머신러닝과 같은 머신러닝 기법이 많이 활용되고 있다. 그리고 “지능(Intelligence; OI)”이라는 말 자체에 이미 인공지능 기술을 활용한다는 의미가 포함되어 있기는 하다. 다만 지금까지는 문제의 탐지와 분류, 그리고 이 문제를 운영자에게 알리는 과정을 자동화하는 과정에서 머신러닝과 같은 인공지능 기술이 활용되었다면 앞으로의 정보 시스템 운영에는 장애 여부의 판단과 이를 해결하기 위한 적절한 시스템 운영 해결책 및 전략의 선택과 실행과 같이 시스템 운영 전반의 자동화를 위해 인공지능 기술의 활용폭과 수준이 더 높아지고 복잡해질 것이다.

클라우드 컴퓨팅 기술을 통해서 하나의 거대한 컴퓨팅 시스템으로서 자원 조율 및 관리가 가능하도록 통합된 분산 컴퓨팅 시스템은 사이버 물리 시스템의 운영을 위해 필요한 빅데이터의 원천이 됨과 동시에 빅데이터를 활용해 탐지해낸 운영 문제와 장애, 고장을 해결하는 자동화된 시스템 운영에 필요한 프로그래밍 가능한 시스템으로 사이버 물리 시스템의 컴퓨팅 자원을 바꾸게 된다. 클라우드 컴퓨팅 기술이 없이는 정보 시스템 운영의 문제 탐지, 분석을 조금 수월하게 해주는 수준에 그쳤을 “운영 지능” 기술이 클라우드 컴퓨팅의 발전을 통해서 정보 시스템이 자율성을 가지고 스스로를 목적에 맞게 최적의 상태로 유지하고 제어하는 사이버 물리 시스템으로 발전하게 되는 것이다.

이런 경향을 보여주는 최근의 기술 현상에 대해서 조금 소개해보도록 하겠다. 앞으로 기고할 사이버 물리 시스템과 유무선 통신 인프라 기술 발전의 관계에 대한 글에서 좀더 자세하게 소개하겠지만, 현재 클라우드 컴퓨팅 기술의 사이버 물리 시스템 발전과의 관계를 소개하는 맥락에서도 같이 한번 살펴보아야 하기 때문에 여기서 간략하게 한번 언급하기로 한다.

최근 5G로 상징되는 이동통신 기술은 클라우드 컴퓨팅 기술의 영향을 많이 받았다. 5G 표준에는 클라우드 컴퓨팅에서 유래된 기술들이 3GPP 표준에 많이 반영되었는데, 이미 앞에서 언급했던 모바일 네트워크의 멀티테넌시와 가상화를 지원하기 위한 기술 표준인 “네트워크 슬라이싱”도 5G 모바일 네트워크에 “네트워크 기능 가상화”와 같은 클라우드 컴퓨팅 기술이 들어오면서 시작된 개념이다.

최근 5G 표준에 새로 들어온 개념 중에 “네트워크 데이터 분석 기능(NetWork Data Analytics Function; NWDAF)”은 5G 모바일 네트워크를 다양한 장비와 시스템에서 수집되는 운영 데이터를 이용하여 5G 모바일 네트워크 운영을 자동화하는 것을 목표로 한다. “네트워크 데이터 분석 기능(NetWork Data Analytics Function; NWDAF)”이 5G 모바일 단말에 연결된 다양한 단말(User Equipment; UE)과 스마트 시티, 스마트 팩토리 등의 산업 분야별 서비스, 모바일 네트워크의 운영 지원 시스템(OSS), 비즈니스 지원 시스템(BSS), 그리고 네트워크 관리 시스템(NMS) 등의 “운영, 관리, 경영 시스템(Operation Administration and Management; OAM)”과 5G 네트워크 장비 등에서 수집된 다양한 데이터를 머신러닝 및 인공지능 기술과 빅데이터 기술을 이용해 분석하여, 예전에는 모바일 네트워크 시스템 운영자(operator)의 수작업으로 이루어진 네트워크 운영을 NWDAF가 자동화된 방식으로 운영하려고 하는 것이다[30-37].

NWDAF와 같은 개념으로 모바일 네트워크 시스템을 종단 간으로 운영, 제어하기 위해서는 모바일 네트워크 시스템을 구성하는 장비 모두가 NWDAF의 폐쇄 루프 피드백(closed-loop feedback) 명령을 받아 유연하게 제어될 수 있어야 한다. 5G 표준에서 명시하고 있는 “네트워크 슬라이싱”과 “네트워크 기능 가상화” 등의 가상화 기술을 기반으로 프로그래머블한 인프라로 변화된 모바일 네트워크 인프라가 서비스 및 산업별로 다양한 데이터 전송 및 저지연, 보안 품질을 만족시키기 위해서는 최대한 자동화된 운영을 실현해야 한다고 판단한 것이다.

“네트워크 데이터 분석 기능(NetWork Data Analytics Function; NWDAF)”과 같이 빅데이터를 통해 사이버 물리 시스템과 그 자신이 운영되는 환경, 서비스를 이용하는 이용자, 다른 하부 사이버 물리 시스템들의 상태와 정보를 수집, 확인하고, 이 빅데이터와 자율적인 운영을 위한 폐쇄 루프 회로를 통해 사이버 물리 시스템의 운영과 동작을 자동화하여야 시스템의 서비스 요구 사항과 신뢰성을 충족할 수 있다. 이는, 앞서 서른여섯 번째 글에서 소개했듯이, 앞으로 우리가 만나게 될 사이버 물리 시스템이 인간과 지능적인 고급 상호작용을 구현하기 위해 필요한 컴퓨팅 자원의 규모와 데이터의 양이 크고, 광범위한 공간에 걸쳐 대규모로 배치, 통합되어 운영되는 사이버 물리 시스템의 특성 때문이다.

5G 이후의 모바일 네트워크 인프라도 사이버 물리 시스템으로서 동작하도록 진화하고 있다. 5G 및 5G 이후(beyond 5G) 모바일 네트워크는 앞으로 우리가 만나게 될 다양한 사이버 물리 시스템의 구성 요소로서 역할도 하기 때문에, 다른 사이버 물리 시스템과 통합되어 정보 고속도로 및 신경계로서 역할을 다하기 위해서는 모바일 네트워크 시스템 전체도 사이버 물리 시스템화되지 않을 수 없는 것이다.

NWDAF가 제어할 수 있는 네트워크 자원들은 물리적인 모바일 네트워크 시스템 파라미터도 있지만, “네트워크 기능 가상화”로 정의된 “가상 네트워크 기능(Virtual Network Function; VNF)”의 가상화 시스템 파라미터들도 있다. 예를 들어 출퇴근 시간과 같은 혼잡한 시간대에 일시적으로 C-V2X 통신의 요구 대역폭이 급격하게 증가하여 C-V2X “네트워크 슬라이스(network slice)”에 할당된 네트워크 대역폭을 늘여야 할 필요가 있다고 가정하자.  

NWDAF는 5G 기지국에 접속하는 사용자 디바이스(user equipment; UE) 중 자동차의 접속량이 급격하게 증가하는 것을 수집된 데이터로부터 파악하고, 통상적인 추이에 비추어 미리 정해진 네트워크 제어 시간 구간(time window) 동안 어느 정도의 대역폭이 더 필요한지를 예측 분석을 수행한다. 

이렇게 예측 분석을 수행하여 C-V2X 네트워크 슬라이스의 대역폭을 어느 정도 더 늘이기로 자율적으로 결정하고, 5G 기지국에 있는 모바일 에지 컴퓨팅 시스템부터 전송 네트워크와 코어 네트워크에 있는 “가상 네트워크 기능(Virtual Network Function; VNF)”의 수, 또는 “가상 네트워크 기능(Virtual Network Function; VNF)”의 C-V2X에 할당된 가상 네트워크 포트의 수나 대역폭을 일시적으로 늘여(scale-out) 더 많은 네트워크 대역폭을 확보하도록 5G 모바일 네트워크의 “네트워크 관리 및 오케스트레이션(Management and Orchestration; MANO)” 원격 API를 호출하여 자원 제어를 위한 피드백을 전달한다. 

자동차 접속량의 증가와 함께, 특정한 도로 구간이 교통 체증이나 정체로 지나치게 많은 C-V2X 서비스 요청이 몰려 저지연 요구사항이 충족되지 못할 것이라는 예측 분석의 결과가 다시 NWDAF에서 이벤트로 발생한다. 이 이벤트가 생성됨과 동시에 해당 서비스 구간의 C-V2X 서비스 지연을 낮추기 위해 해당 도로 구간에 해당하는 엑세스망과 전송망C-V2X 슬라이스에 할당된 자원과 패킷의 우회 경로를 늘여 병목이 일어나지 않도록 하는 피드백을 생성, 전달한다.

NWDAF에서 “가상 네트워크 기능(Virtual Network Function; VNF)” 자원 제어 명령을 받은 “네트워크 관리 및 오케스트레이션(Management and Orchestration; MANO)” 시스템은 해당 “가상 네트워크 기능(Virtual Network Function; VNF)”의 가상 머신을 추가로 프로비저닝하여 5G 종단 간의 네트워크 대역폭이 C-V2X 네트워크 슬라이스에 추가로 할당되도록 조정한다.

이와 같이, “가상 네트워크 기능(Virtual Network Function; VNF)” 기술과 네트워크 슬라이스로 가상화되어 클라우드 컴퓨팅 시스템화된 모바일 네트워크 자원을 종단 간 제어하여 5G를 비롯한 미래 모바일 네트워크 서비스의 품질과 요구사항을 맞추도록 자율적으로 동작하는 사이버 물리 시스템으로 모바일 네트워크가 진화하고 있다. 클라우드 컴퓨팅 기술은 모바일 네트워크 인프라를 프로그래머블(programmable)하고 제어가능(controllable)하며, 유연한(elastic) 자원 제어가 가능한 운영체제로서 역할을 다하여 모바일 네트워크가 사이버 물리 시스템으로서 동작하는 데 중요한 역할을 하게 된다.

위와 같이 모바일 네트워크 인프라의 사이버 물리 시스템화가 실제로 일어나기 위해서는 모바일 네트워크 인프라상의 다양한 장비와 모바일 네트워크에 연결된 다양한 디바이스들로부터 자원 관리 및 제어를 위한 데이터가 수집되어야 하는데 이 데이터는 엄청난 크기의 빅데이터가 된다[21]. 5G 또는 5G 이후의 모바일 네트워크 운영 초반부터 이렇게 많은 빅데이터를 당장 수집하여 모든 영역에서 자동화, 지능화가 한꺼번에 일어나지는 않겠지만, 이들 빅데이터의 수집이 확대되고 미래 모바일 네트워크 인프라에서 처리해야 하는 빅데이터의 양과 복잡도가 점차 더 높아질 것은 분명하다. 

지능화, 자동화된 모바일 네트워크 인프라 제어를 위해 필요한 빅데이터 처리 자원도 역시 지능화, 자동화되어 관리, 제어되어야 한다. 이 때문에 NWDAF와 같은 모바일 네트워크의 지능 제어를 위한 빅데이터 시스템도 궁극적으로는 모바일 네트워크 인프라 전용 클라우드 컴퓨팅 시스템에서 구성되어 빅데이터 처리의 요구사항을 만족하도록 자원 관리와 제어가 지능화, 자동화될 것이다.

미래의 사이버 물리 시스템의 핵심 구성요소 중의 하나인 5G, 5G 이후의 모바일 네트워크 인프라 그 자체도 클라우드 컴퓨팅 기술로 무장한 사이버 물리 시스템으로 진화하고 있다. 이런 사이버 물리 시스템의 컴퓨팅 자원을 유연하고 지능화된 방식으로 제어, 관리하기 위한 분산 컴퓨팅 운영체제로서 클라우드 컴퓨팅의 중요성은 앞으로 점점 더 높아지게 될 것이다. 퍼블릭 클라우드 서비스의 클라우드 컴퓨팅 자원을 활용하는 것도 중요하지만, 5G 모바일 네트워크 인프라와 같이 미션-크리티컬한 서비스를 제공하는 인프라에서 자원 관리를 담당할 프라이빗 클라우드 컴퓨팅 기술의 중요성도 함께 높아질 것이다. 여러 퍼블릭 클라우드 자원, 그리고 미션-크리티컬한 프라이빗 클라우드 컴퓨팅 시스템과의 흠 없는(seamless) 하이브리드 클라우드 구성 및 관리 기술의 중요성도 점점 더 높아질 것이다.

다음 글에서는 미래 사이버 물리 시스템의 핵심 요소로서 클라우드 컴퓨팅 기술이 해결해야 할 문제들과 발전 방향과 함께, 사이버 물리 시스템의 지능화, 자동화를 위한 빅데이터 문제를 해결하기 위해서 클라우드 컴퓨팅 기술이 어떻게 바뀌어 갈지 생각해보도록 하자.

[참고문헌]
[1] 김진철, “LHC에서 배우는 빅데이터와 machine learning 활용 방안”, 2016년 9월 28일, A CIO Conversation for Technology Leadership – Breakfast Roundtable 발표 자료
[2] 김진철, “김진철의 How-to-Big Data (9) – 빅데이터와 클라우드 기술 (1)”, CIO Korea, 2017년 9월 28일자. (http://www.ciokorea.com/column/35688)
[3] 김진철, “김진철의 How-to-Big Data (10) – 빅데이터와 클라우드 기술 (2)”, CIO Korea, 2017년 9월 28일자. (http://www.ciokorea.com/column/36179)
[4] 김진철, “김진철의 How-to-Big Data (11) – 빅데이터와 클라우드 기술 (3)”, CIO Korea, 2017년 9월 28일자. (http://www.ciokorea.com/column/36540)
[5] 김진철, “김진철의 How-to-Big Data (12) – 빅데이터와 클라우드 기술 (4)”, CIO Korea, 2017년 9월 28일자. (http://www.ciokorea.com/column/36748)
[6] 김진철, “김진철의 How-to-Big Data (13) – 빅데이터와 클라우드 기술 (5)”, CIO Korea, 2017년 9월 28일자. (http://www.ciokorea.com/column/37099)
[7] 김진철, “김진철의 How-to-Big Data (14) – 빅데이터와 클라우드 기술 (6)”, CIO Korea, 2017년 9월 28일자. (http://www.ciokorea.com/column/37380)
[8] Sabina Jeschke, “Everything 4.0? – Drivers and Challenges of Cyber Physical Systems,” Forschungsdialog Rehinland – Invited Talk, Wuppertal, December 4, 2013.
[9] Helen Gill, “From Vision to Reality: Cyber-Physical Systems,” Presentation at the HCSS National Workshop on New Research Directions for High Confidence Transportation CPS: Automotive, Aviation, and Rail, November 18-20, 2008.
[10] Helen Gill, “A Continuing Vision: Cyber-Physical Systems,” Fourth Annual Carnegie Mellon Conference on the Electricity Industry – FUTURE ENERGY SYSTEMS: EFFICIENCY, SECURITY, CONTROL, March 10-11, 2008.
[11] CPS Steering Group, “Cyber-Physical Systems – Executive Summary,” March 6, 2008.
[12] Insup Lee, “Cyber Physical Systems – The Next Computing Revolution,” Lecture – CIS 480, Department of Computer and Information Science, University of Pennsylvania, 2009.
[13] Insup Lee, “Cyber Physical Systems – The Next Computing Revolution,” Adream Lecture, LAAS-CNRS, June 15, 2010.
[14] Raj Rajkumar, Dionisio de Niz, Mark Klein, Cyber-Physical Systems, in the SEI Series in Software Engineering, Addison-Wesley, 2017.
[15] Rajeev Alur, Principles of Cyber-Physical Systems, The MIT Press, 2015.
[16] Edward Ashford Lee, Sanjit Arunkumar Seshia, Introduction to Embedded Systems – a Cyber-Physical Systems Approach, 2nd Edition, The MIT Press, 2017.
[17] 진회승, 서영희, 김원태, “CPS의 기능, 비기능적 소프트웨어 요구사항 분석”, 연구보고서 2017-008, 소프트웨어정책연구소(SPRi), 2018년 4월.
[18] Francesca Palumbo, “Introduction on Cyber-Physical Systems,” Lecture at CPS Summer School – From Concepts to Implementation, Alghero(IT), September 17 ~ 21, 2018.
[19] Wolfgang Wahlster, “Industrie4.0: Cyber-Physical Production Systems for Mass Customization,” German-Czech Workshop on Industrie4.0/Průmysl4.0 Prague, April 11, 2016.
[20] Teodora Sanislav, Sherali Zeadally, George Dan Mois, “A Cloud-Integrated, Multilayered, Agent-Based Cyber-Physical System Architecture,” Computer, April, 2017.
[21] Kartikey Joshi, Dhivya Sampath Kumar, Rahul Mehta, Shiva Muthuraj, “Autonomous Vehicles (AVs) – Technology, Economics, and Opportunities,” (https://www.slideshare.net/Funk98/autonomous-vehicles-60845449)
[22] Edward A. Lee, “The Past, Present and Future of Cyber-Physical Systems: A Focus on Models,” Sensors Vol. 15, pp. 4837-4869, 2015. doi:10.3390/s150304837
[23] Kyoung-Dae Kim and P. R. Kumar, “Cyber-Physical Systems: A Perspective at the Centennial,” Proceedings of the IEEE, Vol. 100, p. 1287 ~ 1308, May 13th, 2012.
[24] Soldani D, Manzalini A, “A 5G Infrastructure for ‘Anything-as-a-Service’”, J. Telecommun. Syst. Manage. 3, pp. 114, 2014. doi:10.4172/2167-0919.1000114
[25] Kyoung-Dae Kim and P. R. Kumar, “An Overview and Some Challenges in Cyber-Physical Systems,” Journal of the Indian Institute of Science, Vol. 93(3), p. 341 ~ 351, Jul.–Sep. 2013. (http://journal.library.iisc.ernet.in/index.php/iisc/article/view/1693)
[26] Alessandro D’Innocenzo, Henry Muccini, “Introduction to CPS,” 1ST DISIM WORKSHOP ON ENGINEERING CYBER-PHYSICAL SYSTEMS, TUESDAY 26, JANUARY 2016.
[27] Krishnarajanagar GopalaIyengar Srinivasa, Gaddadevara Matt Siddesh and Kushagra Mishra, “Influence of Big Data on Cyber-Physical Systems,” in Cyber-Physical Systems – A Computational Perspective, edited by Gaddadevara Matt Siddesh, Ganesh Chandra Deka, Krishnarajanagar GopalaIyengar Srinivasa, Lalit Mohan Patnaik, CRC Press, 2016.
[28] Srinidhi Hiriyannaiah, Gaddadevara Matt Siddesh, and Krishnarajanagar Gopala Iyengar Srinivasa, “Ubiquitous Computing for Cyber-Physical Systems,” in Cyber-Physical Systems – A Computational Perspective, edited by Gaddadevara Matt Siddesh, Ganesh Chandra Deka, Krishnarajanagar GopalaIyengar Srinivasa, Lalit Mohan Patnaik, CRC Press, 2016.
[29] Houbing Song, Qinghe Du, Pinyi Ren, Wenjia Li, and Amjad Mehmood, “Cloud Computing for Transportation Cyber-Physical Systems,” in Cyber-Physical Systems – A Computational Perspective, edited by Gaddadevara Matt Siddesh, Ganesh Chandra Deka, Krishnarajanagar GopalaIyengar Srinivasa, Lalit Mohan Patnaik, CRC Press, 2016.
[30] 신명기, “5G 시스템/네트워크 Phase-2 기술 현황 및 전망”, 한국통신학회 제2회 미래 통신기술 워크샵, 2019년 4월 26일.
[31] 신명기, 이수환, 이종화, “5G 네트워크 자동화 및 지능 기술 표준화 동향(Trends of 5G Network Automation and Intelligence Technologies Standardization)”, 전자통신동향분석(Electronics and Telecommunications Trends), 34권 2호 (통권 176), p. 92-100, 2019년 4월 1일. (DOI: 10.22648/ETRI.2019.J.340210, https://ettrends.etri.re.kr/ettrends/176/0905176010/)
[32] 이수환, “5G 네트워크 자동화를 위한 NWDAF 표준화 현황”, OSIA S&TR Journal, Vol. 31, No. 4, p. 04 ~ 10, December 2018.
[33] NGMN Alliance, “5G White Paper,” Next Generation Mobile Networks, White paper, 2015.02.
[34] 3GPP TS 23.501, “System Architecture for the 5G System (Release 15),” 2017.12.
[35] 3GPP TS 23.502, “Procedures for the 5G System (Release 15),” 2017.12.
[36] 3GPP TS 23.503, “Policy and Charging Control Framework for the 5G System (Release 15),” 2017.12.
[37] 3GPP TR 23.791, “Study of Enablers for Network Automation for 5G (Release 16)”, 2018.12*김진철 박사는 1997년 한국과학기술원에서 물리학 학사, 1999년 포항공과대학교에서 인공신경망에 대한 연구로 석사 학위를, 2005년 레이저-플라즈마 가속기에 대한 연구로 박사 학위를 받았다. 2005년부터 유럽입자물리학연구소(CERN)의 LHC 데이터 그리드 구축, 개발에 참여, LHC 빅데이터 인프라를 위한 미들웨어 및 데이터 분석 기술을 연구하였다. 이후 한국과학기술정보연구원(KISTI), 포항공과대학교, 삼성SDS를 거쳐 2013년부터 SK텔레콤에서 클라우드 컴퓨팅과 인공지능 기술을 연구하고 있다. 빅데이터와 인공지능 기술의 기업 활용 방안에 대해 최근 다수의 초청 강연 및 컨설팅을 수행하였다. dl-ciokorea@foundryco.com