자세히 보기

By Kim Jin Cheol

김진철의 How-to-Big Data | 빅데이터의 미래 (2)

사이버 물리 시스템(Cyber-Physical System)의 개념이전 서른 다섯번째 글에서 근 미래의 빅데이터 비즈니스와 기술의 모습을 그려

이 여섯 가지 현상들 각각 광범위한 기술 영역을 아우르는 말로써 서로 관련 없이 각자의 필요에 따라 독립적으로 발전하는 듯하게 보인다. 이 기술들이 공통의 지향점을 가지고 나아가고 있다는 것을 이번에 여러분들에게 소개하고자 한다. 이들 기술이 나아가는 지향점을 가장 포괄적이고 근접하게 설명하는 단어로서 “사이버 물리 시스템(Cyber-Physical System)”에 대해서 소개하고, 위 여섯 가지 기술들이 어떻게 “사이버 물리 시스템(Cyber-Physical System)”이라는 개념 아래에서 일관된 지향점으로서 통합되어 나가는지, 앞으로 나타날 “사이버 물리 시스템(Cyber-Physical System)”이 어떻게 발전해갈지 같이 생각해보면서 빅데이터 활용에 대한 힌트와 교훈을 얻어보고자 한다.

먼저 “사이버 물리 시스템(Cyber-Physical System)”의 정의를 같이 살펴보자. “사이버 물리 시스템(Cyber-Physical System)”이라는 말은 2006년 즈음 미국 국립과학재단(National Science Foundation; NSF)의 프로그램 관리자(program director)였던 헬렌 질(Helen Gill)이 언급하면서 처음으로 사용되기 시작하였다. 헬렌 질의 “사이버 물리 시스템”에 대한 정의를 같이 살펴보기로 하자.
 

“Cyber-physical systems are physical, biological, and engineered systems whose operations are integrated, monitored, and/or controlled by a computational core. Components are networked at every scale. Computing is deeply embedded into every physical components, possibly even into materials. The computational core is an embedded system, usually demands real-time response, and is most often distributed.” – Helen Gill, NSF, USA.[2-4]

“사이버 물리 시스템이란 물리적, 생물학적이며 엔지니어링된 시스템으로 그 작동이 계산 코어에 의해 통합, 모니터, 제어되는 시스템이다. 컴포넌트들은 모든 수준의 스케일에서 네트워크를 통해 연결된다. 계산은 각각의 물리적인 컴포넌트에 깊숙하게 내재되어 있고, 심지어는 (컴포넌트를 구성하는) 재료에도 내재되어 있다. 계산 코어는 임베디드 시스템이며, 보통 실시간 응답을 요구하고 분산되어 있다.” – 헬렌 질, 미국과학재단[2-4]


“사이버-물리 시스템(Cyber-Physical System; 이하 CPS)”이라는 말을 처음으로 주요 연구주제로 정착시키는데 크게 기여한 헬렌 질의 정의와 함께 CPS분야에 많은 기여를 한 컴퓨터 과학 석학이면서 “사이버-물리 시스템 관점에서의 임베디드 시스템 개요(Introduction to Embedded Systems – a Cyber-Physical Systems Approach, 2nd Edition)”라는 책을 쓴 UC 버클리의 에드워드 리(Edward Ashford Lee) 교수와 산지트 아룬쿠마 세시아(Sanjit Arunkumar Seshia) 교수의 정의도 같이 참고해보자.
 

“A cyber-physical system (CPS) is an integration of computation with physical processes whose behavior is defined by both cyber and physical parts of the system. Embedded computers and networks monitor and control the physical processes, usually with feedback loops where physical processes affect computations and vice versa. As an intellectual challenge, CPS is about the intersection, not the union, of the physical and the cyber. It is not sufficient to separately understand the physical components and the computational components. We must instead understand their interaction.” – Edward Lee and Sanjit Arunkumar Seshia [10]

“사이버-물리 시스템(CPS)은 시스템의 물리적인 부분들과 사이버 부분들에 의해 그 행동양식이 정의되는 물리적인 프로세스와 계산이 함께 통합된 것이다. 임베디드 컴퓨터들과 네트워크들이, 물리적인 프로세스들이 계산에 영향을 주는 피드백 루프를 이용해, 물리적인 프로세스들을 모니터하고 제어한다. 지적인 도전으로서 CPS는 물리적인 객체들과 사이버 객체들의 합집합이 아닌 교집합에 관한 것이다. 물리적인 컴포넌트들과 계산 컴포넌트들을 별개로 이해하는 것으로는 충분하지 않다. 대신에 우리는 그들 사이의 상호 작용을 이해해야만 한다.” – 에드워드 리, 산지트 아룬쿠마 세시아[10]




CPS의 정의를 시도한 많은 문헌과 학자들이 있지만[11], 여러 CPS의 정의에서 공통되는 부분들이 있는데 다음과 같은 것들이다.
∙ 기계적인, 또는 전기, 전자적인 물리적인 프로세스를 따르는 물리적인 구성요소
∙ 계산에 의해 신호와 피드백을 발생시키는 사이버 구성요소
∙ 네트워크를 통한 물리적인 구성요소와 사이버 구성 요소들의 상호작용
∙ 물리적인 구성요소와 사이버 구성요소 개별 요소만으로는 전체 시스템 특성이 나타나지 않음
∙ 작은 부품 단위에서 광역 센서 네트워크에 이르는 모든 스케일 수준의 시스템 통합
 


펜실베니아 대학의 이인섭 교수의 발표 자료에 따르면, CPS의 특성은 다음과 같이 정리할 수 있다[6-7].

□ 컴퓨팅과 소프트웨어가 긴밀하게 통합된 사이버 구성요소
– 모든 물리적인 컴포넌트에는 계산과 소프트웨어 집중적인 기능을 갖춘 컴퓨팅 요소 내재
– 대규모의 유무선 네트워크를 포함
– 다양한 스케일 계층 수준에서의 네트워크가 작동
□ 시스템으로 이루어진 시스템
– 다양한 시공간 스케일에서의 복잡성과 제약
– 동적으로 재조직/재구성할 수 있는 능력
– 나노물질과 생체공학적인 요소와 같이 새로운(unconventional) 형태의 컴퓨팅 및 물리층(substrate) 내재
□ 통신/컴퓨팅/제어 요소 간의 새로운 형태의 긴밀한 상호작용
– 높은 자유도를 가진 자동화, 제어 루프 간의 모든 스케일에서의 완결된 상호작용
– 제어 루프에 기술에 대한 지식이 없는(non-technical savvy) 사용자들이 포함
□ 구성요소 간의 유비쿼터스한 연결로 인해 전례 없는 보안과 개인 정보 보호 이슈가 발생
□ 시스템의 작동은 신뢰성이 보장되어야 하며, 특정한 경우에는 인증이 요구됨

위에서 소개한 CPS의 정의와 특성을 보면 CPS는 시스템을 구성하는 각 구성요소들이 물리적인 프로세스를 따르는 동작을 하며, 이런 물리적인 프로세스에 따르는 동작을 위해 컴퓨팅과 소프트웨어가 긴밀하게 통합된 사이버 구성요소가 물리적인 구성요소에 통합되어 있다. CPS는 또한 이러한 물리적인 구성요소와 사이버 구성요소 사이에 네트워크를 통한 통합과 조율(coordination)이 일어나는 시스템으로 이해할 수 있다.

CPS의 정의와 말만으로는 어떤 시스템을 얘기하는 것인지 독자분들께서 머릿속에 그리기가 쉽지 않으실 것 같아 예를 들어보고자 한다. CPS로 발전하고 있는 대표적인 시스템은 다음과 같은 것들이다.

□ 커넥티드 자동차와 지능형 교통 시스템(ITS)
□ 항공기
□ 전력망(Power Grid) 및 스마트 그리드
□ SCADA 및 스마트 팩토리
□ 방위 시스템 체계
□ 헬스케어 및 의료 진단, 수술 시스템
 
CPS의 대표적인 예로 자동차를 같이 생각해보자. 현재 우리들이 타고 다니는 자동차에는 수십 개의 전자 제어장치(Electronic Control Unit; ECU)가 사용된다. 2010년대에 들어서 자동차 내 전자 제어 장치의 숫자는 급격하게 증가하는 추세이다. 이들 전자 제어 장치는 자동차의 주요 부품, 가장 중요한 부품인 엔진부터 시작하여 자동차 차체의 주요 구성 요소인 창문, 후면 거울(rear-view mirror), 잠금 장치 등과 함께, 우리가 핸들이라 속칭하는 조향 제어 장치의 액추에이터와 변속 제어 시스템을 포함한 다양한 부품들에 장착되어 부드럽게 제어, 작동될 수 있도록 정밀하게 제어한다.



자동차가 이동 수단으로서 문제없이 작동하기 위해서는 엔진, 변속기 등의 각 컴포넌트들이 제각각 동작해서는 안된다. 엔진, 변속기, 조향 제어 장치, 변속 제어 장치 등이 서로 협력하고 긴밀하게 연동, 조율되어 자동차가 운전자의 의도에 맞는 승차감과 이동성을 제공할 수 있도록 자동차 본연의 이동 기능을 제공해야 한다. 이동 기능을 제공하는 부품과 컴포넌트들의 동작은 자동차 제어 네트워크를 통해 서로 정보를 주고받으며 서로의 동작이 하나의 자동차로서의 모빌리티 기능으로 통합되어야 그 의미가 있다. 자동차의 이동성 메커니즘을 구현하는 엔진, 변속기, 조향 및 가감속 제어, 변속 제어 등의 중요 부품들의 고장이나 결함은 자동차의 이동성이 온전하게 작동하지 못하게 한다.

자동차는 또한 대표적인 미션-크리티컬 시스템(mission-critical system)이기도 하다. 자동차 부품의 고장이나 결함은 경우에 따라서 운전자와 탑승객의 생명을 위협할 수 있다. 이런 이유로 자동차 부품의 품질과 안전성은 ISO26262, ASIL과 같은 국제적인 안전 기준과 각국 정부의 자동차 안전 법규 및 기준에 따라 엄격하게 평가되고 테스트, 인증되어야 한다. 



지능형 교통 인프라(Intelligent Transportation System; ITS)와 커넥티드 자동차(connected car)가 상용화되면 좀더 복잡한 문제가 발생한다. 자동차 기능 제어에 5G 무선 네트워크와 광대역 네트워크(WAN)를 통해 전달되는 교통 인프라 정보와 제어 신호가 사용되면 자동차 외부에서 전달되는 이들 정보와 신호가 자동차에 탑승한 승객들의 안전에 위협이 되지 않아야 하며, 이 때문에 보안(security)과 개인 정보 보호(privacy protection)가 더 철저하게 관리되어야 한다. 이뿐만 아니라 외부에서 전달되어 자동차 제어에 사용되는 정보들이 신뢰할 만한 대상으로부터 전달된 것인지, 현재 전달된 자동차에서 자동차 기능 제어에 사용할 수 있을 만큼 안전한 경로를 거쳐 만들어진 것인지 사용 전에 검증하고 확인하는 절차를 어떻게 만들어야 할 것인지도 중요하다.



5G, 6G 기반의 C-V2X(Cellular Vehicle-to-Everything communication) 통신 시스템과 커넥티드 자동차가 보편화되었을 때 보안도 중요해지지만, 광범위한 스케일에서 자동차 시스템과 교통 인프라 시스템 간 시스템 통합을 어떻게 신뢰성 있게 구현해내느냐 하는 기술적인 문제도 중요해진다. 앞서 설명한 CPS의 특성 중에서 다양한 스케일에서 물리적인 컴포넌트와 사이버 컴포넌트들이 네트워크로 연결되어 완결된 상호작용을 이루어야 한다고 얘기한 것이 바로 이 내용에 해당된다.

자동차 내부의 전자 제어 장치와 부품들이 자동차로서 기능이 통합되기 위해 차량 내 제어 네트워크를 통해 상호작용하는 과정도 복잡하고 신뢰성이 보장되어야 하는데, 차량 간의 통신을 통해 차량간 주행 정보 공유, 군집 주행(platooning), 협력 자율 주행(cooperative autonomous driving)과 같은 미래 이동 수단(mobility) 서비스가 안전하게 제공되게끔 차량 사이에 기능을 조율하고  신뢰성이 보장되도록 시스템을 개발, 통합하는 것은 더 어려운 일이다. 

C-V2X 통신과 커넥티드 자동차 시대에는 자동차 내부에서 작동하는 컴포넌트와 시스템 간 기능 통합과 신뢰성 확보도 중요하지만, C-V2X 통신을 통해 자동차 사이에 일어나는 기능 통합과 신뢰성도 자동차 안전에 큰 영향을 미치게 된다. 바로 이것이 앞서 설명한 “시스템들의 시스템(system of systems)”로서 통합되는 CPS 관점에서의 커넥티드 자동차이다. 이와 같이 “시스템들의 시스템”으로서 광범위한 지역에 걸쳐 모바일 네트워크를 통해 연결되어 통합되는 CPS는 개별 시스템 단위의 시스템 통합뿐만 아니라 개별 단위 시스템 사이의 시스템 통합이 넓은 지역에 걸쳐 이루어져야 한다는 점에서 다양한 수준, 계층의 스케일에서 완전한 상호작용과 동작이 보장되어야 한다.
 


지금까지 자동차의 예를 들어 CPS가 어떤 시스템인지 좀더 구체적으로 살펴보았다. 임베디드 시스템에 쓰이는 임베디드 컴퓨터의 성능이 PC 수준, 또는 NVidia사의 Xavier GPU가 장착된 Jetson 임베디드 컴퓨터와 같이 작은 슈퍼컴퓨터급으로 급격하게 향상되는 트렌드, IoT로 연결되는 다양한 사물에 엣지 컴퓨팅 시스템이 붙어 지능형 사물이 증가하는 트렌드, 5G 네트워크로 대표되는 사물과 사람 간의 연결성(connectivity) 확대 트렌드에 힘입어 CPS는 다양한 임베디드 시스템과 미션-크리티컬 인프라가 발전하는 지향점이 되어가고 있다.

CPS라는 개념과 트렌드가 빅데이터와 어떤 연관이 있길래 이렇게 필자가 빅데이터 얘기를 하다 말고 CPS에 대해서 꽤 긴 지면을 할애해서 설명하는지 궁금하신 독자분들이 있을 법하다. CPS와 빅데이터가 어떤 관련이 있는지, 앞으로 어떤 방식으로 발전해갈지 같이 생각해보자.

사이버 물리 시스템(Cyber-Physical System)과 빅데이터의 관계
필자가 이번 글 초반에 현재 사회에 나타나는 기술 트렌드의 지향점을 설명하는 단어로 “사이버-물리 시스템(Cyber-Physical System)”을 소개하였을 때 사이버-물리 시스템이 빅데이터의 미래를 보여주는 단 하나의 정답이라고 얘기하지 않았음을 독자 여러분들께서는 잊지 않으셨으면 한다. 빅데이터 트렌드가 다른 기술 트렌드들과 융합하여 발전하는 방향을 현재 시점에서 가장 잘 설명하는 단어가 “사이버-물리 시스템(Cyber-Physical System)”이기 때문에 “사이버-물리 시스템(Cyber-Physical System)”을 좀더 구체적으로 살펴보게 된 것이라고 언급했던 것을 꼭 기억해 주셨으면 한다.

필자가 이렇게 조심스럽게 “사이버-물리 시스템(Cyber-Physical System)”에 대해서 소개하는 것은 빅데이터 트렌드 초반에 빅데이터 관련 몇몇 기술들이 빅데이터의 전부인 양 비치고, 이런 오해를 통해 빅데이터라는 말이 실체가 아닌 단순한 마케팅 용어로 전락하면서 현실을 정확하게 보지 못하게 했던 부작용이 이 “사이버-물리 시스템(Cyber-Physical System)”이라는 용어를 통해서 또다시 생겨나지 않기를 바라는 마음 때문이다. “사이버-물리 시스템(Cyber-Physical System)”이라는 말 자체를 내세우기보다는 “사이버-물리 시스템(Cyber-Physical System)”이라는 말 뒤에 숨어 있는 현상과 배경의 의미를 정확하게 이해하는 데 같이 집중하도록 하자.

앞에서 설명한 것과 같이 “사이버-물리 시스템(Cyber-Physical System)”에서는 다양한 스케일에서의 컴포넌트와 시스템 간의 통합으로 다시 하나의 거대한 “사이버-물리 시스템(Cyber-Physical System)”이 조직되며, 이렇게 다양한 계층에서의 시스템 통합이 각각의 목적을 달성하도록 전체 시스템이 동작하는 데 중요한 역할을 한다. 바로 이 지점에 “사이버-물리 시스템(Cyber-Physical System)”과 빅데이터가 긴밀한 관련을 가지고 발전하게 된다.

“사이버-물리 시스템(Cyber-Physical System)”에서 일어나는 다양한 스케일에서의 컴포넌트와 시스템 간의 통합은 전체 시스템이 의도했던 목적과 효용을 위한 거대한 시스템으로 일관성 있고 흠없이(seamlessly) 작동하도록 이루어져야 한다. 이런 다양한 스케일에서의 컴포넌트 간 통합과 조율을 위해 필요한 정보의 수집, 가공, 관리와 분석에 빅데이터 기술들이 필요하다.

먼저 데이터 수집 관점에서 “사이버-물리 시스템(Cyber-Physical System)”과 빅데이터와의 연관성을 생각해보자. 앞서 예를 들었던 커넥티드 자동차를 다시 같이 생각해보자.

커넥티드 자동차나 자율주행 자동차는 자동차 내부에서 생산되는 데이터도 엄청난 양의 빅데이터가 된다. 지능형 교통 시스템 CPS를 구성하는 하나의 구성요소인 커넥티드 자동차가 단위 CPS로서 엄청난 양의 빅데이터를 쏟아내는 것이다. 



커넥티드 자율주행 자동차의 경우 이런 빅데이터를 생산하는 주된 컴포넌트는 주행 환경 인지를 위한 센서들인데, 이들 센서에 고성능 엣지 컴퓨팅 디바이스가 사이버 컴포넌트로서 같이 통합되면서 엄청난 양의 빅데이터를 자동차 내부 네트워크에 쏟아내게 된다.
센서들이 쏟아내는 빅데이터뿐만 아니라, 이들 센서 빅데이터가 커넥티드 자동차의 주행에 필요한 정보로 변환되는 과정에서 생기는 파생 데이터도 빅데이터가 된다. 물론, 엣지 컴퓨팅의 도움을 빌어 파생 데이터의 양은 센서에서 원래 생산되었던 원시 데이터의 양보다는 그 양이 많이 줄어들고 정보도 많이 압축되겠지만, 센서에서 생산되었던 원시 데이터가 워낙 많기 때문에 그 양이 줄어들고 압축된다고 해도 여전히 무시할 수 없는 빅데이터가 될 수밖에 없다.

다음에는 이들 커넥티드 자동차 내부에서 생산되는 빅데이터뿐만 아니라, 커넥티드 자동차들과 교통 인프라, 5G 또는 6G의 미래 모바일 네트워크 인프라가 엮여 만들어지는 대규모 교통 CPS 관점에서 생산되고 순환되는 빅데이터에 대해서도 한번 생각해보자. 앞에서 커넥티드 자율주행 자동차 한 대의 내부에서 생산되는 데이터만도 하루에 4TB에 이를 것으로 예측했던 인텔의 2016년 전망이 사실대로 이루어진다고 가정하자. 이런 커넥티드 자율주행 자동차들이 수백 대, 수천 대, 또는 서울과 같은 대도시에서 수십만 대에서 수백만 대가 도시 전역에서 주행하고 있는 상황에서 이들이 쏟아내어 모바일 네트워크로 하루에 전송하는 데이터의 양은 엑사바이트(1TB의 10만 배, 즉 1018 바이트)에서 제타바이트(1TB의 10억 배, 즉 1021바이트)정도의 규모가 된다는 것은 간단한 곱셈으로도 확인할 수 있다.

최근 빅데이터의 생산 주기가 점점 더 짧아지고 있어서, 지난 2016년에서 2017년 동안 생산된 데이터가 인류가 지금까지 생산한 데이터의 90%에 달한다고 한다[17, 19-20]. 2020년에는 전 세계에서 한 해에 40제타바이트가 생산되고 이 데이터는 2005년에 생산된 데이터의 300배에 달하며, 현재 매일 생산되는 데이터는 2.3제타바이트(23억 테라바이트)에 달한다는 IBM의 통계도 있다[17-18, 20]. 2018년 발표된 IDC의 백서에 따르면 2025년 한 해에만 175제타바이트의 데이터가 생산된다고 하는데, 그 증가 속도는 기하급수적으로 증가하는 것을 볼 수 있다. 이런 기하급수적인 데이터 생산량 증가는 앞서 커넥티드 자율주행 자동차의 예에서 CPS의 다양한 스케일의 계층에서 생산되는 데이터양을 생각해보면 어느 정도 수긍할 수 있다.

“사이버-물리 시스템(Cyber-Physical System)”에서 빅데이터 문제의 원인을 같이 생각해보자. 먼저 CPS에서 빅데이터를 처리해야 하는 가장 큰 이유는 CPS에 통합되는 컴포넌트의 수, 시스템 행동양식의 복잡도, 네트워크로 통합되어 상호작용하는 단위 CPS의 수에 비례하여 전체 CPS의 복잡도가 기하급수적으로 증가하며, 이 복잡도가 증가할수록 다루어야 하는 데이터의 양과 속도도 증가하기 때문이다. 

현재 자동차에 들어가는 전자 제어 장치(ECU)의 수만 해도 차종에 따라 수십 개에 이르는데, 자율주행을 위한 다양한 센서와 차량에 커넥티비티(connectivity)를 제공하기 위한 통신 모듈, 그리고 5G 및 6G 모바일 네트워크를 통해 커넥티드 자동차에 제공될 다양한 서비스를 위한 인포테인먼트 시스템과 기타 지능형 기능을 지원하기 위해 전자 제어 장치(ECU)나 차량 내 컴퓨팅 모듈의 수는 점차 늘어날 전망이다. 

이들 전자 제어 장치나 차량 내 컴퓨팅 모듈들은 앞서 살펴보았듯이 그 성능이 지난 20년간 지속적으로 향상되어 엔비디아(Nvidia)사의 Jetson Xavier 임베디드 컴퓨터와 같이 소형 슈퍼컴퓨터급의 성능을 지닌 임베디드 컴퓨터도 현재 시장에 출시된 상황이다. 이렇게 복잡한 연산이 가능한 임베디드 컴퓨터가 차량에 쓰이게 될 경우 차량 내에서 처리, 가공되는 데이터의 양도 자연스럽게 늘어날 수밖에 없다. 반대로 이런 고성능의 임베디드 컴퓨터가 자동차에 쓰이게 된다는 것은 자동차 내에서 처리해야 할 데이터의 양이 그만큼 많아진다는 뜻이기도 하다.

미래의 C-V2X 네트워크와 지능형 교통 시스템에 우선적으로 접속하게 될 이동 수단은 자동차가 되겠지만, 자동차만이 미래의 지능형 교통 시스템을 사용하는 것은 아니다. 우리의 이동 수단은 앞으로 비행 택시나 자율 드론 택시, 하이퍼루프와 같은 초고속 열차, IoT 기능이 추가된 자전거, 오토바이 등의 이륜차, 공유 킥보드 등과 같이 다양화될 것이다. 이런 다양한 이동 수단이 사용자의 집부터 최종 목적지까지 이동 수단이 필요한 모든 영역에서 모빌리티 서비스를 제공하기 위해 C-V2X를 통해 정보를 공유하거나 상호작용하게 되기 때문에 서로 교환하고 처리해야 할 빅데이터의 규모, 속도, 종류가 기하급수적으로 증가하게 된다.

위와 같이 CPS 시스템 내외부의 복잡도, CPS 개체 간의 상호작용의 복잡도에 따라 이를 구현하기 위해 필요한 정보의 양도 급증하기 때문에 CPS에서 유독 빅데이터 이슈가 부각되는 것은 자연스러운 현상이다.

두번째로 “사이버-물리 시스템(Cyber-Physical System)”의 가장 큰 특징 중의 하나인 시스템의 “자율성”을 구현하고 유지하기 위해 사용되는 제어 피드백 루프 회로가 지속적인 데이터 스트림을 만들어 내기 때문이다. 

우리 주변을 둘러싼 시스템과 인프라가 “사이버-물리 시스템(Cyber-Physical System)”으로 전환되면서 지금까지의 임베디드 시스템이나 인프라에 비해 “자율성(autonomy)”의 정도가 더 높아지게 된다. “사이버-물리 시스템(Cyber-Physical System)”이 자율성을 가지고 움직일 수 있도록 하기 위해 CPS 자기 자신과 CPS가 동작하는 주변 환경에 대한 정보를 끊임없이 수집하고 이를 가공, 분석해서 시스템에 피드백을 주어 CPS 전체의 상태를 안정적으로 유지할 수 있어야 하는데, 바로 이런 특성 때문에 하나의 CPS 전 시스템에서 빅데이터 수집, 처리 및 가공, 저장, 관리, 분석의 모든 이슈가 나타나게 된다.

빅데이터의 최종 활용 목적이 데이터의 분석과 분석 결과를 활용하는 수준이라면 데이터가 가공되면서 그 양과 속도가 점진적으로 줄어들 것이다. 그렇지만, 빅데이터의 최종 활용 목적이 시스템의 자율성을 유지하기 위해 자신의 상태 정보와 외부 환경 정보를 끊임없이 지속적으로 가공하여 피드백 루프를 통해 CPS 시스템에 다시 피드백을 주는 시스템이라면 빅데이터 가공의 최종 단계인 CPS의 제어 시스템에 이를 때까지 빅데이터의 양과 속도가 항상 줄어들지는 않을 수 있다. 시스템의 복잡도에 따라서는 오히려 더 늘어날 수도 있게 된다.

CPS와 상호작용하는 객체가 사람일 경우에는 사람의 행동 양식과 상호작용 방식을 완전하게 예측할 수 없는 불확실성 때문에 CPS의 행동 양식이 더욱 복잡해져 CPS의 자율성을 유지하기 위해 더 많은 빅데이터가 발생할 수 있다. 

구체적인 예를 들자면, 자율주행 자동차가 C-V2X와 센서의 도움을 받아 차선을 변경하는 경우를 생각해보자. 차선 변경을 위해서는 자율주행 자동차가 차선을 변경하는 동안 주변의 차량이 자신의 진로에 끼어들지 않을 것이라고 예측되어야 하고, 이 예측하는 계산 시간을 포함해서 실제로 차선 변경을 실행하는 동안에도 여전히 주변 차 중에서 사람이 직접 운전하는 차들이 갑작스럽게 끼어들 경우에 대비하면서 자동차 제어계를 제어해야 한다. 이 과정에서 주변 차들과 교통 상황에 대한 다양한 시나리오에 대해 수시로 예측 분석을 해야 하는데, 이 예측 분석의 결과가 또한 데이터가 되고, 이 예측 분석의 결과에 따른 차선 변경 경로 계획 데이터가 차량 내부에서 관리되면서 또 다른 종류의 데이터를 발생시키게 된다. 

고려해야 할 시나리오의 수가 많아지면 많아질수록 생성되는 경로 데이터의 양도 많아지며, 이렇게 예측 분석을 통해 계산된 경로 계획 데이터는 센서 데이터를 수집, 가공한 데이터와는 다른 종류의 데이터이다. 이렇게 CPS의 사이버 컴포넌트에 의해 자동화된 분석이나 시뮬레이션 과정에서 생기는 데이터도 CPS가 생산하는 빅데이터의 큰 비중을 차지할 것이기 때문에 CPS에서 빅데이터 처리가 더욱 중요해질 수밖에 없다.

세번째로 CPS 특유의 계층 구조와 네트워크를 통해 여러 수준의 스케일에 걸쳐 일어나는 상호작용 때문에 빅데이터를 처리해야 할 필요성이 높아진다.

하부 계층의 단위 CPS가 네트워크로 또 다른 계층의 CPS를 구성하는 대규모 CPS의 경우 계층별로 생산, 처리되는 막대한 빅데이터에 더해 이들 단위 CPS 간에 상호작용을 위해, 계층 간 상호작용을 위해 가공되고 교환되는 데이터가 파생되어 추가로 생겨난다. CPS의 계층이 늘어나고 CPS 안에서 상호작용하는 단위 CPS의 숫자가 늘어나면 늘어날수록 기하급수적으로 데이터의 규모와 속도도 높아지게 된다.

이와 같이 CPS를 구성하고 참여하는 컴포넌트와 하위 계층의 CPS의 숫자가 증가하면서 CPS에서 생산되고 흐르는 데이터의 규모와 속도도 기하급수적으로 증가하기 때문에 CPS가 사회 곳곳에 확산되는 것은 새로운 차원의 빅데이터 문제를 해결해야 하게 되는 것이다.

사회에서 인간과 상호작용하는 객체와 시스템이 고도로 지능화되고 자율성을 얻으며, 물리적 구성요소의 안전한 작동을 위한 컴퓨팅, 네트워크 구성 요소의 통합과 조율이 더 긴밀하고 복잡하게 엮여 나가게 되면 빅데이터 기술을 활용해야 할 필요성은 더 높아지게 된다.

이들 CPS가 자율적으로 동작하도록 하기 위해서는 예전에 CPS가 아니었던 업무 시스템이나 인프라 시스템에서 시스템의 구성요소로서 일하던 인간의 역할을 도와 인간의 능력을 더 증강하고 좀더 긴밀하고 유기적으로 통합된 시스템으로서 CPS가 작동하게끔 할 필요가 있다. 이를 위해 인간의 지능이 CPS와 상호작용하는 과정을 좀더 흠없이(seamlessly) 연동하기 위해 데이터 과학자와 소프트웨어 엔지니어들이 해당 업무를 기계 학습, 인공지능 기술로 자동화, 개선하게 될 것이다. 이와 함께, CPS 내에서 인간이 맡은 역할을 증강할 수 있는 방법을 찾기 위해 CPS가 제공하는 데이터를 분석하고 인간의 인지, 판단 능력을 보조하는 사이버 컴포넌트의 모델과 모듈을 개발하게 될 것이다.

위에서 소개한 바와 같이 CPS의 확산은 빅데이터 기술을 좀더 높은 수준으로 활용해야 하는 사회적인 공감을 확산시켜 빅데이터 기술 전문가와 데이터 과학자의 수요를 증가시키게 될 것이다. CPS의 확산으로 빅데이터 기술이 어떤 모습으로 바뀌어 갈 것인지 좀더 나가보도록 하자. 

인지 사이버-물리 시스템(Cognitive Cyber-Physical System)과 빅데이터의 미래
CPS 기술 체계가 발전, 확산되고 있는 현재에도 이미 빅데이터 기술의 중요성이 충분히 높아지고 있지만, 빅데이터 기술이 기하급수적으로 발전하게 될 또 하나의 전환점이 우리에게 점점 다가오고 있다. 바로 인지 컴퓨팅, 인공지능 기술과 사이버-물리 시스템의 융합이다.

인공지능 기술은 이미 CPS에서 센서와 다양한 데이터원으로부터의 데이터 수집, 데이터 처리의 자동화를 위한 이벤트 검출, 데이터 자동 분류를 위한 클러스터링, 자동화된 판단 및 의사 결정과 같이 시스템과 환경의 정보 취득 및 가공, 시스템 운영 자동화, CPS의 진단 및 분석에 많이 활용되고 있다. CPS의 많은 수의 컴포넌트와 광범위한 스케일에 걸친 자원을 조율하고 통합하면서 시스템의 자율적인 동작을 보장하기 위해 최근 딥러닝을 중심으로 급격하게 발전하고 있는 인공지능 기술을 CPS에 적용하는 연구개발 사례가 늘어나는 추세이다.

현재 자연어 처리에 사용되는 딥러닝 모델을 제외하고 딥러닝 기술은 대부분 지능형 센서나 주변 환경의 정보를 수집하는 CPS의 인지(perception) 관련 기능에 적용되고 있다. 최근 연구가 많이 진행되고 있는 심층신경망 기반의 강화학습(deep reinforcement learning)은 딥마인드의 알파고 사례에서 살펴볼 수 있듯이 인공지능 시스템이 데이터로부터 스스로 특정한 학습 전략이나 해답을 찾아 나가는 자가-적응형(self-adaptive) 시스템을 중심으로 그 응용 분야를 넓혀가고 있다.

최근 인공지능 연구자들은 장애물 탐지 및 추적과 같은 데이터로부터 환경에 대한 기초적인 정보를 수집하는 저수준 인지(perception)기능보다 더 높은 수준의 정신 과정(higher mental process)을 어떻게 컴퓨터 소프트웨어화할 것인가하는 문제로 관심을 많이 전환하고 있다. 이런 고수준의 정신 과정에는 공간과 상황의 맥락(context)을 이해하는 일부터 여러 카테고리의 정보에서 인지한 유사성을 바탕으로 새로운 카테고리의 데이터에 대한 정보와 구조를 이해하는 유추(analogy)와 이를 기초로 하여 다른 카테고리의 정보를 복합하여 일반화하는 복합 추론(reasoning)과 같은 고도의 정신 과정을 포함한다.

앞서 예를 든 자율주행 자동차만 해도 딥러닝의 발전으로 주변 환경을 인지하고 장애물을 회피하는 정도의 기본적인 주행 제어는 어느 정도 가능한 수준이 되었다. 물론 사고율을 절대적으로 낮추고 연산의 신뢰성을 높이는 엔지니어링과 안전성 향상의 문제는 여전히 숙제로 남아 있지만 원리적인 측면에서 기초적인 주행 환경 인지에 대한 문제는 딥러닝이 상당수 해결했다. 최근 인공지능 연구자들은 윤리적인 판단이 동반되어야 하거나 다양한 맥락의 이벤트가 동시다발적으로 발생하는 도심 자율주행과 같이 복잡한 상황과 맥락을 이해하는 고급 자율주행 인공지능 기술 개발에 벌써 관심을 가지고 도전하고 있다.

“인지 사이버-물리 시스템(Cognitive Cyber-Physical System; CCPS)”은 인지 컴퓨팅과 인공지능 기술의 발전에 힘입어 CPS의 종단 간(end-to-end) 시스템 통합 수준과 자율성을 한단계 더 높이고 시스템 각 컴포넌트의 동작이 더 지능화되어 인간의 고등 정신 과정과 상호작용까지 가능한 사이버-물리 시스템이다. 인지 컴퓨팅, 인공지능 기술과 사이버-물리 시스템을 통해 발전한 대규모 분산 컴퓨팅 시스템과 미션-크리티컬 시스템 통합 기술이 규모가 확장된 인지 컴퓨팅과 인공지능 시스템을 만드는데 응용된다고 보면 조금 이해가 쉬울 것 같다.

“인지 사이버-물리 시스템(Cognitive Cyber-Physical System; CCPS)”은 “사이버-물리 시스템”이라는 말과 같이 어떤 하나의 기술을 특정하는 단어라기보다는 기존의 시스템보다 좀더 높은 자율성을 가지고 인간의 고등 정신 능력을 닮아가는, 인간에 친화적이면서 더 복잡하고 고등한 상호작용이 가능하도록 발전한 시스템의 엔지니어링 체계라고 보는 것이 더 정확할 것 같다. CPS의 지능 수준과 자율성이 높아질수록 인간과의 상호작용이 더 복잡해지면서 더 많은 정보가 필요하게 되고, 이로 인해서 CPS 내에서 빅데이터 기술의 중요성이 더 높아지게 되는 것이다.

“인지 사이버-물리 시스템(Cognitive Cyber-Physical System; CCPS)”이 빅데이터 기술 발전과 활용에 근본적으로 더 깊은 영향을 미치는 원인은 기존의 CPS에 비해 더 수준이 높아진 자율성이다. 자율성이 높아진 에이전트와 CPS 구성요소들이 자신들에게 부여된 자율성을 이용해 인간의 개입이나 조작없이 자율적으로 데이터를 수집하고 자체적으로 분류하여 “인지 사이버-물리 시스템(Cognitive Cyber-Physical System; CCPS)”의 결함과 고장을 개선하고, 전체 시스템이 바뀌는 환경에 맞추어 좀더 능동적이고 자율적으로 적응할 수 있도록 하게 되면 이런 “인지 사이버-물리 시스템(Cognitive Cyber-Physical System; CCPS)”과 상호작용하는 인간의 업무방식과 생활방식에 큰 변화가 일어나게 될 것이다.

지금 인공지능 기술이 적용된 CPS를 만드는데 가장 큰 걸림돌 중의 하나인 인공지능 및 기계 학습 모델을 학습시키고 테스트, 평가할 데이터를 수집, 가공하는 일을 “인지 사이버-물리 시스템(Cognitive Cyber-Physical System; CCPS)”이 어느 정도 자동화하여 수행하기만 할 수 있어도 인공지능 기술의 응용과 확산에 많은 발전이 가능할 것이다. 

이렇게 자동화된 방식으로 수집된 데이터가 최근에 많이 연구되고 있는 AutoML과 같은 자동화된 딥러닝 모델 탐색 및 아키텍처 선택 방법과 결합하게 되면 CPS를 설계하고 구현하는 방식에서도 더 큰 변화가 예상된다. 이렇게 CPS의 설계 및 구현 과정의 자동화율이 높아지고 개발 기간이 짧아지게 되어 사회 인프라 곳곳의 지능화율이 높아지게 되면 인공지능에 의한 사회 시스템과 우리 생활의 변화도 더 가속화되어 빨라지게 될 것이다.

다음 편 글부터 “사이버-물리 시스템(Cyber-Physical System)”, 특히 방금 살펴본 “인지 사이버-물리 시스템(Cognitive Cyber-Physical System; CCPS)”과 빅데이터, 클라우드 컴퓨팅, IoT, 인공지능, 5G 및 고성능 네트워크와의 관계를 좀더 구체적으로 살펴보고 이로 인해 나타나는 기업 조직의 변화와 디지털 트랜스포메이션(digital transformation)과의 관계까지 살펴볼 것이다. 이 과정에서 빅데이터 기술 발전의 지향점과 활용 방법에 대해 좀더 구체적인 아이디어와 교훈을 얻을 수 있을 것이다.

[참고문헌]
[1] 김진철, “LHC에서 배우는 빅데이터와 machine learning 활용 방안”, 2016년 9월 28일, A CIO Conversation for Technology Leadership – Breakfast Roundtable 발표 자료
[2] Sabina Jeschke, “Everything 4.0? – Drivers and Challenges of Cyber Physical Systems,” Forschungsdialog Rehinland – Invited Talk, Wuppertal, December 4, 2013.
[3] Helen Gill, “From Vision to Reality: Cyber-Physical Systems,” Presentation at the HCSS National Workshop on New Research Directions for High Confidence Transportation CPS: Automotive, Aviation, and Rail, November 18-20, 2008.
[4] Helen Gill, “A Continuing Vision: Cyber-Physical Systems,” Fourth Annual Carnegie Mellon Conference on the Electricity Industry – FUTURE ENERGY SYSTEMS: EFFICIENCY, SECURITY, CONTROL, March 10-11, 2008.
[5] CPS Steering Group, “Cyber-Physical Systems – Executive Summary,” March 6, 2008.
[6] Insup Lee, “Cyber Physical Systems – The Next Computing Revolution,” Lecture – CIS 480, Department of Computer and Information Science, University of Pennsylvania, 2009.
[7] Insup Lee, “Cyber Physical Systems – The Next Computing Revolution,” Adream Lecture, LAAS-CNRS, June 15, 2010.
[8] Raj Rajkumar, Dionisio de Niz, Mark Klein, Cyber-Physical Systems, in the SEI Series in Software Engineering, Addison-Wesley, 2017.
[9] Rajeev Alur, Principles of Cyber-Physical Systems, The MIT Press, 2015.
[10] Edward Ashford Lee, Sanjit Arunkumar Seshia, Introduction to Embedded Systems – a Cyber-Physical Systems Approach, 2nd Edition, The MIT Press, 2017.
[11] 진회승, 서영희, 김원태, “CPS의 기능, 비기능적 소프트웨어 요구사항 분석”, 연구보고서 2017-008, 소프트웨어정책연구소(SPRi), 2018년 4월.
[12] Tuan A. Trinh, “Cyber-Physical Systems and Robotics,” Luxembourg, May 13-14, 2016.
[13] NIST CPS PWS(2016), Framework for Cyber-Physical Systems, Release 1.0, pp2-4, 2016.5.
[14] Francesca Palumbo, “Introduction on Cyber-Physical Systems,” Lecture at CPS Summer School – From Concepts to Implementation, Alghero(IT), September 17 ~ 21, 2018.
[15] Tom Kevan, “The V2X Standards Faceoff,” DE247 magazine online edition, September 1, 2018. (https://www.digitalengineering247.com/article/the-v2x-standards-faceoff/)
[16] Patrick Nelson, “Just one autonomous car will use 4,000 GB of data/day,” Network World, December 7, 2016 7:39 AM PST. (https://www.networkworld.com/article/3147892/one-autonomous-car-will-use-4000-gb-of-dataday.html)
[17] “67 Big Data Statistics You Must Learn: 2019 & 2020 Market Share & Data Analysis,” FinancesOnline.com, 2019. (https://financesonline.com/big-data-statistics/)
[18] “The Four V’s of Big Data,” IBM Big Data & Analytics Hub. (https://www.ibmbigdatahub.com/infographic/four-vs-big-data)
[19] Bernard Marr, “How Much Data Do We Create Every Day? The Mind-Blowing Stats Everyone Should Read,” Forbes – online edition (Forbes.com), May 21, 2018, 12:42am. (https://www.forbes.com/sites/bernardmarr/2018/05/21/how-much-data-do-we-create-every-day-the-mind-blowing-stats-everyone-should-read/#c68eafe60ba9
[20] Abeer Aulakh, “Top 10 Big Data Facts [INFOGRAPHIC],” grazitti.com, Feb 10, 2017. (https://www.grazitti.com/blog/top-10-big-data-facts-infographic/)
[21] David Reinsel, John Gantz, John Rydning, “Data Age 2025: The Digitization of the World From Edge to Core,” IDC White Paper, November 2018. (https://www.seagate.com/files/www-content/our-story/trends/files/idc-seagate-dataage-whitepaper.pdf
[22] Alex Woodie, “Global DataSphere to Hit 175 Zettabytes by 2025, IDC Says,” datanami.com,  November 27, 2018. (https://www.datanami.com/2018/11/27/global-datasphere-to-hit-175-zettabytes-by-2025-idc-says/)
[23] Cisco, “Cisco Global Cloud Index: Forecast and Methodology, 2016–2021 White Paper,” November 19, 2018. (https://www.cisco.com/c/en/us/solutions/collateral/service-provider/global-cloud-index-gci/white-paper-c11-738085.html
[24] Wolfgang Wahlster, “Industrie4.0: Cyber-Physical Production Systems for Mass Customization,” German-Czech Workshop on Industrie4.0/Průmysl4.0 Prague, April 11, 2016.
[25] Teodora Sanislav, Sherali Zeadally, George Dan Mois, “A Cloud-Integrated, Multilayered, Agent-Based Cyber-Physical System Architecture,” Computer, April, 2017.
[26] Kartikey Joshi, Dhivya Sampath Kumar, Rahul Mehta, Shiva Muthuraj, “Autonomous Vehicles (AVs) – Technology, Economics, and Opportunities,” (URL: )
[27] Edward A. Lee, “The Past, Present and Future of Cyber-Physical Systems: A Focus on Models,” Sensors Vol. 15, pp. 4837-4869, 2015. doi:10.3390/s150304837
[28] Kyoung-Dae Kim and P. R. Kumar, “Cyber-Physical Systems: A Perspective at the Centennial,” 
[29] Soldani D, Manzalini A, “A 5G Infrastructure for ‘Anything-as-a-Service’”, J. Telecommun. Syst. Manage. 3, pp. 114, 2014. doi:10.4172/2167-0919.1000114
[30] Kyoung-Dae Kim and P. R. Kumar, “An Overview and Some Challenges in Cyber-Physical Systems,” 
[31] Alessandro D’Innocenzo, Henry Muccini, “Introduction to CPS,” 1ST DISIM WORKSHOP ON ENGINEERING CYBER-PHYSICAL SYSTEMS, TUESDAY 26, JANUARY 2016.
[32] M. Törngren, F. Asplund, S. Bensalem, J. McDermid, R. Passerone, H. Pfeifer, A. Sangiovanni-Vincentelli, B. Schätz, “Characterization, Analysis and Recommendations for Exploiting the Opportunities of Cyber-Physical Systems,” Chapter 1 in Cyber-Physical Systems – Foundations, Principles, and Applications, edited by Houbing Song, Danda B. Rawat, Sabina Jeschke, Christian Brecher, Academic Press, 2017.
[33] Glenn A. Fink, Thomas W. Edgar, Theora R. Rice, Douglas G. MacDonald and Cary E. Crawford, “Overview of Security and Privacy in Cyber-Physical Systems,” in Security and Privacy in Cyber-Physical Systems – Foundations, Principles, and Applications, edited by Houbing Song, Glenn A. Fink, Sabina Jeschke, John Wiley and Sons, Ltd, 2018.
[34] Urban Sedlar, Mitja Rakar, Andrej Kos, “Big Data Analysis and Cyber-Physical Systems,” in Cyber-Physical Systems – A Computational Perspective, edited by Gaddadevara Matt Siddesh, Ganesh Chandra Deka, Krishnarajanagar GopalaIyengar Srinivasa, Lalit Mohan Patnaik, CRC Press, 2016.
[35] Mayank Swarnkar and Robin Singh Bhadoria, “Big Data Analysis in Cyber-Physical Systems,” in Cyber-Physical Systems – A Computational Perspective, edited by Gaddadevara Matt Siddesh, Ganesh Chandra Deka, Krishnarajanagar GopalaIyengar Srinivasa, Lalit Mohan Patnaik, CRC Press, 2016.
[36] Krishnarajanagar GopalaIyengar Srinivasa, Gaddadevara Matt Siddesh and Kushagra Mishra, “Influence of Big Data on Cyber-Physical Systems,” in Cyber-Physical Systems – A Computational Perspective, edited by Gaddadevara Matt Siddesh, Ganesh Chandra Deka, Krishnarajanagar GopalaIyengar Srinivasa, Lalit Mohan Patnaik, CRC Press, 2016.
[37] Srinidhi Hiriyannaiah, Gaddadevara Matt Siddesh, and Krishnarajanagar Gopala Iyengar Srinivasa, “Ubiquitous Computing for Cyber-Physical Systems,” in Cyber-Physical Systems – A Computational Perspective, edited by Gaddadevara Matt Siddesh, Ganesh Chandra Deka, Krishnarajanagar GopalaIyengar Srinivasa, Lalit Mohan Patnaik, CRC Press, 2016.
[38] Houbing Song, Qinghe Du, Pinyi Ren, Wenjia Li, and Amjad Mehmood, “Cloud Computing for Transportation Cyber-Physical Systems,” in Cyber-Physical Systems – A Computational Perspective, edited by Gaddadevara Matt Siddesh, Ganesh Chandra Deka, Krishnarajanagar GopalaIyengar Srinivasa, Lalit Mohan Patnaik, CRC Press, 2016.
[39] Chitresh Bhargava, “Applications of Robotics in Cyber-Physical Systems,” in Cyber-Physical Systems – A Computational Perspective, edited by Gaddadevara Matt Siddesh, Ganesh Chandra Deka, Krishnarajanagar GopalaIyengar Srinivasa, Lalit Mohan Patnaik, CRC Press, 2016.
[40] P.V.L. Narayana Rao, and Pothireddy Siva Abhilash, “Application of Mobile Robots by Using Speech Recognition in Engineering,” Cyber-Physical Systems – A Computational Perspective, edited by Gaddadevara Matt Siddesh, Ganesh Chandra Deka, Krishnarajanagar GopalaIyengar Srinivasa, Lalit Mohan Patnaik, CRC Press, 2016.

*김진철 박사는 1997년 한국과학기술원에서 물리학 학사, 1999년 포항공과대학교에서 인공신경망에 대한 연구로 석사 학위를, 2005년 레이저-플라즈마 가속기에 대한 연구로 박사 학위를 받았다. 2005년부터 유럽입자물리학연구소(CERN)의 LHC 데이터 그리드 구축, 개발에 참여, LHC 빅데이터 인프라를 위한 미들웨어 및 데이터 분석 기술을 연구하였다. 이후 한국과학기술정보연구원(KISTI), 포항공과대학교, 삼성SDS를 거쳐 2013년부터 SK텔레콤에서 클라우드 컴퓨팅과 인공지능 기술을 연구하고 있다. 빅데이터와 인공지능 기술의 기업 활용 방안에 대해 최근 다수의 초청 강연 및 컨설팅을 수행하였다. dl-ciokorea@foundryco.com