요즘 수많은 기업이 AI 물결에 올라타고자 안달이다. 그러나 기업용 네트워크 분야의 분위기는 조금 다르다. 이미 수년 전부터 AI 기반 네트워크
챗GPT가 세상에 모습을 드러낸 이후 생성 AI가 장안의 화제다. 덕분에 AI는 이제 일상적인 개념이 됐다. 그렇다면 기업용 네트워크 전문가는 AI의 대중화를 어떻게 받아들여야 할까?
미션 크리티컬 소프트웨어에서 AI가 더 중요한 역할을 차지할 것으로 예상되는 가운데, 네트워크 관리팀과 전문가들이 뒤처지지 않으려면 어떤 준비를 해야할까?
IBM의 소프트웨어 기반 네트워 GM 앤드류 코워드는 대다수 기업 네트워크가 이미 뒤처져 있다고 평가했다. 많은 기업이 클라우드로 이전하면서 기존 기업용 네트워크는 버림받은 신세다. 그에 따르면 기업들이 지금이라도 네트워크를 현대화하려면 AI와 자동화가 필수 조건이다.
그는 “무게중심이 데이터 센터에서 하이브리드 멀티클라우드 환경으로 바뀐 데 반해 기존 네트워크는 여전히 모든 트래픽이 데이터 센터로 흘러 들어가는 시대에 머물러 있다. 트래픽 플로우와 정책을 결정하는 네트워크 구성요소가 네트워크 관리팀의 통제권을 벗어날 수밖에 없는 이유다”라고 말했다.
EMA(Enterprise Management Associates)의 최근 연구도 이런 시사점을 뒷받침한다. EMA의 2022년 네트워크 관리 메가트렌드 보고서에 따르면, 99%의 기업이 적어도 하나의 퍼블릭 클라우드 서비스를 채택한 상황이며, 72%가 멀티클라우드 전략을 실행 중이다. 반면 400개의 IT 기업 중 현재 사용하고 있는 도구가 퍼블릭 클라우드를 효과적으로 모니터링하고 있다고 답한 비율은 18%에 불과했다.
AI는 AI로 상대하라
네트워크 기술의 관점에서 AI의 부상은 네트워크에 더 큰 부담을 안기고 있다. 일단 오픈AI, IBM 왓슨, AWS 딥렌즈와 같이 클라우드 기반 AI 툴을 사용하는 기업은 이런 모델을 학습시키기 위해 클라우드와 엔터프라이즈 데이터 센터 간에 엄청난 네트워크 트래픽을 발생시킨다. AI를 학습시키고 최신 상태로 유지하려면 방대한 양의 데이터가 오가야 한다.
심지어 AI는 알게 모르게 네트워크에 압력을 가하기도 한다. 다른 툴에 내장된 AI 기능에 옆문을 통해 네트워크에 올라타기 때문이다. AI는 콘텐츠 제작 툴, 안티스팸 엔진, 영상 감시 소프트웨어, 엣지 장치에 이르기까지 오늘날 수많은 툴과 솔루션에 탑재된다. WAN을 통해 엔터프라이즈 데이터 센터와 쉴새없이 통신한다. 트래픽이 급증하거나 지연 현상을 일으키는 주범이 될 수도 있다.
반대로 ‘AI는 AI로 상대하라’는 말처럼 AI를 네트워크 관리에 활용할 방법도 많다. AI 기반의 트래픽 관리 및 모니터링 툴은 항상 자원에 쪼들린 네트워크 팀이 멀티 클라우드 분산 네트워크의 복잡성과 취약성에 대처하는 데 한 줄기 빛과 같은 존재다. 동시에 SD-WAN, SASE 및 5G와 같은 현대 네트워크 서비스도 이제 지능형 라우팅, 로드 밸런싱 및 네트워크 슬라이싱 같은 작업을 수행하기 위해 AI에 의존한다.
그러나 AI가 네트워크에 많이 쓰일수록 이 질문을 피해갈 수 없다. 과연 기업 리더들이 이 기술을 완전히 신뢰할 수 있을까?
‘안정성이 생명’인 네트워킹, AI에게 믿고 맡길 수 있을까
AI로 네트워킹의 미래를 구축하는 임무를 맡은 몇몇 전문가들은 AI 시장이 과열됐다고 생각한다. AI 솔루션 공급업체가 때로 제품을 과대 포장하는 경우가 있다는 의견이다.
브로드컴 소프트웨어의 네트옵스(NetOps) 제품 관리자인 제이슨 노만딘은 “네트워크를 운영해본 사람들이 네트워크라는 것이 얼마나 복잡하고 오류에 취약한 환경인지 잘 안다. 그래서 혹여나 네트워크 중단 사태가 벌어질까봐 주요 의사 결정에 AI를 사용하는 걸 꺼린다”라고 말했다.
AI 모델의 기본적인 논리를 이해하지 못하는 운영팀은 특히 설득하기 어렵다. 노만딘은 “네트워크 운영팀이 AI 파도에 올라타게 하려면 인간의 개입과 감시를 보장하는 것이 먼저다”라고 말했다.
전문가들이 AI를 신뢰하려면 ‘설명가능한(explainable)’ AI가 필요하다. AI 모델이 신비로운 블랙박스가 아니라 속이 훤히 보이는 도구로 다가와야 한다는 뜻이다. 디지털 전환 서비스 업체 UST의 수석 AI 설계자 아드난 마수드 박사는 “AI가 믿을 수 있는 도구로서 자리매김하려면, 기업은 먼저 AI의 능력과 한계를 투명하게 드러내고 제한된 환경에서 마음껏 테스트할 수 있는 환경을 마련해줘야 한다”라고 말했다.
네트워크 기술자 입장에서 AI 도구를 쉽게 설명할 수 있고, 작동 방식을 이해하기 쉽다면 의사결정에 활용할 마음이 생긴다. AI 모니터링 도구가 보여주는 주요 수치는 성능을 추적하도록 도와준다. 마수드는 “AI가 제시하는 결과물을 계속 평가하고 동료와 공유하는 일도 중요하다”라며 “AI를 활용하는 데 잊어선 안 되는 점이 바로 맹목적으로 AI를 신뢰해서는 안 된다는 점이다. 그 한계를 명확히 인지하고 성과를 높이는 데 유용한 도구로만 써야 한다”라고 조언했다.
브로드컴의 노만딘은 네트워킹 전문가들이 AI에 ‘주도권을 내주는’것을 꺼릴 수 있다고 지적했다. 그러나 그는 중간 지점을 찾을 수 있다고 덧붙였다.
그는 “추천 엔진은 인간이 모든 걸 관리하는 시스템과 완전히 자동화된 시스템 사이에서 좋은 절충점이 될 수 있다. 인간은 AI가 제시하는 추천을 살펴보며 최종 결정을 내린다. 이 접근 방식은 지속적인 학습 피드백 루프를 만들어 AI 모델을 끊임없이 개선하는 데도 효과적이다”라고 말했다.
AI 채팅 지원으로 잡무 해결
기업 네트워크가 날이 갈수록 분산되고 혼잡해지는 상황에서 AI는 일단 자원에 부족한 팀의 잡일을 대신하는 것만으로도 그 가치를 톡톡히 입증하고 있다. IBM의 코워드는 “기업 전체에 걸쳐 즉각적이고 탄력적인 커넥티비티를 갖추는 일은 이제 필수가 됐다. 사업의 성패가 갈릴 만큼 중요해져 업계가 AI와 지능형 자동화 솔루션을 도입하려 다들 난리인 것”이라고 설명했다.
AI는 현재 성능 모니터링, 오보 차단, 근본 원인 분석, 이상 탐지 등의 여러 네트워크 기능에 활용되고 있다.
예를 들어 시스코의 메라키 인사이트(Meraki Insight)는 네트워크 성능 문제를 분석하고 문제를 해결해준다. 주니퍼(Juniper)의 미스트(Myst) AI는 네트워크 구성을 자동화하고, 최적화 작업을 처리한다. IBM의 왓슨 AIOps는 IT 운영을 자동화하고 서비스 제공을 개선한다.
AI는 또한 고객 경험을 개선하는 데 사용되고 있다. 주니퍼 네트웍스의 최고 AI 책임자인 밥 프라이데이는 “AI는 사용자와 클라우드 간의 소통을 유동적으로 파악해 최적화할 수 있다. 사람들이 모바일과 데스크톱 등 다양한 환경에서 네트워크에 접속하는 오늘날의 환경에 요긴한 이유다”라고 말했다. 그는 특히 원격 근무가 급격히 늘어난 네트워크 환경에서 AI의 유연성은 매우 유용하다고 덧붙였다.
원격 근무의 증가로 인해 사용자 지원용 AI 챗봇의 역할도 커졌다. 원격 근무 사용자의 지원 요청에 대응하기에 챗봇만한 도구가 없다.
프라이데이는 “AI가 차세대 검색 및 챗봇의 시대를 열고 있다. 목표는 결국 사용자에게 오류가 없는 안정적 네트워크 환경을 제공하는 것이며, 귀중한 IT 리소스를 산더미 같은 지원 티켓을 처리하는 데 낭비하지 않는 것이다”라고 말했다.
자연어 처리(NLP)와 자연어 이해(NLU) 기술을 기반으로 하는 챗봇과 가상 어시스턴트는 사용자의 질문을 이해할 수 있다. 시스템은 LAN, WLAN 및 WAN을 분석해 얻은 인사이트로 지원 요청에 해결책을 제시한다.
프라이데이는 “몇 년 전만 해도 클라이언트-클라우드 인사이트를 얻거나 지원 요청에 자동화된 답변을 하는 건 불가능했다”라며 “오늘날 NLP 기술로 사용자 의도의 맥락과 의미를 파악할 수 있고, 단순 예/아니오 답변이 아니라 더 복잡한 문제 해결도 자동으로 할 수 있다. NLP 기능은 사용자가 이게 사람인지 기계인지 분간하기 어려울 정도로 발전할 수도 있다고 본다”라고 말했다.
이러한 미래는 현재진행형이다. AI는 현재 포춘 500대 기업이 엔드 투 엔드 사용자 연결을 관리하고 새로운 5G 서비스를 제공하는 데 사용되고 있다.
소매업체 갭(GAP), AI로 매장 네트워킹 기술지원 85% 감소
소매업계의 대기업 갭(GAP)의 매장에 있는 WLAN 네트워크는 원래 소수의 모바일 장치를 수용하도록 설계됐다. 그러나 이제는 중앙 집중식 리소스에 대한 직원 연결뿐만 아니라 쇼핑객의 장치와 수천 개의 상점에 걸쳐 증가하는 소매 IoT 장치를 연결하는 데도 사용된다.
갭의 글로벌 네트워크 설계자인 스네할 페이텔은 “소매업에서 네트워크를 구축하기란 정말 어려운 일이다”라고 말했다. WLAN에 연결되는 클라이언트의 숫자가 늘어나자 문제가 하나둘씩 일어났다. 매장은 네트워크 용량을 더 많이 확보해야 했고 네트워크 운영팀은 가시성을 개선해야 했다.
갭의 IT 팀은 퍼블릭 클라우드의 확장성과 복원력을 활용할 수 있는 WLAN 기술을 찾았다. 하지만 이것만으로는 부족했다. 향후 수요에 맞게 네트워크를 확장할 수 있는 AI 및 자동화와 같은 툴이 포함된 플랫폼이 필요했다.
갭은 결국 주니퍼의 툴 세트에 안착했다. 갭은 AI로 구동되는 네트워크 운영 및 지원 플랫폼인 주니퍼의 미스트 AI, 미스트 AI와 함께 작동하도록 설계된 가상 네트워크 어시스턴트인 마비스(Marvis) VNA, 그리고 주니퍼의 SD-WAN 서비스를 배치했다.
갭의 운영팀은 필요할 때 언제든지 마비스에게 질문을 할 수 있으며, 마비스는 네트워크 문제를 알려줄 뿐만 아니라 해결책도 내놓는다.
페이텔은 “미스트가 있기 전에는 문제 해결에 훨씬 더 많은 시간을 썼다”라고 말했다. 이제 미스트는 기본 성능을 지속적으로 측정하고, 편차가 있을 때는 운영팀이 마비스를 활용해 문제를 파악한다. 갭에 따르면 그 결과 네트워크 가시성이 올라가고 근본 원인 분석을 더 빨리 파악하게 돼 직원이 현장 문제를 해결하기 위해 매장에 방문하는 횟수가 85%나 줄어들었다.
DISH, AI로 5G 네트워킹 ‘슬라이싱’
네트워킹 현대화를 위해 AI를 채택한 또 다른 포춘 500대 기업은 DISH 네트워크다. 회사는 AI를 배치해 새로운 5G 서비스를 출시했다.
DISH는 기업 5G 서비스에 대한 수요가 증가하고 있는 것을 보았지만 그 수요를 맞추기 위해 인프라를 최적화하는 데 어려움을 겪고 있었다.
기업 고객은 스마트 시티, 농업용 드론 네트워크, 스마트 공장과 같은 새로운 사용 사례에 활용할 수 있는 5G 서비스를 찾고 있었다. 그러나 이런 활용 사례가 가능하려면 보안, 낮은 지연 시간, 안정성을 확보해야 했다.
DISH는 5G 사설 네트워크를 제공하기 위해 SLA(서비스 수준 계약)를 보장하는 툴을 찾던 중, 레거시 툴로는 이를 해결할 수 없다는 것을 깨달았다.
그래서 DISH는 IBM에 도움을 요청했다. IBM의 AI와 자동화 및 네트워크 오케스트레이션 소프트웨어와 서비스를 사용해 5G 네트워크 조정을 운영 및 비즈니스 플랫폼 모두에서 제공할 수 있도록 했다. 이제 DISH의 클라우드 네이티브 5G 네트워크 아키텍처는 결과물 중심(intent-based)의 오케스트레이션, 소프트웨어 기반 자동화 프로세스로 이루어져 있다.
또한 DISH는 IBM Cloud Pak for Network Automation 소프트웨어 제품군을 사용하여 주문형 제공 등 새로운 수익원을 창출하려고 한다. 이 솔루션은 복잡한 프로세스를 자동화하여 5G 네트워크 슬라이스를 생성하고, 사설 네트워크로 프로비저닝할 수 있게 한다.
AI로 구동되는 고급 네트워크 슬라이싱을 통해 DISH는 각 사업체에 맞춤형 5G 서비스를 제공할 수 있다. 기업은 네트워크의 각 장치에 대한 서비스 수준을 설정할 수 있다. 예를 들어 자율 주행 차량은 매우 짧은 지연 시간을 우선하고, 초고화질 영상 촬영 카메라는 높은 대역폭을 우선할 수 있다.
DISH Wireless의 최고 네트워크 책임자인 마크 로안은 “기업 고객이 각자 고유한 환경에 맞게 5G 네트워크를 커스터마이징할 수 있다는 점이 가장 큰 차별점이다”라며 “IBM의 오케스트레이션 솔루션은 AI, 자동화 및 머신러닝을 활용해 이러한 사설 5G 슬라이스 기능뿐만 아니라 고객 사용 패턴에 맞춰 네트워크를 맞춤 최적화한다”라고 말했다.
네트워크 전문가도 AI 전문가가 되어야 할까
AI, 머신러닝 및 자동화 기술이 이제 네트워킹 세계에 스며들면서 IT 전문가들은 이런 질문을 피할 수 없다. ‘새로운 동료와 마찬가지인 AI 도구를 잘 다루기 위해 어떤 준비를 해야 하는가?’라는 질문이다.
물론 AI가 이미 대체하고 있는 지루하고 반복적인 작업을 그리워하는 전문가는 없을 것이다. 그러나 몇몇 전문가는 AI가 사람 자체를 통째로 대체하지는 않을지 걱정하기도 한다.
브로드컴의 노만딘은 “AI가 기하급수적으로 발전하는 동안 네트워크 팀은 수많은 AI 기반 장치와 시스템을 다뤄야 할 것이다. 네트워크 전문가와 AI 전문가는 또 다르므로 문화적인 변화가 필요할 수도 있다”라고 말했다.
UST의 마수드도 네트워킹 분야의 문화가 바뀔 수밖에 없다고 말했다. 그는 “미래의 네트워크 팀은 단지 네트워크를 관리하는 것을 넘어 지능이 있는 네트워크를 관리해야 한다. 이제 네트워크 엔지니어들은 AI 시스템을 구축, 배포, 유지하기 위해 데이터 과학자, 소프트웨어 엔지니어 및 기타 전문가들과 협력할 수 있는 능력을 길러야 할 것”이라고 조언했다.
네트워크 전문가는 머신러닝 알고리즘을 사용하여 네트워크 지체를 예측하고, 네트워크 성능을 향상시키는 것과 같은 작업을 수행할 수 있도록 네트워크 관리 및 최적화에 대한 역량을 한 단계 끌어올려야 한다.
또한 데이터 분석 및 시각화, NLP, 이상치 분석, 이상 징후 감지 및 최적화 알고리즘에 대한 새로운 역량도 습득해야 한다.
마수드는 “네트워크 엔지니어가 AI 개발자나 데이터 과학자가 되어야 한다는 건 아니다”라며 “그러나 네트워킹 특정 AI 시스템을 구축하는 데 사용되는 기본 알고리즘과 통계 모델을 깊이 이해하고 있다면 인재 시장에서 확실한 경쟁 우위를 선점할 수 있는 건 사실이다”라고 말했다.
노만딘은 AI 오케스트레이션 네트워크를 관리하기 위해 넷데브옵스가 해결책으로 부상할 것이라고 말했다. 그는 “성공적인 넷데브옵스 이니셔티브란 [지속적 통합/지속적 제공] 파이프라인 전반에 걸쳐 데브옵스 접근 방식으로 사용할 수 있는, 완전히 자동화된 환경이다”라고 설명했다.
코드형 인프라(IaC)를 비롯한 자동화 기술로 네트워킹은 발전해왔다. 클라우드로 이전했고, 프로그래밍 가능해졌으며, 하드웨어 대신 소프트웨어로 관리할 수 있게 됐다. 그리고 모든 것이 합쳐진 결실이 넷데브옵스다.
노만딘은 “이제 네트워크 팀은 애자일 혁명을 받아들여야 한다. 위험을 감수하고 끊임없는 변화와 자동화 방식을 받아들여야 할 때다. 생각해보면 이는 새로운 게 아니다. 결국 네트워크의 궁극적인 목표, 즉 네트워크가 제공하는 디지털 경험의 안정성을 보장하는 목표에 더 집중하려는 노력이다”라고 말했다.
dl-ciokorea@foundryco.com