리누스 토발즈는 오픈소스 거물이다. 그리고 그가 학생으로서 “단지 재미를 위해”(Just For Fun ; 그의 저서 제목) 리눅스를 개발하고 리눅스 커널을 개발한 커뮤니티를 (다시 심술궂게) 통치한 이야기는 초기 오픈소스 운동과 해커 정신의 전형적인 사례다.
하지만 오픈소스는 분명 바뀌었다. 기업 분야에서 적극 수용했으며, 그 결과 기업과 오픈소스 커뮤니티가 모두 바뀌었다. 오늘날의 가장 영향력 있는 오픈소스 프로젝트는 개인보다는 대기업의 협업 프로세스에서 등장할 가능성이 더 높다. 하지만 오픈소스이기 때문에 프로젝트는 커뮤니티 전체에 도움이 되며, 그 창시자들은 새롭게 높아질 프로필의 이점을 누리는 경우가 많다.
오늘날 주요 오픈소스 프로젝트 이면에 자리한 혁신가들을 살펴본다.
아파치 카프카(Apache Kafka) : 제이 크렙스, 네하 나크헤드, 준 라오
데이터 스트리밍은 디지털 배관 작업처럼 따분하고 기술적으로 들릴 수 있다. 하지만 더 많은 소스로부터 얻은 더 많은 데이터를 소화하고 처리해야 하면서 데이터 흐름를 적절한 곳에 보내기 위해 필요한 인프라가 그 어느 때보다 중요해졌다.
2000년대 말과 2010년대 초기에 링크드인(LinkedIn)은 이 문제에 부딪힌 초기 기업 중 하나였다. 링크드인의 WVMPF(Who’s Viewed My Profile Feature) 기능을 개발하는 팀에서 근무하던 엔지니어 3명(제이 크렙스(가운데), 네하 나크헤드(오른쪽), 준 라오(왼쪽))은 메시징 시스템 프로젝트에 참여했고 이것이 결국 카프카가 되었다. 참고로 카프라라는 이름은 크렙스가 좋아하는 작가 중 한 명의 이름에서 비롯됐다.
오픈소스로 공개된 아파치 카프카는 광범위한 기업들과 프로제트를 위한 배관 작업의 중요한 부분이 됐다. 한편 크렙스, 나크헤드, 라오는 상업용 클라우드 기반의 카프카 버전을 제공하는 기업인 컨플루언트(Confluent)를 설립했다.
레디스(Redis) : 살바토르 산필리포
레디스는 디스크에 상주하며 데이터베이스, 캐시, 메시지 브로커 등의 기능을 할 수 있는 NoSQL 인메모리데이터 구조 스토어이다. 다른 많은 오픈소스 프로젝트처럼 골칫거리를 풀려는 시도에서 시작되었다. 실시간 웹로그 분석 도구를 개발하던 이탈리아 스타트업 소속의 살바토르 산필리포는 작업을 위해 테스트하고 있던 다양한 데이터베이스의 기능 부족에 불만이 많았다.
산필리포는 레디스를 공개한 후 이내 오픈소스화 했으며, 프로젝트가 빠르게 성장했고 이내 깃허브 같은 대형 조직이 사용했다. 이후에도 산필리포의 직업 생활은 다른 사람들과 다르지 않았다. 자신의 고향인 시칠리아에서 머물면서 VM웨어(VMware)에 고용되어 레디스 프로젝트를 지속했다. 오픈소스의 후원자인 대기업들이 이 직업 생태계의 중요한 부분이 되었다. 산필리포는 소설도 집필했으며, 곧 출간된다!
쿠버네티스(Kubernetes) : 조 베다, 브렌든 번스, 크레이그 맥럭키
쿠버네티스는 컨테이너 기반 아키텍처로 이전하려는 기업들에게 이미 중요한 인프라로 자리잡은 컨테이너 오케스트레이션 시스템이다. 구글(Google) 내부에서 시작되었으며, 창시자 중 한 사람인 조 베다(왼쪽)는 브렌든 번스 및 크레이그 맥럭키와 함께 해당 기업의 초기 ‘보그(Borg)’ 클러스터 관리자로부터 해당 개념을 구축했다.
쿠버네티스의 본래 이름은 스타 트렉 : 보이저(Star Trek : Voyager)에서 보그 캐릭터 세븐 오브 나인(Seven of Nine)에서 딴 ‘프로젝트 7’이었다. 베다의 스토리 중 가장 중요한 부분은 아마도 자신, 번스, 맥럭키가 배아 프로젝트를 오픈소스화 할 수밖에 없었던 이야기일 것이다. 그는 “사람들이 정말로 이것을 사용하고, 보그에서 얻은 최고의 아이디어를 오픈소스에 적용하고 싶었다”라고 말했다. 베다와 맥럭키는 현재 VM웨어에서 클라우드 기술을 개발하고 있으며, 번스는 마이크로소프트의 애저(Azure) 사업부의 VP다.
아파치 스파크(Apache Spark) : 마테이 자하리아
아파치 스파크는 빅 데이터의 승자로서, 맥리듀스(MapReduce)를 대체한 데이터 처리 플랫폼이다. 학계에서 등장했다는 점은 오늘 소개하는 프로젝트들 중 이색적인 존재다. 창시자인 마테이 자하리아는 ICPC(International Collegiate Programming Contest)에서 우승했고 UC 버클리에서 박사 학위를 취득했으며, 그곳에서 그의 연구의 일환으로 스파크의 기초가 완성됐다. 스파크는 기업에서 만든 것이 아니기에 거의 처음부터 오픈소스였다.
스파크는 빅 데이터 세계에 폭풍을 몰고 왔고 자하리아는 비즈니스 및 학계에서 자리를 잡았다. 그는 스파크와 다른 데이터 엔지니어링, 데이터 사이언스, 머신 러닝 프로젝트를 중심으로 클라우드 서비스를 제공하는 기업 데이터브릭스(Databricks)를 설립했으며 스탠포드대학교에서 교수로 재직하고 있다. 현재도 그의 연구 그룹은 오픈소스 커뮤니티와 긴밀히 협력하고 있다.
앤서블(Ansible) : 마이클 드한
앤서블은 강력한 자동화 플랫폼이며, 오늘날 코드형 인프라 동향의 중요한 존재다. YAML 기반의 앤서블 플레이북(Ansible Playbook)은 앤서블이 SSH를 통해 대상 시스템으로 자동 전송하는 서버 구성을 정의한다. 퍼펫(Puppet), 쉐프(Chef) 등의 도구와 함께 앤서블은 인프라 관리를 데브옵스(DevOps) 세계에 적용하는 데 중요한 역할을 했다.
마이클 드한은 앤서블의 창시자이며, 그의 커리어는 오픈소스 프로젝트와 창시자가 따라갈 수 있는 또 다른 경로를 제시한다. 드한은 2000년대 중반 레드햇(Red Hat)의 R&D 그룹에서 근무한 후 다른 몇 개의 기업들로 옮기면서 고객들과 협력했고, 다양한 종류의 인프라를 제공하는 일을 하다가 점차 기존의 도구에 대한 불만을 가지게 되었다. 드한은 앤서블을 오픈소스 프로젝트로 시작한 후, 이를 중심으로 회사를 설립했고, 이전의 고용주였던 레드햇에서 이를 인수했다. 리눅스와 오픈소스 대기업은 자연스럽게 어울린다.
Node.js 및 디노(Deno) : 라이언 달
라이언 달은 오픈소스 세계에서 드물게 2건의 업적을 자랑한다. 그의 영향력 있는 첫 번째 프로젝트는 Node.js였으며, 서버측 자바스크립트 실행 메인스트림을 가져다가 자바스크립트를 더 많은 비 브라우저 틈새에 적용한 런타임이다. 노드(Node)와 달은 익숙한 오픈소스 궤도를 달렸다. 프로젝트가 임계 질량에 도달한 후 해당 프로젝트와 창시자는 이를 배양할 수 있는 영리 기업으로 이동했다. 몇 년 후 달은 물러섰으며, Node.js는 한 재단으로 이동했다.
그리고 달은 다음 행보로 또 다른 자바스크립트 런타임(이며 노드의 철자 순서를 바꾸어 만든) 디노를 발표했다. 달은 도발적으로 “Node.js에 관해 내가 후회하는 10가지”라는 대담에서 자신의 새로운 프로젝트를 발표했다. 결론은 다음과 같다. 디노는 Node.js보다 프로그래머에게 더 안전하고 생산적인 것이 목표다. 디노는 빠르게 성장했으며, 달은 (여전히 오픈소스로 남아 있지만) 이를 지원하기 위해 새로운 기업을 설립했다.
코크로치DB(CockroachDB) : 스펜서 킴볼, 피터 매티스, 벤 다넬
스펜서 킴볼(왼쪽)과 피터 매티스(가운데)는 오픈소스 역사상 두 시대에 걸쳐있다. 1990년대 중반 UC 버클리에서 학부 룸메트일 당시 GNU IMP(Image Manipulation Program)와 GTK를 개발했으며, 이 두 소프트웨어는 오픈소스의 성공 가능성이 열리는 데 일조했다. 그러나 두 사람은 해당 프로젝트의 개발에 지속적으로 참여하지 않았다.
대신에 킴볼과 매티스는 2000년대와 2010년대를 실리콘 밸리에서 보내면서 초기 구글 직원으로 근무했고 다양한 소셜 미디어 유사 프로젝트에 참여했다. 하지만 결국 구글의 동료 직원이었던 벤 다넬(오른쪽)과 함께 파괴하기가 매우 어렵도록 분산형 아키텍처에 기초하여 개발된 SQL 데이터베이스인 코크로치DB를 공개했다. 킴볼, 매티스, 다넬이 구글에서 얻은 경험에 기초한 코크로치DB는 구글 클라우드 스패너(Google Cloud Spanner)와 정면으로 맞선다. 하지만 오픈소스 프로젝트로서 누구든 무료로 사용할 수 있다.
장고(Django) : 사이먼 윌리슨과 에이드리언 홀로바티
지금까지 우리는 실리콘 밸리 대기업과 스타트업 및 연구실과 기숙사방에서 시작된 대형 오픈소스 프로젝트들에 관해 이야기했다. 최종적으로 겸손한 오픈소스 혁신의 기원인 켄자스의 한 학술도시의 지역 신문을 살펴보자. 사이먼 윌리슨(좌)과 에이드리언 홀로바티(우)는 2000년대에 20대 초반의 나이로 로렌스 저널 월드(Lawrence Journal-World)에서 근무했다. “가능한 적은 시간을 들여 합리적으로 복잡한 데이터베이스 기반 웹 애플리케이션을 개발해야 했다”라고 윌리슨이 말했다. 장고는 윌리슨과 홀로바티가 개발한 파이썬(Python) 기반의 웹 애플리케이션 프레임워크였다.
장고는 해당 신문사에서 사용되었을 뿐 아니라 파이썬 웹 개발에 널리 사용되었으며, 지금도 여전히 중요한 위치를 고수하고 있다. 윌리슨과 홀로바티는 이 목록의 다른 사람들처럼 다른 대형 프로젝트를 구성하지는 못했지만 흥미롭고 생산적인 직업 생활을 했다. 홀로바티는 워싱턴포스트와 다른 출판사에서 기술 저널리즘 프로젝트를 진행했고, 윌리슨은 자신의 부인과 이벤트 플랫폼을 개발하여 이벤트브라이트(Eventbrite)에 인수되었다. 이 목록에 있는 다른 모든 사람들처럼 그의 오픈소스 업적을 통해 많은 사람들이 혜택을 입었다. 그들은 분명 만족했을 것이다. dl-ciokorea@foundryco.com