모든 AI 소프트웨어가 오픈소스화되기를 간절히 바라는 사람은 많다. 이를 위해서는 개발자들의 관심과 노력도 필요하지만, 간단한 문제가 아니다.
어떤 이유에서인지 역사가 반복되지 않으리라고 생각하는 이들이 많다. 완벽한 오픈소스 라이선스를 통해 모두가 평화롭고 자유롭게 공유되는 코드를 누리기를 기대하는 것이다. 하지만 역사는 그렇지 않았다. 오픈소스라는 용어가 등장한 지 26년이 지났고, 오픈소스 소프트웨어는 분명 인기가 있으며 대다수의 소프트웨어가 오픈소스를 포함하고 있지만, ‘오픈소스 라이선스’는 적용되지 않는 경우가 많다. 오픈소스 이니셔티브(OSI) 메일링 리스트에서 활동하는 개발자를 포함해 대부분이 이러한 사실을 잘 알고 있다. 이들 대부분은 수많은 폐쇄형 하드웨어와 소프트웨어를 사용한다. 그 결과, ‘오픈소스 AI’(그것이 무엇을 의미하든)에 대한 기대가 커지고 있음에도 불구하고 독점 모델이 소프트웨어의 역사를 지배해 온 것처럼 AI도 대부분의 독점 라이선스가 지배할 가능성이 매우 높다.
과연 이를 신경 써야 할까?
그렇게 해야 한다고 생각하면 반갑겠지만, 소프트웨어의 역사에서는 독점 소프트웨어와 오픈소스가 지속적으로 조화를 이뤄왔다. 여전히 그렇다. AI라고 해서 다를 것이라고 생각할 이유도, 또 달라야 한다고 생각할 이유도 없다.
반복되는 역사
스티븐 본-니콜스는 오픈소스와 AI에 대해 훌륭한 시놉시스를 쓰며 “오픈소스 AI를 정의하는 것은 아직 해결되지 않은 복잡한 문제다”라고 말했다. 덧붙이자면, 이 문제는 당분간 해결되지 않을 것이다.
몇 주 전에 이 아이디어를 살펴본 적이 있다. 당시 필자는 “OSI를 비롯한 단체가 오픈소스 정의(OSD)를 업데이트하기 위해 위원회를 구성하는 동안 메타와 같은 거대 기업들은 업계를 정의하는 모델을 출시하면서 ‘오픈소스’라고 부르고, 일부 사람들에게 OSD에 맞지 않는 라벨을 붙였다고 질책을 받아도 신경 쓰지 않고 있다”라고 지적했다. 또한 모두가 AI 모델을 오픈소스화해 달라고 간절히 요청하고 있지만, “기본적으로 오늘날의 모델 중 전통적인 의미에서 ‘오픈소스’라고 할 수 있는 것은 없다”라고 언급했다.
여기에 익숙해져야 한다. 오픈소스의 규모가 그 어느 때보다 커졌으나 매일 사용하는 소프트웨어에 있어서는 여전히 편차가 있다. 쉽게 말하자면, 사용하는 소프트웨어의 내부에 오픈소스가 포함돼 있더라도 대부분 오픈소스 라이선스는 부여되지 않았다. 오픈소스는 분명 필수적인 요소이지만 완제품으로 제공되는 경우는 드물다.
AI가 점점 더 많은 소프트웨어와 시스템에 침투할 가능성을 고려하면 AI 모델이 오픈소스가 되기를 바라는 것은 타당하지만, 이는 비현실적인 요구일 수 있다. 본-니콜스는 “최고의 AI 벤더들이 프로그램과 데이터 세트를 오픈소스화하지 않으려고 한다”라고 비난하며 “투명성, 협업, 혁신이라는 오픈소스의 긍정적인 의미만 취해 자신들의 프로그램을 포장하기를 바라고 있다”라고 지적했다. 정말 그럴까? 아니면 모든 코드를 공개하는 것이 비즈니스에 좋지 않다고 판단해 공개하지 않는 것일 수도 있다. 일부 사람들은 레드햇을 비즈니스 성공 사례로 언급하지만, 오픈소스로 성공을 거둔 레드햇을 메타, AWS 등과 비교하기는 어렵다. 허깅페이스의 사샤 루치오니는 유엔의 ‘선한 OSPO(OSPOs for Good)’ 컨퍼런스에서 “오픈소스 라이선스가 정의하는 대로 모든 기업이 100% 오픈소스를 사용하길 기대할 수는 없다. 쉽게 말해 기업이 수익 창출을 모두 포기하고 사용자가 원하는 방식으로 오픈소스화할 것이라고 기대하긴 어렵다는 것이다”라고 말했다.
현실적으로 접근할 때
현실이 달라지기를 바라지만, 수십 년 동안 오픈소스와 독점 소프트웨어가 편안히 공존해 온 상황에서 AI는 다를 것이라고 기대할 수 있을까?
클라우드나 그 전의 온프레미스 소프트웨어와 마찬가지로 대부분의 AI 소프트웨어는 오픈소스가 아닐 것이다. 일부 개발자에게는 오픈소스 문제보다 퇴근 후 자녀의 축구 경기에 참석하는 것이 더 큰 관심사일 수 있다. 지난 몇 년 동안 오픈소스에 대한 논의는 잘못된 방향에 집중돼 왔고, 젊은 개발자들 대부분은 여기에 큰 신경을 쓰지 않았다. 연령대를 떠나 개발자들은 오픈소스 라이선스 문제보다는 실제 작업을 완료하는 데 더 관심이 있다. 미스트랄 최신 모델의 비용, 속도, 성능 향상 같은 문제에 관심을 가질 뿐 오픈소스의 라이선스 유무에 대해서는 크게 신경쓰지 않는다. 오픈AI, 메타의 라마 등에 대해서도 마찬가지다.
그렇다고 오픈소스가 AI에서 중요하지 않다는 말은 아니다. 분명 중요한 요소이지만, 유일한 요소는 아니라는 것이다. 오픈소스 라이선스에 집착하다 보면 최소한의 번거로움으로 업무를 처리할 소프트웨어가 필요한 수천만 명의 개발자를 놓치게 될 수 있다.
* Matt Asay는 몽고DB의 개발자 관계 업무를 담당하고 있다. 그러나 본 글은 몽고DB의 입장이 아니다. dl-ciokorea@foundryco.com