자세히 보기

By 편집부

회의에도 참여하는 음성 비서··· 오터.ai, 음성 인식 AI 에이전트 출시

'오터 미팅 에이전트’(Otter Meeting Agent)는 음성 호출로 에이전트를 활성화하고, 질문을 이해하며, 인터넷이나 내부 문서에서 데이터를 가져온다.

음성-텍스트 변환 서비스로 주로 알려진 오터.ai(Otter.ai)가 음성으로 활성화되는 AI 에이전트를 발표했다. 15일 출시된 ‘오터 미팅 에이전트’는 요청이 있을 때 활성화되고 받은 질문을 이해하며, 공개 웹이나 내부 문서에서 정보를 가져와 질문에 답변한다.

오터.ai는 이미 웹 인터페이스와 음성 메모를 텍스트로 변환하는 앱을 보유하고 있다. 메모의 요약을 생성하고 텍스트를 통해 시스템에 질문을 할 수 있도록 하는 앱이다. 새로운 에이전트를 활용하면 이제 회의 중에도 음성을 통해 동일한 작업을 수행할 수 있다.

덕분에 즉각적인 정보를 번거로운 타이핑 작업 없이 받아볼 수 있게 됐다고 오터의 샘 리앙 CEO는 밝혔다. 그는 “이 새로운 AI 미팅 에이전트는 실제로 질문에 답하거나 회의에 참여할 수 있다. 뿐만 아니라, 일부 작업을 수행하기 위한 몇 가지 조치를 취할 수도 있다”라고 말했다.

그는 줌 화상 회의 시연에서 사례를 제시했다. 리앙은 참석자로 참여한 AI 에이전트에게 “오터, 오디오 레코더를 발명한 사람은 누구고, 몇 년도에 발명했지?”라고 물었고, 에이전트는 즉시 “오디오 레코더는 1877년에 토마스 에디슨이 발명했다”라고 대답했다.

이 음성 인식 에이전트는 줌에서 운용되며, 앞으로 몇 주 안에 구글 미트와 마이크로소프트 팀즈 소프트웨어에 통합될 예정이다.

회사에 따르면 이 에이전트는 기업 데이터에서 정보를 가져와 질문에 답변할 수도 있다. 예를 들어, 내부 데이터베이스에서 데이터를 선택적으로 가져와 가입자 수 또는 성장률에 대한 질문에 답한다.

이 밖에 후속 회의 예약이나 이메일 초안 작성 등 다른 작업도 수행할 수 있다. 이 시스템은 검색 증강 생성(Retrieval-Augmented Generation)(RAG)을 사용하여 사용자 질의를 분석한 다음, 이를 하위 작업으로 세분화하고 어떤 기능을 호출할지 또는 어떤 내부 시스템에 질의를 전송할지 결정한다. “여러 곳에서 데이터를 가져온 다음, 결과를 요약하는 답변을 생성할 수 있다”라고 리앙은 말했다.

현재 음성 인식 회의 에이전트는 텍스트 기반 요청과 마찬가지로 내부 문서에서 질문에 답하는 온디맨드 기능이다. 에이전트는 음성 요청 시에만 활성화되며 대화를 방해하지 않는다. 리앙은 그러나 에이전트가 곧 적극적인 참여자가 되는 방향으로 나아가고 있다고 제시했다. 잘못된 정보를 수정할 수도 있다는 것이다.

그러나 AI 회의 참가자가 환영 받기까지는 해결해야 할 몇 가지 문제가 있다. 정확성과 사회적 수용이 이에 포함된다. 참가자들은 AI 에이전트에 의해 방해받는 것을 좋아하지 않을 수 있다. 그리고 이 도구가 실수를 저지른다면 이내 신뢰성을 잃게 될 가능성이 있다.

포레스터의 J.P 가운더 애널리스트는 “이러한 서비스가 주류가 되려면 아직 몇 년은 더 걸릴 것 같지만, 매우 논리적이고 잠재적으로 강력한 가치 제안을 제공한다는 점에서 주목할 만하다”라고 말했다.

오터는 현재 무료 등급과 비즈니스 사용자를 위한 월 30달러 요금제를 포함하여 다양한 월간 및 연간 구독 요금제를 갖추고 있다. 구독 서비스에는 가격이 명시되지 않은 기업 요금제도 포함되어 있다. 현재 오터의 구독자 수는 2,500만 명이며, 유료 구독자 수는 알려지지 않았다.
dl-ciokorea@foundryco.com