구글 픽셀폰, 이제 통화 중에도 실시간 자막 본다

구글, 픽셀폰의 음성-영상 통화에 실시간 캡션 기능 제공 픽셀 4A 시작으로 픽셀 2, 3, 3A, 4에도 추후 적용 자체 브랜드 스마트 디스플레이에 적용할 수도

2020-08-05     정근호 기자
구글이

[애틀러스리뷰=정근호 기자] 구글이 지난 3일(현지시간) 안드로이드 스마트폰의 실시간 캡션 기능인 ‘라이브 캡션(Live Caption)’을 음성 및 영상 통화에서도 제공한다고 밝혔다. 이제는 유튜브 같은 동영상을 재생할 때만이 아니라 통화 중에도 상대방이 말하는 내용을 텍스트로 확인할 수 있게 된 것이다.

다만, 이 기능은 구글이 새롭게 발표한 자체 브랜드 스마트폰 ‘픽셀 4a’에서 먼저 제공되며, 픽셀 2, 3, 3a, 4 등 기존의 픽셀 스마트폰에도 순차적으로 적용될 예정이다.

구글의 픽셀 4a는 구글 문서와 연결돼 텍스트 변환 및 녹음을 저장하는 ‘구글 녹음기(Recorder)’ 기능 외에도 실시간 긴급 알림 및 교통사고 감지를 위한 ‘퍼스널 세이프티(Personal Safety)’ 앱 등을 제공한다.


◆구글, 라이브 캡션 기능으로 청각장애인의 이용접근성 제고

지난 2019년 10월 구글은 디지털 미디어에 대한 접근성 향상을 위해 유튜브뿐만 아니라 스마트폰에서 재생하는 동영상에 자동으로 실시간 자막을 생성해주는 라이브 캡션 기능을 픽셀 4폰에서 제공하기 시작했다.

특히 해당 기능은 데이터나 와이파이가 없어도 이용할 수 있으며, 항상 비공개로 유지되어 프라이버시를 보호하는 것이 특징이다. 또한, 구글의 최신 인공지능 기술을 적용하여 자막 생성 시간을 단축해 지연시간도 줄일 수 있다.

그리고 구글의 이번 발표는 이 기능을 동영상 재생이 아닌, 음성과 영상 통화에도 적용한다는 점에서 주목받고 있다. 음성 통화 시에는 스마트폰의 통화 화면에 자막이 생성되는 형태로, 이는 구글도 밝히는 것처럼 청각장애인이나 난청 증상이 있는 이용자들이 더욱 편리하게 커뮤니케이션 할 수 있게 된다.

그러나 이 외에도 매우 시끄러운 환경 혹은 반대로 도서관 및 독서실처럼 소리를 키울 수 없는 환경에서도 유용성이 커질 수 있다.

향후 이 기능을 실시간 번역 기능과 접목함으로써 외국인과 통화할 때 언어 장벽 없이 소통할 수 있도록 지원할 가능성도 있다.

한편, 구글은 향상된 속도와 새로운 디자인 및 기능이 적용된 구글 어시스턴트의 새로운 버전이 독일, 프랑스, 이탈리아, 스페인에서도 이용 가능하며, 향후 더 많은 언어를 지원하게 된다고 밝혔다.

 

◆구글이 픽셀 스마트폰에 신규 기능을 먼저 적용하는 이유

구글이 라이브 캡션 기능을 자사의 픽셀폰에 먼저 제공한다는 점에서 주목할 만하다. 일반적으로 새로 개발되는 혁신 기능은 바로 대규모로 적용하기에는 아직 완성도가 부족하거나 이용자들의 피드백을 반영해 더욱 업그레이드할 필요가 있다. 또한, 구글의 의도처럼 실제로 유용성을 제공하는지에 대한 검증도 진행될 필요가 있다.

 

구글이

이 때문에 구글은 자체 브랜드 스마트폰인 픽셀폰을 일종의 테스트 단말로 활용하는 것으로 볼 수 있다.

실제로 구글은 어두운 환경에서도 좋은 이미지의 사진을 촬영할 수 있는 ‘나이트 사이트(Night Sight)’, 자동 식당 예약 기능 ‘듀플렉스(Duplex)’, 네트워크 접속이 필요 없는 주변 음악 인식 기능, 스팸방지 기능 등을 픽셀폰에 먼저 제공한 바 있다.

구글이 이처럼 픽셀폰에 먼저 제공한 기능과 이에 대한 유저들의 반응을 통해 안드로이드의 기본 기능 추가 여부를 결정할 수 있게 된다. 구글로서는 대규모 유저들에 의한 테스트를 보다 비용 효율적인 방식으로 진행할 수 있으며, 픽셀 유저 입장에서는 혁신적 기능을 먼저 접해볼 기회인 셈이다.

한 마디로 픽셀폰에 최신 기능을 일정 기간 독점적으로 제공함으로써 단말을 차별화함은 물론, 전체 모바일 시장에서의 영향력을 키울 수 있는 서비스의 완성도를 높이는 일석이조 효과를 거두는 모습이다.

 

◆스마트 디스플레이로도 확대 적용 가능성 있어

구글은 스마트홈 단말 시장에서 아마존을 따라잡기 위해 다양한 기술개발과 서비스 도입을 시도하고 있다. 특히 스마트 스피커와 더불어 화면을 갖춘 인공지능 홈단말인 스마트 디스플레이의 경쟁력을 높이기 위해 주력하고 있다.

예를 들어 지난 7월, 구글은 스마트 디스플레이 ‘네스트 허브(Nest Hub)’를 스마트홈 단말 조작을 위한 용도를 넘어 게임 단말로도 활용할 수 있도록 강화할 것이라고 밝혔다. 

구글은 지난 해의 개발자 회의 ‘Google I/O 2019’에서 스마트 디스플레이에서 이용할 수 있는 앱 개발을 위해 음성 기반의 개발 툴에 시작 및 애니메이션 요소를 추가하는 인터랙티브 캔버스(Interactive Canvas) 프레임워크를 도입한다고 발표한 바 있는데, 그 일환으로 이제 스마트 디스플레이에서 써드파티 업체들이 개발한 간단한 게임을 즐길 수 있도록 한 것이다.

 

지난

또한 지난 5월에는 노년층이 더 쉽게 스마트 디스플레이를 이용할 수 있도록 미국 워싱턴주의 일부 은퇴자들을 대상으로 새로운 UI 테스트를 진행한 바 있다. 이용자는 해당 단말을 디지털 액자로 활용하는 것은 물론 듀오(Duo)와 같은 구글의 앱을 통해 다른 사람들과 영상통화/채팅을 할 수 있다. 빠른 연락을 위해 연락처를 사전 로딩해 보여주는 것은 물론, 날씨 정보/알람 설정 등과 같은 스마트 디스플레이의 기능을 보여주기도 했다.

이런 행보를 보인 구글이 앞으로 라이브 캡션 기능을 픽셀폰뿐만 아니라 네스트 허브 등 자체 브랜드 스마트 디스플레이에도 적용할 가능성은 충분하다.

가령, 듀오 앱을 통해 집에서도 라이브 캡션 기능을 이용할 수 있도록 하는 것이다. 대체로 주변 소음이 적은 집에서 이 기능을 통화 시에 이용할 이유는 적다고 볼 수 있지만, 여전히 청각장애인이나 외국인과의 통화 시에는 상당한 유용성을 제공할 수 있다는 점에서 긍정적인 반향을 불러일으킬 것으로 예상된다.

물론, 아마존도 이미 음성인식 및 텍스트 전환 기술을 보유하고 있기에 스마트 디스플레이 단말에서 구글과 유사한 기능을 제공할 수는 있다. 그러나 구글은 듀오를 이용할 수 있는 단말이 스마트 디스플레이뿐 아니라 안드로이드폰과 태블릿에 이르기까지 다양하다는 점에서 경쟁력을 가질 수 있다.

향후 구글이 실제로 이 기능을 네스트 허브에 도입할 것인지, 그렇다면 그 시기는 언제가 될지에 관심이 모아진다.