어제 저녁 구글 음성 입력을 소개하는 구글 블로거 나이트, ‘말로 쓰는 모바일 서비스’ 행사가 있었습니다. 구글 음성 입력은 몇달 전, 말로써 검색어를 입력했던 음성 검색을 새 한글 입력기를 쓰는 구글 토크나 G메일 등에서 음성으로 입력할 수 있도록 확장한 기능이라고 할 수 있는데요. 원래 구글 내부에서는 음성 IME로 부르던 기능이라고 하더군요.
우리나라에서 구글 음성 입력을 쓸 수 있는 단말기는 넥서스원과 LG 옵티머스원만 됩니다. 둘은 공통점이 하나 있습니다. 안드로이드 2.2 단말이라는 것이죠. 네, 음성 검색은 2.1부터 할 수 있지만, 음성 입력은 안드로이드 2.2부터입니다. 그 이유는 키보드 때문인데요. 이번 음성 입력을 쓰려면 새로운 한글 키보드 또는 그 API를 이용한 키보드가 깔려야 하는데, 그 한글 키보드와 API가 안드로이드 2.2부터 작동합니다. 때문에 처음 업그레이드 된 프로요 단말이었던 넥서스원과 국내에서 제작된 최초의 프로요 단말은 옵티머스원만 이 기능을 쓸 수 있고, 다른 안드로이드 스마트폰은 2.2로 업그레이드 이후 이 기능을 쓸 수 있습니다.
음성 검색이나 음성 입력의 기본 작동 방식은 똑같습니다. 이용자가 음성을 입력하면 그 음성을 서버로 보내 분석하고 그에 맞는 문장을 만들어 단말기에 입력하는 것이죠. 차이가 있다면 종전에는 검색 창에만 그 음석 분석 결과가 입력됐다면, 이번에는 키보드를 띄우는 모든 입력 창에 음성 분석 결과를 넣을 수 있다는 점입니다. G메일 뿐만 아니라 최근 발표된 스카이프, 트위터 앱을 비롯한 각종 문서 편집기에서도 모두 쓸 수 있는 기능이지요.
때문에 새로운 키보드가 중요한데요. 여기에 음성을 입력할 수 있는 마이크 버튼이 달렸기 때문입니다. 입력 창을 눌렀을 때 키보드가 뜨면 마이크 버튼을 누르고 입력할 문장을 말하면 됩니다.
문제는 입력 결과인데요. 음성 검색 때에는 비교적 짧은 단문 위주로 입력하는 터라 어느 정도 비슷한 검색어가 입력된 데 비해, 이번 음성 입력은 단문이 아니라 정말 일상적인 문장을 입력하는 경우가 많아서 이전의 검색어에서 잘 쓰지 않는 발음을 분석해 내는 게 쉽지 않아 보이더군요. 어제도 행사에 참석한 블로거들이 직접 넥서스원으로 음성 입력 이벤트를 했을 때 몇 개의 발음이 제대로 입력되지 않아 애를 먹었습니다. 넥서스원이나 옵티머스원을 가진 이들은 아래의 문장을 입력해보세요.
강남역 7번 출구에서 뵙겠습니다
제 전화번호는 010 1234 5678 입니다
애플리케이션을 추천해주세요
지금 운전중이라 전화하기가 힘듭니다. 이따가 연락드리겠습니다
2010년 10월 6일 수요일
영화 시간표 알아보고 나한테 연락 부탁해.
직접 해본 분들은 알겠지만, 대부분의 문장, 숫자 등은 무난하게 음성 결과를 만들어냈을 겁니다. 다만 첫 문장의 ‘뵙겠습니다’와 ‘이따가’의 음성 입력 결과가 달라 수차례 반복 입력을 통해 제시된 문장의 결과가 나올 때까지 이를 다시 입력할 수밖에 없었지요. 첫 문장을 어려 번 반복해도 의도한 결과가 나오지 않다보니 참으로 답답하더군요. 혈압이 오르고 목덜미가 뻐근할 만한 상황이었습니다. 앞으로 구글 음성 검색이 해결해야 할 과제를 어제 블로거들이 현장에서 보여준 게 아닌가 싶네요.
음성 입력을 자주 쓸 일은 없겠지만, 틈틈히 쓸 일은 분명 있습니다. 길을 걷거나 운전 중 간단한 단문 메시지를 보내는 정도로는 괜찮겠죠. 또는 키보드 입력이 귀찮거나 힘들 때도 마찬가지고요. 다만 그 정확도를 높여야만 믿고 쓸 수 있는 기능이 될 것 같네요. 지금 ‘조금 실망’이라는 단계에 머무른 느낌을 더 끌어올려 주시길.
덧붙임 #
1. 이 음성 입력은 말로서 명령을 실행하는 보이스 액션은 아닙니다. 그 보이스 액션의 전 단계 기능 정도라고 보면 됩니다.
2. 문장 뒤 마침표는 ‘쩜’이라고 말하면 찍힙니다. 다만 느낌표나 물음표는 말을 해도 입력하지 않더군요.
3. 아이폰용은 당분간 출시할 예정이 없는 게 아니라, 애플이 음성 IME가 적용된 키보드로 바꾸지 않는 이상 적용하기는 힘들 것 같습니다.
디자이어도 프로요 업글이 완료돼 사용가능한 것으로 알고 있습니다 ㅎㅎ
아.. 디자이어가 있었군요. 깜빡했네요~ ^^
음성 입력은 아직 시기상조가 아닐까 생각되네요. 어제 행사는 기술 과시 차원에서 치러진 행사가 아닐까 생각됩니다. 사실 음성검색도 그렇게 정확하지 않더라구요. 뻐근해진 목은 계란으로 풀어주심이… ^^;
계란으로 풀어질 건 아닌가 봅니다. 시간이 해결해주겠죠~ ^^
오잉 요거 저도 좀 델꼬가시징~ 목아프심 주물러드림 ㅋ
다음엔 그렇게 합지요~ ^^
지금 시작하는 단계이니 서서히 뻐근함도 줄어들겠죠. ㅎㅎ
오피스에서의 한글 음성 타자가 빨리 이뤄지면 좋겠네요. ^^
오피스의 음성 입력은 그리 멀지 않았을 것 같습니다. ^^
음성입력 궁금하네요. 그나저나 옵7 때 오시면 뵐 수 있겠네요. ^^
옷~ 오랜만에 뵙겠군요. 그날 보여드릴 수도… ^^
일단은 재미삼아 해볼수 있는 수준인것 같네요 저도 아직 2.1 사용자라 프로요 업글이 이뤄진다면 한번 해보고 싶네요 ^^ 말씀하신것 처럼 운전중에 문자메세지 입력등에 사용하면 편리할것 같아요
아직 재미삼아 해볼 수준도 아닐 수 있습니다. 사실 보이스 액션이 나와야 운전 중에 더 편하게 입력할 수 있을 거에요. ^^
확실히 제대로 음성입력을 잘 할 수 있게되면 이 부분, 입력의 혁명이 이뤄질 듯 합니다. 더이상 모바일기기에서 키보드에 의지할 필요가 사라지겠죠.
아마 때와 장소가 문제겠죠. 음성으로 입력할 수 있는 환경이라면 별 문제가 안되는데, 많은 사람들이 있는 곳, 시끄러운 곳에서는 음성 입력이 어려우니 입력을 대체하는 게 아닌 확장하는 개념으로 봐야할 것 같습니다. ^^
모토쿼티도 다음년도 초반에 언넝 2.2로 업글되면 그제서야 시도를 해보겠네요 ㅠ.ㅠ
그때는 버전업해서 뒷목은 안 잡아도 되려나요^^;
그 때는 제에~발 그랬으면 좋겠어요. ^^
오오
신기한 기능 인데요
다음에 출시될 보이스 액션을 더 기대하세요. ^^
음성인식같은 패턴인식에서 가장 중요한것은 언어습관에 대한 커스터마이징과 언어의 문맥에 따른 후처리죠.. 하나같이 쉬운 일이 아닙니다. 사람이란게 얼마나 위대한 기기인지 알수 있는 부분이죠. 저정도만 해도 사실 대단한겁니다. OTL.
사람이란게 얼마나 위대한 기기인지 알수 있는 부분… 이라는 말에 공감 백배…