2011년 10월 23일 일요일

안드로이드용 음성 입력 (Speech Input) API

Alex Gruenstein에 의해 2010년 3월 5일 오전 10시에 작성되었습니다.
Speech Input API for Android의 번역입니다.

사람들은 휴대폰을 어디서나 만질 수 있어 좋아합니다. 대화 뿐만 아니라 이메일, 문자, 마이크로블로깅 등을 하고요. 게다가 안드로이드 2.1 버전에서는 음성 지원 키보드가  추가되었고 음성으로 검색하고 "~로 가자"와 같은 음성 단축키와 같은 기능도 쉽게 사용할 수 잇습니다. 이제 우리의 메시지를 치지 않고 말로 할 수 있습니다. 키보드에 새로 들어온 마이크로폰 버튼을 누른 후 평소에 타이핑하던 것들을 그냥 말하면 됩니다.

우리는 음성 (입력)이 모바일 경험을 근본적으로 바꿀 수 있다고 믿습니다. 우리는 안드로이드 SDK를 통해 음성 입력 능력을 통합하는 것을 고려하도록 모든 안드로이드 애플리케이션 개발자들을 초대하고 싶습니다. 내가 좋아하는 마켓에 올라온 음성 입력 가능한 앱은 Handcent SMS입니다. 어떤 SMS라도 SMS 팝업 윈도우가 뜨면 툭 건딜어 답장할 수 있죠.



음성 입력 통합된 Handcent SMS

안드로이드 SDK는 애플리케이션에 음성 입력을 직접 결합하는 것을 쉽게 합니다. 이 샘플 애플리케이션을 복사 붙여넣기 해서 시작점으로 삼으세요. 안드로이드는 개방된 플랫폼이기 때문에 디바이스에 RecognizerIntent를 받게 등록된 음성 인식 서비스를 아무거나 사용할 수 있습니다. 많은 안드로이드 단말에 미리 설치된 구글 음성 검색 애플리케이션은 RecognizerIntent를 받아 "Speak Now" 대화창을 표시하고 음성을 구글 서버로 전송합니다. 이 서버는 검색 위젯이나 음성 지원 키보드에서 마이크로폰 버튼을 눌렀을 때도 사용됩니다. (음성 검색이 설치되어있는지 여부는 Settings -> Applications -> Manage applications.에서 확인할 수 있습니다.)

중요한 팁 하나: 말해질 문장에 대해 생각하면 음성 입력을 더 정확하게 할 수 있습니다. "엄마, 내 목소리로 메시지를 보내는 거야."는 메일이나 SMS 메시지에 적합하고 구글 검색을 이용한다면 "마운틴 뷰의 날씨"등을 말이 더 맞을겁니다. 적합한 언어 모델을 요청하면사용자 경험을 향상할 수 있습니다. 긴 문장은 "free_form"을 쓰고 검색 문장과 같이 짧은 것은 "short_search"를 쓰는 거죠. 우리는 "free_from" 모델이 넥서스 원 보이스 키보드의 받아쓰기의 적합도를 향상하고 반면에 "web_search"는 사용자가 음성 검색을 원할때 사용하도록 개발했습니다.

구글 서버는 현재 영어, 만달린 중국어, 일본어를 지원합니다. 웹 검색(web_search) 모델은 세 언어 모두 지원하고 자유 형식 모델은 영어에만 우선 최적화되어 있습니다. 우리가 다른 언어의 다른 모델들을 열심히 개발하고  우리 제품에 사용될 음성 인식 기술의 적합도를 향상시키고 있습니다. 애플리케이션에 음성 능력을 바로 통합시킨 개발자들은 이익을 거두어가게 될 것입니다.

댓글 없음:

댓글 쓰기