Microsoft는 음성 인식 기술이 오류율을 줄이고 사람만큼 효과적이라고 발표했습니다.

다양한 플랫폼이 가까운 미래에 성장할 것이라고 많은 사람들이 단언하는 기둥 중 하나입니다. 서면 명령이나 제스처와 상호 작용할 것이 없습니다. 미래는 기계와 대화하는 것로봇 명령과 부자연스러운 명령으로 대화하는 것은 아닙니다. 우리는 개인 비서에서 점점 더 명확하게 감사하는 자연 언어로 그것을 할 것입니다."

그리고 이러한 의미에서 가장 주목할만한 경력을 가진 회사 중 하나는 플랫폼에서 직원 음성 인식을 지속적으로 개선하기 위해 노력하는 개발 경로를 가진 회사인 Microsoft입니다.현재 개발팀에서 소식을 전하는 기술, 인간 사이에서 사용되는 것과 동일한 수준의 정밀도로 배치하는 엄청난 개선

이러한 의미에서 음성 인식 시스템이 WER에서 5.1%에 도달했다고 발표했습니다., 즉 비율의 오류 사용하는 단어의. 많은 사람들에게 이것은 아무 의미가 없을 수도 있지만 한편으로는 이 속도는 사람들 간의 의사 소통에서 발견한 속도와 동일합니다

이를 수행하기 위해 Redmond에서 그들은 신경망 사용을 기반으로 구두 및 음향 언어의 개선된 모델을 사용하기로 선택했습니다.이들은 장기 양방향 메모리와 결합하여 음향 모델링을 개선하여 통신 이력을 기반으로 사용할 수 있는 단어를 예측하여 인식을 향상시킵니다.이러한 개선 사항은 회사가 특히 Azure를 통해 클라우드 컴퓨팅 인프라를 개선하기 위해 노력한 덕분에 클라우드에서도 지원됩니다.

또한 이것은 이 오류율이 실패 마진 측면에서 낮아졌다는 것을 의미합니다., 5.9%로 시스템이 1년도 채 되지 않은 수치인 12%에서 떨어졌습니다. 따라서 Microsoft는 인간만큼 효과적인 음성 인식 시스템을 달성했으며 그들이 발전하고 있는 것을 보면 앞으로 몇 달 또는 몇 년 안에 이를 개선할 것이라는 것은 놀라운 일이 아닙니다.

지금부터 몇 년 안에 Windows PC와 대화하고 Cortana 또는 Office와 같은 응용 프로그램과 상호 작용하는 것이 이미 우리를 꿈꾸게 만든 것(또는 악몽, 누가 알아) 영화관에서.

In Xataka | 그들은 무덤 너머의 목소리가 아니라 음성 비서가 인식하고 인간은 인식하지 못하는 숨겨진 명령입니다.

편집자의 선택