사무실

Skype 번역기 작동 방식

차례:

Anonim

공상과학 소설은 기술적으로 진보된 장치에 대한 언급으로 가득 차 있습니다. 저자의 창의적인 사고에서 비롯된 이러한 발명품이 언제 우리 손에 들어올 수 있는지 상상하기 어렵고 결국 우리는 그들의 존재가 우리 라이프 사이클의 일부가 되지 않을 것이라는 사실을 받아들이게 됩니다. 그러나 때때로 그들 중 하나가 너무 일찍 우리 삶에 몰래 들어옵니다. 이것이 바로 Microsoft와 Skype가 실현하려는 실시간 번역의 경우입니다.

"작업은 결코 단순하지 않습니다.여기에는 Skype의 화상 회의 기능, Microsoft Azure의 방대한 클라우드 서버 네트워크, Microsoft Research의 기술 혁신, 통계 및 기계 학습과 같은 여러 영역의 최근 발전이 포함됩니다. 이 모든 것이 귀하의 언어로 된 문장을 발음하는 즉시 시스템이 귀하가 말하는 내용을 인식하고 번역하여 다른 언어로 귀하의 연락처에 전송하도록 귀하의 서비스에 제공됩니다. 그게 어떻게 가능해?"

이를 가능하게 하는 기술

Skype Translator, 새로운 기능을 알 수 있는 이름은 1년이 지나도 팬 속의 섬광이 아닙니다. . Skype 번역기는 음성 인식, 기계 번역 및 기계 학습 기술에 대한 수십 년간의 연구 결과입니다. 이 모든 영역에는 최신 기술이 없었다면 불가능했을 시스템의 작동이 있습니다.

Skype 번역기는 음성 인식, 기계 번역 및 기계 학습 기술에 대한 수십 년간의 연구 결과입니다.

시작 음성 인식, 한동안 조사 중이었지만 항상 많은 수의 영향을 받아 채택된 기술 기존 시스템의 오류 및 과도한 민감도. 잠깐의 의심, 악센트의 작은 변화 또는 최소한의 소음만으로도 컴퓨터를 혼란스럽게 하고 컴퓨터가 원하는 것을 이해하게 만들 수 있었습니다. 마이크로소프트 리서치가 알고 있는 '딥 러닝' 기술의 개발과 인공 신경망의 생성이 폭발하기 전까지는 그랬다. 덕분에 Skype 번역기의 첫 번째 단계인 오류율을 크게 줄이고 음성 인식의 신뢰성과 견고성을 향상시킬 수 있었습니다.

기계 번역은 Skype 번역기의 또 다른 확실한 기둥입니다. 여기서 Microsoft는 다시 사내 기술을 사용하고 Bing 번역 엔진을 사용하여 한 언어에서 다른 언어로 텍스트를 번역합니다.그의 시스템은 구문 인식 기술과 통계 모델의 조합을 사용하여 결과를 개선합니다. 또한 이 경우 엔진은 일반적으로 서면으로 가정되는 정확함과 깔끔함과는 거리가 먼 구어 대화에서 발생하는 언어 유형을 인식하도록 특별히 훈련되었습니다. 따라서 Skype 번역기 시스템은 Bing 번역기의 방대한 언어 지식 기반과 구어체 언어에서 일반적으로 사용되는 광범위한 단어 및 구문을 결합합니다.

하지만 말과 언어는 복잡한 지형이다. 그들은 끊임없이 변화하고, 다양한 맛과 종류가 있으며, 각 사람은 자신만의 특정한 스타일을 가지고 있습니다. Skype 번역기는 이 모든 것을 따라잡아야 하며 음성 인식과 기계 번역 모두에 대한 지속적인 교육과 최적화가 필요합니다. 이를 위해 시스템은 강력한 '머신 러닝' 플랫폼을 기반으로 구축되었습니다. 샘플 데이터로 학습하여통계 분야에서 일반적으로 사용되는 이러한 기술을 사용하면 서비스를 사용하면서 서비스를 개선할 수 있으며 사용 시 생성되는 데이터를 활용하여 음성 인식 및 자동 번역을 더욱 세분화할 수 있습니다.

이 테스트 데이터 중 일부는 Facebook과 같은 소셜 네트워크, 번역된 웹 페이지, 자막이 있는 비디오 또는 목적을 위해 생성되고 수동으로 기록 및 번역된 대화를 포함하여 다양한 소스에서 자동으로 생성됩니다. . 그러나 데이터의 또 다른 부분은 서비스를 통해 진행된 실제 대화에서 가져옵니다. 이는 Microsoft가 전화를 걸 때마다 알림을 보내므로 Skype Translator가 대화를 녹음하여 익명으로 유지하여 나중에 알고리즘으로 분석할 수 있음을 알아야 하기 때문에 중요합니다. 및 통계 모델의 교육 과정에 도입되었습니다.

Skype 번역기는 실제 인간 대화에서의 사용을 기반으로 한 프로세스를 통해 학습할 수 있는 경우에만 제대로 작동할 수 있습니다.

"

이 학습 과정 없이는 시스템이 작동할 수 없습니다. 인간이 말할 때 우리는 말을 멈추고 반복하며, 실수를 하고 생각을 바꾸며 아, 흠, uhms>실제 사용에 대해 배우는 것만으로 더 나아질 수 있습니다. "

한 언어에서 몇 초 안에 다른 언어로 전환

이러한 모든 발전에 힘입어 Skype Translator가 사용자를 위해 전체 인식 및 번역 프로세스를 빠르고 투명하게 실행할 수 있다는 것이 핵심입니다. 우리가 말을 할 때마다 시스템은 우리가 말하는 내용을 인식하고 받는 사람의 언어로 번역한 다음 처음에 전달하려고 했던 내용에 충실한 방식으로 전달해야 합니다.중간 단계를 덜 알아차릴수록 좋습니다.

시스템이 우리가 말하고 있음을 감지하자마자 우리가 말하는 것을 녹음하기 시작하고 음성 인식 프로세스를 시작합니다. 이것은 그렇지 않습니다. 우리가 발음하는 각 단어를 인식하는 것뿐만 아니라 불필요한 모든 것을 제거하고 무의미한 표현과 잡음을 삭제하고 구두점과 대문자를 포함하여 텍스트의 문장 분할을 감지하고 컨텍스트를 제공합니다. 해석에 도움이 됩니다. 조금만 생각해보면 이 모든 것을 구어로 판단하는 것이 얼마나 어려운 일인지 깨닫게 됩니다.

스카이프 번역기는 가능한 한 정확한 음성 인식이 필요합니다. 그 이유는 수집된 정보를 개선된 통계 모델과 비교하기 위해 준비하기 때문입니다. 자사의 '머신러닝' 시스템을 통해.여기서 프로세스는 시스템이 이해한 내용과 모델에 포함된 단어 및 컨텍스트 간의 유사점을 찾아 오디오를 텍스트로 변환하고 외국어로 번역하는 이전에 학습된 변환을 적용하는 것으로 구성됩니다.

마지막 단계에서 Skype는 통화에서 통역사 역할을 하는 여성 및 남성 음성의 한 쌍의 봇을 준비했습니다. 사용자가 하나를 선택하면 그는 번역된 메시지를 수신자에게 전달하는 일을 담당하게 됩니다. 그러면 서면 필사본과 번역이 화면에 나타날 뿐만 아니라 마치 세 번째 사람이 있는 것처럼 큰 소리로 들을 수 있습니다. 우리 사이를 중재.. 이 봇은 메시지를 빠르게 전달할 수 있으므로 화면 반대편에서 듣고 있는 사람은 누구나 우리가 발음한 후 몇 초 후에 메시지를 받을 수 있습니다.

시작점으로 테스트 프로그램

정확히 대화에서 제3자 스피커로 봇의 존재는 아직 다듬어야 할 세부 사항 중 하나입니다. Microsoft는 통역사를 통해 말하는 데 익숙한 사람들에게는 적응이 쉽지만 다른 사람들에게는 학습 기간이 필요하다는 것을 알고 있습니다. 그리고 Microsoft와 Skype는 현존하는 최고의 실시간 번역 경험을 만들기로 결정했을 수 있지만 그렇게 하려면 그들은 우리가 우리 자신과 기계를 모두 배워야 합니다스카이프 번역기 미리보기는 그 과정의 한 단계에 불과합니다.

테스트 프로그램은 12월 중순에 시작되어 영어와 스페인어의 음성 번역과 40개 이상의 서면 번역을 도입했습니다. 액세스하려면 프로그램 웹 사이트에 등록하여 요청할 수 있는 초대장이 필요합니다. 은혜가 있다면 Windows 8용 Skype 응용 프로그램에서 Skype 번역기를 사용해 볼 수 있습니다.1 또는 Windows 10 기술 프리뷰. 그렇지 않으면 서비스가 확장되어 공식적으로 공개될 때까지 기다려야 합니다.

"

어쨌든, 스카이프 번역기는 2014년과 작별을 고할 즈음에 시작되었습니다. 끝내기 전에 여기서 잠시 멈추고 방금 읽은 연도를 생각해 보십시오. 이천십사>"

통해 | 스카이프 블로그 I, II

사무실

편집자의 선택

Back to top button