KR20120040190A - 음성번역시스템, 사전서버장치, 및 프로그램 - Google Patents

음성번역시스템, 사전서버장치, 및 프로그램 Download PDF

Info

Publication number
KR20120040190A
KR20120040190A KR1020127001119A KR20127001119A KR20120040190A KR 20120040190 A KR20120040190 A KR 20120040190A KR 1020127001119 A KR1020127001119 A KR 1020127001119A KR 20127001119 A KR20127001119 A KR 20127001119A KR 20120040190 A KR20120040190 A KR 20120040190A
Authority
KR
South Korea
Prior art keywords
information
translation
voice
speech
languages
Prior art date
Application number
KR1020127001119A
Other languages
English (en)
Other versions
KR101626887B1 (ko
Inventor
사토시 나카무라
에이이치로 스미타
유타카 아시카리
노리유키 기무라
치오리 호리
Original Assignee
독립행정법인정보통신연구기구
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 독립행정법인정보통신연구기구 filed Critical 독립행정법인정보통신연구기구
Publication of KR20120040190A publication Critical patent/KR20120040190A/ko
Application granted granted Critical
Publication of KR101626887B1 publication Critical patent/KR101626887B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)

Abstract

종래, 음성번역에 있어서 사용하는 음성인식사전, 번역사전, 및 음성합성사전에 있어서 부정합이 있었다. 2 이상의 언어에 대해서, 음성인식, 번역, 음성합성에 이용하는 전언어용어정보를 2이상 저장할 수 있는 전언어대사전저장부와, 전언어에 대해서, 용어의 음성인식정보를 포함하는 음성인식용 정보를 취득하고, 1이상의 음성인식서버장치에 송신하는 음성인식용 정보송신부와, 전언어에 대해서, 용어의 표기를 포함하는 번역용 정보를 취득하고, 1이상의 번역서버장치에 송신하는 번역용 정보송신부와, 전언어에 대해서, 용어의 음성합성정보를 포함하는 음성합성용 정보를 취득하고, 1이상의 음성합성서버장치에 송신하는 음성합성용 정보송신부를 구비하는 사전서버장치에 의해, 사전간의 부정합을 해소할 수 있다.

Description

음성번역시스템, 사전서버장치, 및 프로그램{SPEECH TRANSLATION SYSTEM, DICTIONARY SERVER DEVICE, AND PROGRAM}
본 발명은, 음성번역을 하는 음성번역시스템 등에 관한 것이다.
종래의 음성번역시스템에 있어서, 음성인식의 정도를 향상시키거나, 번역처리의 도를 향상시키는 등, 각 부분처리의 정도를 향상시키기 위한 기술이 존재했다(예를 들면, 특허문헌1, 특허문헌2 참조).
특허문헌1 : 일본 공개특허공보 특개 2008-243080호 공보(제1쪽, 제1도 등) 특허문헌2 : 일본 공개특허공보 특개 2009-140503호 공보(제1쪽, 제1도 등)
그러나, 종래, 음성번역처리를 할 때 사용하는 음성인식사전, 번역사전, 및 음성합성사전의 사이에서 부정합이 있어, 음성번역을 할 수 없을 경우가 있었다. 사전간의 부정합이라는, 어떤 사전에 존재하는 용어의 정보가 다른 사전에는 존재하지 않는다는 현상이다.
본 제1발명의 음성번역시스템은, 사전서버장치와, 1이상의 음성인식서버장치, 1이상의 번역서버장치, 1이상의 음성합성서버장치를 가지는 음성번역시스템이며, 사전서버장치는, 2이상의 언어의 각 언어에 대해서, 1이상의 단어를 가지는 용어의 표기와, 용어를 음성인식하기 위한 정보인 음성인식정보와, 용어를 음성합성하기 위한 정보인 음성합성정보를 가지는 용어정보를, 2이상의 언어 모두에 대해서 대응시켜서 가지는 전언어(全言語)용어정보를, 2이상 저장할 수 있는 전언어대사전저장부와, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 용어의 음성인식정보를 포함하는 음성인식용 정보를, 전언어대사전저장부에서 취득하고, 1이상의 음성인식서버장치에 송신하는 음성인식용 정보송신부와, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 용어의 표기를 포함하는 번역용 정보를, 전언어대사전저장부에서 취득하고, 1이상의 번역서버장치에 송신하는 번역용 정보송신부와, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 용어의 음성합성정보를 포함하는 음성합성용 정보를, 전언어대사전저장부에서 취득하고, 1이상의 음성합성서버장치에 송신하는 음성합성용 정보송신부를 구비하고, 음성인식서버장치는, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 음성인식용 정보를 저장할 수 있는 음성인식용 정보저장부와, 사전서버장치로부터, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대한 음성인식용 정보를 수신하는 음성인식용 정보수신부와, 음성인식용 정보수신부가 수신한 음성인식용 정보를 음성인식용 정보저장부에 축적하는 음성인식용 정보축적부와, 제일단말장치에 입력된 음성의 정보인 음성정보를 수신하는 음성정보수신부와, 음성정보수신부가 수신한 음성정보를, 음성인식용 정보저장부의 음성인식용 정보를 이용하여 음성인식하고, 음성인식결과를 취득하는 음성인식부와, 음성인식결과를 송신하는 음성인식결과송신부를 구비하고, 번역서버장치는, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 번역용 정보를 저장할 수 있는 번역용 정보수용부와, 사전서버장치로부터, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 번역용 정보를 수신하는 번역용 정보수신부와, 번역용 정보수신부가 수신한 번역용 정보를 번역용 정보저장부에 축적하는 번역용 정보축적부와, 음성인식결과를 수신하는 음성인식결과수신부와, 음성인식결과수신부가 수신한 음성인식결과를, 번역용 정보저장부의 번역용 정보를 이용하여, 목적언어로 번역하고, 번역결과를 취득하는 번역부와, 번역결과를 송신하는 번역결과송신부를 구비하고, 음성합성서버장치는, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 음성합성용 정보를 저장할 수 있는 음성합성용 정보저장부와, 사전서버장치로부터, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 음성합성용 정보를 수신하는 음성합성용 정보수신부와, 음성합성용 정보수신부가 수신한 음성합성용 정보를 음성합성용 정보저장부에 축적하는 음성합성용 정보축적부와, 번역결과를 수신하는 번역결과수신부와, 번역결과수신부가 수신한 번역결과를, 음성합성용 정보저장부의 음성합성용 정보를 이용하여 음성합성하고, 음성합성결과를 취득하는 음성합성부와, 음성합성결과를 제2단말장치에 송신하는 음성합성결과송신부를 구비하는 음성번역시스템이다.
상기 구성에 의해, 음성번역에 있어서 사용하는 사전 사이의 부정합을 없앨 수 있다.
또한, 본 제2발명의 음성번역시스템은, 제1발명에 대하여, 음성인식서버장치의 음성인식부는, 음성정보수신부가 수신한 음성정보에 대한 음성인식처리가 성공일지 실패일지를 판단하는 음성인식판단수단과, 음성인식판단수단이, 음성인식처리가 실패라고 판단했을 경우에, 사전서버장치에 대하여, 음성인식정보를 송신하는 지시를 하는 음성인식정보송신지시수단과, 음성정보수신부가 수신한 음성정보를, 음성인식용 정보저장부의 음성인식용 정보를 이용하여 음성인식하고, 음성인식결과를 취득하고, 또한, 지시의 송신에 대응하고, 사전서버장치로부터 음성인식용 정보수신부가 수신한 음성인식정보를 이용하여 음성인식하고, 음성인식결과를 취득하는 음성인식수단을 구비하고, 음성인식용 정보수신부는, 지시의 송신에 대응하고, 사전서버장치로부터 음성인식정보를 수신하는 음성번역시스템이다.     
상기 구성에 의해, 음성번역에 있어서, 음성인식사전에 용어의 정보가 일시적으로 존재하지 않는 경우에도, 음성인식처리의 시점에서 자동적으로 필요한 용어의 정보를 취득할 수 있고, 음성인식처리를 실행할 수 있다.
또한, 본 제3 발명의 음성번역시스템은, 제1발명에 대하여, 번역서버장치의 번역부는, 음성인식결과수신부가 수신한 음성인식결과에 대한 번역처리가 성공일지 실패일지를 판단하는 번역판단수단과, 번역판단수단이, 번역처리가 실패라고 판단했을 경우에, 사전서버장치에 대하여, 목적언어의 용어의 표기를 송신하는 지시를 하는 번역정보송신지시수단과, 음성인식결과수신부가 수신한 음성인식결과를, 번역용 정보저장부의 번역용 정보를 이용하여, 목적언어로 번역하고, 번역결과를 취득하고, 또한, 지시의 송신에 대응하고, 사전서버장치로부터 번역용 정보수신부가 수신한 목적언어의 용어의 표기를 이용하여, 음성인식결과를 목적언어로 번역하고, 번역결과를 취득하는 번역수단을 구비하고, 번역용 정보수신부는, 지시의 송신에 대응하고, 사전서버장치로부터 목적언어의 용어의 표기를 수신하는 음성번역시스템이다.
상기 구성에 의해, 음성번역에 있어서, 번역사전에 용어의 정보가 일시적으로 존재하지 않는 경우에도, 번역처리의 시점에서 자동적으로 필요한 용어의 정보를 취득할 수 있고, 번역처리를 실행할 수 있다.
또한, 본 제4발명의 음성번역시스템은, 제1발명에 대하여, 음성합성서버장치의 음성합성부는, 번역결과수신부가 수신한 번역결과에 대한 음성합성처리가 성공일지 실패일지를 판단하는 음성합성판단수단과, 음성합성판단수단이, 음성합성처리가 실패라고 판단했을 경우에, 사전서버장치에 대하여, 음성합성정보를 송신하는 지시를 하는 음성합성정보송신지시수단과, 번역결과수신부가 수신한 번역결과를, 음성합성용 정보저장부의 음성합성용 정보를 이용하여 음성합성하고, 음성합성결과를 취득하고, 또한, 지시의 송신에 대응하고, 사전서버장치로부터 음성합성용 정보수신부가 수신한 음성합성정보를 이용하여 번역결과를 음성합성하고, 음성합성결과를 취득하는 음성합성수단을 구비하고, 음성합성용 정보수신부는, 지시의 송신에 대응하고, 사전서버장치로부터 음성합성정보를 수신하는 음성번역시스템이다.
상기 구성에 의해, 음성번역에 있어서, 음성합성사전에 용어의 정보가 일시적으로 존재하지 않는 경우에도, 음성합성처리의 시점에서 자동적으로 필요한 용어의 정보를 취득할 수 있고, 음성합성처리를 실행할 수 있다.
또한, 본 제5발명의 음성번역시스템은, 제1부터 제4 어느 하나의 발명에 대하여, 사전서버장치는, 인터넷상의 1이상의 웹서버장치의 웹페이지로부터, 전언어대사전저장부에 존재하지 않는 용어의 표기를 취득하는 표기취득부와, 표기취득부가 취득한 용어의 표기를, 전언어대사전저장부에 축적하는 표기축적부를 더 구비하는 음성번역시스템이다.
상기 구성에 의해, 음성번역에 있어서 사용하는 사전 사이의 부정합을 없애기 위해서 이용하는 다국어공통사전의 정보를 자동적으로 보충할 수 있다.
또한, 본 제6발명의 음성번역시스템은, 제5에 대하여, 사전서버장치는, 1이상의 제3단말장치로부터, 용어정보 중 어느 하나의 정보를 접수하는 정보접수부와, 정보접수부가 접수한 정보를, 대응하는 언어의 대응하는 용어의 표기에 대응시키고, 전언어대사전저장부에 축적하는 정보축적부를 더 구비하는 음성번역시스템이다.
상기 구성에 의해, 음성번역에 있어서 사용하는 사전 사이의 부정합을 없애기 위해서 이용하는 다국어공통사전의 정보를 보충할 수 있다.
또한, 본 제7발명의 음성번역시스템은, 제5 또는 제6발명에 대하여, 사전서버장치는, 전언어용어정보 또는 전언어용어정보의 일부의 정보를 출력하는 출력부를 더 구비하고, 출력부는, 전언어용어정보 또는 전언어용어정보의 일부의 정보를 출력할 경우에, 2이상의 모든 언어에 대해서, 미리 결정된 모든 정보가 존재할 경우와, 미리 결정된 모든 정보 중 일부의 정보가 존재하지 않을 경우에 따라, 시각적으로 다른 태양에서, 전언어용어정보 또는 전언어용어정보의 일부의 정보를 출력하는 음성번역시스템이다.
상기 구성에 의해, 음성번역에 있어서 사용하는 사전 사이의 부정합을 없애기 위해서 이용하는 다국어공통사전의 정보를 보충하기 쉽게 할 수 있다.
본 발명에 의한 음성번역시스템에 의하면, 음성번역에 있어서 사용하는 사전 사이의 부정합을 없앨 수 있다.
도 1은 실시예 형태에 있어서의 음성번역시스템의 개념도이다.
도 2는 동음성번역시스템의 블럭도이다.
도 3은 동사전서버장치의 블럭도이다.
도 4는 동음성인식서버장치의 블럭도이다.
도 5는 동번역서버장치의 블럭도이다.
도 6은 동음성합성서버장치의 블럭도이다.
도 7은 동사전서버장치의 동작에 관하여 설명하는 플로 차트이다.
도 8은 동음성인식서버장치의 동작에 관하여 설명하는 플로 차트이다.
도 9는 동번역서버장치의 동작에 관하여 설명하는 플로 차트이다.
도 10은 동음성합성서버장치의 동작에 관하여 설명하는 플로 차트이다.
도 11은 동전언어대사전을 나타내는 도면이다.
도 12는 동음성인식사전을 나타내는 도면이다.
도 13은 동번역사전을 나타내는 도면이다.
도 14는 동음성합성사전을 나타내는 도면이다.
도 15는 동음성번역제어정보를 나타내는 도면이다.
도 16은 동음성번역제어정보를 나타내는 도면이다.
도 17은 동전언어대사전을 나타내는 도면이다.
도 18은 동출력예를 나타내는 도면이다.
도 19는 동컴퓨터시스템의 개관도이다.
도 20은 동컴퓨터시스템의 블럭도이다.
이하, 음성번역시스템 등의 실시형태에 대해서 도면을 참조해서 설명한다. 또한, 실시의 형태에 있어서 동일한 부호를 갖는 구성요소는 같은 동작을 하므로, 재차의 설명을 생략할 경우가 있다.
(실시의 형태1)
본 실시의 형태예에 있어서, 전언어대사전을 가지는 사전서버장치를 이용하여, 음성번역에 있어서 사용하는 사전 사이의 부정합을 없앨 수 있는 음성번역시스템에 대하여 설명한다. 또한, 전언어대사전이라는, 음성인식, 번역, 및 음성합성에 필요한 정보를 일원관리하고 있는 사전이다. 전언어대사전은, 2이상의 전언어용어정보를 저장하고 있는 사전의 정보이다. 전언어용어정보는, 음성번역의 대상이 될 수 있는 2이상의 언어에 대해서, 언어마다, 하나의 용어정보를 가지는 정보이다. 용어정보는, 음성인식에 필요한 정보인 음성인식정보와, 번역에 필요한 정보인 번역정보와, 음성합성에 필요한 정보인 음성합성정보를 가지는 정보이다. 용어정보는, 하나의 용어에 관한 정보이다. 또한 용어정보는, 언어에 따라, 그 구조가 달랄 수도 있다. 또한, 음성번역의 대상이 될 수 있는 2이상의 언어는, 바람직하게는 3이상의 언어이다.  
또한, 본 실시의 형태에 있어서, 음성인식이나 번역이나 음성합성 등의 각 처리의 단계에서, 각 처리를 하는 장치에 있어서, 필요한 정보가 존재하지 않을 경우에, 리얼타임에, 전언어대사전을 가지는 사전서버장치로부터, 각 장치가 처리를 하기 위해서 필요한 정보를 취득하러 가는 처리(리얼타임보완처리, 라고 함)를 실행하는 음성번역시스템에 관하여 설명한다.
또한, 본 실시의 형태에 있어서, 예를 들면, 1이상의 웹서버로부터, 새롭게 출현한 용어 등의 정보를, 크롤 등을 해서 취득하고, 전언어대사전을 충실시켜 가거나, 예를 들면, 불특정다수 또는 특정한 다수의 사용자로부터, 전언어대사전에 축적되는 정보를 접수하거나하는 기능을 가지는 사전서버장치에 관하여 설명한다.
도 1은 본 실시의 형태의 음성번역시스템(1)의 개념도이다. 음성번역시스템(1)은, 1이상의 제일단말장치(11), 1이상의 제2단말장치(12), 사전서버장치(13), 1이상의 음성인식서버장치(14), 1이상의 번역서버장치(15), 1이상의 음성합성서버장치(16), 1이상의 제3단말장치(17)를 구비한다.
음성번역시스템(1)에 있어서, 예를 들면, 제1단말장치(11)의 사용자(사용자A)인 일본인이 일본어로 "おはよう(오하요)"라고 발화했을 경우, 음성인식서버장치(14)는 일본어 "おはよう" 음성인식한다. 그리고, 번역서버장치(15)는 음성인식결과를, 예를 들면, 영어 "Good morning"으로 번역한다. 다음에, 음성합성서버장치(16)는 영문"Good morning"부터 "Good morning"의 음성정보를 만들어 낸다. 그리고, 영어의 모국어사용자(native speaker)인 사용자B의 제2단말장치(12)로부터, 음성 "Good morning"이 출력된다.
제일단말장치(11) 및 제2단말장치(12)는, 예를 들면, 통화하는 단말(전화, 휴대전화를 포함한다)이다. 여기에서는, 주로, 제1단말장치(11)를 발화하는 쪽의 단말, 제2단말장치(12)를 발화를 당하는 쪽의 단말로서 설명하지만, 양자는 교체할 수 있는 것은 말할 필요도 없다.
또한, 사전서버장치(13)는, 음성인식서버장치(14), 번역서버장치(15), 및 음성합성서버장치(16)로 이용되는 정보를 모두 보유하고 있다. 이 정보가, 상기한 전언어대사전이다.
더욱이, 제3단말장치(17)는, 전언어대사전에 정보를 추기하고, 전언어대사전을 충실시키기 위해서, 정보를 입력하기 위한 단말이다.
도 2는 본 실시의 형태의 음성번역시스템(1)의 블럭도이다. 또한, 도 3은 사전서버장치(13)의 블럭도이다. 도 4는 음성인식서버장치(14)의 블럭도이다. 도 5는 번역서버장치(15)의 블럭도이다. 도 6은 음성합성서버장치(16)의 블럭도이다.
제1단말장치(11)는, 제1음성접수부(111), 제1음성송신부(112), 제1음성수신부(113), 제1음성출력부(114)를 구비한다.
제2단말장치(12)는, 제2음성접수부(121), 제2음성송신부(122), 제2음성수신부(123), 제2음성출력부(124)를 구비한다.
도 3에서 나타낸 바와 같이 사전서버장치(13)는, 전언어대사전저장부(131), 음성인식용 정보송신부(132), 번역용 정보송신부(133), 음성합성용 정보송신부(134), 표기취득부(135), 표기축적부(136), 정보접수부(137), 정보축적부(138), 출력부(139)를 구비한다.
도 4에서 나타낸 바와 같이,음성인식서버장치(14)는, 음성인식용 정보저장부(141), 음성인식용 정보수신부(142), 음성인식용 정보축적부(143), 음성정보수신부(144), 음성인식부(145), 음성인식결과송신부(146)를 구비한다. 음성인식부(145)는, 음성인식판단수단(1451), 음성인식정보송신지시수단(1452), 음성인식수단(1453)을 구비한다.
도 5에서 나타낸 바와 같이, 번역서버장치(15)는, 번역용 정보저장부(151), 번역용 정보수신부(152), 번역용 정보축적부(153), 음성인식결과수신부(154), 번역부(155), 번역결과송신부(156)를 구비한다. 번역부(155)는, 번역판단수단(1551), 번역정보송신지시수단(1552), 번역수단(1553)을 구비한다.
도 6에서 나타낸 바와 같이 음성합성서버장치(16)는, 음성합성용 정보저장부(161), 음성합성용 정보수신부(162), 음성합성용 정보축적부(163), 번역결과수신부(164), 음성합성부(165), 음성합성결과송신부(166)를 구비한다. 음성합성부(165)는, 음성합성판단수단(1651), 음성합성정보송신지시수단(1652), 음성합성수단(1653)을 구비한다.
제3단말장치(17)는, 입력접수부(171), 정보수신부(172), 정보출력부(173), 입력 정보송신부(174)를 구비한다.
제1음성접수부(111)는, 제1단말장치(11)의 사용자(사용자A라고 함)부터 음성을 접수한다. 제1음성접수부(111)는, 예를 들면, 마이크로폰과 그 디바이스드라이버 등에 의해 실현될 수 있다.
제1음성송신부(112)는, 제1음성접수부(111)가 접수한 음성을 송신한다. 음성의 송신처는, 1이상의 음성인식서버장치(14) 중 어느 하나이다. 또한, 제1음성송신부(112)는, 2이상의 음성인식서버장치(14)에 음성을 송신할 수도 있다. 또한, 여기서, 음성이라는 음성의 정보이며, 송신하는 음성은 디지탈화되어 있는 것이 바람직하다. 또한, 제1음성송신부(112)는, 음성과 함께, 음성번역제어정보를 송신할 수도 있다. 음성번역제어정보는, 음성인식서버장치(14), 번역서버장치(15), 및 음성합성서버장치(16)가, 각각 음성인식, 번역, 및 음성합성을 하거나, 처리결과를 송신하거나 하기 위한 정보를 가진다. 음성번역제어정보는, 예를 들면, 처리결과를 송신하는 곳을 특정하는 정보(IP어드레스나 전화번호 등), 원언어나 목적언어를 특정하는 정보(일본어, 영어, 독일어 등) 등을 가진다. 제1단말장치(11)나 제2단말장치(12)는, 예를 들면, 원언어와 목적언어를, 사용자로부터 접수한다. 또한, 제1단말장치(11)나 제2단말장치(12)는, 예를 들면, 제2단말장치(12)나 제1단말장치(11)의 전화번호나 IP어드레스 등으로부터, 자동적으로 원언어와 목적언어를 결정한다. 상기의 경우, 제2단말장치(12)나 제1단말장치(11)는, 전화번호나 IP어드레스 등의 정보와, 언어를 특정하는 정보를 대응시켜서 유지하고 있거나, 전화번호나 IP어드레스 등의 정보를 키로서 다른 장치로부터 언어를 특정하는 정보를 취득하거나 한다. 또한, 제1단말장치(11)나 제2단말장치(12)는, 원언어나 목적언어로부터 음성인식해야 할 음성인식서버장치(14)를 특정하는 정보(IP어드레스 등)나, 번역서버장치(15)를 특정하는 정보(IP어드레스 등)나, 음성합성서버장치(16)를 특정하는 정보(IP어드레스 등)를 취득한다. 즉, 제1단말장치(11)나 제2단말장치(12)는, 원언어나 목적언어와, 각 서버장치를 특정하는 정보를 대응시켜서 가지고 있거나, 원언어나 목적언어를 이용하여, 다른 장치로부터, 각 서버장치를 특정하는 정보를 취득하거나 한다. 또한, 음성번역제어정보는, 입력음성의 포맷을 나타내는 정보, 출력음성의 포맷을 나타내는 정보, 입출력음성의 성질을 지정하는 정보, 입력텍스트의 포맷을 나타내는 정보, 출력텍스트의 포맷을 나타내는 정보 등도 가질 수 있다. 또한, 제1음성송신부(112)는, 직접적으로 음성을 1이상의 음성인식서버장치(14)에 송신할 수 있고, 다른 장치경유로(간접적으로), 음성을 1이상의 음성인식서버장치(14)에 송신할 수도 있다. 제1음성송신부(112)는, 보통, 무선 또는 유선의 통신수단으로 실현되지만, 방송수단으로 실현될 수도 있다.
제1음성수신부(113)는, 음성(보통, 디지탈화되어 있는 음성정보)을 수신한다. 이 음성은, 제2단말장치(12)의 사용자(사용자B라고 함)가 발성한 음성의 내용을, 제1단말장치(11)의 사용자A가 이해할 수 있는 언어로 번역된 음성이다. 제1음성수신부(113)는, 음성합성서버장치(16)로부터, 직접적 또는 간접적으로 음성을 수신한다. 제1음성수신부(113)는, 보통, 무선 또는 유선의 통신수단으로 실현되지만, 방송을 수신하는 수단으로 실현될 수도 있다.
제1음성출력부(114)는, 제1음성수신부(113)가 수신한 음성을 출력한다. 제1음성출력부(114)는, 스피커(출력디바이스)를 포함한다고 생각해도 포함하지 않는다고 생각해도 된다. 제1음성출력부(114)는, 출력디바이스의 드라이버소프트웨어 또는, 출력디바이스의 드라이버소프트웨어와 출력디바이스 등으로 실현될 수 있다.
제2음성접수부(121)는, 제2단말장치(12)의 사용자B로부터 음성을 접수한다. 제2음성접수부(121)는, 예를 들면, 마이크로폰과 그 디바이스드라이버 등에 의해 실현될 수 있다.
제2음성송신부(122)는, 제2음성접수부(121)가 접수한 음성을 송신한다. 음성의 송신처는, 1이상의 음성인식서버장치(14) 중 어느 하나이다. 또한, 제2음성송신부(122)는, 2이상의 음성인식서버장치(14)에 음성을 송신할도 수 있다. 또한, 여기서, 음성이라는 음성의 정보이며, 송신하는 음성은 디지탈화되어 있는 것이 바람직하다. 더욱이, 제2음성송신부(122)는, 직접적으로 음성을 1이상의 음성인식서버장치(14)에 송신할 수도 있고, 다른 장치경유로(간접적으로), 음성을 1이상의 음성인식서버장치(14)에 송신할 수도 있다. 제2음성송신부(122)는, 보통, 무선 또는 유선의 통신수단으로 실현되지만, 방송수단으로 실현될 수도 있다.
제2음성수신부(123)는, 음성(보통, 디지탈화되어 있는 음성정보)을 수신한다. 이 음성은, 제1단말장치(11)의 사용자A가 발성한 음성의 내용을, 제2단말장치(12)의 사용자B가 이해할 수 있는 언어(목적언어)로 번역된 음성이다. 제2음성수신부(123)는, 음성합성서버장치(16)로부터, 직접적 또는 간접적으로 음성을 수신한다. 제2음성수신부(123)는, 보통, 무선 또는 유선의 통신 수단으로 실현되지만, 방송을 수신하는 수단으로 실현될 수도 있다.  
제2음성출력부(124)는, 제2음성수신부(123)가 수신한 음성을 출력한다. 제2음성출력부(124)는, 스피커(출력디바이스)를 포함한다고 생각해도 포함하지 않는다고 생각해도 된다. 제1음성출력부(114)는, 출력디바이스의 드라이버소프트웨어 또는, 출력디바이스의 드라이버소프트웨어와 출력디바이스 등으로 실현될 수 있다.
전언어대사전저장부(131)는, 전언어대사전을 저장하고 있다. 전언어대사전에 대해서는, 상기했다. 또한, 전언어대사전이 가지는 음성인식정보는, 예를 들면, 은닉마르코프(HMM, Hidden Markov Model) 등의 음향모델이다. 또한, 전언어대사전이 가지는 번역정보는, 예를 들면, 용어의 표기이다. 용어의 표기라는, 언어의 일본어가 "大阪(오사카)"일 경우, 영어는 "Osaka", 중국어는 "大阪(daban, 따반)"이다. 또한, 용어라는, 하나의 단어, 1이상의 단어, 1이상의 문절, 문 등도 포함하는 넓은 개념이다, 라고 파악된다. 음성합성정보라는, 예를 들면, 읽기의 정보(적절한 "읽기"라고 함)와 악센트의 정보(적절한 "악센트"라고 함) 등이다. 용어정보는, 용어의 읽기를, 보통, 가진다. 용어정보는, 예를 들면, 표기, 읽기, 악센트, 톤 등의 정보를 가진다. 용어정보는, 보통, 언어에 따라 구조는 다르다. 예를 들면, 언어가 독일어의 경우, 용어정보는, 용어에 대하여 남성일지 여성일지를 나타내는 플래그정보를 가진다. 또한, 상기 플래그정보는, 일본어나 영어 등의 언어의 용어정보에는 존재하지 않는다.  
또한, 전언어대사전은, 보통, 언어마다 구조정보를 가진다. 예를 들면, 전언어대사전은, "일본어<HMM><표기><읽기><악센트>""영어<HMM><표기><읽기><악센트><톤>""독일어<표기><플래그정보><읽기><악센트>" 등이다. 또한, 구조정보는, 언어공통으로 가지는 구조의 정보는 하나로 관리하고, 언어특유의 정보를 나타내는 구조정보만, 언어마다 관리할 수도 있다. 상기 경우, 구조정보는, 언어공통의 구조정보 "<HMM><표기><읽기><악센트>", "독일<플래그정보>" 등의 정보가 된다.
전언어대사전저장부(131)는, 불휘발성의 기록매체가 바람직하지만, 휘발성의 기록매체라도 실현가능하다. 전언어대사전저장부(131)에 각종의 정보가 기억되는 과정은 묻지 않는다(따지지 않다, 즉 처리하지 않는다). 예를 들면, 기록매체를 통해서 각종의 정보가 전언어대사전저장부(131)로 기억하게 될 수도 있고, 통신회선 등을 통해서 송신된 각종의 정보가 전언어대사전저장부(131)로 기억하게 될 수도 있고 혹은, 입력디바이스를 통해서 입력된 각종의 정보가 전언어대사전저장부(131)로 기억하게 될 수도 있다. 또한, 후술할 표기취득부(135), 표기축적부(136), 정보접수부(137), 정보축적부(138) 등에 의해, 전언어대사전저장부(131)에 정보가 축적되는 것이 바람직하다.
음성인식용 정보송신부(132)는, 전언어대사전저장부(131)로부터 음성인식용 정보를 읽어 내고, 당해 음성인식용 정보를 1이상의 음성인식서버장치(14)에 송신한다. 음성인식용 정보라는, 용어의 음성인식정보를 포함하는 정보이며, 음성인식서버장치(14)에서 음성인식을 위해서 이용되는 정보이다. 음성인식용 정보는, 2이상의 언어 중 모든 언어 또는 일부의 언어에 관한 음성인식정보를 포함하는 정보이다. 음성인식용 정보는, 음성인식정보와 동일한 정보일 수도 있고, 음성인식정보에 다른 정보를 첨가한 정보일 수도 있다. 또한, 음성인식용 정보송신부(132)는, 음성인식용 정보 중 일부에 빠지고 있는 정보가 있는 용어의 음성인식정보는 송신하지 않는 것이 바람직하다. 음성인식용 정보송신부(132)는, 보통, 무선 또는 유선의 통신수단으로 실현되지만, 방송수단으로 실현될 수도 있다.
번역용 정보송신부(133)는, 전언어대사전저장부(131)로부터 번역용 정보를 읽어 내고, 당해 번역용 정보를 1이상의 번역서버장치(15)에 송신한다. 번역용 정보라는, 용어의 표기를 포함하는 정보이며, 번역서버장치(15)에서 번역을 위해서 이용되는 정보이다. 번역용 정보는, 2이상의 언어 중 모든 언어 또는 일부의 언어에 관한 표기를 포함하는 정보이다. 번역용 정보는, 표기뿐으로도 되고, 표기에 다른 정보를 첨가한 정보라도 된다. 또한, 번역용 정보송신부(133)는, 번역용 정보 중에서 일부에 빠지고 있는 정보가 있는 용어의 번역정보는 송신하지 않는 것이 바람직하다. 즉, 일본어의 용어의 표기만이 존재하는 용어정보가 있었을 경우, 당해 용어정보가 가지는 정보는, 전혀 송신하지 않는 것이 바람직하다. 번역용 정보송신부(133)는, 보통, 무선 또는 유선의 통신 수단으로 실현되지만, 방송수단으로 실현될 수도 있다.
음성합성용 정보송신부(134)는, 전언어대사전저장부(131)로부터 음성합성용 정보를 읽어 내고, 당해 음성합성용 정보를1이상의 음성합성서버장치(16)에 송신한다. 음성합성용 정보라는, 용어의 음성합성정보를 포함하는 정보이며, 음성합성서버장치(16)에서 음성합성을 위해서 이용되는 정보이다. 음성합성용 정보는, 2이상의 언어 중 모든 언어 또는 일부의 언어에 관한 음성합성정보를 포함하는 정보이다. 음성합성용 정보는, 음성합성정보와 동일한 정보일 수도 있고, 음성합성정보에 다른 정보를 첨가한 정보일 수도 있다. 또한, 음성합성용 정보송신부(134)는, 음성합성용 정보 중에서 일부에 빠지고 있는 정보가 있는 용어의 음성합성정보는 송신하지 않는 것이 바람직하다. 음성합성용 정보송신부(134)는, 보통, 무선 또는 유선의 통신수단으로 실현되지만, 방송수단으로 실현될 수도 있다.
표기취득부(135)는, 인터넷상의 1이상의 웹서버장치의 웹페이지로부터, 전언어대사전저장부(131)에 존재하지 않는 용어의 표기를 취득한다. 표기취득부(135)는, 표기를 취득할 경우에, 언어를 식별하는 정보인 언어식별자도 취득 하는 것이 바람직하다. 표기취득부(135)는, 예를 들면, 용어를 취득한 웹페이지의 URL이 ".jp"를 포함하는 경우는 언어식별자 "일본어", ".kr"을 포함하는 경우는 언어식별자 "한국어"를 취득한다. 또한, 표기취득부(135)는, 예를 들면, 용어를 취득한 곳의 데이터베이스나 웹페이지의 문자코드로부터, 언어를 자동식별할 수도 있다. 또한, 표기취득부(135)는, 웹페이지로부터 용어를 취득한 후, 사용자에 문의하고, 언어를 입력해 달랄 수도 있다.
또한, 표기취득부(135)는, 웹페이지로부터 용어를 취득하고, 당해 용어를 키로서, 전언어대사전저장부(131)를 검색하고, 전언어대사전저장부(131)에 용어는 존재하지 않는다고 판단했을 경우에, 용어를 취득했다, 라고 할 수도 있다. 즉, 상기 경우, 표기취득부(135)는, 한번, 취득한 용어가, 전언어대사전저장부(131)에 존재할 경우, 당해 용어를 버리도록 할 수도 있다.
표기취득부(135)는, 보통, MPU나 메모리나 통신수단 등으로부터 실현될 수 있다. 표기취득부(135)의 처리순서는, 보통, 소프트웨어로 실현되어, 당해 소프트웨어는 ROM 등의 기록매체에 기록되어 있다. 다만, 하드웨어(전용회로)로 실현할 수도 있다. 표기취득부(135)는, 소위 검색엔진을 기동하는 처리를 할도 수 있다. 상기 경우, 표기취득부(135)는, 검색엔진을 가지지 않는다고 생각해도, 검색엔진을 가진다고 생각해도 된다.
표기축적부(136)는, 표기취득부(135)가 취득한 용어의 표기를,
전언어대사전저장부(131)에 축적한다. 보통, 표기축적부(136)는, 표기취득부(135)가 취득한 언어식별자에 대응하는 언어의 표기로서, 취득한 용어의 표기를 축적한다. 표기축적부(136)는, 보통, MPU나 메모리 등으로부터 실현될 수 있다. 표기축적부(136)의 처리 순서는, 보통, 소프트웨어로 실현되어, 당해 소프트웨어는 ROM 등의 기록매체에 기록되어 있다. 다만, 하드웨어(전용회로)로 실현할 수도 있다.
정보접수부(137)는, 1이상의 제3단말장치(17)로부터, 용어정보 중 어느 하나의 정보를 접수한다. 접수하는 정보는, 예를 들면, HMM, 표기, 읽기, 악센트, 톤, 플래그정보 등이다. 정보접수부(137)는, 보통, 언어와, 대응하는 표기 등을 식별하는 정보와 함께, 정보를 접수한다. 즉, 접수한 정보가, 어느 언어의 어느 표기 또는 읽기 등에 대응하는 정보일지를 판단할 수 있는 상황인 것은 말할 필요도 없다. 여기서, 접수라는, 키보드나 마우스, 터치패널 등의 입력디바이스로부터 입력된 정보의 접수, 유선 혹은 무선의 통신회선을 통해서 송신된 정보의 수신, 광디스크나 자기디스크, 반도체메모리 등의 기록매체로부터 읽어 내진 정보의 접수 등을 포함하는 개념이다. 정보접수부(137)는, 예를 들면, 유선 혹은 무선의 통신수단으로 실현될 수 있다.
정보축적부(138)는, 정보접수부(137)가 접수한 정보를, 대응하는 언어가 대응하는 용어의 표기에 대응시켜서 축적한다. 또한, 정보접수부(137)가 표기를 접수했을 경우, 대응하는 언어의 영역에 축적한다. 또한, 정보접수부(137)가 표기를 접수하고, 또한 읽기 등의 다른 정보가 이미 존재할 경우, 대응하는 언어가 대응하는 용어의 읽기 등에 대응시켜서, 표기를 축적한다. 정보축적부(138)는, 보통, MPU나 메모리 등으로부터 실현될 수 있다. 정보축적부(138)의 처리순서는, 보통, 소프트웨어로 실현되어, 당해 소프트웨어는 ROM 등의 기록매체에 기록되어 있다. 다만, 하드웨어(전용 회로)로 실현할 수도 있다.
출력부(139)는, 전언어용어정보 또는 전언어용어정보의 일부의 정보를 출력한다. 출력부(139)는, 보통, 제3단말장치(17)로부터 온 지시, 또는 사용자로부터의 지시에 의해, 정보를 출력한다. 여기서 말하는 출력이라는, 보통, 지시를 송신한 제3단말장치(17)에 하는, 정보의 송신이다. 출력부(139)는, 전언어용어정보 또는 전언어용어정보의 일부의 정보를 출력할 경우에, 2이상의 모든 언어에 대해서, 미리 결정된 모든 정보가 존재할 경우와, 미리 결정된 모든 정보 중 일부의 정보가 존재하지 않을 경우에 의하여, 시각적으로 다른 태양에서, 전언어용어정보 또는 전언어용어정보의 일부의 정보를 출력하는 것이 바람직하다. 미리 결정된 모든 정보는, 전언어대사전저장부(131)가 가지는 구조정보에 대응하는 정보이다. 출력부(139)는, 보통, 무선 또는 유선의 통신수단으로 실현되지만, 방송수단으로 실현될 수도 있다.
음성인식용 정보저장부(141)는, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 음성인식용 정보를 저장될 수 있다. 음성인식용 정보저장부(141)는, 불휘발성의 기록매체가 바람직하지만, 휘발성의 기록매체라도 실현가능하다.
통상, 사전서버장치(13)로부터 음성인식용 정보를 수신함으로써, 음성인식용 정보저장부(141)에 음성인식용 정보가 기억된다. 다만, 음성인식용 정보저장부(141)에 음성인식용 정보가 기억되는 과정은, 묻지 않는다(따지지 않다, 즉 처리하지 않는다). 예를 들면, 기록매체를 통해서 음성인식용 정보가 음성인식용 정보저장부(141)로 기억하게 될도 수 있고, 혹은, 입력디바이스를 통해서 입력된 음성인식용 정보가 음성인식용 정보저장부(141)로 기억하게 될도 수 있다.
음성인식용 정보수신부(142)는, 사전서버장치(13)로부터, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 관한 음성인식용 정보를 수신한다. 음성인식용 정보수신부(142)는, 음성인식정보송신지시수단(1452)에 있어서의 사전서버장치(13)에 하는 지시의 송신에 대응하고, 사전서버장치(13)로부터 음성인식정보를 수신할도 수 있다. 음성인식용 정보수신부(142)는, 보통, 무선 또는 유선의 통신수단으로 실현되지만, 방송을 수신하는 수단으로 실현될 수도 있다.
음성인식용 정보축적부(143)는, 음성인식용 정보수신부(142)가 수신한 음성인식용 정보를 음성인식용 정보저장부(141)에 축적한다. 또한, 음성인식용 정보축적부(143)는, 음성인식용 정보수신부(142)가 수신한 음성인식정보를 음성인식용 정보저장부(141)에 축적한다. 음성인식용 정보축적부(143)는, 보통, MPU나 메모리 등으로부터 실현될 수 있다. 음성인식용 정보축적부(143)의 처리순서는, 보통, 소프트웨어에서 실현되어, 당해 소프트웨어는 ROM 등의 기록매체에 기록되어 있다. 다만, 하드웨어(전용 회로)로 실현할 수도 있다.
음성정보수신부(144)는, 제1단말장치 (11)에 입력된 음성의 정보인 음성정보를 수신한다. 음성정보수신부(144)는, 제1단말장치(11)로부터 직접, 또는 간접적으로 음성정보를 수신한다. 음성정보수신부(144)는, 보통, 무선 또는 유선의 통신수단으로 실현되지만, 방송을 수신하는 수단으로 실현될 수도 있다.
음성인식부(145)는, 음성정보수신부(144)가 수신한 음성정보를, 음성인식용 정보저장부(141)의 음성인식용 정보를 이용하여 음성인식하고, 음성인식결과를 취득한다. 음성인식결과는, 보통, 원언어(제1단말장치(11)의 사용자A가 발화한 음성의 언어)의 문자열이다. 음성인식부(145)가 하는 음성인식방법은, 어떠한 음성인식방법이라도 좋다. 음성인식부(145)는 공지기술이므로 상세한 설명을 생략한다. 음성인식부(145)는, 보통, MPU나 메모리 등으로부터 실현될 수 있다. 음성인식부(145)의 처리순서는, 보통, 소프트웨어로 실현되어, 당해 소프트웨어는 ROM 등의 기록매체에 기록되어 있다. 다만, 하드웨어(전용 회로)로 실현할 수도 있다.
음성인식판단수단(1451)은, 음성정보수신부(144)가 수신한 음성정보에 대한 음성인식처리가 성공일지 실패일지를 판단한다. 음성인식판단수단(1451)은, 예를 들면, 음성정보수신부(144)가 수신한 음성정보가 가지는 정보이며, 1이상의 용어에 대응하는 정보인 부분음성정보에 대응하는 음성인식정보가, 음성인식용 정보저장부(141)에 존재할지 아닐지를 판단한다. 또한, 여기서, 부분음성정보는, 보통, 음성정보의 일부이지만, 음성정보와 같을 경우도 있을 수 있다. 또한, 음성인식판단수단(1451)은, 음성정보수신부(144)가 수신한 음성정보에 대하여, 음성인식수단(1453)에 음성인식처리를 시키고, 그 결과가 성공일지 실패일지를 판단할 수도 있다. 성공인 경우에는, 부분음성정보에 대응하는 음성인식정보가, 음성인식용 정보저장부(141)에 존재할 경우이다. 또한 실패인 경우에는, 부분음성정보에 대응하는 음성인식정보가, 음성인식용 정보저장부(141)에 존재하지 않을 경우이다. 또한, 음성인식판단수단(1451)은, 음성인식결과의 우도가 미리 결정된 수치보다 큰(이상의) 경우에 음성인식처리가 성공이며, 미리 결정된 수치이하의(보다 작은) 경우에 음성인식처리가 실패라고 판단할 수도 있다. 음성인식판단수단(1451)은, 보통, MPU나 메모리 등으로부터 실현될 수 있다. 음성인식판단수단(1451)의 처리순서는, 보통, 소프트웨어로 실현되어, 당해 소프트웨어는 ROM 등의 기록매체에 기록되어 있다. 다만, 하드웨어(전용 회로)로 실현할 수도 있다.
음성인식정보송신지시수단(1452)은, 음성정보수신부(144)가 수신한 음성정보에 대한 음성인식처리가 실패이었다고 판단했을 경우에, 사전서버장치(13)에 대하여, 음성인식정보를 송신하는 지시를 한다. 예를 들면, 음성인식판단수단(1451)이 음성인식정보는 음성인식용 정보저장부(141)에 존재하지 않는다고 판단했을 경우에, 사전서버장치(13)에 대하여, 음성인식정보를 송신하는 지시를 한다. 또한, 이 지시는, 예를 들면, 부분음성정보와 언어식별자 등을 포함한다. 또한 이 지시는, 예를 들면, 부분음성정보로부터 생성된 음소열과 언어식별자 등을 포함한다. 음성인식정보송신지시수단(1452)은, 보통, 무선 또는 유선의 통신수단으로 실현되지만, 방송수단으로 실현될 수도 있다.
음성인식수단(1453)은, 상기 음성정보수신부가 수신한 음성정보를, 상기 음성인식용 정보저장부의 음성인식용 정보를 이용하여 음성인식하고, 음성인식결과를 취득한다. 또한, 음성인식수단(1453)은, 음성인식정보송신지시수단(1452)에 있어서의 지시의 송신에 대응하고, 사전서버장치(13)로부터 음성인식용 정보수신부(142)가 수신한 음성인식정보를 이용하여 음성인식하고, 음성인식결과를 취득한다. 또한 음성인식수단(1453)은, 음성인식판단수단(1451)이 음성인식정보는 음성인식용 정보저장부(141)에 존재한다고 판단했을 경우에, 음성인식용 정보저장부(141)의 음성인식용 정보를 이용하여 음성인식하고, 음성인식결과를 취득한다. 음성인식수단(1453)은, 보통, MPU나 메모리 등으로부터 실현될 수 있다. 음성인식수단(1453)의 처리순서는, 보통, 소프트웨어로 실현되어, 당해 소프트웨어는 ROM 등의 기록매체에 기록되어 있다. 다만, 하드웨어(전용 회로)로 실현할 수도 있다.
음성인식결과송신부(146)는, 음성인식부(145)가 취득한 음성인식결과를 송신한다. 음성인식결과송신부(146)는, 직접적 또는 간접적으로, 음성인식결과를 번역서버장치(15)에 송신한다. 음성인식결과송신부(146)은, 보통, 무선 또는 유선의 통신수단으로 실현되지만, 방송수단으로 실현될 수도 있다.
번역용 정보저장부(151)는, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 번역용 정보를 저장할 수 있다. 번역용 정보는, 예를 들면, 번역모델과 언어모델이다. 번역용 정보저장부(151)는, 불휘발성의 기록매체가 바람직하지만, 휘발성의 기록매체로도 실현가능하다.
통상, 사전서버장치(13)로부터 번역용 정보를 수신 함으로써, 번역용 정보저장부(151)로 번역용 정보가 기억된다. 단, 번역용 정보저장부(151)로 번역용 정보가 기억되는 과정은 묻지 않는다(따지지 않다, 즉 처리하지 않는다). 예를 들면, 기록매체를 통해서 번역용 정보가 번역용 정보저장부(151)로 기억하게 될 수도 있고, 혹은, 입력디바이스를 통해서 입력된 번역용 정보가 번역용 정보저장부(151)로 기억하세 될 수도 있다.
번역용 정보저장부(152)는, 사전서버장치(13)로부터, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 번역용 정보를 수신한다. 번역용 정보수신부(152)는, 번역정보송신지시수단(1552)에 있어서의 사전서버장치(13)에 하는 지시의 송신에 대응하고, 사전서버장치(13)로부터 목적언어의 용어의 표기를 수신한다. 번역용 정보저장부(152)는, 보통, 무선 또는 유선의 통신수단에서 실현되지만, 방송을 수신하는 수단에서 실현될 수도 있다.
번역용 정보축적부(153)는, 번역용 정보수신부(152)가 수신한 번역용 정보를 번역용 정보저장부(151)에 축적한다. 또한, 번역용 정보축적부(153)는, 번역용 정보수신부(152)가 수신한 목적언어의 용어의 표기를 번역용 정보저장부(151)에 축적한다. 번역용 정보축적부(153)는, 보통, MPU나 메모리 등으로부터 실현될 수 있다. 번역용 정보축적부(153)의 처리순서는, 보통, 소프트웨어에서 실현되어, 당해 소프트웨어는 ROM 등의 기록매체에 기록되어 있다. 다만, 하드웨어(전용 회로)로 실현할 수도 있다.
음성인식결과수신부(154)는, 음성인식서버장치(14)가 취득한 음성인식결과를 수신한다. 음성인식결과수신부(154)는, 음성인식서버장치(14)로부터 직접, 또는 간접적으로 음성인식결과를 수신한다. 음성인식결과수신부(154)는, 보통, 무선 또는 유선의 통신수단에서 실현되지만, 방송을 수신하는 수단으로 실현될 수도 있다.
번역부(155)는, 음성인식결과수신부(154)가 수신한 음성인식결과를, 번역용 정보저장부(151)의 번역용 정보를 이용하여, 목적언어로 번역하고, 번역결과를 취득한다. 번역부(155)에 있어서의 번역알고리즘 등이라고 묻지 않는다(따지지 않다, 즉 처리하지 않는다). 번역부(155)는 공지기술이므로 상세한 설명을 생략한다. 번역부(155)는, 보통, MPU나 메모리 등으로부터 실현될 수 있다. 번역부(155)의 처리순서는, 보통, 소프트웨어에서 실현되어, 당해 소프트웨어는 ROM 등의 기록매체에 기록되어 있다. 다만, 하드웨어(전용 회로)로 실현할 수도 있다.
번역판단수단(1551)은, 음성인식결과수신부(154)가 수신한 음성인식결과에 대한 번역처리가 성공일지 실패일지를 판단한다. 번역판단수단(1551)은, 예를 들면, 음성인식결과수신부(154)가 수신한 음성인식결과가 가지는 정보이며, 1이상의 용어에 대응하는 정보인 부분음성인식결과(보통, 원언어의 용어의 문자열)에 대응하는 목적언어의 용어의 표기가, 번역용 정보저장부(151)에 존재할지 아닐지를 판단한다. 또한, 여기서, 부분음성인식결과는, 보통, 음성인식결과의 일부이지만, 음성인식결과와 같을 경우도 있을 수 있다. 또한, 번역판단수단(1551)은, 음성인식결과수신부(154)가 수신한 음성인식결과에 대하여, 번역수단(1553)에 번역처리를 시키고, 그 결과가 성공일지 실패일지를 판단할 수도 있다. 성공인 경우에는, 부분음성인식결과에 대응하는 목적언어의 용어의 표기가, 번역용 정보저장부(151)에 존재할 경우이다. 또한, 실패인 경우에는, 부분음성인식결과에 대응하는 목적언어의 용어의 표기가, 번역용 정보저장부(151)에 존재하지 않을 경우이다. 또한, 번역판단수단(1551)은, 번역결과의 우도가 미리 결정된 수치보다 큰(이상의) 경우에 번역처리가 성공이며, 미리 결정된 수치이하의(보다 작은) 경우에 번역처리가 실패라고 판단할 수도 있다. 번역판단수단(1551)은, 보통, MPU나 메모리 등으로부터 실현될 수 있다. 번역판단수단(1551)의 처리순서는, 보통, 소프트웨어로 실현되어, 당해 소프트웨어는 ROM 등의 기록매체에 기록되어 있다. 다만, 하드웨어(전용 회로)로 실현할 수도 있다.
번역정보송신지시수단(1552)은, 번역판단수단(1551)이 목적언어의 용어의 표기는 번역용 정보저장부(151)에 존재하지 않는다고 판단했을 경우에, 사전서버장치(13)에 대하여, 목적언어의 용어의 표기를 송신하는 지시를 한다. 이 지시는, 예를 들면, 원언어의 용어의 표기와 목적언어의 언어식별자를 포함한다. 번역정보송신지시수단(1552)은, 보통, 무선 또는 유선의 통신수단으로 실현되지만, 방송수단으로 실현될 수도 있다.
번역수단(1553)은, 음성인식결과수신부(154)가 수신한 음성인식결과를, 번역용 정보저장부(151)의 번역용 정보를 이용하여, 목적언어로 번역하고, 번역결과를 취득한다. 또한, 번역수단(1553)은, 번역정보송신지시수단(1552)에 있어서의 지시의 송신에 대응하고, 사전서버장치(13)로부터 번역용 정보수신부(152)가 수신한 목적언어의 용어의 표기를 이용하여, 음성인식결과를 목적언어로 번역하고, 번역결과를 취득한다. 또한, 번역수단(1553)은, 예를 들면, 번역판단수단(1551)이 목적언어의 용어의 표기는 번역용 정보저장부(151)에 존재한다고 판단했을 경우에, 번역용 정보저장부(151)의 목적언어의 용어의 표기를 이용하여 음성인식결과를 번역하고, 번역결과를 취득한다. 또한, 번역결과라는, 보통, 목적언어의 용어의 문자열이다. 번역수단(1553)은, 보통, MPU나 메모리 등으로부터 실현될 수 있다. 번역수단(1553)의 처리순서는, 보통, 소프트웨어로 실현되어, 당해 소프트웨어는 ROM 등의 기록매체에 기록되어 있다. 다만, 하드웨어(전용 회로)로 실현할 수도 있다.
번역결과송신부(156)는, 번역부(155)가 취득한 번역결과를 송신한다. 번역결과송신부(156)는, 음성합성서버장치(16)에 직접적, 또는 간접적으로 번역결과를 송신한다. 번역결과송신부(156)는, 보통, 무선 또는 유선의 통신수단으로 실현되지만, 방송수단으로 실현될 수도 있다.
음성합성용 정보저장부(161)는, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 음성합성용 정보를 저장할 수 있다. 음성합성용 정보저장부(161)는, 불휘발성의 기록매체가 바람직하지만, 휘발성의 기록매체로도 실현가능하다.
통상, 사전서버장치(13)로부터 음성합성용 정보를 수신함으로써, 음성합성용 정보저장부(161)에 음성합성용 정보가 기억된다. 단, 음성합성용 정보저장부(161)에 음성합성용 정보가 기억되는 과정은 묻지 않는다(따지지 않다, 즉 처리하지 않는다). 예를 들면, 기록매체를 통해서 음성합성용 정보가 음성합성용 정보저장부(161)로 기억하게 될수도 있고, 혹은, 입력 디바이스를 통해서 입력된 음성합성용 정보가 음성합성용 정보저장부(161)로 기억하게 될 수도 있다.
음성합성용 정보수신부(162)는, 사전서버장치(13)로부터, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 음성합성용 정보를 수신한다. 음성합성용 정보수신부(162)는, 음성합성정보송신지시수단(1652)에 있어서의 사전서버장치(13)에 하는 지시의 송신에 대응하고, 사전서버장치(13)로부터 음성합성정보를 수신한다. 음성합성용 정보수신부(162)는, 보통, 무선 또는 유선의 통신수단으로 실현되지만, 방송을 수신하는 수단으로 실현될 수도 있다.
음성합성용 정보축적부(163)는, 음성합성용 정보수신부(162)가 수신한 음성합성용 정보를 음성합성용 정보저장부(161)에 축적한다. 또한, 음성합성용 정보축적부(163)는, 음성합성용 정보수신부(162)가 수신한 음성합성정보를 음성합성용 정보저장부(161)에 축적한다. 음성합성용 정보축적부(163)는, 보통, MPU나 메모리 등으로부터 실현될 수 있다. 음성합성용 정보축적부(163)의 처리순서는, 보통, 소프트웨어로 실현되어, 당해 소프트웨어는 ROM 등의 기록매체에 기록되어 있다. 다만, 하드웨어(전용 회로)로 실현할 수도 있다.
번역결과수신부(164)는, 번역서버장치(15)가 취득한 번역결과를 수신한다. 번역결과수신부(164)는, 번역서버장치(15)로부터 직접, 또는 간접적으로 번역결과를 수신한다. 번역결과수신부(164)는, 보통, 무선 또는 유선의 통신수단으로 실현되지만, 방송을 수신하는 수단으로 실현될 수도 있다.
음성합성부(165)는, 번역결과수신부(164)가 수신한 번역결과를, 음성합성용 정보저장부(161)의 음성합성용 정보를 이용하여 음성합성하고, 음성합성결과를 취득한다. 음성합성의 알고리즘 등이라고 묻지 않는다(따지지 않다, 즉 처리하지 않는다). 음성합성부(165)는 공지기술이므로 상세한 설명을 생략한다. 음성합성부(165)는, 보통, MPU나 메모리 등으로부터 실현될 수 있다. 음성합성부(165)의 처리순서는, 보통, 소프트웨어로 실현되어, 당해 소프트웨어는 ROM 등의 기록매체에 기록되어 있다. 다만, 하드웨어(전용 회로)로 실현할 수도 있다.
음성합성판단수단(1651)은, 번역결과수신부(164)가 수신한 번역결과에 대한 음성합성처리가 성공일지 실패일지를 판단한다. 음성합성판단수단(1651)은, 예를 들면, 번역결과수신부(164)가 수신한 번역결과가 가지는 정보이며, 1이상의 용어에 대응하는 정보인 부분번역결과에 대응하는 음성합성정보가, 음성합성용 정보저장부(161)에 존재할지 아닐지를 판단한다. 또한, 여기서, 부분번역결과는, 보통, 번역결과의 일부이지만, 번역결과와 같을 경우도 있을 수 있다. 또한, 음성합성판단수단(1651)은, 번역결과수신부(164)가 수신한 번역결과에 대하여, 음성합성수단(1653)에 음성합성처리를 시키고, 그 결과가 성공일지 실패일지를 판단할 수도 있다. 성공인 경우에는, 부분번역결과에 대응하는 음성합성정보가, 음성합성용 정보저장부(161)에 존재할 경우이다. 또한, 실패인 경우에는, 부분번역결과에 대응하는 음성합성정보가, 음성합성용 정보저장부(161)에 존재하지 않을 경우이다. 또한, 음성합성판단수단(1651)은, 음성합성결과의 우도가 미리 결정된 수치보다 큰(이상의) 경우에 음성합성처리가 성공이며, 미리 결정된 수치이하의(보다 작은) 경우에 음성합성처리가 실패라고 판단할 수도 있다. 음성합성판단수단(1651)은, 보통, MPU나 메모리 등으로부터 실현될 수 있다. 음성합성판단수단(1651)의 처리순서는, 보통, 소프트웨어에서 실현되어, 당해 소프트웨어는 ROM 등의 기록매체로 기록되어 있다. 다만, 하드웨어(전용 회로)로 실현할 수도 있다.
음성합성정보송신지시수단(1652)은, 번역결과수신부(164)가 수신한 번역결과에 대한 음성합성처리가 실패라고 판단했을 경우에, 사전서버장치(13)에 대하여, 음성합성정보를 송신하는 지시를 한다. 예를 들면, 음성합성정보송신지시수단(1652)은, 음성합성판단수단(1651)이 음성합성정보는 음성합성용 정보저장부(161)에 존재하지 않는다고 판단했을 경우에, 사전서버장치(13)에 대하여, 음성합성정보를 송신하는 지시를 한다. 또한, 이 지시는, 예를 들면, 목적언어의 용어의 표기(부분번역결과)과 목적언어의 언어식별자를 포함한다. 음성합성정보송신지시수단(1652)은, 보통, 무선 또는 유선의 통신수단으로 실현되지만, 방송수단으로 실현될 수도 있다.
음성합성수단(1653)은, 번역결과수신부(164)가 수신한 번역결과를, 음성합성용 정보저장부(161)의 음성합성용 정보를 이용하여 음성합성하고, 음성합성결과를 취득한다. 또한, 음성합성수단(1653)은, 음성합성정보송신지시수단(1652)에 있어서의 지시의 송신에 대응하고, 사전서버장치(13)로부터 음성합성용 정보수신부(162)가 수신한 음성합성정보를 이용하여 부분번역결과를 음성합성하고, 음성합성결과를 취득한다. 또한, 예를 들면, 음성합성수단(1653)은, 음성합성판단수단(1651)이 음성합성정보는 음성합성용 정보저장부(161)에 존재한다고 판단했을 경우에, 음성합성용 정보저장부(161)의 음성합성용 정보를 이용하여 부분번역결과를 음성합성하고, 음성합성결과를 취득할 수도 있다. 음성합성결과라는, 보통, 목적언어의 음성의 정보이다. 음성합성수단(1653)은, 보통, MPU나 메모리 등으로부터 실현될 수 있다. 음성합성수단(1653)의 처리순서는, 보통, 소프트웨어로 실현되어, 당해 소프트웨어는 ROM 등의 기록매체에 기록되어 있다. 다만, 하드웨어(전용 회로)로 실현할 수도 있다.
음성합성결과송신부(166)는, 음성합성부(165)가 취득한 음성합성결과를 제2단말장치(12)에 송신한다. 음성합성결과송신부(166)는, 직접적 또는 간접적으로, 음성합성결과를 제2단말장치(12)에 송신한다. 음성합성결과송신부(166)는, 보통, 무선 또는 유선의 통신수단으로 실현되지만, 방송 수단으로 실현될 수도 있다.
입력접수부(171)는, 사용자로부터 각종의 지시나 각종의 정보의 입력을 접수한다. 지시나 정보의 입력수단은, 텐 키나 키보드나 마우스나 메뉴화면에 의한 것 등, 아무것일 수 있다. 입력접수부(171)는, 텐 키나 키보드 등의 입력수단의 디바이스드라이버나, 메뉴화면의 제어소프트웨어 등으로 실현될 수 있다.
정보수신부(172)는, 사전서버장치(13)로부터, 정보를 수신한다. 이 수신하는 정보는, 전언어용어정보 또는 전언어용어정보의 일부의 정보이다. 정보수신부(172)는, 보통, 무선 또는 유선의 통신수단으로 실현되지만, 방송을 수신하는 수단으로 실현될 수도 있다.
정보출력부(173)는, 정보수신부(172)가 수신한 정보를 출력한다. 정보출력부(173)는, 2이상의 모든 언어에 대해서, 미리 결정된 모든 정보가 존재할 경우와, 미리 결정된 모든 정보 중 일부의 정보가 존재하지 않을 경우에 따라, 시각적으로 다른 태양으로, 수신된 정보(전언어용어정보 또는 전언어용어정보의 일부의 정보)를 출력한다. 정보출력부(173)는, 디스플레이나 스피커 등의 출력디바이스를 포함한다고 생각할 수도 있고, 포함하지 않는다고 생각할 수도 있다. 정보출력부(173)는, 출력디바이스의 드라이버소프트웨어 또는, 출력디바이스의 드라이버소프트웨어와 출력디바이스 등으로 실현될 수 있다.
입력정보송신부(174)는, 입력접수부(171)가 접수한 지시 또는 정보를, 사전서버장치(13)에 송신한다. 입력정보송신부(174)는, 보통, 무선 또는 유선의 통신 수단에서 실현되지만, 방송수단에서 실현될 수도 있다.
다음에, 음성번역시스템(1)의 동작에 관하여 설명한다. 우선, 제1단말장치(11)의 동작에 관하여 설명한다. 제1단말장치(11)의 제1음성접수부(111)는, 사용자A로부터 발성된 언어A의 음성을 접수한다. 그리고, 제1음성송신부(112)는, 접수한 음성을 음성정보로 해서, 당해 음성정보 (단지"음성"이라고 할 경우도 있음)를 송신한다. 또한, 제1음성수신부(113)는, 사용자B가 발성한 언어B의 음성정보를 음성번역해서 얻게 된 언어A의 음성정보를 수신한다. 다음에, 제1음성출력부(114)는, 언어A의 음성정보를, 음성으로서 출력한다.
다음에, 제2단말장치(12)의 동작에 관하여 설명한다. 제2단말장치(12)의 제2음성수신부(123)는, 사용자A로부터 발성된 언어A의 음성을 음성번역해서 얻게 된 언어B의 음성정보를 수신한다. 그리고, 제2음성출력부(124)는, 제2음성수신부(123)가 수신한 언어B의 음성정보를, 음성으로서 출력한다. 또한, 제2음성접수부(121)는, 제2단말장치(12)의 사용자B으로부터, 언어B의 음성을 접수한다. 그리고, 제2음성송신부(122)는, 제2음성접수부(121)가 접수한 언어B의 음성을 음성정보로서 송신한다.
다음에, 사전서버장치(13)의 동작에 대해서, 도 7의 플로 차트를 사용하여 설명한다.
(스텝S701)사전서버장치(13)는, 외부의 장치로부터 지시를 수신한 것인지 아닌지를 판단한다. 지시를 수신하면 스텝S702에 가고, 지시를 수신하지 않으면 스텝 S706에 간다.
(스텝S702)사전서버장치(13)는, 스텝S701로 접수한 지시가 정보의 송신 지시일 것인지 아닌지를 판단한다. 정보의 송신 지시이면 스텝S703에 가고, 정보의 송신 지시가 아니면 스텝S705에 간다.
(스텝S703)사전서버장치(13)의 음성인식용 정보송신부(132), 번역용 정보송신부(133), 또는 음성합성용 정보송신부(134)는, 스텝S701에서 접수한 지시에 대응하는 정보를, 전언어대사전저장부(131)로부터 검색하고, 음성인식을 위해서 필요한 정보, 또는 번역을 위해서 필요한 정보, 또는 음성합성을 위해서 필요한 정보를 취득한다. 또한 구체적으로는, 예를 들면, 음성인식용 정보송신부(132)는, 스텝S701에서 접수한 지시가 가지는 음성인식에 실패한 음성정보와 언어식별자를 키로서, 전언어대사전저장부(131)를 검색하고, 음성인식정보(예를 들면, 음향모델)를 취득한다. 또한, 예를 들면, 번역용 정보송신부(133)는, 스텝S701에서 접수한 지시가 가지는 번역에 실패한 음성인식결과(일부일 경우도 있음)과 원언어의 식별자와 목적언어의 식별자를 키로서, 전언어대사전저장부(131)를 검색하고, 번역정보(예를 들면, 목적언어의 용어의 표기)를 취득한다. 또한, 예를 들면, 음성합성용 정보송신부(134)는, 스텝S701에서 접수한 지시가 가지는 음성합성에 실패한 번역결과(일부일 경우도 있음)과 목적언어의 식별자를 키로서, 전언어대사전저장부(131)를 검색하고, 음성합성정보(예를 들면, 용어의 읽기와 안센트의 정보)를 취득한다.
(스텝S704)음성인식용 정보송신부(132), 번역용 정보송신부(133), 또는 음성합성용 정보송신부(134)는, 스텝S703에서 취득한 정보를 송신한다. 송신처는, 지시를 송신해 온 장치(음성인식서버장치(14), 번역서버장치(15), 또는 음성합성서버장치(16))이다. 스텝S701에 되돌아간다.
(스텝S705)사전서버장치(13)는, 스텝S701에서 접수한 지시에 대응하는 처리를 한다. 예를 들면, 지시가 정보의 출력지시(송신지시)일 경우, 출력부(139)는, 지시에 대응하는 정보를 전언어대사전저장부(131)로부터 검색하고, 검색에 의해 취득한 정보를, 지시를 송신해 온 장치(보통, 제3단말장치(17))에 송신한다. 스텝S701에 되돌아간다.
(스텝S706)정보접수부(137)는, 외부의 장치(보통, 제3단말장치(17))부터 정보를 수신한 것인지 아닌지를 판단한다. 정보를 수신하면 스텝S707에 가고, 정보를 수신하지 않으면 스텝S708에 간다.
(스텝S707)정보축적부(138)는, 스텝S706에서 수신한 정보를, 전언어대사전저장부(131)내의 대응하는 영역에 축적한다. 또한, 정보라는, 예를 들면, 용어의 읽기, HMM, 악센트의 정보, 톤의 정보 등이며, 음성인식, 번역, 또는 음성합성에 이용할 수 있는 정보이다. 또한, 대응하는 영역이라는, 이하와 같다. 즉, 수신한 정보는, 예를 들면, 언어식별자와 용어를 특정하는 정보(용어의 표기 등)라고 추기하는 정보(용어의 읽기, HMM, 악센트의 정보, 톤의 정보 등)가 포함된다. 그리고, 정보축적부(138)는, 언어식별자와 용어를 특정하는 정보를 이용하여, 추기하는 정보를 써 넣어야 할 영역을 결정하고, 당해 영역에 추기하는 정보를 축적한다. 스텝S701에 되돌아간다.
(스텝S708)음성인식용 정보송신부(132), 번역용 정보송신부(133), 또는 음성합성용 정보송신부(134)는, 정보를 송신하는 타이밍일지 아닌가를 판단한다. 정보를 송신하는 타이밍이면 스텝S714에 가고, 정보를 송신하는 타이밍이 아니면 스텝S709에 간다. 여기서, 정보라는, 음성인식용 정보, 번역용 정보, 또는 음성합성용 정보이다. 또한, 정보를 송신하는 타이밍은, 예를 들면, 사용자로부터의 지시를 접수한 타이밍 등이다. 또한, 정보의 송신처는, 음성인식용 정보송신부(132), 번역용 정보송신부(133), 또는 음성합성용 정보송신부(134)가 미리 저장하고 있다.
(스텝S709)표기취득부(135)는, 웹상의 크롤을 시작하는 타이밍일지 아닌지를 판단한다. 크롤을 시작하는 타이밍이면 스텝S710에 가고, 크롤을 시작하는 타이밍이 아니면 스텝S701에 되돌아간다. 또한, 예를 들면, 표기취득부(135)는, 정기적으로 크롤을 시작하는 타이밍이라고 판단한다.
(스텝S710)표기취득부(135)는, 웹상을 크롤하고, 용어의 표기를 취득한다. 또한, 표기취득부(135)는, 갱신된 웹페이지를 검색하고, 구웹페이지와 비교하고, 갱신개소를 추출하고, 당해 갱신개소로부터 용어(명사, 명사구, 동사, 형용사 등)를 취득하는 것이 바람직하다. 또한, 용어의 표기는, 적절하게, "용어"라고도 한다. 또한, 크롤하는 기술은 공지기술이므로 상세한 설명을 생략한다. 또한, 표기취득부(135)는, 본 스텝으로, 1의 용어를 취득할 수 있고, 복수의 용어를 취득할 수도 있다.
(스텝S711)표기취득부(135)는, 스텝S710에서 취득한 1이상의 각 용어의 표기를 키로서, 전언어대사전저장부(131)를 검색한다.
(스텝S712)표기취득부(135)는, 스텝S711에 있어서의 검색의 결과, 스텝S710에서 취득한 1이상의 각 용어의 표기가, 전언어대사전저장부(131)에 존재할지 아닌지를 판단한다. 모든 용어의 표기가 존재하면 스텝S701에 되돌아가고, 존재하지 않는 용어의 표기가 있으면 스텝S713에 간다.
(스텝S713)표기축적부(136)는, 스텝S712에서 전언어대사전저장부(131)에 존재하지 않는다고 판단된 1이상의 용어의 표기를, 전언어대사전저장부(131)에 축적한다. 또한, 표기축적부(136)는, 용어의 표기에 대응시켜 있는 언어식별자에 대응하는 영역에, 1이상의 용어의 표기를 축적한다. 또한, 표기취득부(135)는, 용어를 취득할 때에, 용어와 대응시켜서 언어식별자를 취득한다, 라고 한다. 스텝S701에 되돌아간다.
(스텝S714)음성인식용 정보송신부(132)는, 음성인식용 정보를 송신하는 타이밍일지 아닌지를 판단한다. 음성인식용 정보를 송신하는 타이밍이면 스텝S715에 가고, 음성인식용 정보를 송신하는 타이밍이 아니면 스텝S717에 간다. 음성인식용 정보를 송신하는 타이밍은, 예를 들면, 사용자로부터의 지시를 접수한 타이밍 등이다.
(스텝S715)음성인식용 정보송신부(132)는, 전언어대사전저장부(131)로부터 음성인식용 정보를 읽어 낸다.
(스텝S716)음성인식용 정보송신부(132)는, 스텝S715에서 읽어 낸 음성인식용 정보를, 1이상의 음성인식서버장치(14)에 송신한다. 또한, 1이상의 음성인식서버장치(14)에 정보를 송신하기 위한 정보(IP어드레스나 URL 등)는, 음성인식용 정보송신부(132)가 미리 유지하고 있다, 라고 한다. 스텝S701에 되돌아간다.
(스텝S717)번역용 정보송신부(133)는, 번역용 정보를 송신하는 타이밍일지 아닌지를 판단한다. 번역용 정보를 송신하는 타이밍이면 스텝S718에 가고, 번역용 정보를 송신하는 타이밍이 아니면 스텝S720에 간다. 또한, 번역용 정보를 송신하는 타이밍은, 예를 들면, 사용자로부터의 지시를 접수한 타이밍 등이다.
(스텝S718)번역용 정보송신부(133)는, 전언어대사전저장부(131)로부터 번역용 정보를 읽어 낸다.
(스텝S719)번역용 정보송신부(133)는, 스텝S718에서 읽어 낸 번역용 정보를, 1이상의 번역서버장치(15)에 송신한다. 또한, 1이상의 번역서버장치(15)에 정보를 송신하기 위한 정보(IP어드레스나 URL 등)는, 번역용 정보송신부(133)가 미리 유지하고 있다, 라고 한다. 스텝S701에 되돌아간다.
(스텝S720)음성합성용 정보송신부(134)는, 음성합성용 정보를 송신하는 타이밍일지 아닐지를 판단한다. 음성합성용 정보를 송신하는 타이밍이면 스텝S721에 가고, 음성합성용 정보를 송신하는 타이밍이 아니면 스텝S701에 되돌아간다. 또한, 음성합성용 정보를 송신하는 타이밍은, 예를 들면, 사용자로부터의 지시를 접수한 타이밍 등이다.
(스텝S721)음성합성용 정보송신부(134)는, 전언어대사전자장부(131)로부터 음성합성용 정보를 읽어 낸다.
(스텝S722)음성합성용 정보송신부(134)는, 스텝S718로 읽어 낸 음성합성용 정보를, 1이상의 음성합성서버장치(16)에 송신한다. 또한, 1이상의 음성합성서버장치(16)에 정보를 송신하기 위한 정보(IP어드레스나 URL 등)는, 음성합성용 정보송신부(134)가 미리 유지하고 있다, 라고 한다. 스텝S701에 되돌아간다.
또한, 도 7의 플로 차트에 있어서, 전원오프나 처리종료의 도중진입에 의해, 처리는 종료한다.
다음에, 음성인식서버장치(14)의 동작에 대해서, 도 8의 플로 차트를 사용하여 설명한다.
(스텝S801)음성정보수신부(144)는, 음성정보를 수신한 것인지 아닌지를 판단한다. 음성정보를 수신하면 스텝S802에 가고, 음성정보를 수신하지 않으면 스텝S809에 간다.
(스텝S802)음성인식수단(1453)은, 스텝S801에서 수신된 음성정보에 대하여, 음성인식처리를 하고, 음성인식결과를 얻는다.
(스텝S803)음성인식판단수단(1451)은, 스텝S802에 있어서의 음성인식의 결과가 성공일지 아닐지를 판단한다. 여기서, 예를 들면, 음성인식결과의 우도를 이용하여 판단한다. 성공이면 스텝S804에 가고, 성공이 아니면 스텝S805에 간다.
(스텝S804)음성인식결과송신부(146)는, 스텝S802에서 취득된 음성인식결과를, 번역서버장치(15)에 송신한다. 스텝S801에 되돌아간다.
(스텝S805)음성인식정보송신지시수단(1452)은, 음성정보를 음성인식하기 위해서 필요한 정보(음성인식정보)를 취득하기 위해서, 사전서버장치(13)에 송신하는 정보를 취득한다. 취득하는 정보는, 예를 들면, 음성인식에 실패한 음성정보(일부일 경우도 있다)나, 언어를 특정하는 정보(언어식별자) 등이다.
(스텝S806)음성인식정보송신지시수단(1452)은, 스텝S805에서 취득한 정보를 포함하는 지시를, 사전서버장치(13)에 송신한다. 이 지시는, 음성인식정보의 송신을 재촉하는 지시이다.
(스텝S807)음성인식용 정보수신부(142)는, 스텝S806에 있어서의 지시의 송신에 대응하고, 음성인식정보를 수신한 것인지 아닌지를 판단한다. 음성인식정보를 수신하면 스텝S808에 가고, 음성인식정보를 수신하지 않으면 스텝S807에 되돌아간다.
(스텝S808)음성인식용 정보축적부(143)는, 스텝S807에서 수신된 음성인식정보를 음성인식용 정보저장부(141)에 축적한다.
(스텝S809)음성인식수단(1453)은, 스텝S807에서 수신된 음성인식정보를 이용하여, 스텝S801에서 수신된 음성정보에 대하여, 음성인식처리를 하고, 음성인식결과를 얻는다. 스텝S804에 간다.
(스텝S810)음성인식용 정보수신부(142)는, 사전서버장치(13)로부터, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 관한 음성인식용 정보를 수신한 것인지 아닌지를 판단한다. 음성인식용 정보를 수신하면 스텝S811에 가고, 음성인식용 정보를 수신하지 않으면 스텝S801에 되돌아간다.
(스텝S811)음성인식용 정보축적부(143)는, 스텝S810에서 수신된 음성인식용 정보를 음성인식용 정보저장부(141)에 축적한다. 스텝S801에 되돌아간다.
또한, 도 8의 플로 차트에 있어서, 전원오프나 처리종료의 도중진입에 의해, 처리는 종료한다.
다음에, 번역서버장치(15)의 동작에 대해서, 도 9의 플로 차트를 사용하여 설명한다.
(스텝S901)음성인식결과수신부(154)는, 음성인식결과를 수신한 것인지 아닌지를 판단한다. 음성인식결과를 수신하면 스텝S902에 가고, 음성인식결과를 수신하지 않으면 스텝S909에 간다.
(스텝S902)번역수단(1553)은, 스텝S901에서 수신된 음성인식결과에 대하여, 번역처리를 하고, 번역결과를 얻는다.
(스텝S903)번역판단수단(1551)은, 스텝S902에 있어서의 번역의 결과가 성공일지 아닌지를 판단한다. 여기서, 예를 들면, 번역 결과의 우도를 이용하여 판단한다. 성공이면 스텝S904에 가고, 성공이 아니면 스텝S905에 간다.
(스텝S904)번역결과송신부(156)는, 스텝S902에서 취득된 번역결과를, 음성합성서버장치(16)에 송신한다. 스텝S901에 되돌아간다.
(스텝S905)번역정보송신지시수단(1552)은, 음성인식결과를 번역하기 위해서 필요한 정보(번역정보)를 취득하기 위해서, 사전서버장치(13)에 송신하는 정보를 취득한다. 취득하는 정보는, 예를 들면, 번역에 실패한 음성인식결과(일부일 경우도 있음)과 원언어의 식별자와 목적언어의 식별자 등이다.
(스텝S906)번역정보송신지시수단(1552)은, 스텝S905에서 취득한 정보를 포함하는 지시를, 사전서버장치(13)에 송신한다. 이 지시는, 번역정보의 송신을 재촉하는 지시이다.
(스텝S907)번역용 정보수신부(152)는, 스텝S906에 있어서의 지시의 송신에 대응하고, 번역정보를 수신한 것인지 아닌지를 판단한다. 번역정보를 수신하면 스텝S908에 가고, 번역정보를 수신하지 않으면 스텝S907에 되돌아간다.
(스텝S908)번역용 정보축적부(153)는, 스텝S907에서 수신된 번역정보를 번역용 정보저장부(151)에 축적한다.
(스텝S909)번역수단(1553)은, 스텝S907에서 수신된 번역정보를 이용하여, 스텝S901에서 수신된 음성인식결과에 대하여, 번역처리를 하고, 번역결과를 얻는다. 스텝S904에 간다.
(스텝S910)번역용 정보수신부(152)는, 사전서버장치(13)로부터, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 관한 번역용 정보를 수신한 것인지 아닌지를 판단한다. 번역용 정보를 수신하면 스텝S911에 가고, 번역용 정보를 수신하지 않으면 스텝S901에 되돌아간다.
(스텝S911)번역용 정보축적부(153)는, 스텝S910에서 수신된 번역용 정보를 번역용 정보저장부(151)에 축적한다. 스텝S901에 되돌아간다.
또한, 도 9의 플로 차트에 있어서, 전원오프나 처리종료의 도중진입에 의해, 처리는 종료한다.
다음에, 음성합성서버장치(16)의 동작에 대해서, 도 10의 플로 차트를 사용하여 설명한다.
(스텝S1001)번역결과수신부(164)는, 번역결과를 수신한 것인지 아닌지를 판단한다. 번역결과를 수신하면 스텝S1002에 가고, 번역결과를 수신하지 않으면 스텝S1009에 간다.
(스텝S1002)음성합성수단(1653)은, 스텝S1001에서 수신된 음성정보에 대하여, 음성합성처리를 하고, 음성합성결과를 얻는다.
(스텝S1003)음성합성판단수단(1651)은, 스텝S1002에 있어서의 음성합성의 결과가 성공일 것인지 아닌지를 판단한다. 여기서, 예를 들면, 음성합성결과의 우도를 이용하여 판단한다. 성공이면 스텝S1004에 가고, 성공이 아니면 스텝S1005에 간다.
(스텝S1004)음성합성결과송신부(166)는, 스텝S1002에서 취득된 음성합성결과를, 제2단말장치(12)에 송신한다. 스텝S1001에 되돌아간다.
(스텝S1005)음성합성정보송신지시수단(1652)은, 번역결과를 음성합성하기 위해서 필요한 정보(음성합성정보)를 취득하기 위해서, 사전서버장치(13)에 송신하는 정보를 취득한다. 취득하는 정보는, 예를 들면, 음성합성에 실패한 번역결과(일부일 경우도 있은)과 목적언어의 식별자이다.
(스텝S1006)음성합성정보송신지시수단(1652)은, 스텝S1005에서 취득한 정보를 포함하는 지시를, 사전서버장치(13)에 송신한다. 이 지시는, 음성합성정보의 송신을 재촉하는 지시이다.
(스텝S1007)음성합성용 정보수신부(162)는, 스텝S1006에 있어서의 지시의 송신에 대응하고, 음성합성정보를 수신한 것인지 아닌지를 판단한다. 음성합성정보를 수신하면 스텝S1008에 가고, 음성합성정보를 수신하지 않으면 스텝S1007에 되돌아간다.
(스텝S1008)음성합성용 정보축적부(163)는, 스텝S1007에서 수신된 음성합성정보를 음성합성용 정보저장부(161)에 축적한다.
(스텝 S1009)음성합성수단(1653)은, 스텝S1007에서 수신된 음성합성정보를 이용하여, 스텝S1001에서 수신된 번역결과에 대하여, 음성합성처리를 하고, 음성합성결과를 얻는다. 스텝S1004에 간다.
(스텝S1010)음성합성용 정보수신부(162)는, 사전서버장치(13)로부터, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 관한 음성합성용 정보를 수신한 것인지 아닌지를 판단한다. 음성합성용 정보를 수신하면 스텝S1011에 가고, 음성합성용 정보를 수신하지 않으면 스텝S1001에 되돌아간다.
(스텝S1011)음성합성용 정보축적부(163)는, 스텝S1010에서 수신된 음성합성용 정보를 음성합성용 정보저장부(161)에 축적한다. 스텝S1001에 되돌아간다.
또한, 도 10의 플로 차트에 있어서, 전원오프나 처리종료의 도중진입에 의해, 처리는 종료한다.
다음에, 제3단말장치(17)의 동작에 관하여 설명한다. 제3단말장치(17)의 입력접수부(171)는, 사용자로부터 각종의 지시나 각종의 정보의 입력을 접수한다. 예를 들면, 입력접수부(171)는, 사용자로부터 전언어대사전의 출력지시를 접수한다. 그러자, 입력정보송신부(174)는, 입력접수부(171)가 접수한 출력지시를, 사전서버장치(13)에 송신한다. 그리고, 상기 출력지시의 송신에 대응하고, 정보수신부(172)는, 사전서버장치(13)로부터, 전언어대사전의 전부 또는 일부를 수신한다. 다음에, 정보출력부(173)은, 정보수신부(172)가 수신한 전언어대사전의 전부 또는 일부를 출력한다. 또한, 상기 출력 때, 정보출력부(173)는, 2이상의 모든 언어에 대해서, 미리 결정된 모든 정보가 존재할 경우와, 미리 결정된 모든 정보 중 일부의 정보가 존재하지 않을 경우에 따라, 시각적으로 다른 태양에서, 수신된 정보(전언어용어정보 또는 전언어용어정보의 일부의 정보)를 출력한다. 즉, 빠져 있는 정보가 존재하는 용어에 있어서, 정보가 빠져 있는 것을 사용자에 명시하도록 전언어대사전의 전부 또는 일부(1이상의 용어의 정보)를 출력한다.
또한, 입력접수부(171)는, 사용자로부터 전언어대사전 내가 빠져 있는 정보의 입력을 접수한다. 그리고, 입력정보송신부(174)는, 입력접수부(171)가 접수한 정보를, 사전서버장치(13)에 송신한다. 그리고, 전언어대사전에, 상기 정보가 축적될 것이다. 이것으로써, 전언어대사전이 충실해진다.
이하, 본 실시의 형태에 있어서의 음성번역시스템(1)의 구체적인 동작에 관하여 설명한다. 음성번역시스템(1)의 개념도는 도 1이다.
지금, 사전서버장치(13)의 전언어대사전저장부(131)는, 도 11의 전언어대사전을 저장하고 있다. 도 11의 전언어대사전은, 음성번역에 있어서의 사전간의 부정합의 문제를 해결하기 위해서, 이하와 같은 구조를 가진다. 전언어대사전은, 음성인식사전, 번역용 대역사전, 및 합성음성용 사전에 필요한 정보를 전언어대로 일원관리하고 있는 정보이다. 구체적으로는, 전언어대사전은, 구조정보 "일본어<표기><읽기><음향모델> <악센트>ㅇㅇㅇ""영어<표기><읽기><음향모델><악센트><톤>ㅇㅇㅇ""중국어<표기><읽기><음향모델><악센트><성조>ㅇㅇㅇ""독일어<표기><읽기><음향모델><악센트><플래그정보>ㅇㅇㅇ" 등을 가진다, 라고 한다. 그리고, 전언어대사전은, 구조정보에 대응한 언어마다 용어정보를 가진다. 도 11에 있어서, 용어 "大阪"의 일본어의 용어정보는 "<표기>大阪<읽기>오사카<음향모델>ㅇㅇㅇ<악센트>4모라(mora) O형ㅇㅇㅇ"이다. 또한, 괄호("<"">")에서 둘러싸여진 정보는, 사전의 요소(속성)를 가리키는 정보이며, 괄호("<"">")에서 둘러싸여진 정보군이, 여기서의 구조정보이다.
상기 상황에 있어서, 우선, 사용자로부터의 지시에 의해, 사전서버장치(13)의 음성인식용 정보송신부(132)는, 음성인식용 정보를 송신하는 타이밍이라고, 판단했다, 라고 한다.
그리고, 음성인식용 정보송신부(132)는, 전언어대사전저장부(131)로부터, 도 12에 나타내는 음성인식용 정보(음성인식사전과 동의의임)를 읽어 낸다. 음성인식사전은, 각 용어마다, 각 언어마다에, "표기""음향모델" 등의 정보를 가진다.
다음에, 음성인식용 정보송신부(132)는, 읽어 낸 음성인식사전을, 1이상의 음성인식 서버장치(14)에 송신한다.
다음에, 1이상의 각 음성인식서버장치(14)의 음성인식용 정보수신부(142)는, 사전서버장치(13)로부터, 음성인식사전을 수신한다.
그리고, 음성인식용 정보축적부(143)는, 수신된 음성인식사전(음성인식용 정보)을 음성인식용 정보저장부(141)에 축적한다.
또한, 다음에, 사용자로부터의 지시에 의해, 사전서버장치(13)의 번역용 정보송신부(133)는, 번역용 정보를 송신하는 타이밍이라고 판단한다.
그리고, 번역용 정보송신부(133)는, 전언어대사전저장부(131)로부터, 도 13에 나타내는 번역용 정보(번역사전과 동의의임)를 읽어 낸다. 번역사전은, 각 용어마다, 각 언어마다에, "표기" 등의 정보를 가진다.
다음에, 번역용 정보송신부(133)는, 읽어 낸 번역사전을, 1이상의 번역서버장치(15)에 송신한다.
다음에, 1이상의 각 번역서버장치(15)의 번역용 정보수신부(152)는, 사전서버장치(13)로부터, 번역사전을 수신한다.
그리고, 번역용 정보축적부(153)는, 수신된 번역사전(번역용 정보)을 번역용 정보저장부(151)에 축적한다.
더욱이, 음성합성용 정보송신부(134)는, 음성합성용 정보를 송신하는 타이밍이라고 판단한다.
다음에, 음성합성용 정보송신부(134)는, 전언어대사전저장부(131)로부터, 도 14에 나타내는 음성합성용 정보(음성합성사전과 동의의임)를 읽어 낸다. 음성합성사전은, 각 용어마다, 각 언어마다에, "표기""읽기""악센트" 등의 정보를 가진다.
다음에, 음성합성용 정보송신부(134)는 읽어 낸 음성합성사전을, 1이상의 음성합성서버장치(16)에 송신한다.  
그리고, 음성합성용 정보수신부(162)는, 사전서버장치(13)로부터, 음성합성사전을 수신한다.
그리고, 음성합성용 정보축적부(163)는, 수신된 음성합성사전(음성합성용 정보)을 음성합성용 정보저장부(161)에 축적한다.
이상의 처리에 의해, 음성인식서버장치(14), 번역서버장치(15), 및 음성합성서버장치(16)에는, 정합성이 있는 사전이 저장되어 있으며, 보통, 문제 없이 음성번역을 할 수 있게 되었다. 단, 음성인식서버장치(14), 번역서버장치(15), 및 음성합성서버장치(16)의 각 사전은, 각각 독자적으로 확장될 수 있는 것도 있어, 그 결과, 사전간의 부정합이 생길 경우도 있을 수 있다.
다음에, 음성인식서버장치(14), 번역서버장치(15), 및 음성합성서버장치(16)에, 음성인식, 번역, 및 음성합성에 필요한 사전이 구축된 상황에 있어서, 제1단말장치(11)의 사용자A와, 제2단말장치(12)의 사용자B가, 음성번역시스템을 이용하고, 전화로 회화를 한다, 라고 한다. 또한, 사용자A의 언어는, 예를 들면, 일본어이다. 또한, 사용자B의 언어는, 예를 들면, 영어이다.
그리고, 제1단말장치(11)는, 도 15에 나타내는 음성번역제어정보를 유지하고 있다, 라고 한다. 또한, 제2단말장치(12)는, 도 16에 나타내는 음성번역제어정보를 유지하고 있다, 라고 한다. 음성번역제어정보는, 사용자가 발성하는 언어인 원언어의 정보 (여기서는<원언어>의 정보), 대화의 상대가 발성하는 언어인 목적언어의 정보 (여기서는<목적언어>의 정보), 음성인식서버장치(14)과 통신하기 위한 정보 (여기서는<음성인식서버>의 정보), 번역서버장치(15)과 통신하기 위한 정보 (여기서는<번역서버>의 정보), 음성합성서버장치(16)과 통신하기 위한 정보 (여기서는<음성합성서버>의 정보), 제2단말장치(12) 또는 제1단말장치(11)의 식별자 (여기서는<상대단말>의 정보), 및 제1단말장치(11) 또는 제2단말장치(12)의 식별자 (여기에서는<자단말(자기단말)>의 정보) 등을 가진다. 또한, <음성인식서버>, <번역서버>,<음성합성서버>의 각 정보는, 여기서는, 각 장치의 IP어드레스이지만, URL나 전화번호 등, 다른 정보일 수 있는 것은 말할 필요도 없다. 또한, <상대단말>,<자단말>의 각 정보는, 여기서는, 전화번호이지만, IP어드레스나 MAC어드레스 등 다른 정보일 수 있는 것은 말할 필요도 없다.
그리고, 회화 중에 있어서, 사용자A가 제1단말장치(11)에 대하여 "大阪(오오사카)"라고 발성했다, 라고 한다.
다음에, 제1단말장치(11)는, "大阪"의 음성정보를 구성한다. 그리고, 제1단말장치(11)는, 도 15에 나타내는 음성번역제어정보를 읽어 내고, "<음성인식서버>186.221.1.27"로 특정되는 음성인식서버장치(14)에, "大阪"의 음성정보와, 도 15에 나타내는 음성번역제어정보를 송신한다.
다음에, 음성인식서버장치(14)는, "大阪"의 음성정보와, 도 15에 나타내는 음성번역제어정보를 수신한다.
다음에, 음성인식서버장치(14)의 음성인식수단(1453)은, 도 15에 나타내는 음성번역제어정보의 "<원언어>일본어"를 취득한다. 그리고, 음성인식수단(1453)은, 일본어의 음향모델(도 12참조)을 이용하여, 수신된 "大阪"의 음성정보에 대하여, 음성인식처리를 하고, 음성인식결과(문자열"大阪"를 가짐)를 얻는다.
다음에, 음성인식판단수단(1451)은, 음성인식결과가 가지는 우도가 미리 결정된 역치이상일지 아닐지 (음성인식이 성공일지 아닐지)를 판단한다. 여기서, 음성인식이 성공이었다, 라고 한다.
다음에, 음성인식결과송신부(146)는, 취득된 음성인식결과를, 도 15에 나타내는 음성번역제어정보가 가지는 "<번역서버>225.68.21.129"로 나타내지는 번역서버장치(15)에 송신한다. 또한, 음성인식결과송신부(146)는, 도 15에 나타내는 음성번역제어정보도, "<번역서버>225.68.21.129"로 나타내지는 번역서버장치(15)에 송신한다.
다음에, 번역서버장치(15)의 음성인식결과수신부(154)는, 음성인식결과 ("大阪"를 가짐) 및 음성번역제어정보를 가진다.
다음에, 번역수단(1553)은, 음성번역제어정보가 가지는 "<원언어>일본어" 및 "<목적언어>영어"를 읽어 낸다.
그리고, 번역수단(1553)은, 음성인식결과("大阪"을 가짐)를 일본어라고 판단하고, 용어 "大阪"와 쌍가 되는 "<목적언어>영어"의 용어"Osaka"를, 도 13의 번역사전으로부터 읽어 낸다. 그리고, 번역수단(1553)은, 번역결과"Osaka"를 얻는다.
다음에, 번역판단수단(1551)은, "<목적언어>영어"에 대응하는 용어를 번역사전으로부터 검색할 수 있었으므로, 번역결과가 성공이라고 판단한다.
다음에, 번역결과송신부(156)는, 취득된 번역결과"Osaka"와 도 15에 나타내는 음성번역제어정보를 "<음성합성서버>56.72.128.202"로 나타내지는 음성합성서버장치(16)에 송신한다.
다음에, 음성합성서버장치(16)의 번역결과수신부(164)는, 번역결과"Osaka"과 도 15에 나타내는 음성번역제어정보를 수신한다.
그리고, 음성합성수단(1653)은, 음성번역제어정보로부터 "<목적언어>영어"를 읽어 낸다.
다음에, 음성합성수단(1653)은, 용어"Osaka" 및 "<목적언어>영어"에 대응하는 음성합성정보(읽기 및 악센트 등)를, 도 14의 음성합성사전으로부터 읽어 낸다.
다음에, 음성합성수단(1653)은, 읽어 낸 음성합성정보를 이용하여, 음성합성처리를 하고, 음성합성결과를 얻는다.
다음에, 음성합성판단수단(1651)은, 음성합성결과의 우도가 미리 결정된 역치이상이므로, 음성합성의 결과가 성공이라고 판단한다, 라고 한다.
다음에, 음성합성결과송신부(166)는, 취득된 음성합성결과를, "<상대단말>090-1445-1122"로 특정되는 제2단말장치(12)에 송신한다.
다음에, 제2단말장치(12)의 제2음성수신부(123)는, 사용자A로부터 발성된 일본어의 음성"大阪"를 음성번역해서 얻게 된 영어의 음성("Osaka"의 음성)을 수신한다.  
그리고, 제2음성출력부(124)는, 제2음성수신부(123)가 수신한 음성 ("Osaka"의 음성)을 출력한다.
이상의 처리에 의해, 음성번역이 실현한다. 또한, 사용자B가 발성한 음성이 사용자A에, 번역되어서 도달하기 위해서는, 도 16의 음성번역제어정보를 이용한다. 또한, 음성번역의 순서는, 상기와 같다.
또한, 음성인식, 번역, 음성합성의 각 처리단계에서, 각 처리가 실패했을 경우, 음성인식서버장치(14), 번역서버장치(15), 또는 음성합성서버장치(16)는, 리얼타임으로, 사전서버장치(13)에 문의하고, 필요한 정보를 송신해 준다. 그리고, 음성인식서버장치(14), 번역서버장치(15), 또는 음성합성서버장치(16)는, 각 처리에 필요한 정보를 사전서버장치(13)로부터 수신한 후, 음성인식, 번역, 또는 음성합성의 처리를 진행시키는 것은 전술한 바와 같다.
더욱이, 사전서버장치(13)의 표기취득부(135)는, 웹상의 크롤을 시작하는 타이밍이라고 판단했다, 라고 한다.
그리고, 표기 취득부(135)는, 웹상을 크롤하고, 예를 들면, 용어"名古屋(나고야)"의 표기 "名古屋"를 취득했다, 라고 한다. 그리고, 표기취득부(135)는, 취득한 용어의 표기"名古屋"를 키로서, 전언어대사전을 검색한다. 그리고, 표기취득부(135)는, 검색의 결과, 취득한 용어의 표기 "名古屋"가, 전언어대사전에 존재하지 않는다고 판단했다, 라고 한다.
다음에, 표기축적부(136)는, 전언어대사전에 존재하지 않는다고 판단된 용어의 표기 "名古屋"를, 전언어대사전에 축적한다. 그리고, 전언어대사전은, 예를 들면, 도 17와 같게 된다. 도 17에 있어서, 용어"名古屋"에 대해서, 표기뿐 존재하고, 읽기나 음향모델이 존재하지 않는 상황이다.
상기 상황에 있어서, 제3단말장치(17)의 입력접수부(171)는, 사용자로부터 전언어대사전의 출력지시를 접수했다, 라고 한다.
다음에, 입력정보송신부(174)는, 입력접수부(171)가 접수한 출력지시를, 사전서버장치(13)에 송신한다.
다음에, 사전서버장치(13)는, 출력지시를 수신한다. 그리고, 출력부(139)는, 출력지시에 대응하는 정보를 전언어대사전으로부터 검색하고, 검색에 의해 취득한 정보를, 지시를 송신해 온 장치(보통, 제3단말장치(17))에 송신한다.
다음에, 그리고, 출력지시의 송신에 대응하고, 제3단말장치(17)의 정보수신부(172)는, 사전서버장치(13)로부터, 전언어대사전의 일부를 수신한다.
다음에, 정보출력부(173)는, 정보수신부(172)가 수신한 전언어대사전의 일부를 출력한다. 상기 출력예는, 도 18이다. 도 18에 있어서, 2 이상의 모든 언어에 대해서, 미리 결정된 모든 정보가 존재할 경우(용어"大阪")와, 미리 결정된 모든 정보 중 일부의 정보가 존재하지 않을 경우(용어"名古屋")에 따라, 시각적으로 다른 태양에서 정보를 출력하고 있다. 도 18에 있어서, 빈 데이터 영역(셀)은, 해칭(hatching, 도면에서는 "- -" )이 되어 있다. 이것은, 부족한 정보의 입력을, 제3단말장치(17)의 사용자에 재촉하기 위해서다.
그리고, 사용자는, 예를 들면, 용어"名古屋"의 읽기 "나고야"나 일본어의 음향모델이나, 한국어의 표기나 읽기 등, 영어의 표기나 읽기 등을 입력한다. 다음에, 입력접수부(171)는, 사용자로부터의 입력을 접수한다.
다음에, 제3단말장치(17)의 입력정보송신부(174)는, 입력접수부(171)이 접수한 정보를, 사전서버장치(13)에 송신한다.
다음에, 사전서버장치(13)의 정보접수부(137)는, 제3단말장치(17)로부터, 용어정보 중 몇 개의 정보(용어"名古屋"의 읽이"나고야"나 일본어의 음향모델이나, 한국어의 표기나 읽기 등, 영어의 표기나 읽기 등)를 접수한다.
그리고, 정보축적부(138)는, 정보접수부(137)가 접수한 정보를, 대응하는 언어가 대응하는 용어의 표기에 대응시켜서 축적한다.
이상의 처리에 의해, 사전서버장치(13)의 전언어대사전은 충실해진다.
이상, 본 실시의 형태예 따르면, 음성번역에 있어서 사용하는 음성인식사전, 번역사전, 및 음성합성사전에 있어서, 어떤 사전에 존재하는 용어의 정보가 다른 사전에는 존재하지 않는다 등이라고 하는 사전의 사이의 부정합(불일치)을 회피할 수 있다. 그 결과, 음성번역이 정상으로 하게 된다.
또한, 본 실시의 형태에 따르면, 음성인식, 번역, 음성합성의 각 처리단계에서, 각 처리가 실패할 경우, 음성인식서버장치(14), 번역서버장치(15), 또는 음성합성서버장치(16)는, 이얼타임으로, 사전서버장치(13)에 문의하고, 필요한 정보를 송신해 줄 수 있다. 그 결과, 지극히 높은 확률에서, 음성번역이 하게 된다.
더욱이, 본 실시의 형태에 따르면, 웹상을 크롤하거나, 사용자로부터의 정보의 입력을 접수하거나 함으로써, 사전서버장치(13)의 전언어대사전을 충실시키는 것이 할 수 있게 된다. 이것으로, 신출의 용어 등을 포함한, 여러가지의 용어에 대하여, 음성번역이 가능해진다.
또한, 본 실시의 형태에 있어서, 주로, 음성인식부(145)는, 음성인식판단수단(1451), 음성인식정보송신지시수단(1452), 음성인식수단(1453)을 구비하는 것으로서 설명했다. 단, 음성인식부(145)는, 음성인식판단수단(1451), 및 음성인식정보송신지시수단(1452)을 구비하지 않을 수도 있다. 상기 경우, 음성인식부(145)는, 음성인식처리를 실패하지 않는다, 라고 하는 전제이다. 또한, 본 실시의 형태에 있어서, 주로, 번역부(155)는, 번역판단수단(1551), 번역정보송신지시수단(1552), 번역수단(1553)을 구비하는 것으로서 설명했다. 단, 번역부(155)는, 번역판단수단(1551), 및 번역정보송신지시수단(1552)을 구비하지 않을 수도 있다. 상기 경우, 번역부(155)는, 번역처리를 실패하지 않는다, 라고 하는 전제이다. 또한, 음성합성부(165)는, 음성합성판단수단(1651), 음성합성정보송신지시수단(1652), 음성합성수단(1653)을 구비하는 것으로서 설명했다. 단, 음성합성부(165)는, 음성합성판단수단(1651), 및 음성합성정보송신지시수단(1652)을 구비하지 않을 수도 있다. 상기 경우, 음성합성부(165)는, 음성합성처리를 실패하지 않는다, 라고 하는 전제이다. 상기 경우, 본 실시의 형태에 있어서의 음성번역시스템(1)은, 사전서버장치와, 1이상의 음성인식서버장치, 1이상의 번역서버장치, 1이상의 음성합성서버장치를 가지는 음성번역시스템이며, 상기 사전서버장치는, 2이상의 언어의 각 언어에 대해서, 1이상의 단어를 가지는 용어의 표기와, 용어를 음성인식하기 위한 정보인 음성인식정보와, 용어를 음성합성하기 위한 정보인 음성합성정보를 가지는 용어정보를, 상기 2이상의 언어의 모드에 대해서 대응시켜서 가지는 전언어용어정보를, 2이상 저장할 수 있는 전언어대사전저장부와, 상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 상기 용어의 음성인식정보를 포함하는 음성인식용 정보를, 상기 전언어대사전저장부에서 취득하고, 상기 1이상의 음성인식서버장치에 송신하는 음성인식용 정보송신부와, 상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 상기 용어의 표기를 포함하는 번역용 정보를, 상기 전언어대사전저장부에서 취득하고, 상기 1이상의 번역서버장치에 송신하는 번역용 정보송신부와, 상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 상기 용어의 음성합성정보를 포함하는 음성합성용 정보를, 상기 전언어대사전저장부에서 취득하고, 상기 1이상의 음성합성서버장치에 송신하는 음성합성용 정보송신부를 구비하고, 상기 음성인식서버장치는, 상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 음성인식용 정보를 저장할 수 있는 음성인식용 정보저장부와, 상기 사전서버장치로부터, 상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 관한 음성인식용 정보를 수신하는 음성인식용 정보수신부와, 상기 음성인식용 정보수신부가 수신한 음성인식용 정보를 상기 음성인식용 정보저장부에 축적하는 음성인식용 정보축적부와, 제1단말장치에 입력된 음성의 정보인 음성정보를 수신하는 음성정보수신부와, 상기 음성정보수신부가 수신한 음성정보를, 상기 음성인식용 정보저장부의 음성인식용 정보를 이용하여 음성인식하고, 음성인식결과를 취득하는 음성인식부와, 상기 음성인식결과를 송신하는 음성인식결과송신부를 구비하고, 상기 번역서버장치는, 상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 번역용 정보를 저장할 수 있는 번역용 정보저장부와, 상기 사전서버장치로부터, 상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 번역용 정보를 수신하는 번역용 정보수신부와, 상기 번역용 정보수신부가 수신한 번역용 정보를 상기 번역용 정보저장부에 축적하는 번역용 정보축적부와, 상기 음성인식결과를 수신하는 음성인식결과수신부와, 상기 음성인식결과수신부가 수신한 음성인식결과를, 상기 번역용 정보저장부의 번역용 정보를 이용하여, 목적언어로 번역하고, 번역결과를 취득하는 번역부와, 상기 번역결과를 송신하는 번역결과송신부를 구비하고, 상기 음성합성서버장치는, 상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 음성합성용 정보를 저장할 수 있는 음성합성용 정보저장부와, 상기 사전서버장치로부터, 상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 음성합성용 정보를 수신하는 음성합성용 정보수신부와, 상기 음성합성용 정보수신부가 수신한 음성합성용 정보를 상기 음성합성용 정보저장부에 축적하는 음성합성용 정보축적부와, 상기 번역결과를 수신하는 번역결과수신부와, 상기 번역결과수신부가 수신한 번역결과를, 상기 음성합성용 정보저장부의 음성합성용 정보를 이용하여 음성합성하고, 음성합성결과를 취득하는 음성합성부와, 상기 음성합성결과를 제2단말장치에 송신하는 음성합성결과송신부를 구비하는 음성번역시스템, 이다.
또한, 본 실시의 형태에 있어서의 처리는, 소프트웨어에서 실현할 수도 있다. 그리고, 이 소프트웨어를 소프트웨어다운로드 등으로 배포할 수도 있다. 또한, 이 소프트웨어를 CD-ROM 등의 기록매체에 기록해서 유포할 수도 있다. 또한, 이것은, 본 명세서에 있어서의 다른 실시의 형태에 있어서도 해당한다. 또한, 본 실시의 형태에 있어서의 사전서버장치를 실현하는 소프트웨어는, 이하와 같은 프로그램이다. 즉, 이 프로그램은, 기억매체에, 2이상의 언어의 각 언어에 대해서, 1이상의 단어를 가지는 용어의 표기와, 용어를 음성인식하기 위한 정보인 음성인식정보와, 용어를 음성합성하기 위한 정보인 음성합성정보를 가지는 용어정보를, 상기 2이상의 언어의 모두에 대해서 대응시켜서 가지는 전언어용어정보를, 2이상 저장하고 있고, 컴퓨터를, 상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 상기 용어의 음성인식정보를 포함하는 음성인식용 정보를, 상기 기억매체로부터 취득하고, 상기 1이상의 음성인식서버장치에 송신하는 음성인식용 정보송신부와, 상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 상기 용어의 표기를 포함하는 번역용 정보를, 상기 기억매체로부터 취득하고, 상기 1이상의 번역서버장치에 송신하는 번역용 정보송신부와, 상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 상기 용어의 음성합성정보를 포함하는 음성합성용 정보를, 상기 기억매체로부터 취득하고, 상기 1이상의 음성합성서버장치에 송신하는 음성합성용 정보송신부로서 기능시키기 위한 프로그램, 이다.
또한, 상기 프로그램에 있어서, 컴퓨터를, 인터넷상의 1이상의 웹서버장치의 웹페이지로부터, 상기 기억매체에 존재하지 않는 용어의 표기를 취득하는 표기취득부와, 상기 표기취득부가 취득한 용어의 표기를, 상기 기억매체에 축적하는 표기축적부로서 더욱이 기능시키기 위한 프로그램인 것이 바람직하다.
또한, 상기 프로그램에 있어서, 컴퓨터를, 1이상의 제3단말장치로부터, 용어정보 중 어느 하나의 정보를 접수하는 정보접수부와, 상기 정보접수부가 접수한 정보를, 대응하는 언어가 대응하는 용어의 표기에 대응시켜서, 상기 기억매체에 축적하는 정보축적부로서 더욱이 기능시키기 위한 프로그램인 것이 바람직하다.
또한, 상기 프로그램에 있어서, 컴퓨터를, 상기 전언어용어정보 또는 상기 전언어용어정보의 일부의 정보를 출력하는 출력부를 더욱이 기능시켜, 상기 출력부는, 상기 전언어용어정보 또는 상기 전언어용어정보의 일부의 정보를 출력할 경우에, 상기 2이상의 모든 언어에 대해서, 미리 결정된 모든 정보가 존재할 경우와, 미리 결정된 모든 정보 중 일부의 정보가 존재하지 않을 경우에 따라, 시각적으로 다른 태양에서, 상기 전언어용어정보 또는 상기 전언어용어정보의 일부의 정보를 출력하는 것으로서 기능시키기 위한 프로그램인 것이 바람직하다.
또한, 본 실시의 형태에 있어서의 음성인식서버장치를 실현하는 소프트웨어는, 이하와 같은 프로그램이다. 즉, 이 프로그램은, 기억매체에, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 음성인식용 정보를 저장하고 있어, 컴퓨터를, 사전서버장치로부터, 상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 관한 음성인식용 정보를 수신하는 음성인식용 정보수신부와, 상기 음성인식용 정보수신부가 수신한 음성인식용 정보를 상기 기억매체에 축적하는 음성인식용 정보축적부와, 제1단말장치에 입력된 음성의 정보인 음성정보를 수신하는 음성정보수신부와, 상기 음성정보수신부가 수신한 음성정보를, 상기 기억매체의 음성인식용 정보를 이용하여 음성인식하고, 음성인식결과를 취득하는 음성인식부와, 상기 음성인식결과를 송신하는 음성인식결과송신부로서 기능시키기 위한 프로그램이다.
또한, 상기 프로그램에 있어서, 상기 음성인식부는, 상기 음성정보수신부가 수신한 음성정보에 대한 음성인식처리가 성공일지 실패일지를 판단하는 음성인식판단수단과, 상기 음성인식판단수단이, 상기 음성인식처리가 실패라고 판단했을 경우에, 상기 사전서버장치에 대하여, 음성인식정보를 송신하는 지시를 하는 음성인식정보송신지시수단과, 상기 음성정보수신부가 수신한 음성정보를, 상기 기억매체의 음성인식용 정보를 이용하여 음성인식하고, 음성인식결과를 취득하고, 또한, 상기 지시의 송신에 대응하고, 상기 사전서버장치로부터 상기 음성인식용 정보수신부가 수신한 음성인식정보를 이용하여 음성인식하고, 음성인식결과를 취득하는 음성인식수단을 구비하고, 상기 음성인식용 정보수신부는, 상기 지시의 송신에 대응하고, 상기 사전서버장치로부터 상기 음성인식정보를 수신하는 것으로 기능시키기 위한 프로그램인 것이 바람직하다.
또한, 본 실시의 형태에 있어서의 번역서버장치를 실현하는 소프트웨어는, 이하와 같은 프로그램이다. 즉, 이 프로그램은, 기억매체에, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 번역용 정보를 저장하고 있고, 컴퓨터를, 사전서버장치로부터, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 번역용 정보를 수신하는 번역용 정보수신부와, 상기 번역용 정보수신부가 수신한 번역용 정보를 상기 기억매체에 축적하는 번역용 정보축적부와, 상기 음성인식결과를 수신하는 음성인식결과수신부와, 상기음성인식결과수신부가 수신한 음성인식결과를, 상기 기억매체의 번역용 정보를 이용하여, 목적언어로 번역하고, 번역결과를 취득하는 번역부와, 상기 번역결과를 송신하는 번역결과송신부로서 기능시키기 위한 프로그램이다.
또한, 상기 프로그램에 있어서, 상기 번역부는, 상기 음성인식결과수신부가 수신한 음성인식결과에 대한 번역처리가 성공일지 실패일지를 판단하는 번역판단수단과, 상기 번역판단수단이, 상기 번역처리가 실패라고 판단했을 경우에, 상기 사전서버장치에 대하여, 상기 목적언어의 용어의 표기를 송신하는 지시를 하는 번역정보송신지시수단과, 상기 음성인식결과수신부가 수신한 음성인식결과를, 상기 기억매체의 번역용 정보를 이용하여, 목적언어로 번역하고, 번역결과를 취득하고, 또한, 상기 지시의 송신에 대응하고, 상기 사전서버장치로부터 상기 번역용 정보수신부가 수신한 목적언어의 용어의 표기를 이용하여, 상기 음성인식결과를 목적언어로 번역하고, 번역결과를 취득하는 번역수단을 구비하고, 상기 번역용 정보수신부는, 상기 지시의 송신에 대응하고, 상기 사전서버장치로부터 상기 목적언어의 용어의 표기를 수신하는 것으로서 기능시키기 위한 프로그램인 것이 바람직하다.
본 실시의 형태에 있어서의 음성합성서버장치를 실현하는 소프트웨어는, 이하와 같은 프로그램이다. 즉, 이 프로그램은, 기억매체에, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 음성합성용 정보를 저장하고 있어, 컴퓨터를, 사전서버장치로부터, 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 음성합성용 정보를 수신하는 음성합성용 정보수신부와, 상기 음성합성용 정보수신부가 수신한 음성합성용 정보를 상기기억매체에 축적하는 음성합성용 정보축적부와, 상기 번역결과를 수신하는 번역결과수신부와, 상기 번역결과수신부가 수신한 번역결과를, 상기 기억매체의 음성합성용 정보를 이용하여 음성합성하고, 음성합성결과를 취득하는 음성합성부와, 상기 음성합성결과를 제2단말장치에 송신하는 음성합성결과송신부로서 기능시키기 위한 프로그램이다.
또한, 상기 프로그램에 있어서, 상기 음성합성부는, 상기 번역결과수신부가 수신한 번역결과에 대한 음성합성처리가 성공일지 실패일지를 판단하는 음성합성판단수단과, 상기 음성합성판단수단이, 상기 음성합성처리가 실패라고 판단했을 경우에, 상기 사전서버장치에 대하여, 음성합성정보를 송신하는 지시를 하는 음성합성정보송신지시수단과, 상기 번역결과수신부가 수신한 번역결과를, 상기 기억매체의 음성합성용 정보를 이용하여 음성합성하고, 음성합성결과를 취득하고, 또한, 상기 지시의 송신에 대응하고, 상기 사전서버장치로부터 상기 음성합성용 정보수신부가 수신한 음성합성정보를 이용하여 상기번역결과를 음성합성하고, 음성합성결과를 취득하는 음성합성수단을 구비하고, 상기 음성합성용 정보수신부는, 상기 지시의 송신에 대응하고, 상기 사전서버장치로부터 상기 음성합성정보를 수신하는 것으로서 기능시키기 위한 프로그램인 것이 바람직하다
또한, 도 19는 본 명세서에서 말한 프로그램을 실행하고, 상기한 실시의 형태의 음성번역시스템 등을 실현하는 컴퓨터의 외관을 나타낸다. 상기의 실시의 형태는, 컴퓨터하드웨어 및 그 위헤서 실행되는 컴퓨터프로그램에서 실현할 수 있다. 도 19는 이 컴퓨터시스템(340)의 개관도이며, 도 20은 컴퓨터시스템(340)의 블럭도이다.
도 19에 있어서, 컴퓨터시스템(340)은 FD드라이브, CD-ROM드라이브를 포함하는 컴퓨터(341)와, 키보드(342)와, 마우스(343)와, 모니터(344)를 포함한다.
도 20에 있어서, 컴퓨터(341)는, FD드라이브(3411), CD-ROM드라이브(3412)에 더해서, MPU(3413)와, CD-ROM드라이브(3412) 및 FD드라이브(3411)에 접속된 버스(3414)와, 브팅프로그램 등의 프로그램을 기억하기 위한 ROM(3415)에 접속되어, 애플리케이션프로그램의 명령을 일시적으로 기억하는 동시에 일시기억공간을 제공하기 위한 RAM(3416)과, 애플리케이션프로그램, 시스템프로그랜, 및 데이터를 기억하기 위한 하드디스크(3417)를 포함한다. 여기서는, 도시하지 않았지만, 컴퓨터(341)는, 더욱이, LAN에의 접속을 제공하는 네트워크카드를 포함할 수도 있다.
컴퓨터시스템(340)에, 상기한 실시의 형태의 음성인식 등의 기능을 실행시키는 프로그램은, CD-ROM(3501), 또는 FD(3502)에 기억되고, CD-ROM드라이브(3412) 또는 FD드라이브(3411)에 삽입되어, 또한 하드디스크(3417)에 전송될 수도 있다. 이 대신에, 프로그램은 도시하지 않는 네트워크를 통해서 컴퓨터(341)에 송신되어, 하드디스크(3417)에 기억될 수도 있다. 프로그램은 실행 때에 RAM(3416)에 로드된다. 프로그램은, CD-ROM(3501), FD(3502) 또는 네트워크로부터 직접, 로드될 수도 있다.
프로그램은, 컴퓨터(341)에, 상기한 실시의 형태의 음성인식 등의 기능을 실행시키는 오페레이팅시스템(OS), 또는 서드파티프로그램 등은, 반드시 포함하지 않을 수도 있다. 프로그램은, 제어된 태양에서 적절한 기능(모듈)을 호출하고, 바라는 결과를 얻을 수 있게 하는 명령의 부분뿐을 포함하고 있으면 된다. 컴퓨터시스템(340)이 어떻게 동작할지는 주지이며, 상세한 설명은 생략한다.
또한, 상기 프로그램에 있어서, 정보를 송신하는 송신스텝이나, 정보를 수신하는 수신스텝등에서는, 하드웨어에 의해 하게 되는 처리, 예를 들면, 송신스텝에 있어서의 모뎀이나 인터페이스카드 등으로 하게 되는 처리(하드웨어에서만 하게 되는 처리)는 포함되지 않는다. 
또한, 상기 프로그램을 실행하는 컴퓨터는, 단수일 수도 있고, 복수일 수도 있다. 즉, 집중처리를 할 수도 있고, 혹은 분산처리를 할 수도 있다.
또한, 상기 각 실시의 형태에 있어서, 1의 장치에 존재하는 2이상의 통신수단(음성정보수신부, 음성인식용 정보수신부 등)은, 물리적으로 1의 매체에서 실현될 수도 있는 것은 말할 필요도 없다.
또한, 상기 각 실시의 형태에 있어서, 각 처리(각 기능)는, 단일인 장치(시스템)에 의해 집중처리하게 됨으로써 실현될 수도 있고, 혹은, 복수의 장치에 의해 분산처리하게 됨으로써 실현될 수도 있다.
본 발명은, 이상의 실시의 형태에 한정되는 것이 없이, 여러가지 변경이 가능하며, 그것들도 본 발명의 범위 내에 포함되는 것은 말할 필요도 없다.
[산업상의 이용가능성]
이상과 같이, 본 발명에 따른 음성번역시스템은, 음성번역에 있어서 사용하는 사전의 사이의 부정합을 없앨 수 있다, 라고 하는 효과를 가지고, 음성번역시스템 등으로서 유용하다.

Claims (12)

  1. 사전서버장치와, 1이상의 음성인식서버장치, 1이상의 번역서버장치, 1이상의 음성합성서버장치를 가지는 음성번역시스템이며,
    상기 사전서버장치는,
    2이상의 언어의 각 언어에 대해서, 1이상의 단어를 가지는 용어의 표기와, 용어를 음성인식하기 위한 정보인 음성인식정보와, 용어를 음성합성하기 위한 정보인 음성합성정보를 가지는 용어정보를, 상기 2이상의 언어의 모드에 대해서 대응시켜서 가지는 전언어용어정보를, 2이상 저장할 수 있는 전언어대사전저장부와,
    상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 상기 용어의 음성인식정보를 포함하는 음성인식용 정보를, 상기 전언어대사전저장부에서 취득하고, 상기 1이상의 음성인식서버장치에 송신하는 음성인식용 정보송신부와,
    상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 상기 용어의 표기를 포함하는 번역용 정보를, 상기 전언어대사전저장부에서 취득하고, 상기 1이상의 번역서버장치에 송신하는 번역용 정보송신부와,
    상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 상기 용어의 음성합성정보를 포함하는 음성합성용 정보를, 상기 전언어대사전저장부에서 취득하고, 상기 1이상의 음성합성서버장치에 송신하는 음성합성용 정보송신부를 구비하고,
    상기 음성인식서버장치는,
    상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 음성인식용 정보를 저장할 수 있는 음성인식용 정보저장부와,
    상기 사전서버장치로부터, 상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 관한 음성인식용 정보를 수신하는 음성인식용 정보수신부와,
    상기 음성인식용 정보수신부가 수신한 음성인식용 정보를 상기 음성인식용 정보저장부에 축적하는 음성인식용 정보축적부와,
    제1단말장치에 입력된 음성의 정보인 음성정보를 수신하는 음성정보수신부와,
    상기 음성정보수신부가 수신한 음성정보를, 상기 음성인식용 정보저장부의 음성인식용 정보를 이용하여 음성인식하고, 음성인식결과를 취득하는 음성인식부와,
    상기 음성인식결과를 송신하는 음성인식결과송신부를 구비하고,
    상기 번역서버장치는,
    상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 번역용 정보를 저장할 수 있는 번역용 정보저장부와,
    상기사전서버장치로부터, 상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 번역용 정보를 수신하는 번역용 정보수신부와,
    상기 번역용 정보수신부가 수신한 번역용 정보를 상기 번역용 정보저장부에 축적하는 번역용 정보축적부와,
    상기 음성인식결과를 수신하는 음성인식결과수신부와,
    상기 음성인식결과수신부가 수신한 음성인식결과를, 상기 번역용 정보저장부의 번역용 정보를 이용하여, 목적언어로 번역하고, 번역결과를 취득하는 번역부와,
    상기 번역결과를 송신하는 번역결과송신부를 구비하고,
    상기 음성합성서버장치는,
    상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 음성합성용 정보를 저장할 수 있는 음성합성용 정보저장부와,
    상기 사전서버장치로부터, 상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 음성합성용 정보를 수신하는 음성합성용 정보수신부와,
    상기 음성합성용 정보수신부가 수신한 음성합성용 정보를 상기 음성합성용 정보저장부에 축적하는 음성합성용 정보축적부와,
    상기 번역결과를 수신하는 번역결과수신부와,
    상기 번역결과수신부가 수신한 번역결과를, 상기 음성합성용 정보저장부의 음성합성용 정보를 이용하여 음성합성하고, 음성합성결과를 취득하는 음성합성부와,
    상기 음성합성결과를 제2단말장치에 송신하는 음성합성결과송신부를 구비하는 음성번역시스템.
  2. 제1항에 있어서, 상기 음성인식서버장치의 상기 음성인식부는,
    상기 음성정보수신부가 수신한 음성정보에 대한 음성인식처리가 성공일지 실패일지를 판단하는 음성인식판단수단과,
    상기 음성인식판단수단이, 상기음성인식처리가 실패라고 판단했을 경우에, 상기 사전서버장치에 대하여, 음성인식정보를 송신하는 지시를 하는 음성인식정보송신지시수단과,
    상기 음성정보수신부가 수신한 음성정보를, 상기 음성인식용 정보저장부의 음성인식용 정보를 이용하여 음성인식하고, 음성인식결과를 취득하고, 또한, 상기 지시의 송신에 대응하고, 상기 사전서버장치로부터 상기 음성인식용 정보수신부가 수신한 음성인식정보를 이용하여 음성인식하고, 음성인식결과를 취득하는 음성인식수단을 구비하고,
    상기 음성인식용 정보수신부는,
    상기 지시의 송신에 대응하고, 상기 사전서버장치로부터 상기 음성인식정보를 수신하는 음성번역시스템.
  3. 제1항에 있어서, 상기 번역서버장치의 상기 번역부는,
    상기 음성인식결과수신부가 수신한 음성인식결과에 대한 번역처리가 성공일지 실패일지를 판단하는 번역판단수단과,
    상기 번역판단수단이, 상기 번역처리가 실패라고 판단했을 경우에, 상기 사전서버장치에 대하여, 상기 목적언어의 용어의 표기를 송신하는 지시를 하는 번역정보송신지시수단과,
    상기 음성인식결과수신부가 수신한 음성인식결과를, 상기 번역용 정보저장부의 번역용 정보를 이용하여, 목적언어로 번역하고, 번역결과를 취득하고, 또한, 상기 지시의 송신에 대응하고, 상기 사전서버장치로부터 상기 번역용 정보수신부가 수신한 목적언어의 용어의 표기를 이용하여,
    상기 음성인식결과를 목적언어로 번역하고, 번역결과를 취득하는 번역수단을 구비하고,
    상기 번역용 정보수신부는,
    상기 지시의 송신에 대응하고, 상기 사전서버장치로부터 상기 목적언어의 용어의 표기를 수신하는 음성번역시스템.
  4. 제1항에 있어서, 상기 음성합성서버장치의 상기 음성합성부는,
    상기 번역결과수신부가 수신한 번역결과에 대한 음성합성처리가 성공일지 실패일지를 판단하는 음성합성판단수단과,
    상기 음성합성판단수단이, 상기 음성합성처리가 실패라고 판단했을 경우에, 상기 사전서버장치에 대하여, 음성합성정보를 송신하는 지시를 하는 음성합성정보송신지시수단과,
    상기 번역결과수신부가 수신한 번역결과를, 상기 음성합성용 정보저장부의 음성합성용 정보를 이용하여 음성합성하고, 음성합성결과를 취득하고, 또한, 상기 지시의 송신에 대응하고, 상기 사전서버장치로부터 상기 음성합성용 정보수신부가 수신한 음성합성정보를 이용하여 상기 번역결과를 음성합성하고, 음성합성결과를 취득하는 음성합성수단을 구비하고,
    상기 음성합성용 정보수신부는,
    상기 지시의 송신에 대응하고, 상기 사전서버장치로부터 상기 음성합성정보를 수신하는 음성번역시스템.
  5. 제1항 내지 제4항 어느 한 항에 있어서, 상기 사전서버장치는,
    인터넷상의 1이상의 웹서버장치의 웹페이지로부터, 상기 전언어대사전저장부에 존재하지 않는 용어의 표기를 취득하는 표기취득부와,
    상기 표기취득부가 취득한 용어의 표기를, 상기 전언어대사전저장부에 축적하는 표기축적부를 더욱 구비하는 음성번역시스템.
  6. 제5항에 있어서, 상기 사전서버장치는,
    1이상의 제3단말장치로부터, 용어정보 중 어느 하나의 정보를 접수하는 정보접수부와, 상기 정보접수부가 접수한 정보를, 대응하는 언어가 대응하는 용어의 표기에 대응시켜서, 상기 전언어대사전저장부에 축적하는 정보축적부를 더욱 구비하는 음성번역시스템.
  7. 제5항 또는 제6항에 있어서, 상기 사전서버장치는,
    상기 전언어용어정보 또는 상기 전언어용어정보의 일부의 정보를 출력하는 출력부를 더욱 구비하고,
    상기 출력부는,
    상기 전언어용어정보 또는 상기 전언어용어정보의 일부의 정보를 출력할 경우에, 상기 2이상의 모든 언어에 대해서, 미리 결정된 모든 정보가 존재할 경우와, 미리 결정된 모든 정보 중 일부의 정보가 존재하지 않을 경우에 따라, 시각적으로 다른 태양에서, 상기 전언어용어정보 또는 상기 전언어용어정보의 일부의 정보를 출력하는 음성번역시스템.
  8. 제1항에 기재된 음성번역시스템을 구성하는 사전서버장치.
  9. 제1항에 기재된 음성번역시스템을 구성하는 음성인식서버장치.
  10. 제1항에 기재된 음성번역시스템을 구성하는 번역서버장치.
  11. 제1항에 기재된 음성번역시스템을 구성하는 음성합성서버장치.
  12. 기억매체에,
    2이상의 언어의 각 언어에 대해서, 1이상의 단어를 가지는 용어의 표기와, 용어를 음성인식하기 위한 정보인 음성인식정보와, 용어를 음성합성하기 위한 정보인 음성합성정보를 가지는 용어정보를, 상기 2이상의 언어의 모두에 대해서 대응시켜서 가지는 전언어용어정보를, 2이상 저장하고 있고,
    컴퓨터를,
    상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 상기 용어의 음성인식정보를 포함하는 음성인식용 정보를, 상기 기억매체로부터 취득하고, 1이상의 음성인식서버장치에 송신하는 음성인식용 정보송신부와,
    상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 상기 용어의 표기를 포함하는 번역용 정보를, 상기 기억매체로부터 취득하고, 1이상의 번역서버장치에 송신하는 번역용 정보송신부와, 상기 2이상의 언어 중 모든 언어 또는 2이상의 일부의 언어에 대해서, 상기 용어의 음성합성정보를 포함하는 음성합성용 정보를, 상기 기억매체로부터 취득하고, 1이상의 음성합성서버장치에 송신하는 음성합성용 정보송신부로서 기능시키기 위한 프로그램.
KR1020127001119A 2009-07-16 2010-03-03 음성번역시스템, 사전서버장치, 및 프로그램 KR101626887B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2009-167501 2009-07-16
JP2009167501A JP5471106B2 (ja) 2009-07-16 2009-07-16 音声翻訳システム、辞書サーバ装置、およびプログラム

Publications (2)

Publication Number Publication Date
KR20120040190A true KR20120040190A (ko) 2012-04-26
KR101626887B1 KR101626887B1 (ko) 2016-06-13

Family

ID=43449205

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127001119A KR101626887B1 (ko) 2009-07-16 2010-03-03 음성번역시스템, 사전서버장치, 및 프로그램

Country Status (6)

Country Link
US (1) US9442920B2 (ko)
EP (1) EP2455936B1 (ko)
JP (1) JP5471106B2 (ko)
KR (1) KR101626887B1 (ko)
CN (1) CN102473413B (ko)
WO (1) WO2011007595A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10216729B2 (en) 2013-08-28 2019-02-26 Electronics And Telecommunications Research Institute Terminal device and hands-free device for hands-free automatic interpretation service, and hands-free automatic interpretation service method

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102706343A (zh) * 2012-06-01 2012-10-03 陈耀伦 一种基于互联网语音导航的方法、装置和系统
CN103533129B (zh) * 2013-10-23 2017-06-23 上海斐讯数据通信技术有限公司 实时的语音翻译通信方法、系统及所适用的通讯设备
KR101740332B1 (ko) * 2013-11-05 2017-06-08 한국전자통신연구원 자동 번역 장치 및 방법
JP2016133861A (ja) * 2015-01-16 2016-07-25 株式会社ぐるなび 情報多言語変換システム
JP2016177782A (ja) * 2015-03-19 2016-10-06 パナソニックIpマネジメント株式会社 ウェアラブル装置及び翻訳システム
JP7000671B2 (ja) * 2016-10-05 2022-01-19 株式会社リコー 情報処理システム、情報処理装置、及び情報処理方法
KR102384641B1 (ko) * 2017-02-20 2022-04-08 엘지전자 주식회사 다국어 처리를 수행하는 인공 지능 시스템의 제어 방법
CN106998359A (zh) * 2017-03-24 2017-08-01 百度在线网络技术(北京)有限公司 基于人工智能的语音识别服务的网络接入方法以及装置
US10826857B2 (en) * 2017-10-20 2020-11-03 Sap Se Message processing for cloud computing applications
EP3716267B1 (en) * 2018-03-07 2023-04-12 Google LLC Facilitating end-to-end communications with automated assistants in multiple languages
US11403462B2 (en) * 2019-09-12 2022-08-02 Oracle International Corporation Streamlining dialog processing using integrated shared resources
CN111274828B (zh) * 2020-01-21 2021-02-02 陈刚 基于留言的语言翻译方法、系统、计算机程序和手持终端

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259632A (ja) * 1999-03-09 2000-09-22 Toshiba Corp 自動通訳システム、通訳プログラム伝送システム、記録媒体および情報伝送媒体
US6345245B1 (en) * 1997-03-06 2002-02-05 Kabushiki Kaisha Toshiba Method and system for managing a common dictionary and updating dictionary data selectively according to a type of local processing system
JP2005202884A (ja) * 2004-01-19 2005-07-28 Toshiba Corp 送信装置、受信装置、中継装置、および送受信システム
JP2008243080A (ja) 2007-03-28 2008-10-09 Toshiba Corp 音声を翻訳する装置、方法およびプログラム
JP2009140503A (ja) 2007-12-10 2009-06-25 Toshiba Corp 音声翻訳方法及び装置

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6488875A (en) * 1987-09-30 1989-04-03 Toshiba Corp Voice translation device
JP2667408B2 (ja) * 1987-10-08 1997-10-27 株式会社東芝 翻訳通信システム
GB2302199B (en) * 1996-09-24 1997-05-14 Allvoice Computing Plc Data processing method and apparatus
JPH11328179A (ja) * 1998-05-08 1999-11-30 Toshiba Corp 辞書管理方法及び辞書管理システム
WO1999063456A1 (fr) * 1998-06-04 1999-12-09 Matsushita Electric Industrial Co., Ltd. Dispositif de preparation de regles de conversion du langage, dispositif de conversion du langage et support d'enregistrement de programme
US6138099A (en) * 1998-10-19 2000-10-24 International Business Machines Corp. Automatically updating language models
US6219638B1 (en) * 1998-11-03 2001-04-17 International Business Machines Corporation Telephone messaging and editing system
JP2000148176A (ja) 1998-11-18 2000-05-26 Sony Corp 情報処理装置および方法、提供媒体、音声認識システム、音声合成システム、翻訳装置および方法、並びに翻訳システム
JP2000194698A (ja) 1998-12-25 2000-07-14 Sony Corp 情報処理装置および方法、並びに提供媒体
JP2001005488A (ja) * 1999-06-18 2001-01-12 Mitsubishi Electric Corp 音声対話システム
AU2001259446A1 (en) * 2000-05-02 2001-11-12 Dragon Systems, Inc. Error correction in speech recognition
JP2002123282A (ja) * 2000-10-17 2002-04-26 Brother Ind Ltd 翻訳装置および記録媒体
JP3581648B2 (ja) * 2000-11-27 2004-10-27 キヤノン株式会社 音声認識システム、情報処理装置及びそれらの制御方法、プログラム
JP2002245038A (ja) * 2001-02-21 2002-08-30 Ricoh Co Ltd 携帯端末装置による多国語翻訳システム
US7493259B2 (en) * 2002-01-04 2009-02-17 Siebel Systems, Inc. Method for accessing data via voice
WO2003065252A1 (en) * 2002-02-01 2003-08-07 John Fairweather System and method for managing memory
US7013262B2 (en) * 2002-02-12 2006-03-14 Sunflare Co., Ltd System and method for accurate grammar analysis using a learners' model and part-of-speech tagged (POST) parser
JP2003295893A (ja) * 2002-04-01 2003-10-15 Omron Corp 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
SE0202058D0 (sv) * 2002-07-02 2002-07-02 Ericsson Telefon Ab L M Voice browsing architecture based on adaptive keyword spotting
GB2395029A (en) * 2002-11-06 2004-05-12 Alan Wilkinson Translation of electronically transmitted messages
DE10304229A1 (de) * 2003-01-28 2004-08-05 Deutsche Telekom Ag Kommunikationssystem, Kommunikationsendeinrichtung und Vorrichtung zum Erkennen fehlerbehafteter Text-Nachrichten
JP2005055607A (ja) * 2003-08-01 2005-03-03 Toyota Motor Corp サーバ、情報処理端末、音声合成システム
JP3895766B2 (ja) * 2004-07-21 2007-03-22 松下電器産業株式会社 音声合成装置
JP2006099296A (ja) * 2004-09-29 2006-04-13 Nec Corp 翻訳システム、翻訳通信システム、機械翻訳方法、および、プログラム
US7620549B2 (en) * 2005-08-10 2009-11-17 Voicebox Technologies, Inc. System and method of supporting adaptive misrecognition in conversational speech
US7949529B2 (en) * 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
JP4047885B2 (ja) * 2005-10-27 2008-02-13 株式会社東芝 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
CN101432801B (zh) * 2006-02-23 2012-04-18 日本电气株式会社 语音识别词典制作支持系统、语音识别词典制作支持方法
US7756708B2 (en) * 2006-04-03 2010-07-13 Google Inc. Automatic language model update
KR100859532B1 (ko) * 2006-11-06 2008-09-24 한국전자통신연구원 대응 문형 패턴 기반 자동통역 방법 및 장치
US8355915B2 (en) * 2006-11-30 2013-01-15 Rao Ashwin P Multimodal speech recognition system
JP5121252B2 (ja) * 2007-02-26 2013-01-16 株式会社東芝 原言語による音声を目的言語に翻訳する装置、方法およびプログラム
WO2008114708A1 (ja) * 2007-03-14 2008-09-25 Nec Corporation 音声認識システム、音声認識方法、および音声認識処理プログラム
US7634383B2 (en) * 2007-07-31 2009-12-15 Northrop Grumman Corporation Prognosis adaptation method
JP5098613B2 (ja) * 2007-12-10 2012-12-12 富士通株式会社 音声認識装置及びコンピュータプログラム
JP3142002U (ja) 2008-03-17 2008-05-29 隆司 内山 翻訳通話システム
US8326637B2 (en) * 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
US9171541B2 (en) * 2009-11-10 2015-10-27 Voicebox Technologies Corporation System and method for hybrid processing in a natural language voice services environment

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6345245B1 (en) * 1997-03-06 2002-02-05 Kabushiki Kaisha Toshiba Method and system for managing a common dictionary and updating dictionary data selectively according to a type of local processing system
JP2000259632A (ja) * 1999-03-09 2000-09-22 Toshiba Corp 自動通訳システム、通訳プログラム伝送システム、記録媒体および情報伝送媒体
JP2005202884A (ja) * 2004-01-19 2005-07-28 Toshiba Corp 送信装置、受信装置、中継装置、および送受信システム
JP2008243080A (ja) 2007-03-28 2008-10-09 Toshiba Corp 音声を翻訳する装置、方法およびプログラム
JP2009140503A (ja) 2007-12-10 2009-06-25 Toshiba Corp 音声翻訳方法及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10216729B2 (en) 2013-08-28 2019-02-26 Electronics And Telecommunications Research Institute Terminal device and hands-free device for hands-free automatic interpretation service, and hands-free automatic interpretation service method

Also Published As

Publication number Publication date
WO2011007595A1 (ja) 2011-01-20
CN102473413B (zh) 2013-08-28
JP5471106B2 (ja) 2014-04-16
EP2455936A4 (en) 2018-01-10
EP2455936A1 (en) 2012-05-23
US20120166176A1 (en) 2012-06-28
CN102473413A (zh) 2012-05-23
JP2011022813A (ja) 2011-02-03
EP2455936B1 (en) 2019-01-16
KR101626887B1 (ko) 2016-06-13
US9442920B2 (en) 2016-09-13

Similar Documents

Publication Publication Date Title
KR20120040190A (ko) 음성번역시스템, 사전서버장치, 및 프로그램
KR101683943B1 (ko) 음성번역 시스템, 제1 단말장치, 음성인식 서버장치, 번역 서버장치, 및 음성합성 서버장치
KR101683944B1 (ko) 음성번역 시스템, 제어장치, 및 제어방법
WO2018021237A1 (ja) 音声対話装置、音声対話方法、および記録媒体
JP6767046B2 (ja) 音声対話システム、音声対話装置、ユーザー端末、および音声対話方法
US20220044668A1 (en) Translating between spoken languages with emotion in audio and video media streams
JP5967569B2 (ja) 音声処理システム
KR20030076661A (ko) 음성 인식을 위한 방법, 모듈, 디바이스 및 서버
JP2000137596A (ja) 対話型音声応答システム
JP2008083855A (ja) 機械翻訳を行う装置、システム、方法およびプログラム
KR102140391B1 (ko) 검색 방법 및 이 방법을 적용하는 전자 장치
JP2011504624A (ja) 自動同時通訳システム
JPH11184670A (ja) ネットワークアクセスシステム、方法及び記録媒体
JP2018159729A (ja) 対話システム構築支援装置、方法、及びプログラム
JP7055327B2 (ja) 会話収集装置、会話収集システム及び会話収集方法
CN111524508A (zh) 语音对话系统以及语音对话实现方法
JP2000259632A (ja) 自動通訳システム、通訳プログラム伝送システム、記録媒体および情報伝送媒体
CN110516238B (zh) 语音翻译方法、装置、终端及计算机存储介质
KR20180103273A (ko) 음성 합성 장치 및 음성 합성 방법
JP3136038B2 (ja) 通訳装置
JP2022064779A (ja) 学習装置、予測装置、学習方法および学習プログラム
CN116524916A (zh) 一种语音处理方法、装置及车辆
CN113906502A (zh) 语音处理装置、语音对的语料库的生成方法、以及记录程序的记录介质
Fischer et al. Towards multi-modal interfaces for embedded devices
JPH09258776A (ja) 音声認識方法および音声認識装置、並びに翻訳方法および翻訳装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant