JP2002125047A - 通訳サービス方法および通訳サービス装置 - Google Patents

通訳サービス方法および通訳サービス装置

Info

Publication number
JP2002125047A
JP2002125047A JP2000321920A JP2000321920A JP2002125047A JP 2002125047 A JP2002125047 A JP 2002125047A JP 2000321920 A JP2000321920 A JP 2000321920A JP 2000321920 A JP2000321920 A JP 2000321920A JP 2002125047 A JP2002125047 A JP 2002125047A
Authority
JP
Japan
Prior art keywords
user
sentence
collection
service method
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000321920A
Other languages
English (en)
Other versions
JP2002125047A5 (ja
JP4089148B2 (ja
Inventor
Yasunari Obuchi
康成 大淵
Atsuko Koizumi
敦子 小泉
Yoshinori Kitahara
義典 北原
Seki Mizutani
世希 水谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2000321920A priority Critical patent/JP4089148B2/ja
Priority to KR10-2001-0010092A priority patent/KR100378100B1/ko
Priority to US09/811,560 priority patent/US6789093B2/en
Publication of JP2002125047A publication Critical patent/JP2002125047A/ja
Priority to US10/898,935 priority patent/US7467085B2/en
Publication of JP2002125047A5 publication Critical patent/JP2002125047A5/ja
Application granted granted Critical
Publication of JP4089148B2 publication Critical patent/JP4089148B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/20Aspects of automatic or semi-automatic exchanges related to features of supplementary services
    • H04M2203/2061Language aspects
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99948Application of database or data structure, e.g. distributed, multimedia, or image

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 任意文を受け付ける音声通訳サービスでは、
音声認識システムや機械翻訳システムの性能が限られて
いるため、誤認識や誤訳が生じる可能性がある。定型文
を対象とした音声通訳サービスでは、誤認識や誤訳の問
題はほとんど無いが、その代わりに、ユーザが言いたい
文がサーバに登録されておらず、その文を通訳すること
ができないという現象が発生する。 【解決手段】 音声通訳サービス使用時より前に、ユー
ザが自分の使いたい文例を登録できるシステムを提供す
ることにより、上記の課題を解決する。文例の登録は、
オフィスからだけでなく、旅行先などからも可能になる
ように、WWWの他に、電子メールや電話音声通話など
を使っても文例登録ができるようにする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電話を通じてユー
ザが音声を入力し、その内容を外国語に変換して出力す
ることを目的とする、通訳サービス方法及び装置に関す
る。
【0002】
【従来の技術】例えば、特開平9−65424には、音
声認識サーバと無線携帯端末を用いた音声翻訳システム
が開示されている。この音声翻訳システムは、 電話を
通じた音声による入力を認識し、外国語に変換し、出力
するもので、発話内容を制限しない任意文音声認識技術
を用いている。
【0003】
【発明が解決しようとする課題】旅行等で音声通訳サー
ビスを使用したい場合に、対話相手と向き合った状況で
は、入力に対する即座な反応が欲しい。しかし、任意文
音声認識を使った通訳システムでは、発話内容に制限が
ないために、認識誤りが非常に多く生じ、即座に反応が
得られにくいという問題があった。また、入力された言
語を外国語に変換する際にも、翻訳誤りが頻繁に発生す
るという問題があった。一方、通訳以外の目的の音声入
力システムでは、必要な発声内容があらかじめわかって
おり、その内容だけに制限された定型文音声認識技術も
ある。このように、あらかじめ発話内容を制限する定型
文音声認識を通訳サービスに使えばこの問題は解決する
が、その代わりに、ユーザが通訳したい文が登録されて
いない場合、その文を入力できないという問題が生じ
る。
【0004】
【課題を解決するための手段】そこで、本発明では、上
記の定型文音声認識を使用し、さらに、通訳サービスを
使う前に、電話やインターネットなどの多様な手段でサ
ーバにアクセスし、ユーザが自ら文例集を編集すること
を可能にする手段を提供する。これによって、ユーザは
自分の所望の文に対する通訳サービスを利用することが
できると同時に、精度の高い定型文音声認識による正確
で素早いレスポンスを得ることができる。特に、旅行な
どで使いたい文の多くは、事前にだいたいの予想がつく
ことが多いため、本発明を用いることにより、旅行開始
前や旅行中のホテル滞在時などに所望の文例を予め登録
しておき、実際の対話では即座に訳文を出力させること
ができる。また、対話の現場で新たに通訳したい文例を
思い付いた場合でも、相手に話し掛ける前であれば、携
帯電話等を使って文例登録を済ませてから話し掛けるこ
とにより、同様の効果を得ることができる。これらの使
用方法を通じて、訳文および出力音声の品質が保証され
ていることから、システムの誤認識・誤訳等により意図
せざる内容が伝わってしまうことを防ぐこともできる。
【0005】
【発明の実施の形態】以下、図を用いて本発明の実施例
を説明する。なお、本実施例では、日本語入力を英語出
力に通訳する場合の例を示しているが、入力言語および
出力言語を他の言語に変えた場合でも、本発明を同じよ
うに実施することが可能である。
【0006】図1は、本発明を用いた電話による通訳サ
ービス方法および通訳サービス装置の一実施例における
処理の概要を表わしている。左側に表した通訳サービス
使用時には、ユーザは自分の電話器(102)から通訳
サービスサーバ(108)に電話をかける。通訳サービ
スサーバは、個人認証サーバ(112)を用いてユーザ
を特定し、そのユーザに対応する文例集を、個人向け文
例集(118)のデータベースから抽出する。その後、
ユーザの声による入力を音声認識サーバ(110)で認
識し、その内容に応じた外国語に変換、出力する。ま
た、ユーザは自分専用の文例集を使わないように指定す
ることもできる。このようなユーザの指定を受けた場
合、もしくは個人認証サーバが非登録ユーザーであると
の認証結果を返した場合には、個人向け文例集の代わり
に、一般向け文例集(116)を用いる。
【0007】図1の右側には、文例登録時に用いられる
システムの構成を表している。文例登録時には、電話器
(104)の他に、パーソナルコンピューターなどの一
般的な端末装置(106)を用いることもできる。ユー
ザは、これらの装置から、音声、電子メール、WWWな
どの手段を用いて個人情報管理サーバ(114)にアク
セスする。
【0008】個人情報管理サーバは、個人認証サーバ
(112)を使ってユーザを同定し、そのユーザに対応
する文例集を、個人向け文例集(118)のデータベー
スから抽出する。こうして抽出された個人向け文例集に
対し、個人情報管理サーバは、文例の追加、変更、削除
などの処理を行なう。文例の追加を行なう際には、自由
入力による追加の他に、あらかじめ用意された追加登録
用文例集(120)の中から文例を選んで追加すること
もできる。こうして追加された文例に対しては、外国語
の翻訳を付与することが必要であるが、追加登録用文例
集にあらかじめ対応する外国語が用意されている場合に
は、これをそのまま用いる。そうでない場合には、当該
文例を機械翻訳サーバ(122)に転送し、外国語への
翻訳を行なう。また、機械翻訳サーバでの翻訳が困難な
場合には、さらにオペレータ(124)に転送し、人間
による翻訳を行なう。これらの作業にあたって、ユーザ
が電話器を使って文例登録を行なう際には、音声認識サ
ーバ(110)を使って音声で操作することも可能であ
る。
【0009】図2は、本特許を使用した通訳サービスを
受ける場合の一連の流れの一例を表している。まずユー
ザが通訳サービスの番号に電話をかける。サーバは、発
信者番号通知機能を利用して、ユーザが誰であるかを検
出する。あるいは、PB(プッシュボタン)音を使ってユ
ーザのIDとパスワードを送るなど、他の手段で個人認証
を行ってもよい。ユーザが特定されると、サーバは「通
訳サービスです。日本語をどうぞ」というような応答を
返した後、ユーザの個人向け文例集から基本文例をロー
ドし、これらの文例に対する音声認識を開始する。
【0010】ここで例えばユーザが「私の名前は鈴木一
郎です」というように発声すると、サーバはこれを音声
認識し、その結果を復唱する。ユーザはその復唱音声を
聞き、これが正しい場合には、例えばボタン1を押して
訳文の再生を指示する。サーバは、PB音を認識してユー
ザの指示を検知し、先程認識した文例の英語訳を再生す
る。ユーザが何度も再生音を聞きたいときには、繰り返
しボタン1を押して再生を指示すればよい。ユーザがこ
のやりとりに満足し、次の文例を入力したい場合には、
例えばボタン2を押して次の文の音声認識開始を指示す
る。サーバはこのPB音を認識して音声認識を開始する。
【0011】ここで、ユーザが基本文例ではなく病院の
文例を入力したい場合には、「病院の会話」というよう
に、場面の変更を指示するコマンド語を発声する。な
お、コマンドについては、発声ではなくPB音を用いるよ
うなシステム構成も可能である。サーバはこのコマンド
発声をサーバが音声認識し、その結果に基づき、「病院
で使う文をどうぞ」と応答すると同時に、ユーザの個人
向け文例集から病院の会話をロードし、これらの文例に
対する音声認識を開始する。この後は、基本文例の場合
と同じように、「私は高血圧症です」というような音声
入力を認識し、復唱し、ボタン入力に応じて英語音声を
出力する。更に同じような動作が続き、場面を変更する
コマンドが入力された場合にはそれに応じた文例をロー
ドし、以下、サービス終了のコマンドが入力されるか、
もしくは電話が切られるまでこの動作が続く。
【0012】図3は、個人向け文例集の内容の一例を表
している。個人向け文例集には、ユーザを同定するため
の個人情報として、ID、名前、電話番号、パスワードな
どが付帯している。これらの個人情報は、より高度な使
用のために、別のサーバで管理してもよい。その後にユ
ーザが登録した文例が列挙されている。上記図2の説明
にもある通り、音声通訳サービス使用時の便宜のため、
文例集は使用場面ごとに分類されていることが望まし
い。この例では、基本文例の他に、病院の会話、買物の
会話といった場面が使われている。これらの場面別に、
「こんにちは」といった誰でも使うような文の他に、
「私の名前は鈴木一郎です」というような、個人に特化
した文例を登録しておくことができる。場面はあらかじ
めシステムによって設定されているのが普通だが、ユー
ザが個人的に新たな場面を追加したり、不必要な場面を
削除したりすることもできる。
【0013】図4は、個人認証サーバの構成の一例を表
している。個人認証の元となるデータとしては、電話番
号(416)、ID、名前、パスワード(418)、音声
特徴(420)などが考えられる。これらは、現在の電
話器でも比較的容易に使用できる個人特徴であるが、将
来の電話器に高度な情報処理機構が付加された際には、
指紋や虹彩などの生体認証用データなどを利用すること
も考えられる。電話番号を利用する場合には、電話器
(402)から送られる発信者番号情報を発信者番号検
知部(406)で検知し、データベースと照合してユー
ザを特定する。IDや名前、パスワードを用いる場合に
は、電話器のボタン操作で発生するPB音認識部(40
8)でPB音を認識して、該当するデータと照合する。ま
た、声で名前やパスワードを入力し、音声認識部(41
0)で認識した結果をデータと照合してもよい。声紋な
どの音声特徴(420)を用いる場合には、話者認識部
(412)で認識を行なう。
【0014】図5は、文例登録の一例として、電子メー
ルを使う場合の内容例を表したものである。電子メール
を使って文例登録する場合には、宛先アドレスの他に、
フォーマットに関するルールを予め決めておき、そのル
ールに従ったメールを指定されたアドレスに送ることに
よって登録が行なわれる。このとき、他人による改竄を
防ぐために、パスワードの記入を必要とすることも可能
である。
【0015】追加の例(502)では、"APPEND"という
サブジェクトで追加であることを示し、本文にその内容
と該当するシーンを記入している。シーンの記入が無い
場合には、基本文例に入れるなどの処置を取ればよい。
パスワードの記入が必要かどうかは、サーバの設定によ
る。削除の例(504)では、削除すべき文の内容と該
当するシーンを記入している。シーンの記入が無い場合
には、一致する文例をすべて削除すればよい。変更の例
(506)では、文の内容の後に、どのシーンからどの
シーンへ変更するのかを記入している。また、場面の切
り替えやサービス終了を指示するためのコマンド文の変
更をしたい場合には、場面選択の選択肢の中に「コマン
ド」という分類を用意しておき、この中に記述されたコ
マンド文を変更・削除・追加等するようにしておけばよ
い。
【0016】図6は、文例登録の一例として、WWWを
使う場合の表示例を表したものである。ユーザが自分の
アカウントにログインすると、図のような画面が表示さ
れる。個人情報表示部(602)には、ID、名前等が表
示される。場面選択・表示部(604)には、編集対象
となっている場面の名前が表示され、例えばこれがプル
ダウンメニュー等になっていて場面の選択も行えるよう
になっている。その横には、新規場面登録ボタン(60
6)、場面削除ボタン(608)等があって、場面の登
録や削除が行えるようになっている。その下の文例表示
部(610)には、選択した場面に含まれる文例が表示
されている。文例の変更や削除を行ないたい場合には、
マウス等を使って文例を選択した後に、文例変更ボタン
(612)や文例削除ボタン(614)を押すことで変
更や削除を実行する。また、場面変更ボタン(616)
を使って、場面の変更を行なうこともできる。更に、新
規の文例を追加登録したい場合には、新規文例入力部
(618)に文例を入力し、新規登録ボタン(620)
を押すことで登録を実行する。
【0017】図7は、文例登録の一例として、WWWを
使う場合の図7とは異なるもう一つの方式の表示例を表
したものである。ユーザは、自ら文例を入力する代わり
に、キーワード入力部(704)にキーワードを入力す
る。検索ボタン(704)を押すと、あらかじめサーバ
に蓄積されている文例データベースから、入力されたキ
ーワードに関連付けられているものが文例表示部(70
8)に表示される。ここで、サーバに蓄積されている文
例データベースとは、音声通訳サービス用に用意されて
いる文例集とは異なるもので、音声通訳サービス用の文
例集よりも遥かに大規模なものである。音声通訳サービ
スで用いる場合には、音声認識率を高く保つ必要がある
ため、あまり多くの文例を対象としてしまうことはでき
ないが、ここでは文字列を使った検索に用いるだけであ
るので、数千から数万、数十万という単位のデータベー
スを用意しておくことが望ましい。また、このデータベ
ースには、日本語文とそれに対応する英語文(外国語)
を合わせて用意しておくことにより、迅速かつ正確な訳
文生成を実現することができる。こうして表示された文
例の中から、ユーザは必要な文例を選択し、登録ボタン
(712)を押すことで自分の個人用文例集に登録する
ことができる。この際、この文例に対応する場面を、場
面選択・表示部(710)を使って設定することができ
るが、場面はあらかじめ予想がつくことが多いので、最
も可能性の高そうな場面をデフォルトとして表示してお
くことが望ましい。
【0018】図8は、文例登録の一例として、電話によ
る音声通話を使う場合の処理の流れの例を表したもので
ある。ユーザから電話がかかってくると、サーバは図4
で説明したような方式を用いて個人認証(802)を行
なう。個人認証が成功したら、次に文例登録の方式指定
(804)を行なう。ここでは例として、自由入力方式
とキーワード検索方式を考え、本図で自由入力方式を、
次図でキーワード検索方式を説明する。方式指定は、音
声あるいはPB音のどちらを使用しても構わない。
【0019】自由入力方式では、次に登録したい文例を
発声する(806)。サーバはこの音声を認識し、結果
を復唱する(808)。ここで用いる音声認識は、音声
通訳サービスで用いる定型文認識とは異なり、あらゆる
単語の自由な繋がりを受け付ける任意文認識である。任
意文認識の認識率は低く、一度で完全に正しい認識結果
が得られることは少ないが、以下に述べる修正を用いて
正しい文例を入力する。ユーザは、音声認識結果の復唱
を聞き、それが正しいかどうかを判定する(810)。
正しくない場合には、修正コマンド・修正内容を発声す
る(812)。この修正コマンドと修正内容の発声の仕
方には様々なパターンが考えられるが、例えば、間違っ
ている部分だけをもう一度発声するとか、間違っている
部分を復唱した後に正しい内容を発声するなどの方式が
考えられる。修正を行なう度にサーバは認識結果を復唱
し、最終的に正しい認識結果が得られるまでこのサイク
ルを繰り返す。このようにして文例が確定したら、次に
場面を発声し(814)、この認識結果を復唱し(81
6)、これが正しいかどうかを判定し(818)、正し
くない場合には再発声により修正し(820)、正しい
場面が得られるまで繰り返す。こうして正しい文例と正
しい場面が得られたら、この文例は個人用文例集に登録
される。
【0020】図9は、文例登録の一例として、電話によ
る音声通話を使う場合の図8とは異なるもう一つの処理
の流れの例を表したものである。方式指定(904)で
キーワード検索方式を選んだ場合、ユーザはキーワード
を発声する(906)。サーバはこの音声を認識し、結
果を復唱する(908)。ここで用いる音声認識は、文
ではなく単語を対象とした孤立単語認識であり、音声通
訳サービスで用いるものとは異なる。ユーザは音声認識
結果の復唱を聞き、それが正しいかどうかを判定する
(910)。正しくない場合には、キーワードを再度発
声し(912)、正しい認識結果が得られるまで同じ動
作を繰り返す。あるいは、ボタン操作等により、音声認
識結果の第2候補、第3候補等を順次再生させ、入力し
た単語が再生されたところでこれを選択するという方式
を用いてもよい。こうして正しいキーワードが得られる
と、サーバはこのキーワードに関連付けられた文例を順
次再生する(914)。ここで用いるキーワードおよび
文例のデータベースは、図7で説明した方式の場合と同
じものを用いることができる。ユーザは、順次再生され
る文例の中から、ボタン操作等により所望の文例を選択
し(916)、その後は、図8の例と同じように、場面
の入力を行なう。
【0021】図10は、登録したい文例に対して訳文を
作成する方式の概略を示している。図5から図9までの
ような手段でユーザが日本語文を入力したら(100
2)、その文がサーバが予め持っている対訳データベー
スに含まれか、もしくは類似文があるかどうかを調べる
(1004)。一般的には、図7ないし図9の文例登録
方式で用いる文例データベースと、本図で扱う対訳デー
タベースは一緒に管理することが期待されるので、この
データベースに含まれる文例すべてに対訳を付けて保存
しておけば、図7ないし図9の方式で登録した文例につ
いては常に対訳が見つかることになる。また、データベ
ース中の文の一部の単語を単純に他の単語で置き換えた
だけのものについては、対訳も同じように単語の置き換
えで容易に作成できることから、データベースに含まれ
る場合と同様に扱う。これらの場合には、該当するデー
タを対訳として抽出・出力すれば良い(1006)。一
方、対訳データベースに同一文も類似文も見つからない
場合には、機械翻訳システムを用いて対訳を作成する
(1008)。こうして作成された訳文を個人向け文例
集に登録する際には、システムからユーザに、「この訳
文は機械翻訳で作成されたものであり、誤訳が含まれる
可能性がある」旨を通知する(1010)。ユーザは、
誤訳の虞れを承知でこの文の登録を認めるか、もしくは
更に精度の高い翻訳を要求するかのいずれかを選択する
(1012)。一般的には、更に精度の高い翻訳に対し
ては相応のコストを支払うことになる。ユーザが「精度
の高い翻訳は必要ない」と答えた場合には、機械翻訳で
作成された訳文を確定し(1014)、文例集に登録す
る。「精度の高い翻訳が必要である」と答えた場合に
は、人間の通訳オペレータにデータを送付し、人手で訳
文を作成、後日登録する(1016)。
【0022】図11は、登録したい文例に対して出力音
声を作成する方式の概略を示している。出力音声の作成
は、図10で述べた訳文の作成とほとんど同じ枠組みで
行なう。則ち、英語文の入力(1102)に対し、音声
データベースに同一文もしくは類似文があるかどうかを
検索し(1104)、見つかればそれをそのまま出力
(1106)、見つからない場合には音声合成を用いて
作成する(1108)。この場合も訳文作成の場合と同
じように、単純な単語の置き換えについては、韻律情報
はそのままで、単語の波形情報のみを置き換えることで
自然な出力音声を作成できるため、類似文についても該
当するデータを使用することができる。データベースに
同一文もしくは類似文が見つからない場合には、発音・
韻律等に誤りや不自然さが生じる虞れがあるため、その
旨をユーザに通知し(1110)、これをそのまま受け
入れるか、更に精度の高いものを希望するかの選択を求
める(1112)。受け入れる場合にはそのまま出力音
声として確定し(1114)、そうでない場合にはオペ
レータの作業によって更に高品質の出力音声を作成・登
録する(1116)。
【0023】
【発明の効果】本発明によれば、音声認識精度をあげる
と共に、ユーザが自分の使いたい文を自由に通訳させる
ことができることができる。また、対話の現場で新たに
通訳したい文例を思い付いた場合でも、相手に話し掛け
る前であれば、携帯電話等を使って文例登録を済ませて
から話し掛けることにより、同様の効果を得ることがで
きる。これらの使用方法を通じて、訳文および出力音声
の品質が保証されていることから、システムの誤認識・
誤訳等により意図せざる内容が伝わってしまうことを防
ぐこともできる。
【図面の簡単な説明】
【図1】本発明を用いたシステムの構成の概要。
【図2】本発明で用いたサービスを使用する場合の処理
の例。
【図3】本発明で用いる個人向け文例集の例。
【図4】本発明を用いたシステムの中の個人認証サーバ
の構成。
【図5】本発明を用いたシステムにおける文例登録の例
(1)。
【図6】本発明を用いたシステムにおける文例登録の例
(2)。
【図7】本発明を用いたシステムにおける文例登録の例
(3)。
【図8】本発明を用いたシステムにおける文例登録の例
(4)。
【図9】本発明を用いたシステムにおける文例登録の例
(5)。
【図10】本発明を用いたシステムの中の訳文作成方
式。
【図11】本発明を用いたシステムの中の出力音声作成
方式。
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/30 330 G06F 17/30 330C G10L 15/00 H04M 3/50 A H04M 3/50 G10L 3/00 551C 551A (72)発明者 北原 義典 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 水谷 世希 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所コンシューマネットビジネ ス推進本部内 Fターム(参考) 5B075 ND03 ND24 PP07 PP24 PQ04 UU01 UU40 5B091 AA05 BA03 CB12 CB32 CC01 CC16 DA09 5D015 GG03 KK02 5K015 AA06 AA07 AF06 5K024 AA71 BB01 BB05 CC11 EE09 GG01 GG05

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】ユーザからの電話を受けるステップと、 前記ユーザが予め登録した文例集をデータベースから抽
    出するステップと、 前記ユーザの発話を電話網を通じて受け取りこれを音声
    認識するステップと、認識した発話に対応する文例を上
    記文例集から検索するステップと、 検索した文例の訳文を電話網を通じて音声で出力するス
    テップとを有することを特徴とする通訳サービス方法。
  2. 【請求項2】請求項1に記載の通訳サービス方法におい
    て、ユーザからの電話を受ける際にユーザの電話器の電
    話番号を検知し、検知した電話番号に基づき前記データ
    ベースから前記ユーザが予め登録した文例集を抽出する
    ことを特徴とする通訳サービス方法。
  3. 【請求項3】請求項1に記載の通訳サービス方法におい
    て、ユーザからの電話を受ける際にユーザから個人情報
    の入力を受け、前記個人情報に基づきデータベースから
    前記ユーザが予め登録した文例集を抽出することを特徴
    とする通訳サービス方法。
  4. 【請求項4】ユーザからのアクセスを個人情報管理サー
    バで受け取るステップと、前記個人情報管理サーバ内に
    もうけられた個人認証サーバを用いて前記ユーザを特定
    するステップと、特定したユーザに対応する文例集を個
    人向け文例集のデータベースから抽出するステップと、
    抽出した文例集に対するユーザの編集情報を受け取るス
    テップと、前記編集情報に基づき前記文例集への文例の
    追加、変更、削除を行った後、前記文例集を前記データ
    ベースに登録するステップとを有することを特徴とする
    通訳サービス方法。
  5. 【請求項5】請求項4に記載の通訳サービス方法におい
    て、ユーザからのアクセスは、インターネット等の双方
    向情報通信プロトコル、或いは、電子メール等の片方向
    情報通信プロトコルを通じて行われることを特徴とする
    通訳サービス方法。
  6. 【請求項6】請求項4に記載の通訳サービス方法におい
    て、ユーザからのアクセスは電話網を通じて行われ、前
    記ユーザの電話器の電話番号を検知して前記ユーザを特
    定し、前記ユーザからの音声による指示によって前記編
    集情報を受け取ることを特徴とする通訳サービス方法。
  7. 【請求項7】請求項4に記載の通訳サービス方法におい
    て、前記ユーザに予め用意した追加登録要文例集を提示
    し、該文例集から前記ユーザが選択した文例を受け取
    り、選択された文例とこの外国語の訳文を前記ユーザの
    データベースに登録することを特徴とする通訳サービス
    方法。
  8. 【請求項8】請求項4から6のいずれかに記載の通訳サ
    ービス方法において、追加、変更された文例の外国語の
    訳文を自動翻訳により作成すると共に、作成された訳文
    の信頼度をユーザに伝え、更にユーザから精度の高い訳
    文の要求を受けた場合は、翻訳者に追加、変更された文
    例を送付して精度の高い訳文を作成することを可能にす
    ることを特徴とする通訳サービス方法。
  9. 【請求項9】請求項8に記載の通訳サービス方法におい
    て、追加、変更された文例と同一もしくは類似の文例が
    データベースに含まれるかどうかを検知し、同一もしく
    は類似の文例が含まれる場合には、訳文の信頼度が十分
    に高いと判定することを特徴とする通訳サービス方法。
  10. 【請求項10】請求項4から6のいずれかに記載の通訳
    サービス方法において、追加、変更された文例の訳文が
    作成された際に、その訳文に対応する出力音声を自動作
    成し、上記自動作成された出力音声の品質を推定してユ
    ーザに伝え、更に品質の高い出力音声の要求を受けた場
    合、オペレータにデータを送付し、品質の高い出力音声
    を作成することを可能にすることを特徴とする通訳サー
    ビス方法。
  11. 【請求項11】請求項10に記載の通訳サービス方法に
    おいて、追加、変更された文例と同一もしくは類似の文
    例がデータベースに含まれるかどうかを検知し、同一も
    しくは類似の文例が含まれる場合には、訳文に対する出
    力音声の品質が十分に高いと判定することを特徴とする
    通訳サービス方法。
  12. 【請求項12】ユーザからの電話を受ける手段と、前記
    ユーザが予め登録した文例集をデータベースから抽出す
    る手段と、前記ユーザの発話を電話網を通じて受け取り
    これを音声認識する手段と、認識した発話に対応する文
    例を上記文例集から検索する手段と、検索した文例の訳
    文を電話網を通じて音声で出力する手段とを有すること
    を特徴とする通訳サービス装置。
  13. 【請求項13】ユーザからのアクセスを受け取る個人情
    報管理サーバと、前記個人情報管理サーバ内にもうけら
    れ、前記ユーザを特定する個人認証サーバと、個人向け
    文例集のデータベースと、特定したユーザに対応する文
    例集を前記個人向け文例集のデータベースから抽出する
    手段と、抽出した文例集に対するユーザの編集情報を受
    け取る手段と、前記編集情報に基づき前記文例集への文
    例の追加、変更、削除を行った後、前記文例集を前記デ
    ータベースに登録する手段とを有することを特徴とする
    通訳サービス装置。
JP2000321920A 2000-10-17 2000-10-17 通訳サービス方法および通訳サービス装置 Expired - Fee Related JP4089148B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2000321920A JP4089148B2 (ja) 2000-10-17 2000-10-17 通訳サービス方法および通訳サービス装置
KR10-2001-0010092A KR100378100B1 (ko) 2000-10-17 2001-02-27 통역 서비스 방법 및 통역 서비스 장치
US09/811,560 US6789093B2 (en) 2000-10-17 2001-03-20 Method and apparatus for language translation using registered databases
US10/898,935 US7467085B2 (en) 2000-10-17 2004-07-27 Method and apparatus for language translation using registered databases

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000321920A JP4089148B2 (ja) 2000-10-17 2000-10-17 通訳サービス方法および通訳サービス装置

Publications (3)

Publication Number Publication Date
JP2002125047A true JP2002125047A (ja) 2002-04-26
JP2002125047A5 JP2002125047A5 (ja) 2004-11-04
JP4089148B2 JP4089148B2 (ja) 2008-05-28

Family

ID=18799890

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000321920A Expired - Fee Related JP4089148B2 (ja) 2000-10-17 2000-10-17 通訳サービス方法および通訳サービス装置

Country Status (3)

Country Link
US (2) US6789093B2 (ja)
JP (1) JP4089148B2 (ja)
KR (1) KR100378100B1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007094086A (ja) * 2005-09-29 2007-04-12 Toshiba Corp 入力装置、入力方法および入力プログラム
JP2009140466A (ja) * 2007-12-04 2009-06-25 Nhn Corp 使用者製作問答データに基づいた会話辞書サービスの提供方法及びシステム
WO2013150883A1 (ja) * 2012-04-06 2013-10-10 八楽株式会社 Webページ翻訳システム
JP2019003433A (ja) * 2017-06-15 2019-01-10 株式会社リクルートライフスタイル プログラム、表示方法及び情報処理装置
CN117524193A (zh) * 2024-01-08 2024-02-06 浙江同花顺智能科技有限公司 中英混合语音识别系统训练方法、装置、设备及介质

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4089148B2 (ja) * 2000-10-17 2008-05-28 株式会社日立製作所 通訳サービス方法および通訳サービス装置
US20030013438A1 (en) * 2001-07-12 2003-01-16 Darby George Eugene Pocket concierge system and method
FI112279B (fi) * 2001-11-21 2003-11-14 Mapvision Oy Ltd Menetelmä vastinpisteiden määrittämiseksi
US8249880B2 (en) * 2002-02-14 2012-08-21 Intellisist, Inc. Real-time display of system instructions
US7376415B2 (en) * 2002-07-12 2008-05-20 Language Line Services, Inc. System and method for offering portable language interpretation services
US20100070265A1 (en) * 2003-05-28 2010-03-18 Nelson David D Apparatus, system, and method for multilingual regulation management
US20040243391A1 (en) * 2003-05-28 2004-12-02 Nelson David D. Apparatus, system, and method for multilingual regulation management
US20050079859A1 (en) * 2003-10-14 2005-04-14 Eakin William Joseph System and method for remotely accessing a private database
US7130401B2 (en) 2004-03-09 2006-10-31 Discernix, Incorporated Speech to text conversion system
KR20060110787A (ko) * 2005-04-20 2006-10-25 가부시키가이샤 소니 컴퓨터 엔터테인먼트 회화 지원 장치
US20060293890A1 (en) * 2005-06-28 2006-12-28 Avaya Technology Corp. Speech recognition assisted autocompletion of composite characters
US20070016421A1 (en) * 2005-07-12 2007-01-18 Nokia Corporation Correcting a pronunciation of a synthetically generated speech object
US8249873B2 (en) * 2005-08-12 2012-08-21 Avaya Inc. Tonal correction of speech
US7792276B2 (en) * 2005-09-13 2010-09-07 Language Line Services, Inc. Language interpretation call transferring in a telecommunications network
US7894596B2 (en) 2005-09-13 2011-02-22 Language Line Services, Inc. Systems and methods for providing language interpretation
US8023626B2 (en) * 2005-09-13 2011-09-20 Language Line Services, Inc. System and method for providing language interpretation
US8265924B1 (en) 2005-10-06 2012-09-11 Teradata Us, Inc. Multiple language data structure translation and management of a plurality of languages
US20070239625A1 (en) * 2006-04-05 2007-10-11 Language Line Services, Inc. System and method for providing access to language interpretation
US7593523B2 (en) * 2006-04-24 2009-09-22 Language Line Services, Inc. System and method for providing incoming call distribution
US7773738B2 (en) * 2006-09-22 2010-08-10 Language Line Services, Inc. Systems and methods for providing relayed language interpretation
US7752043B2 (en) * 2006-09-29 2010-07-06 Verint Americas Inc. Multi-pass speech analytics
KR100834549B1 (ko) * 2006-10-19 2008-06-02 한국전자통신연구원 번역 시스템 및 번역 서비스 제공방법
US8768689B2 (en) * 2007-02-14 2014-07-01 Nuance Communications, Inc. Method and system for translation management of source language text phrases
US20090307870A1 (en) * 2008-06-16 2009-12-17 Steven Randolph Smith Advertising housing for mass transit
US8989704B2 (en) * 2008-12-10 2015-03-24 Symbol Technologies, Inc. Invisible mode for mobile phones to facilitate privacy without breaching trust
US20100198582A1 (en) * 2009-02-02 2010-08-05 Gregory Walker Johnson Verbal command laptop computer and software
US20100205074A1 (en) * 2009-02-06 2010-08-12 Inventec Corporation Network leasing system and method thereof
SG175265A1 (en) * 2009-05-08 2011-11-28 Werner Jungblut Interpersonal communications device and method
KR101233655B1 (ko) * 2009-12-11 2013-02-15 한국전자통신연구원 음성인식 기반 국제회의 통역 장치 및 방법
KR101377459B1 (ko) * 2009-12-21 2014-03-26 한국전자통신연구원 자동 통역 장치 및 그 방법
JP5243646B2 (ja) 2011-05-24 2013-07-24 株式会社エヌ・ティ・ティ・ドコモ サービスサーバ装置、サービス提供方法、サービス提供プログラム
US9098494B2 (en) * 2012-05-10 2015-08-04 Microsoft Technology Licensing, Llc Building multi-language processes from existing single-language processes
KR101945258B1 (ko) * 2012-06-27 2019-02-08 한국전자통신연구원 위치정보 및 프로파일링 정보를 이용한 통번역 장치 및 방법
RU2546064C1 (ru) * 2013-11-12 2015-04-10 Общество с ограниченной ответственностью "Технологии управления переводом" Распределенная система и способ языкового перевода

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5384701A (en) * 1986-10-03 1995-01-24 British Telecommunications Public Limited Company Language translation system
US4984177A (en) * 1988-02-05 1991-01-08 Advanced Products And Technologies, Inc. Voice language translator
JPH03268062A (ja) * 1990-03-19 1991-11-28 Fujitsu Ltd 機械翻訳電子メール装置における私用単語の登録装置
JP3315221B2 (ja) 1993-11-19 2002-08-19 シャープ株式会社 会話文翻訳装置
JPH07222248A (ja) 1994-02-08 1995-08-18 Hitachi Ltd 携帯型情報端末における音声情報の利用方式
US6134549A (en) * 1995-03-31 2000-10-17 Showcase Corporation Client/server computer system having personalizable and securable views of database data
JP3741156B2 (ja) * 1995-04-07 2006-02-01 ソニー株式会社 音声認識装置および音声認識方法並びに音声翻訳装置
JP3385146B2 (ja) * 1995-06-13 2003-03-10 シャープ株式会社 会話文翻訳装置
JP3473204B2 (ja) 1995-08-21 2003-12-02 株式会社日立製作所 翻訳装置及び携帯端末装置
JPH09231224A (ja) * 1996-02-26 1997-09-05 Fuji Xerox Co Ltd 言語情報処理装置
US5732216A (en) * 1996-10-02 1998-03-24 Internet Angles, Inc. Audio message exchange system
US6085162A (en) * 1996-10-18 2000-07-04 Gedanken Corporation Translation system and method in which words are translated by a specialized dictionary and then a general dictionary
US6161082A (en) * 1997-11-18 2000-12-12 At&T Corp Network based language translation system
US6336114B1 (en) * 1998-09-03 2002-01-01 Westcorp Software Systems, Inc. System and method for restricting access to a data table within a database
JP2000194700A (ja) 1998-12-25 2000-07-14 Sony Corp 情報処理装置および方法、並びに提供媒体
US6266642B1 (en) * 1999-01-29 2001-07-24 Sony Corporation Method and portable apparatus for performing spoken language translation
US6243669B1 (en) * 1999-01-29 2001-06-05 Sony Corporation Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6356865B1 (en) * 1999-01-29 2002-03-12 Sony Corporation Method and apparatus for performing spoken language translation
US6374224B1 (en) * 1999-03-10 2002-04-16 Sony Corporation Method and apparatus for style control in natural language generation
US6792086B1 (en) * 1999-08-24 2004-09-14 Microstrategy, Inc. Voice network access provider system and method
US6788768B1 (en) * 1999-09-13 2004-09-07 Microstrategy, Incorporated System and method for real-time, personalized, dynamic, interactive voice services for book-related information
US6330530B1 (en) * 1999-10-18 2001-12-11 Sony Corporation Method and system for transforming a source language linguistic structure into a target language linguistic structure based on example linguistic feature structures
US6438524B1 (en) * 1999-11-23 2002-08-20 Qualcomm, Incorporated Method and apparatus for a voice controlled foreign language translation device
AUPQ539700A0 (en) * 2000-02-02 2000-02-24 Worldlingo.Com Pty Ltd Translation ordering system
KR100387918B1 (ko) * 2000-07-11 2003-06-18 이수성 통역기
JP4089148B2 (ja) * 2000-10-17 2008-05-28 株式会社日立製作所 通訳サービス方法および通訳サービス装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007094086A (ja) * 2005-09-29 2007-04-12 Toshiba Corp 入力装置、入力方法および入力プログラム
JP4559946B2 (ja) * 2005-09-29 2010-10-13 株式会社東芝 入力装置、入力方法および入力プログラム
US8346537B2 (en) 2005-09-29 2013-01-01 Kabushiki Kaisha Toshiba Input apparatus, input method and input program
JP2009140466A (ja) * 2007-12-04 2009-06-25 Nhn Corp 使用者製作問答データに基づいた会話辞書サービスの提供方法及びシステム
WO2013150883A1 (ja) * 2012-04-06 2013-10-10 八楽株式会社 Webページ翻訳システム
JP2019003433A (ja) * 2017-06-15 2019-01-10 株式会社リクルートライフスタイル プログラム、表示方法及び情報処理装置
CN117524193A (zh) * 2024-01-08 2024-02-06 浙江同花顺智能科技有限公司 中英混合语音识别系统训练方法、装置、设备及介质
CN117524193B (zh) * 2024-01-08 2024-03-29 浙江同花顺智能科技有限公司 中英混合语音识别系统训练方法、装置、设备及介质

Also Published As

Publication number Publication date
KR100378100B1 (ko) 2003-03-29
KR20020030694A (ko) 2002-04-25
US6789093B2 (en) 2004-09-07
JP4089148B2 (ja) 2008-05-28
US20040267538A1 (en) 2004-12-30
US7467085B2 (en) 2008-12-16
US20020046206A1 (en) 2002-04-18

Similar Documents

Publication Publication Date Title
JP4089148B2 (ja) 通訳サービス方法および通訳サービス装置
US6895257B2 (en) Personalized agent for portable devices and cellular phone
US7739118B2 (en) Information transmission system and information transmission method
JP4135307B2 (ja) 音声通訳サービス方法および音声通訳サーバ
KR102108500B1 (ko) 번역 기반 통신 서비스 지원 방법 및 시스템과, 이를 지원하는 단말기
JP2002125047A5 (ja)
EP1343096A2 (en) System and method for message language translation
JP2010102254A (ja) 話者テンプレートを更新する装置及び方法
CN106713111B (zh) 一种添加好友的处理方法、终端及服务器
CN111325039A (zh) 基于实时通话的语言翻译方法、系统、程序和手持终端
US20060190260A1 (en) Selecting an order of elements for a speech synthesis
CN106603792B (zh) 一种号码查找设备
WO2015188454A1 (zh) 一种快速进入ivr菜单的方法及装置
JP2001197207A (ja) 多言語応対装置
KR20000024318A (ko) 인터넷을 이용한 tts 시스템 및 tts 서비스 방법
KR100380829B1 (ko) 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체
CN111274828B (zh) 基于留言的语言翻译方法、系统、计算机程序和手持终端
JPH11110389A (ja) 携帯型翻訳機
KR20160097406A (ko) 실시간 통번역 통화서비스 시스템 및 그 제공방법
JP2005331608A (ja) 情報処理装置および情報処理方法
TWI722715B (zh) 智能語音助理之模組化系統及其運作方法
EP3035207A1 (en) Speech translation device
CN118551776A (zh) 一种基于大数据的智能英语翻译系统及其使用方法
Goldman et al. Voice Portals—Where Theory Meets Practice
KR100432373B1 (ko) 독립적 음성처리를 위한 음성인식 시스템

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060228

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080218

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110307

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110307

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120307

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130307

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130307

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees