JP2006510095A - 多モードの音声言語翻訳及び表示 - Google Patents

多モードの音声言語翻訳及び表示 Download PDF

Info

Publication number
JP2006510095A
JP2006510095A JP2004559022A JP2004559022A JP2006510095A JP 2006510095 A JP2006510095 A JP 2006510095A JP 2004559022 A JP2004559022 A JP 2004559022A JP 2004559022 A JP2004559022 A JP 2004559022A JP 2006510095 A JP2006510095 A JP 2006510095A
Authority
JP
Japan
Prior art keywords
language
sentence
natural language
text
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004559022A
Other languages
English (en)
Other versions
JP4448450B2 (ja
JP2006510095A5 (ja
Inventor
ガオ、ユーキン
グ、リャン
フウファ リュウ、
ソレンセン、ジェフリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2006510095A publication Critical patent/JP2006510095A/ja
Publication of JP2006510095A5 publication Critical patent/JP2006510095A5/ja
Application granted granted Critical
Publication of JP4448450B2 publication Critical patent/JP4448450B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

【課題】 ソース言語がシステムに入力され、ターゲット言語に翻訳され、種々の様式で出力される、多モードの音声言語翻訳システム及び方法を提供すること。
【解決手段】 ソース言語の自然言語文を記号表示及び/又はターゲット言語に翻訳するための、多モードの音声言語翻訳システム及び方法が提供される。システムは、ソース言語の自然言語文を該システムに入力するための入力装置と、該自然言語文を機械読み取り可能な形態で受信し、該自然言語文を記号表示及び/又はターゲット言語に翻訳するためのトランスレータと、該自然言語文の記号表示を表示するための画像ディスプレイとを含む。さらに、画像ディスプレイが、ターゲット言語のテキスト、記号表示、及びソース言語のテキストの間の相関関係を示す。

Description

本発明は、一般に、言語翻訳システムに関し、より具体的には、ソース言語がシステムに入力され、ターゲット言語に翻訳され、例えばディスプレイ、音声合成装置などのような種々の様式で出力される、多モードの音声言語翻訳システム及び方法に関する。
人間のコミュニケーションのために視覚画像を用いることは、非常に古くからの、基本的なことである。洞窟絵画から現代の子供の絵に至るまで、絵、記号、及びアイコン表示は、人間の表現において基本的な役割を担ってきた。画像及び空間的形状は、場面及び物理的物体だけではなく、プロセス及びより抽象的な観念を表すためにも用いられる。やがて、絵文字システム即ち視覚言語は、表現力についての相似よりも規則に依存する度合いが強いアルファベット及び記号システムに進化した。
視覚言語は、広範囲ではあるが、限られた領域で使用されている。例えば、交通標識、及び、電話、トイレ、レストラン、非常口などといった公共の場所における施設の国際的なアイコンは、一般に受け入れられており、世界のほとんどの地域で理解される。
過去20〜30年にわたって、例えば、グラフィカル・インターフェース、グラフィック・プログラミング言語のような、人間/コンピュータの対話のための視覚言語に強い関心が寄せられてきた。例えば、マイクロソフト社のWindows(登録商標)インターフェースは、フォルダ、ファイル・キャビネット、ごみ箱、描画用具、その他の馴染みのあるものについての比喩的デスクトップ用シンボルを使用しており、これらは、コンピュータを使いやすくし、学びやすくするので、パーソナル・コンピュータには標準になっている。しかしながら、移動のしやすさ、インターネットのような通信媒体の速度の改善、及び市場の国際化のために国際社会が小さくなるに従って、視覚言語が、異なる言語の人の間のコミュニケーションにおいて果たす役割が増えている。さらに、視覚言語は、例えば、聴覚障害者又は非識字者のような全く話せない人の間のコミュニケーションを助けることもできる。
Tanimoto、Steven L.著、「Representation and Learnability in Visual Languages for Web−based Interpersonal Communication」、IEEE Proceedings of VL 1997年9月23日−26日、1997年
視覚言語は、以下の特徴、すなわち(1)国際性−視覚言語が特定の話し言葉又は書き言葉に依存しないこと、(2)視覚表示の使用の結果得られる学習可能性、(3)書く能力が損なわれている人が用いるのを助けるコンピュータを使った著述及び表示、(4)自動適合(例えば、視覚障害者のための大きなディスプレイ、色覚障害者のための色の付け直し、初心者に対してより明確なメッセージを与えるといった)、及び(5)例えば、動画のような高度の視覚化技術の使用(非特許文献1を参照されたい)のために、人と人との間のコミュニケーションに対する大きな可能性を有する。
ソース言語の自然文を記号表示及び/又はターゲット言語に翻訳するための多モードの音声言語翻訳システム及び方法が提供される。本発明は、自然言語理解技術を用いて、話される文における概念及び意味を分類し、その文をターゲット言語に翻訳し、視覚表示(例えば、写真、画像、アイコン、又は何らかのビデオ・セグメント)を用いて、その文における主要な概念及び意味を、例えば話し手と聞き手のような両方のパーティに示し、ユーザが互いを理解するのを助け、該ソース言語のユーザが翻訳の正確さを確認するのを助ける。
旅行者は、手荷物及びタクシーについて空港の標示に用いられるもののような視覚描写の有用性をよく知っている。本発明は、話し言葉の出力と共に、これらの及び他のこうした画像を表示される記号表示に組み込むことによって、同じ機能を対話式会話モデルにもたらす。記号表示は、動画を組み込み、静的表示ではできない方法で主語/目的語及び動作の関係を示すことさえできる。
本発明の1つの側面によると、言語翻訳システムは、ソース言語の自然言語文をシステムに入力するための入力装置と、該自然言語文を機械読み取り可能な形態で受信し、該自然言語文を記号表示に翻訳するためのトランスレータと、該自然言語文の該記号表示を表示するための画像ディスプレイとを含む。このシステムは、自然言語文をターゲット言語で音声生成するためのテキスト音声合成装置をさらに含む。
トランスレータは、自然言語文の要素を分類し、カテゴリーによって該要素にタグ付けするための自然言語理解統計的分類装置と、分類された文からの構造情報を構文解析し、該分類された文の意味構文解析ツリーの表示を出力するための自然言語を理解構文解析プログラムとを含む。トランスレータは、自然言語文の言語独立表示を抽出するためのインテルリングア情報抽出装置と、該言語独立表示の要素を視覚描写に関連付けることによって、該自然言語文の記号表示を生成するための記号画像生成装置とをさらに含む。
本発明の別の側面によると、トランスレータは自然言語文をターゲット言語のテキストに翻訳し、画像ディスプレイは該ターゲット言語のテキスト、記号表示、及びソース言語のテキストを表示し、この場合、該画像ディスプレイが、該ターゲット言語のテキストと、該記号表示と、該ソース言語のテキストとの間の相関関係を表示する。
本発明のさらに別の側面によると、言語を翻訳する方法が提供される。この方法は、ソース言語の自然言語文を受信するステップと、該自然言語文を記号表示に翻訳するステップと、該自然言語文の該記号表示を表示するステップとを含む。
受信するステップは、話される自然言語文を音響信号として受信するステップと、該話される自然言語文を機械認識可能なテキストに変換するステップとを含む。
本発明の別の側面によると、この方法は、自然言語文の要素を分類し、カテゴリーによって要素にタグ付けするステップと、分類された文からの構造情報を構文解析し、該分類された文の意味構文解析ツリー表示を出力するステップと、該意味構文解析ツリーから該自然言語文の言語独立表示を抽出するステップとをさらに含む。
さらに、この方法は、言語独立表示の要素を視覚描写に関連付けることによって、該自然言語文の記号表示を生成するステップをさらに含む。
さらに別の側面においては、この方法は、ターゲット言語のテキスト、記号表示、及びソース言語のテキストを互いに関連付けるステップと、該ターゲット言語のテキスト、該記号表示、及び該ソース言語のテキストの間の相関関係を表示するステップとをさらに含む。
本発明の別の側面によると、言語を翻訳するための方法ステップを実行させるためのコンピュータにより実行可能な命令のプログラムを明白に具体化する、機械読み取り可能なプログラム記憶装置において、該方法ステップが、ソース言語の自然言語文を受信するステップと、該自然言語文を記号表示に翻訳するステップと、該自然言語文の該記号表示を表示するステップとを含む。
本発明の上記及び他の態様、特徴、並びに利点は、添付の図面と併せて以下の詳細な説明を解釈するときに、以下の詳細な説明に照らしてより明らかになるであろう。
本発明の好ましい実施形態が、添付の図面に関連して以下に説明される。以下の説明においては、本発明を不必要に分かりにくくしないように、公知の機能又は構成は詳細に説明されていない。
ソース言語の自然言語文を記号表示及び/又はターゲット言語に翻訳するための、多モードの音声言語翻訳システム及び方法が提供される。本発明は、装置によって表示される入力文のグラフ表示又は記号表示の付加的な翻訳を加えることによって、音声認識の技術、自然言語理解、意味翻訳、自然言語生成、及び音声合成に適用される。視覚描写(例えば、写真、画像、アイコン、或いはビデオ・セグメント)を含めることにより、翻訳システムは、(ソース言語の)話し手に、音声が認識され、適切に理解されたことを示す。さらに、視覚表示は、両方のパーティに、翻訳の不明瞭さのために不正確なものになり得る意味表示の側面を示す。
任意の言語の視覚描写は、特に抽象的なダイアログの場合は、それ自体が難題である。しかしながら、翻訳プロセス中に「インテルリングア(interlingua)」表示、即ち言語独立表示を作成する際の自然言語理解処理のために、適切な画像を適合させる付加的な機会が利用可能である。この意味で、視覚言語は、ターゲットにする言語生成システムの別のターゲット言語と考えることができる。
本発明は、ハードウェア、ソフトウェア、ファームウェア、特殊用途プロセッサ、又はそれらの組み合わせの種々の形態で実施することができることを理解すべきである。1つの実施形態において、本発明は、プログラム記憶装置上で明白に具体化されるアプリケーション・プログラムのようなソフトウェアで実施することができる。アプリケーション・プログラムは、いずれかの適切なアーキテクチャからなる機械にアップロードすることができ、該機械によって実行することができる。機械は、1つ又はそれ以上の中央演算処理装置(CPU)、ランダム・アクセス・メモリ(RAM)、読み取り専用メモリ(ROM)、並びにキーボード、カーソル制御装置(例えば、マウス)、及びディスプレイ装置のような入力/出力(I/O)インターフェースのような、ハードウェアを有するコンピュータ・プラットフォーム上で実施されることが好ましい。コンピュータ・プラットフォームは、オペレーティング・システム及びマイクロ命令コードも含む。ここに説明される種々のプロセス及び機能は、マイクロ命令コードの一部又はアプリケーション・プログラムの一部のいずれか(又はそれらの組み合わせ)とすることができ、オペレーティング・システムを介して実行される。さらに、種々の他の周辺装置を、付加的なデータ記憶装置及び印刷装置のようなコンピュータ・プラットフォームに接続することができる。
添付の図面に示される構成システム・コンポーネントの一部及び方法ステップはソフトウェアで実施することができるので、システム・コンポーネント(又は方法ステップ)間の実際の接続は、本発明をプログラムする方法によって異なり得ることをさらに理解すべきである。本発明の教示が与えられた場合、当業者であれば、本発明のこれらの及び類似した実施又は構成を考えることができるであろう。
図1は、本発明の一実施形態による多モードの音声言語翻訳システム100のブロック図であり、図2は、ソース言語の自然言語文を記号表示に翻訳する方法を示すフローチャートである。システム及び方法の詳細な説明が、図1及び図2に関連して与えられる。
図1及び図2を参照すると、言語翻訳システム100は、自然言語文を該システム100に入力するための入力装置102と、該自然言語文を機械読み取り可能な形態で受信し(ステップ202)、該自然言語文を記号表示に翻訳するためのトランスレータ104と、該自然言語文の記号表示を表示するための画像ディスプレイ106とを含む。任意に、システム100は、自然言語文をターゲット言語で音声生成するためのテキスト音声合成装置108を含む。
入力装置102は、話し言葉をコンピュータ又は機械認識可能なテキスト語に変換する(ステップ204)ための自動音声認識装置(ASR)に結合されたマイクであることが好ましい。ASRは、音響音声信号を受信し、該信号を、入力されたソース言語の音響モデル110及び言語モデル112と比較し、話し言葉をテキストに書き換える。
任意に、入力装置は、テキスト語、デジタル・タブレットを直接入力するためのキーボード、又は手書きのテキストをコンピュータ認識可能なテキスト語に変換するためのスキャナである(ステップ204)。
自然言語文がコンピュータ/機械認識可能な形態になると、テキストは、トランスレータ104によって処理される。トランスレータ104は、自然言語理解(NLU)統計的分類装置114、NLU総計的構文解析プログラム116、インテルリングア情報抽出装置120、翻訳及び統計的自然言語生成装置124、並びに記号画像生成装置130を含む。
NLU統計的分類装置114は、ASR102からコンピュータ認識可能なテキストを受信し、文において一般的なカテゴリーを見つけ出し、特定の要素にタグ付けする(ステップ206)。例えば、ASR102は、「私は、明日の朝のテキサス州ヒューストンまでの片道切符を予約したい」という文を出力することができる。NLU分類装置114が、テキサス州ヒューストンを場所「LOC」として分類し、これを入力文に置き換える。さらに、片道は、例えば、往復又は片道(RT−OW)のような切符のタイプと解釈され、明日は、「日付」と置き換えられ、朝は、「時間」と置き換えられ、その結果、「私は日付・時間のLOCまでのRT−OWの切符を予約したい」という文が得られる。
次に、分類された文は、NLU統計的構文解析プログラム116に送られ、そこで、例えば、主語/動詞のような構造的情報が抽出される(ステップ208)。構文解析プログラム116は、構文解析プログラム・モデル118と対話し、入力文の統語構造を判断し、意味構文解析ツリーを出力する。構文解析プログラム・モデル118は、例えば、交通、医療などの特定の領域のために構築することができる。
次に、意味構文解析ツリーは、インテルリングア情報抽出装置120によって処理され、ツリー構造化インテルリングアとしても周知の、入力ソース文についての言語独立意味を判断する(ステップ210)。インテルリングア情報抽出装置120は、テキストによって表される数を、周囲のテキストによって定められるような適切にフォーマットされた数表示に書き換えるための標準化装置122に連結される。例えば、「便名two eighteen」というテキストが入力された場合、数表示「218」が出力される。さらに、「時間two eighteen」が入力された場合、時刻形式の「2:18」が出力される。
ツリー構造化されたインテルリングアが求められると、元の入力ソース自然言語文を、例えば、異なる話し言葉のような何らかのターゲット言語又は記号表示に翻訳することができる。話し言葉の場合、インテルリングアは、翻訳及び統計的自然言語生成装置124に送られ、該インテルリングアをターゲット言語に変換する(ステップ212)。生成装置124は、インテルリングアをターゲット言語のテキストに翻訳するために、多国語辞書126にアクセスする。次に、ターゲット言語のテキストは、意味依存辞書128を用いて処理され、出力されるテキストの適切な意味を公式化する。最後に、テキストは、自然言語生成モデル129を用いて処理され、ターゲット言語に従った理解可能な文でテキストを構築する。次いで、ターゲット言語文は、自然言語文をターゲット言語で音声生成するために、テキスト音声合成装置108に送られる。
インテルリングアはまた、画像・ディスプレイ106上に表示される視覚描写の記号表示を生成するための記号画像生成装置130にも送られる(ステップ214)。記号画像生成装置130は、例えば、Blissymbolics又はMinspeakのような画像記号モデルにアクセスして、記号表示を生成することができる。ここで、生成装置130は、適切な記号を抽出して、元のソース文の異なる要素を表す「語」を作成し、その元のソース文の意図された意味を伝えるようにその「語」をグループ化する。代替的に、生成装置130は、画像カタログ134にアクセスし、そこで、インテルリングアの要素を表すために合成画像が選択される。記号表示が構築されると、該記号表示は、画像表示装置106上に表示される。図3は、ソース言語の、入力された元の自然言語文の記号表示を示す(ステップ216)。
本発明の翻訳システムの機能的利点に加えて、共有のグラフィカル表示の存在によって、話し手及び聞き手の両方のユーザ・エクスペリエンスが大きく向上する。如何なる言語も共有しない人の間のコミュニケーションは、困難であり、ストレスが多い。視覚描写により、共有体験の感覚が育ち、適切な画像を有する共通域が与えられ、身振りを通して又は継続した一連の対話を通して、コミュニケーションが促進される。
本発明の翻訳システムの別の実施形態において、表示された記号表示が、話されたダイアログのどの部分が表示された画像に対応するかを示す。この実施形態の例示的な画面が、図4に示される。
図4は、話し手によって話されるようなソース言語の自然言語文402、ソース文の記号表示404、及びここでは中国語であるターゲット言語への該ソース文の翻訳406を示す。流暢な言語翻訳には、多くの場合語順の変更を必要とするので、線408は、画像が各言語において対応する話し言葉の部分を表している。単語と句の視覚描写を結び付け、それらが、各言語において話される句のどこにあたるかを示すことによって、聞き手は、通常、現在の音声認識システムでは登録されていない、話し手がもたらす韻律的な手がかりをうまく利用することができる。
任意に、対応する語又は概念がテキスト音声合成装置によって音声生成されるとき、画像ディスプレイ上に示された各画像が強調表示される。
別の実施形態においては、システムは、話し手の感情を検知し、「:−)」のような「感情」をターゲット言語のテキストに組み込む。話し手の感情は、音の高さと音質について受信した音響信号を分析することによって検知することができる。代替的に、当該分野において周知のように、神経回路網を通して話し手の捕捉画像を分析することにより、カメラが該話し手の感情を捕捉する。その後、後の翻訳のために、話し手の感情が機械認識可能なテキストと関連付けられる。
本発明は、特定の好ましい実施形態に関連して示され、説明されているが、当業者であれば、添付の特許請求の範囲に定められるような本発明の精神及び範囲から逸脱することなく、形態及び詳細の種々の変更をなし得ることを理解するであろう。
本発明の一実施形態による、多モードの音声言語翻訳システムのブロック図である。 本発明の一実施形態による、ソース言語の自然言語文を記号表示に翻訳する方法を示すフローチャートである。 ソース言語の自然言語文の記号表示を示す、多モードの音声言語翻訳システムの例示的な表示である。 ソース言語及びターゲット言語がどのように記号表示に関連付けられているかを示す形で、ソース言語での自然言語文と、該文の記号表示と、ターゲット言語に翻訳された文とを示す、多モードの音声言語翻訳システムの例示的な表示である。

Claims (23)

  1. 言語翻訳システムであって、
    ソース言語の自然言語文を前記システムに入力するための入力装置と、
    前記自然言語文を機械読み取り可能な形態で受信し、該自然言語文を記号表示に翻訳するためのトランスレータと、
    前記自然言語文の前記記号表示を表示するための画像ディスプレイと、
    を備えることを特徴とするシステム。
  2. 前記自然言語文をターゲット言語で音声生成するためのテキスト音声合成装置をさらに含む、請求項1に記載のシステム。
  3. 前記入力装置が、話し言葉を機械認識可能なテキストに変換するための自動音声認識装置である、請求項1に記載のシステム。
  4. 前記トランスレータが、
    前記自然言語文からの構造情報を構文解析し、該自然言語文の意味構文解析ツリー表示を出力するための自然言語理解構文解析プログラム、
    をさらに備える、請求項1に記載のシステム。
  5. 前記トランスレータが、
    前記自然言語文の要素を分類し、カテゴリーによって前記要素にタグ付けするための自然言語理解統計的分類装置と、
    前記分類された文からの構造情報を構文解析し、該分類された文の意味構文解析ツリー表示を出力するための自然言語理解構文解析プログラムと、
    をさらに備える、請求項1に記載のシステム。
  6. 前記トランスレータが、前記自然言語文の言語独立表示を抽出するためのインテルリングア(interlingua)情報抽出装置をさらに備える、請求項5に記載のシステム。
  7. 前記トランスレータが、前記言語独立表示の要素を視覚描写に関連付けることによって、前記自然言語文の前記記号表示を生成するための記号画像生成装置をさらに備える、請求項6に記載のシステム。
  8. 前記トランスレータが、前記言語独立表示をターゲット言語に変換するための自然言語生成装置をさらに備える、請求項6に記載のシステム。
  9. 前記トランスレータが、前記自然言語文をターゲット言語のテキストに翻訳し、前記画像ディスプレイが、前記記号表示と共に前記ターゲット言語のテキストを表示する、請求項1に記載のシステム。
  10. 前記トランスレータが、前記自然言語文をターゲット言語のテキストに翻訳し、前記画像ディスプレイが前記ターゲット言語のテキスト、前記記号表示、及び前記ソース言語のテキストを表示する、請求項3に記載のシステム。
  11. 前記画像ディスプレイが、前記ターゲット言語のテキスト、前記記号表示、及び前記ソース言語のテキストの間の相関関係を示す、請求項10に記載のシステム。
  12. 言語を翻訳する方法であって、前記方法が、
    ソース言語の自然言語文を受信するステップと、
    前記自然言語文を記号表示に翻訳するステップと、
    前記自然言語文の前記記号表示を表示するステップと、
    を含むことを特徴とする方法。
  13. 前記受信するステップが、
    話される自然言語文を音響信号として受信するステップと、
    前記話される自然言語文を機械認識可能なテキストに変換するステップと、
    を含む、請求項12に記載の方法。
  14. 前記自然言語文からの構造情報を構文解析し、該自然言語文の意味構文解析ツリー表示を出力するステップをさらに含む、請求項13に記載の方法。
  15. 前記意味構文解析ツリーから前記自然言語文の言語独立表示を抽出するステップをさらに含む、請求項14に記載の方法。
  16. 前記自然言語文の要素を分類し、カテゴリーによって前記要素にタグ付けするステップと、
    前記分類された文からの構造情報を構文解析し、該分類された文の意味構文解析ツリー表示を出力するステップと、
    を含む、請求項13に記載の方法。
  17. 前記意味構文解析ツリーから前記自然言語文の言語独立表示を抽出するステップをさらに含む、請求項16に記載の方法。
  18. 前記言語独立表示の要素を視覚描写に関連付けることによって、該自然言語文の前記記号表示を生成するステップをさらに含む、請求項17に記載の方法。
  19. 前記言語独立表示をターゲット言語のテキストに変換するステップと、前記記号表示と共に前記ターゲット言語のテキストを表示するステップとをさらに含む、請求項18に記載の方法。
  20. 前記ターゲット言語のテキストを音声生成するステップをさらに含む、請求項19に記載の方法。
  21. 前記ターゲット言語の前記テキストに対応する前記表示された記号表示の要素を強調表示するステップをさらに含む、請求項20に記載の方法。
  22. 前記ターゲット言語のテキスト、前記記号表示、及び前記ソース言語のテキストを互いに関連付けるステップと、該ターゲット言語のテキスト、該記号表示、及び該ソース言語のテキストとの相関関係を表示するステップとをさらに含む、請求項19に記載の方法。
  23. 言語を翻訳する方法ステップを実行させるための機械により実行可能な命令のプログラムを明白に具体化する、機械読み取り可能なプログラム記憶装置において、前記方法ステップが、
    ソース言語の自然言語文を受信するステップと、
    前記自然言語文を記号表示に翻訳するステップと、
    前記自然言語文の前記記号表示を表示するステップと、
    を含むことを特徴とするプログラム記憶装置。
JP2004559022A 2002-12-10 2003-04-23 多モードの音声言語翻訳及び表示 Expired - Fee Related JP4448450B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/315,732 US20040111272A1 (en) 2002-12-10 2002-12-10 Multimodal speech-to-speech language translation and display
PCT/US2003/012514 WO2004053725A1 (en) 2002-12-10 2003-04-23 Multimodal speech-to-speech language translation and display

Publications (3)

Publication Number Publication Date
JP2006510095A true JP2006510095A (ja) 2006-03-23
JP2006510095A5 JP2006510095A5 (ja) 2006-06-15
JP4448450B2 JP4448450B2 (ja) 2010-04-07

Family

ID=32468784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004559022A Expired - Fee Related JP4448450B2 (ja) 2002-12-10 2003-04-23 多モードの音声言語翻訳及び表示

Country Status (8)

Country Link
US (1) US20040111272A1 (ja)
EP (1) EP1604300A1 (ja)
JP (1) JP4448450B2 (ja)
KR (1) KR20050086478A (ja)
CN (1) CN1742273A (ja)
AU (1) AU2003223701A1 (ja)
TW (1) TWI313418B (ja)
WO (1) WO2004053725A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016218618A (ja) * 2015-05-18 2016-12-22 沖電気工業株式会社 取引装置
JPWO2017072915A1 (ja) * 2015-10-29 2018-07-12 株式会社日立製作所 視覚情報と聴覚情報の同期方法および情報処理装置
JP2019514131A (ja) * 2016-05-09 2019-05-30 ネイバー コーポレーションNAVER Corporation 顔文字が共に提供される翻訳文提供方法、ユーザ端末、サーバ及びコンピュータプログラム

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7536294B1 (en) * 2002-01-08 2009-05-19 Oracle International Corporation Method and apparatus for translating computer programs
JP2004280352A (ja) * 2003-03-14 2004-10-07 Ricoh Co Ltd 文書データ翻訳方法及び文書データ翻訳プログラム
US7607097B2 (en) * 2003-09-25 2009-10-20 International Business Machines Corporation Translating emotion to braille, emoticons and other special symbols
US7272562B2 (en) * 2004-03-30 2007-09-18 Sony Corporation System and method for utilizing speech recognition to efficiently perform data indexing procedures
US7502632B2 (en) * 2004-06-25 2009-03-10 Nokia Corporation Text messaging device
JP2006155035A (ja) * 2004-11-26 2006-06-15 Canon Inc ユーザインタフェースの構築方法
US20060136870A1 (en) * 2004-12-22 2006-06-22 International Business Machines Corporation Visual user interface for creating multimodal applications
US20080249776A1 (en) * 2005-03-07 2008-10-09 Linguatec Sprachtechnologien Gmbh Methods and Arrangements for Enhancing Machine Processable Text Information
US20060229882A1 (en) * 2005-03-29 2006-10-12 Pitney Bowes Incorporated Method and system for modifying printed text to indicate the author's state of mind
JP4050755B2 (ja) * 2005-03-30 2008-02-20 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP4087400B2 (ja) * 2005-09-15 2008-05-21 株式会社東芝 音声対話翻訳装置、音声対話翻訳方法および音声対話翻訳プログラム
US7983910B2 (en) * 2006-03-03 2011-07-19 International Business Machines Corporation Communicating across voice and text channels with emotion preservation
US7860705B2 (en) * 2006-09-01 2010-12-28 International Business Machines Corporation Methods and apparatus for context adaptation of speech-to-speech translation systems
US8335988B2 (en) 2007-10-02 2012-12-18 Honeywell International Inc. Method of producing graphically enhanced data communications
GB0800578D0 (en) * 2008-01-14 2008-02-20 Real World Holdings Ltd Enhanced message display system
US20100121630A1 (en) * 2008-11-07 2010-05-13 Lingupedia Investments S. A R. L. Language processing systems and methods
US9401099B2 (en) * 2010-05-11 2016-07-26 AI Squared Dedicated on-screen closed caption display
US8856682B2 (en) 2010-05-11 2014-10-07 AI Squared Displaying a user interface in a dedicated display area
US8798985B2 (en) * 2010-06-03 2014-08-05 Electronics And Telecommunications Research Institute Interpretation terminals and method for interpretation through communication between interpretation terminals
WO2011161825A1 (ja) * 2010-06-25 2011-12-29 楽天株式会社 機械翻訳システム及び機械翻訳方法
JP5066242B2 (ja) * 2010-09-29 2012-11-07 株式会社東芝 音声翻訳装置、方法、及びプログラム
US10019995B1 (en) 2011-03-01 2018-07-10 Alice J. Stiebel Methods and systems for language learning based on a series of pitch patterns
US11062615B1 (en) 2011-03-01 2021-07-13 Intelligibility Training LLC Methods and systems for remote language learning in a pandemic-aware world
US8862462B2 (en) * 2011-12-09 2014-10-14 Chrysler Group Llc Dynamic method for emoticon translation
WO2013086666A1 (en) * 2011-12-12 2013-06-20 Google Inc. Techniques for assisting a human translator in translating a document including at least one tag
US9740691B2 (en) * 2012-03-19 2017-08-22 John Archibald McCann Interspecies language with enabling technology and training protocols
US8452603B1 (en) 2012-09-14 2013-05-28 Google Inc. Methods and systems for enhancement of device accessibility by language-translated voice output of user-interface items
KR20140119841A (ko) * 2013-03-27 2014-10-13 한국전자통신연구원 애니메이션을 이용한 번역 검증 방법 및 그 장치
KR102130796B1 (ko) * 2013-05-20 2020-07-03 엘지전자 주식회사 이동 단말기 및 이의 제어방법
JP2015060332A (ja) * 2013-09-18 2015-03-30 株式会社東芝 音声翻訳装置、音声翻訳方法およびプログラム
US9754591B1 (en) * 2013-11-18 2017-09-05 Amazon Technologies, Inc. Dialog management context sharing
US9195656B2 (en) 2013-12-30 2015-11-24 Google Inc. Multilingual prosody generation
US9614969B2 (en) * 2014-05-27 2017-04-04 Microsoft Technology Licensing, Llc In-call translation
US9740689B1 (en) * 2014-06-03 2017-08-22 Hrl Laboratories, Llc System and method for Farsi language temporal tagger
KR101635144B1 (ko) * 2015-10-05 2016-06-30 주식회사 이르테크 텍스트 시각화와 학습자 말뭉치를 이용한 언어학습 시스템
US20180018973A1 (en) 2016-07-15 2018-01-18 Google Inc. Speaker verification
US9747282B1 (en) 2016-09-27 2017-08-29 Doppler Labs, Inc. Translation with conversational overlap
CN108447348A (zh) * 2017-01-25 2018-08-24 劉可泰 语言学习的方法
US11144810B2 (en) 2017-06-27 2021-10-12 International Business Machines Corporation Enhanced visual dialog system for intelligent tutors
US10841755B2 (en) 2017-07-01 2020-11-17 Phoneic, Inc. Call routing using call forwarding options in telephony networks
CN108090053A (zh) * 2018-01-09 2018-05-29 亢世勇 一种语言转换输出装置及方法
CN108563641A (zh) * 2018-01-09 2018-09-21 姜岚 一种方言转换方法及装置
US10423727B1 (en) 2018-01-11 2019-09-24 Wells Fargo Bank, N.A. Systems and methods for processing nuances in natural language
US11836454B2 (en) 2018-05-02 2023-12-05 Language Scientific, Inc. Systems and methods for producing reliable translation in near real-time
US11763821B1 (en) * 2018-06-27 2023-09-19 Cerner Innovation, Inc. Tool for assisting people with speech disorder
US10740545B2 (en) * 2018-09-28 2020-08-11 International Business Machines Corporation Information extraction from open-ended schema-less tables
US10902219B2 (en) * 2018-11-21 2021-01-26 Accenture Global Solutions Limited Natural language processing based sign language generation
US11250842B2 (en) * 2019-01-27 2022-02-15 Min Ku Kim Multi-dimensional parsing method and system for natural language processing
KR101986345B1 (ko) * 2019-02-08 2019-06-10 주식회사 스위트케이 기계독해 성능향상을 위해 표·이미지에 메타 문장을 생성하는 장치
CN111931523A (zh) * 2020-04-26 2020-11-13 永康龙飘传感科技有限公司 在新闻播报实时翻译文字和手语的方法和系统
US11620328B2 (en) 2020-06-22 2023-04-04 International Business Machines Corporation Speech to media translation
CN111738023A (zh) * 2020-06-24 2020-10-02 宋万利 一种图文音频自动翻译方法及其系统
CN112184858B (zh) * 2020-09-01 2021-12-07 魔珐(上海)信息科技有限公司 基于文本的虚拟对象动画生成方法及装置、存储介质、终端
US20220237660A1 (en) * 2021-01-27 2022-07-28 Baüne Ecosystem Inc. Systems and methods for targeted advertising using a customer mobile computer device or a kiosk

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02121055A (ja) * 1988-10-31 1990-05-08 Nec Corp 点字ワードプロセッサ装置
US5510981A (en) * 1993-10-28 1996-04-23 International Business Machines Corporation Language translation apparatus and method using context-based translation models
US6022222A (en) * 1994-01-03 2000-02-08 Mary Beth Guinan Icon language teaching system
AUPP960499A0 (en) * 1999-04-05 1999-04-29 O'Connor, Mark Kevin Text processing and displaying methods and systems
JP2001142621A (ja) * 1999-11-16 2001-05-25 Jun Sato エジプト象形文字を用いた文字通信
AU2001250050A1 (en) * 2000-03-24 2001-10-08 Eliza Corporation Remote server object architecture for speech recognition

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016218618A (ja) * 2015-05-18 2016-12-22 沖電気工業株式会社 取引装置
JPWO2017072915A1 (ja) * 2015-10-29 2018-07-12 株式会社日立製作所 視覚情報と聴覚情報の同期方法および情報処理装置
JP2019514131A (ja) * 2016-05-09 2019-05-30 ネイバー コーポレーションNAVER Corporation 顔文字が共に提供される翻訳文提供方法、ユーザ端末、サーバ及びコンピュータプログラム

Also Published As

Publication number Publication date
JP4448450B2 (ja) 2010-04-07
WO2004053725A1 (en) 2004-06-24
AU2003223701A1 (en) 2004-06-30
TWI313418B (en) 2009-08-11
KR20050086478A (ko) 2005-08-30
TW200416567A (en) 2004-09-01
US20040111272A1 (en) 2004-06-10
CN1742273A (zh) 2006-03-01
EP1604300A1 (en) 2005-12-14

Similar Documents

Publication Publication Date Title
JP4448450B2 (ja) 多モードの音声言語翻訳及び表示
CN109256133A (zh) 一种语音交互方法、装置、设备及存储介质
Dhanjal et al. An automatic conversion of Punjabi text to Indian sign language
Dhanjal et al. An optimized machine translation technique for multi-lingual speech to sign language notation
Al-Barahamtoshy et al. Arabic text-to-sign (ArTTS) model from automatic SR system
JP7117629B2 (ja) 翻訳装置
López-Ludeña et al. LSESpeak: A spoken language generator for Deaf people
JP2002244842A (ja) 音声通訳システム及び音声通訳プログラム
Reddy et al. Indian sign language generation from live audio or text for tamil
KR20210073856A (ko) 휴대용 수화 번역기 및 수화 번역 방법
US20230069113A1 (en) Text Summarization Method and Text Summarization System
Kumar et al. Development of a speech to Indian sign language translator
Gayathri et al. Sign language recognition for deaf and dumb people using android environment
WO2023059818A1 (en) Acoustic-based linguistically-driven automated text formatting
JP2005128711A (ja) 感性情報推定方法および文字アニメーション作成方法、これらの方法を用いたプログラム、記憶媒体、感性情報推定装置、文字アニメーション作成装置
Goyal et al. Text to sign language translation system: a review of literature
CN105702130A (zh) 手语翻译器
WO2022118720A1 (ja) 画像と文字との混在文章を生成する装置
Gayana et al. Enhancing Communication through Speech to Sign Language Converter
Asif et al. ASSISTIVE COMMUNICATION FOR BLIND.
Oak et al. RETRACTED CHAPTER: Literature Review on Sign Language Generation
Chypak et al. AUDIO READING ASSISTANT FOR VISUALLY IMPAIRED PEOPLE
Joy et al. Speech to Sign Language Converter
Regulwar et al. Audio to Sign Language Translator
Moradi et al. A Review of Sign Language Systems

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060419

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061010

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061213

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20061213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20061213

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070404

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070522

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20070601

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20100113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100122

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130129

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees