JP2003532194A - 言語間リーディングウィザードを用いたコンピュータ援用リーディングシステムおよび方法 - Google Patents

言語間リーディングウィザードを用いたコンピュータ援用リーディングシステムおよび方法

Info

Publication number
JP2003532194A
JP2003532194A JP2001579130A JP2001579130A JP2003532194A JP 2003532194 A JP2003532194 A JP 2003532194A JP 2001579130 A JP2001579130 A JP 2001579130A JP 2001579130 A JP2001579130 A JP 2001579130A JP 2003532194 A JP2003532194 A JP 2003532194A
Authority
JP
Japan
Prior art keywords
translation
text
user
computer
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001579130A
Other languages
English (en)
Other versions
JP2003532194A5 (ja
Inventor
シュン エントン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2003532194A publication Critical patent/JP2003532194A/ja
Publication of JP2003532194A5 publication Critical patent/JP2003532194A5/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 母国語以外の言語で読んでいるユーザが支援を必要としているときに、ユーザにテキストから気を逸らすことを要求せずに、ユーザの支援を提供するコンピュータ援用リーディングシステム。一実施形態において、リーディングシステムはブラウザプログラムに対するリーディングウィザードとして実装される。リーディングウィザードは、ユーザが母国語以外のテキスト内の単語、句、文、または他の単語のグループを選択し、選択されたテキストのユーザ自身の母国語での翻訳を見ることを可能にする。翻訳は選択されたテキストの近くに配置されたウインドウまたはポップアップボックス内に提供され、気を逸らすことを最小限にする。

Description

【発明の詳細な説明】
【0001】 (関連出願) 本出願は、2000年4月24日に提出された米国仮出願60/199,28
8に由来し、またその優先権を主張するものであり、その開示内容は参照により
本明細書に明白に組み込まれている。本出願は、2000年4月24日に提出さ
れた米国特許出願09/556,229にも関連し、その開示内容は参照により
本明細書に組み込まれている。
【0002】 (発明の分野) 本発明はコンピュータ援用リーディング(reading)システムおよび方法に関
する。より詳細には、本発明はユーザが母国語以外の(non-native)言語で読む
ことを支援するユーザインタフェースおよび基本的なアーキテクチャに関する。
【0003】 (発明の背景) インターネットの急速な発展により、世界中のコンピュータユーザはますます
母国語以外の言語で書かれた文書に触れるようになっている。多くのユーザは母
国語以外の言語が全く分からない。母国語以外の言語でいくらか訓練を受けてい
るユーザにとってさえ、そのユーザが母国語以外の言語を読み、理解することは
しばしば困難である。
【0004】 英語で書かれたウェブページあるいは他の電子文書をアクセスする中国人のユ
ーザの立場を考えよう。その中国人のユーザは在学中に英語でいくらか正規の教
育を受けているかもしれない。しかし、そのような教育は、彼らが英語で書かれ
た特定の単語、句、あるいは文を完全に読み、理解することを可能にするには多
くの場合不十分である。中国語−英語の状況は問題を示すための単なる一例とし
て使用したに過ぎない。この問題は、他の言語の境界を超えて存続している。
【0005】 従って、本発明は、コンピュータのユーザが母国語以外の言語で提供された電
子文書を読み、理解することを助ける機械援用リーディングシステムおよび方法
の提供に関連する懸念から生じたものである。
【0006】 (発明の概要) コンピュータ援用リーディングシステムは、母国語以外の言語で読んでいるユ
ーザに対し、そのユーザが助けを必要としているときに、そのユーザにテキスト
から注意を逸らすことを要求することなしに、支援を提供する。
【0007】 一実施態様では、リーディングシステムはブラウザプログラムに対するリーデ
ィングウィザードとして実装される。リーディングウィザードは、ユーザが母国
語以外の言語で書かれたテキスト内の単語、句、文または単語のグループを選択
し、ユーザ自身の母国語で書かれた選択されたテキストの翻訳を見ることを可能
にするグラフィカル・ユーザ・インタフェースを介して与えられる。翻訳は、選
択されたテキストの近くに配置されたウインドウまたはポップアップボックス内
に提供されて、気を散らすことを最小限にする。
【0008】 一形態において、リーディングウィザードのコアは、シャローパーサ(shallo
w parser)、統計的単語翻訳セレクタ、および翻訳ジェネレータを含む。シャロ
ーパーサは、ユーザが選択した母国語以外のテキストの句または文を構文解析し
、個々の翻訳単位(translation unit)(例えば句、単語)にする。一実施態様
において、シャローパーサは選択されたテキスト内の単語をセグメント化し、そ
れらを形態的に処理して各単語の形態的語根(morphological root)を取得する
。シャローパーサは品詞(POS)タグ付けおよび単名詞句(baseNP)を使用して
、さらなる翻訳の選択のため単語および句を特徴付けする。POSタグ付けおよびb
aseNP識別は、例えば統計的モデルにより実行することができる。シャローパー
サは、単語に対しルールベースの(rule-based)句拡張(phrase-extension)お
よびパターンマッチングを適用し、ツリーリストを生成する。
【0009】 統計的単語翻訳セレクタは、母国語以外のテキストから構文解析された翻訳単
位に対する最上位候補の単語の翻訳を選択する。単語翻訳セレクタは、全ての可
能な翻訳パターンを生成し、統計的翻訳および言語モデルを使用して翻訳単位を
翻訳する。最上位候補の翻訳が出力される。
【0010】 翻訳ジェネレータは候補の単語の翻訳を母国語の対応する句に翻訳する。翻訳
ジェネレータは、一部に母国語モデルを使用して適切な翻訳の決定を助ける。そ
して、母国語の単語および句は、選択されたテキストに近接して、UIを介して提
供される。
【0011】 (好ましい実施形態の詳細な説明) 概要 コンピュータ援用リーディングシステムはユーザが母国語以外の言語を読むこ
とを援助する。議論のため、コンピュータ援用リーディングシステムは汎用コン
ピュータにより実行されるブラウザプログラムの一般的なコンテキストにおいて
説明される。しかし、コンピュータ援用リーディングシステムは、ブラウジング
(例えば電子メールシステム、ワードプロセッシング等)以外の多くの異なる環
境に実装することができ、また多くの異なるタイプのデバイスで実行できる。
【0012】 後述する実施形態は、母国語でより快適なコミュニケーションを行うユーザが
、母国語以外の言語の電子文書を広範囲に、早く、便利に読むことを可能にし、
ある意味では主題への焦点合わせおよび素早い吸収を促進する。ユーザの便宜は
、翻訳されるテキストに近接した翻訳ウインドウ用いたユーザインタフェースを
提供することにより向上する。翻訳ウインドウは翻訳されるテキストの翻訳を含
んでいる。翻訳されたテキストに近接した翻訳ウインドウを配置することにより
、ユーザの眼は翻訳されたテキストを確かめるために非常に遠くへ移動すること
を要求されない。これは、結果として、このようにしなければ、例えばユーザが
翻訳されたテキストを見るために遠くを一瞥することを要求される場合に存続す
るかもしれないユーザが知覚する気を散らすものを減少させる。
【0013】 ある実施形態では、マウスポイント翻訳プロセスによって、ユーザの対話がさ
らに向上する。ユーザは、マウスの位置を定めてテキストの部分を選択すること
によりそれらの選択を素早く行うことが可能であり、システムは翻訳を自動的に
実行し、ユーザに翻訳されたテキストを提供する。
【0014】 例示のシステムアーキテクチャ 図1は、中央処理装置(CPU)102、メモリ104、および入出力(I/O)イ
ンタフェース106を有する例示のコンピュータシステムを示す。CPU102は
メモリ104および入出力I/Oインタフェース106と通信する。メモリ104
は揮発性メモリ(例えばRAM)および不揮発性メモリ(例えばROM、ハードディス
ク等)を表している。プログラム、データ、ファイルは、メモリ104に格納さ
れ、CPU102上で実行できる。
【0015】 コンピュータシステム100は、I/Oインタフェース106を介して接続され
た1または複数の周辺装置を有する。例示の周辺装置は、マウス110、キーボ
ード112(例えば英数字QWERTYキーボード、phoneticキーボード)、ディスプ
レイモニタ114、プリンタ116、周辺記憶装置118、およびマイクロホン
120を含む。コンピュータシステムは、例えば汎用コンピュータとして実装で
きる。よって、コンピュータシステム100は、メモリ104に格納されてCPU
102上で実行されるコンピュータオペレーティングシステム(図示せず)を実
装する。オペレーティングシステムは、ウインドウ環境を支援するマルチタスク
オペレーティングシステムであることが好ましい。適切なオペレーティングシス
テムの一例はマイクロソフト社のウインドウズ(R)ブランドのオペレーティン
グシステムである。
【0016】 ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベー
スまたはプログラマブル消費者電子機器、ネットワークPC、ミニコンピュータ、
メインフレームコンピュータ等のような他のコンピュータシステム構成が使用で
きることに留意されたい。また、図1にはスタンドアロンのコンピュータが示さ
れているが、言語入力システムは、通信ネットワーク(例えばLAN、インターネ
ットなど)を通じてリンクされたリモートプロセッシングデバイスによりタスク
が実行される分散コンピューティング環境で実施することができる。分散コンピ
ューティング環境では、プログラムモジュールはローカルの記憶装置およびリモ
ートの記憶装置の両方に配置することができる。
【0017】 例示のリーディングシステム コンピュータシステム100は、ユーザが母国語以外の言語を読むことを支援
するリーディングシステム130を実装する。リーディングシステムは、単語、
句または文レベルで支援を提供することができる。リーディングシステムは、図
1においてメモリ104に格納されてCPU102上で実行されるブラウザプログ
ラムとして実装されている。後述するリーディングシステムは、ブラウザコンテ
キスト以外のコンテキストにおいて実施できることが認められ、理解されること
になる。
【0018】 リーディングシステム130は、ユーザインタフェース134および言語間リ
ーディングウィザード136を有する。UI134は、言語間リーディングウィザ
ード136を与える。ブラウザプログラム132はリーディングシステムに加え
て他の構成要素を含むことができるが、そのような構成要素はブラウザプログラ
ムにとって標準と考えられ、図示されることも、あるいは詳細に説明されること
もないであろう。
【0019】 リーディングウィザード136は、シャローパーサ140、統計的単語翻訳セ
レクタ142および翻訳ジェネレータ144を含む。
【0020】 例示のシャローパーサ シャローパーサ140は選択される母国語以外のテキストの句または文を構文
解析し個々の翻訳ユニット(例えば句、単語)にする。
【0021】 図2は、一実施形態による多少詳細なシャローパーサ140を示す。シャロー
パーサは適当なハードウェア、ソフトウェア、ファームウェアまたはそれらの結
合のいずれでも実装することができる。例示のおよび説明する実施形態において
、シャローパーサはソフトウェアで実装される。
【0022】 図示のように、シャローパーサ140は、単語セグメントモジュール200、
形態的アナライザ202、品詞(POS)タグ付け/単名詞句識別モジュール20
4、句拡張モジュール206、およびパターンまたはテンプレートマッチングモ
ジュール208を備えている。これらの構成要素は個別の構成要素として示され
ているが、構成要素は互いにまたは他の構成要素と結合できることが認められ、
理解されるであろう。
【0023】 説明する実施形態によれば、シャローパーサ140はユーザにより選択されて
いるテキスト内の複数の単語をセグメント化する。これは、セグメントモジュー
ル200を使用して行われる。次に、シャローパーサは形態的アナライザ202
を使用して単語を形態的に処理し、各単語の形態的語根を取得する。形態的アナ
ライザは、各単語の形態的語根を見つけるために、単語に種々の形態的ルールを
適用することができる。形態的アナライザ202が使用するルールは、分析され
る特定の言語に熟練した人により開発されることができる。例えば、英語での1
つのルールは、「ed」で終わる単語の形態的語根は「d」または「ed」のいずれ
かを除去することにより形成されるというものである。
【0024】 シャローパーサ140は、品詞(POS)タグ付け/単名詞句(baseNP)識別モ
ジュール204を使用してさらなる翻訳の選択に対して単語および句を特徴付け
る。POSタグ付けおよび単名詞句識別は、例えば、すぐ後で「POSタグ付けおよび
baseNP識別」と題された節でその例が後述される統計的モデルにより実行するこ
とができる。シャローパーサ140は句拡張モジュール206を使用して、POS
タグ付け/単名詞句識別モジュール204により特徴付けられた単語に対してル
ールベースの句拡張を実施する。句拡張モジュールの1つの目標は、単名詞句を
より複雑な名詞句に拡張することである。例えば、「baseNPのbaseNP」は、「ba
seNP」句のより複雑な名詞句である。シャローパーサ140はパタニングまたは
テンプレートマッチングモジュール208も使用して、ツリーリストを生成する
。パタニングまたはテンプレートマッチングモジュールは翻訳に使用され、ある
句の翻訳がパターン依存で、かつ句の中の単語に直接には関係しないことを理解
する。例えば、「baseNPに興味がある」という句は、翻訳に対するより複雑な翻
訳ユニットを形成するために使用されるパターン(即ち「baseNP」)を含んでい
る。単語“be interested in”は、より複雑な翻訳単位を形成するために使用さ
れるパターンに直接には関係しない。
【0025】 POSタグ付けおよびbaseNP識別 以下の議論は、英語のbaseNP(名詞句)の自動識別のための統計的モデルにつ
いて説明し、ツリーリストが生成できるように選択されたテキストを処理する単
なる一方法を構成している。後述の手法は2つのステップを使用する。N個の最
良品詞(POS)タグ付け(N-best Part-Of-Speech tagging)および所与のN個の
最良POS列のbaseNP識別である。後述するモデルはまた、辞書の情報も統合する
。結局、全体のプロセスに対して直線的な複雑さ(linear complexity)が得ら
れることを許容する全体の文においてグローバルな調査を行うために、ビタビア
ルゴリズムが用いられる。
【0026】 単純で、非帰納的な単名詞句(baseNP)を見つけることは、部分的な構文解析
、情報検索よび機械翻訳などの多くの自然言語処理アプリケーションに対する重
要なサブタスクである。baseNPは、他の名詞句を帰納的に含まない単純な名詞句
である。例えば、後述の例における[...]の中の構成要素はbaseNPであり、
ここでNNS、IN VBG等は品詞(POS)タグである。POSタグは周知であり、Marcus
他、Building a Large Annotated Corpus of English : the Penn Treebank, Co
mputational Linguistics, 19(2) : 313-330, 1993で説明されている。
【0027】 [Measures/NNS] of/IN [manufacturing/VBG activity/NN] fell/VBD more/RBR t
han/IN [the/DT overall/JJ measures/NNS] ./.
【0028】 統計的手法 本節では、2点通過統計モデル(two-pass statistical model)、パラメータ
のトレーニング、ならびにPOSタグ付けおよびbaseNP識別の最良列の調査のため
のビタビアルゴリズムを説明する。アルゴリズムを説明する前に、全体を通して
使用されるいくつかの表記法を紹介する。
【0029】 単語列としての入力文E、およびPOSの列を、それぞれ以下のように表現しよう
【0030】 E=w1 w2 wn-1 wn T=t1 t2 tn-1 tn
【0031】 ここで、nは文の中の単語の数であり、tiは単語wiのPOSタグである。
【0032】 Eが与えられると、baseNP識別の結果は列であると仮定され、いくつかの単語
は以下のようにbaseNPにグループ化される。
【0033】 wi-1 [wi wi+1 wj] wj+1…
【0034】 対応するタグ列は以下のようになる。
【0035】 (a) B=ti-1 [ti ti+1 tj] tj+1… =ti-1 bi,j tj+1 =n1 n2 nm
【0036】 ここでbi,jは、baseNPのタグ列に対応する。[ti ti+1… tj]・bi,jがbase
NPルールとみなされる場合もある。このため、BはPOSタグ付けおよびbaseNPルー
ルの用法の列である。従って1≦m≦n、ni∈(POSタグのセット∪baseNPルール
セット)である。これは、baseNP表記がなされた文の第1の表現である。ときど
き、以下のような同等の形式も使用される。
【0037】 (b) Q=(ti-1,bmi-1) (ti,bmi) (ti+1,bmi+1) (tj,bmj) (tj+1,bmj+1) =q1 q2… qn
【0038】 ここで、baseNPに関して各POSタグtiはその位置情報bmiと関連付けられている
。位置情報は{F,I,E,O,S}の1つである。F、EおよびIはそれぞれ、単語が
baseNPの左の境界、baseNPの右の境界、またはbaseNP内の別の位置にあることを
意味する。Oは単語がbaseNPの外にあることを意味する。Sは1つの単語のbaseNP
を示す。
【0039】 例えば、上で与えられた例の2つの表現は以下のようになる。
【0040】 (a) B=[NNS] IN [VBG NN] VBD RBR IN [DT JJ NNS] (b) Q=(NNS S)(IN O)(VBG F)(NN E)(VBD O)(RBR O)(IN O)(DT F)(JJ I)(NNS E)
(. O)
【0041】 「統合された」2点通過処理 説明される手法の原理は以下のとおりである。最も可能性のあるbaseNP列B*
一般に以下のように表現することができる。
【0042】
【数1】
【0043】 処理全体は、2つのパス(pass)に分離される。即ち、
【0044】
【数2】
【0045】 探索空間および計算の複雑さを減少させるには、EのN個の最良POSタグ付けを
考慮するだけでよい。即ち、
【0046】
【数3】 従って、
【0047】
【数4】 を得る。
【0048】 相応して、アルゴリズムは2つのステップからなる。式(2)を使用してN個
の最良のPOSタグ付けを決定すること、次いで式(3)を使用してそれらのPOS列
から最良のbaseNP列を決定することである。2つのステップは他の手法内にある
ように分離されるのではなく、統合される。ここで、2つのステップをより厳密
に考察しよう。
【0049】 N個の最良POS列の決定 第1のパスにおけるアルゴリズムの目標は、探索空間(POS格子)内でN個の最
良POS列を探索することである。Bayesのルールによれば、
【0050】 P(T|E)=P(E|T)×P(T)/P(E)
【0051】 が得られる。
【0052】 P(E)はP(T|E)の最大化処理に作用しないので、式(2)は
【0053】
【数5】 となる。
【0054】 いま、E内の単語が独立であると仮定する。従って、
【0055】
【数6】
【0056】 次いで、P(T)の近似としてトライグラムモデルを使用する。即ち、
【0057】
【数7】 最終的に、
【0058】
【数8】 が得られる。
【0059】 Nの最良探索のビタビアルゴリズムにおいて、P(wi|ti)は辞書の生成(また
は出力)率、P(ti|ti-2,ti-1)は隠れマルコフモデル(Hidden Markov Model
)における遷移率と呼ばれる。ビタビアルゴリズムはViterbi、Eror Bounds for
Convolution Codes and Asymptotically Optimum Decoding Algorithm, IEEE T
ransactions on Information Theory IT-13(2):pp.260-269, April, 1967で説明
されている。
【0060】 baseNPの決定 前に述べたように、第2のパスの目標は、N個の最良POS列が与えられた最良ba
seNP列を探索することである。
【0061】 E、TおよびBを任意の変数と考慮すると、Bayesのルールによれば、
【0062】 P(B|T,E)=P(B|T)×P(E|B,T)/P(E|T) P(B|T)=P(T|B)×P(B)/P(T)なので、 P(B|T,E)=P(E|B,T)×P(T|B)×P(B)/(P(E|T)×P(T)) (8)
が得られる。
【0063】 所与の文Eの可能なPOS列の各々に対する最良baseNP列が探索されるので、P(E
|T)×P(T)=P(E∩T)=constである。さらに、Bの定義から、各探索処理の
間、
【0064】
【数9】
【0065】 が得られる。従って、式(3)は
【0066】
【数10】 となる。
【0067】 独立性の仮定 (independence assumption)を使用して、
【0068】
【数11】 が得られる。
【0069】 P(B)のトライグラム近似を使用して、
【0070】
【数12】 が得られる。
【0071】 最終的に、
【0072】
【数13】 が得られる。
【0073】 要約のため、第1ステップで、POSタグ付け処理においてビタビN−最良探索ア
ルゴリズム(Vitervi N-best searching algorithm)を適用し、以下のように計
算して各POS列に対する経路確率(path probability)ftを決定する。
【0074】
【数14】
【0075】 第2ステップにおいて、可能なPOSタグ付け結果の各々に対し、ビタビアルゴリ
ズムを再び適用して最良のbaseNP列を探索する。このパスで見つけられるどのba
seNP列も、経路確率
【0076】
【数15】
【0077】 に関連付けられている。baseNP列の統合された確率はft α×fbによって決定され
る。ここで、αは正規化係数(実験ではα=2.4)である。所与の文Eに対す
る最良baseNP列を決定する場合、Eの最良baseNPに対応するEの最良POS列も決定
する。
【0078】 これが動作できる方法の例として、次のテキスト“stock was down 9.1 point
s yesterday morning.(昨日の朝、株が9.1ポイント下がった。)”を考慮さ
れたい。第1のパスにおいて、この文のN−最良POSタグ付けの結果の1つがT=N
N VBD RB CD NNS NN NNである。
【0079】 このPOS列に対し、第2のパスは図3に示すようにbaseNPを決定しようと試み
るであろう。破線の経路の詳細は図4に与えられている。第2のパスにおいて計
算されるその確率は、以下のとおりである(Φは擬変数である)。
【0080】 P(B|T,E)=p(stock|NN,S)×p(was|VBD,O)×p(down|RB,O)×p(NUMBER|CD,B)×p(po
ints|NNS,E)×p(yesterday|NN,B)×p(morning|NN,E)×p(.|.,O)×p([NN]|Φ,Φ)
×p(VBD|Φ,[NN])×p(RB|[NN],VBD)×p([CD NNS]|VBD,RB)×p([NN NN]|RB,[CD N
NS])×p(.|[CD NNS],[NN NN])
【0081】 統計的パラメータトレーニング この動作において、トレーニングおよびテストデータはPenn Treebankの25
節から導出された。Penn Treebankデータ全体は2つに分けた。一方がトレーニ
ング用であり、他方がテスト用である。
【0082】 出願人の統計的モデルにおいては、次の4つの確率を計算する。(1)P(ti
|ti-2,ti-1)、(2)P(wi|ti)、(3)P(ni|ni-2ni-1)および(4)P
(wi|ti,bmi)である。第1および第3のパラメータはそれぞれTおよびBのト
ライグラムである。第2および第4は辞書の生成確率である。確率(1)および
(2)はPOSタグ付けデータから以下の式を使用して計算できる。
【0083】
【数16】
【0084】
【数17】
【0085】 トレーニングセット内の各文はPOSタグおよびbaseNP境界タグの両方を持って
いるので、最後の節で説明したB(a)およびQ(b)のように2つの列に変換され
る。それらの列を使用して、パラメータ(3)および(4)は等式(13)およ
び(14)にそれぞれ類似する計算式により計算できる。
【0086】 トライグラムモデル(3)をトレーニングする前に、全ての可能なbaseNPルー
ルがトレーニングコーパスから抽出されるべきである。例えば、以下の3つの列
は抽出されたbaseNPルールの中にある。
【0087】 (1)DT CD CD NNPS (2)RB JJ NNS NNS (3)NN NN POS NN … …
【0088】 Penn Treebankには、6,000以上のbaseNPルールがある。トライグラムモ
デル(3)をトレーニングするとき、出願人は、それらのbaseNPルールを2日で
処理する。第1に、各baseNPルールに固有の識別子(UID)が割り当てられる。
これは、アルゴリズムが各baseNPルールの対応する構造を考慮することを意味す
る。第2に、それらのルールの全てが同じ識別子(SID)に割り当てられる。こ
の場合、それらのルールは同じクラスにグループ化される。それにもかかわらず
、baseNPの識別子はまだPOSタグに割り当てられた識別子と異なっている。
【0089】 パラメータの平滑化のため、Katz,Estimation of Probabilities from Spars
e Data for Language Model Component of Speech Recognize, IEEE Transactio
ns on Acoustics, Speech, and Signal Processing, Volume ASSP-35, pp.400-4
01, March 1987 に説明されたような手法を使用した。トライグラムモデルを組
み立てて、パラメータ(1)および(3)の確率を予測した。baseNP識別の間未
知の単語に出会う場合、以下の方法でパラメータ(2)および(4)が計算され
る。
【0090】
【数18】
【0091】
【数19】
【0092】 ここで、bmjはtiに付けられた全ての可能なbaseNPを示し、tjは未知の単語wi
に対して推量されるPOSタグである。
【0093】 図5は一実施形態による方法のステップを説明する流れ図である。このステッ
プは適切なハードウェア、ソフトウェア、ファームウェアまたはそれらの結合の
いずれにも実装することができる。このようなソフトウェアの1つの詳細な実施
形態を、ブラウザプログラム132(図1)の一部を形成する上述した言語間ラ
イティングウィザードに見ることができる。より詳細には、説明すべき方法は図
2に図示され説明されたようなシャローパーサにより実装することができる。
【0094】 ステップ500は選択されたテキストを受け取る。このステップは翻訳される
べきテキストの部分を選択するユーザに関連して実装される。一般に、ユーザは
マウスなどのような入力デバイスを使用してテキストを選択する。ステップ50
2では選択されたテキスト内の単語をセグメント化する。当業者により認められ
るであろう任意の適切なセグメンテーション処理を実行することができる。ステ
ップ504では各単語の形態的語根を取得する。図示され説明された実施形態に
おいて、このステップは図2に示されたもののような形態的アナライザにより実
装される。図示された例において、形態的アナライザは、英語で書かれた単語を
処理するように構成される。しかしながら、どのような適切な言語でも形態的ア
ナライザを組み立てる基礎を提供できることが認められ、理解されるべきである
【0095】 ステップ506では、品詞(POS)タグ付けおよび単名詞句識別を使用して単
語を特徴付ける。どのような適切な技法を使用できる。1つの例示の技法は上記
の「POSタグ付けおよびbaseNP識別」という説で詳述した。ステップ508では
特徴付けられた単語にルールベースの句拡張およびパターンマッチングを適用し
、ツリーリストを生成する。上述の例において、このステップは句拡張モジュー
ル206、およびパターンまたはテンプレートマッチングモジュール208を使
用して実装された。ステップ510ではさらなる処理に対するツリーリストを出
力する。
【0096】 ツリーリストの例として、図6を考えよう。そこでは、文「The Natural Lang
uage Computing Group at Microsoft Research China is exploring research i
n advanced natural language technologies(マイクロソフトリサーチチャイナ
の自然言語コンピューティンググループは高度な自然言語技術を探求している)
」は上記のように処理された。具体的には、ツリーリストはセグメント化され、
形態的に処理され、上述したPOSタグ付けおよびbaseNP技法を使用して特徴付け
られている文の個別の単語を説明する。例えば、構成要素600を考えよう。そ
こでは、単語「Natural(自然の)」は文および親の構成要素「natural languag
e」からセグメント化されている。構成要素600はまたPOSタグ「JJ」を使用し
て特徴付けられた。ツリー内の他の構成要素が同様に処理されている。
【0097】 例示の単語翻訳セレクタ 単語翻訳セレクタ142は、ツリーリストを受け取り、全ての可能な翻訳パタ
ーンを生成する。セレクタ142は、統計的翻訳および単語モデルを使用して構
文解析された翻訳単位を翻訳し、母国語のテキストにおける最上位候補の単語翻
訳を抽出する。最上位候補の翻訳が出力される。
【0098】 図7は、一実施形態による方法のステップを説明する流れ図である。この方法
は、適当なハードウェア、ソフトウェア、ファームウェアまたはそれらの結合の
いずれでも実施できる。図示され説明された実施形態において、この方法はソフ
トウェアにおいて実施される。このようなソフトウェアの一実施形態は単語翻訳
セレクタ142を備えることができる(図1)。
【0099】 ステップ700では、上述した処理に従って生成されたツリーリストを受け取
る。ステップ702ではツリーリストから翻訳パターンを生成する。一実施形態
において、全ての可能な翻訳パターンが生成される。例えば、英語から中国語へ
の翻訳に対し、英語の名詞句"NP1 of NP2"は、2種類の可能な翻訳を有すること
ができる。(1)T(NP1)+T(NP2)、および(2)T(NP2)+T(NP1)で
ある。句の翻訳において、翻訳される句は構文ツリーであり、一実施形態では、
全ての可能な翻訳順序が考慮される。次いで、ステップ704では翻訳モデルお
よび言語モデルを使用して、構文解析された翻訳単位を翻訳する。翻訳単位は単
語および句を備えることができる。ステップ704では、最上位N個の候補の単
語翻訳を出力する。最上位N個の候補の単語翻訳は、統計的モデルを使用して選
択することができる。
【0100】 例示の翻訳ジェネレータ 翻訳ジェネレータ144は、最上位N個の候補の単語翻訳を母国語における対
応する句に翻訳する。次いで、母国語の単語および句はUIを介して選択されたテ
キストに近接して提供される。
【0101】 図8は、一実施形態により多少詳細に翻訳ジェネレータ144を示す。最上位
の候補の単語を翻訳するため、翻訳ジェネレータは多数の異なるリソースを用い
ることができる。例えば、翻訳ジェネレータは、翻訳処理注で使用する辞書モジ
ュール800を含むことができる。当業者に明らかなように、辞書モジュール8
00は、単語辞書、句辞書、不規則な形態辞書(irregular morphology diction
ary)または一般に母国語の翻訳処理に使用される任意の他の辞書を含むことが
できる。当業者に理解しているであろうこのような辞書の操作および機能は、こ
こでは簡潔のためにさらに詳細には説明しない。
【0102】 翻訳ジェネレータ144は、翻訳処理において使用される多数のテンプレート
を含むテンプレートモジュール802を含むことができる。任意の適切なテンプ
レートを利用できる。例えば、翻訳処理において支援するための、いわゆる大規
模な句のテンプレート(large phrase template)を使用することができる。母
国語の翻訳において利用するためのテンプレートの操作が知られており、ここで
はさらに詳細には説明しない。
【0103】 翻訳ジェネレータ144は、翻訳処理を容易にするために使用される多数のル
ールを含むルールモジュール804を含むことができる。ルールは、翻訳の対象
である特定の言語に熟達した個人により起草された手書きのルール(hand-draft
ed rule)でもよい。ルールは翻訳、構文解析、翻訳パターンにおける統計的エ
ラーに関係する問題に対処するために起草することができる。ルールベースの翻
訳の原理は当業者に理解されるであろう。
【0104】 翻訳ジェネレータ144は翻訳処理に使用される1または複数の統計的モデル
806を含むことができる。使用できる統計的モデルは、特に翻訳が必要な言語
に関係する可能な母国語以外の言語および母国語の数が与えられたときに、広範
囲に変えることができる。統計的モデルは上述したPOSおよびbaseNP統計的パラ
メータに基づくことができる。英語から中国語へ翻訳することが必要な特定の実
装において、以下のモデルを使用することができる。中国語のトライグラム言語
モデルおよび中国語の相互情報モデルである。もちろん他のモデルも使用される
【0105】 上述のモジュールおよびモデルは別個にあるいは他方との様々な結合において
使用される。
【0106】 処理のこの時点で、ユーザは母国語へ翻訳すべき母国語以外の言語の部分を選
択している。選択されたテキストは上述したように処理されている。すぐ下の議
論において、ユーザにとって便利で効率のよい方法で翻訳されたテキストを提供
する方法およびシステムが提供される。
【0107】 リーディングウィザードユーザインタフェース 残りの議論は、リーディングウィザードを提供する場合のユーザインタフェー
ス134の特徴に向けられている。特に、リーディングウィザードユーザインタ
フェース134はユーザに、そのユーザが読んで理解する方法が不確かな、母国
語以外の言語で書かれたテキストを選択させる。選択は個々の単語、句または文
であってもよい。
【0108】 図9〜13は、ブラウザプログラムまたは他のコンピュータ援用リーディング
システムの一部としてユーザに提供されるグラフィカルUI(GUI)として実装さ
れる例示のリーディングウィザードユーザインタフェースを示す。例示のシステ
ムは、中国のユーザが英語のテキストを読む場合に支援するように設計されたリ
ーディングシステムを示す。英語のテキストはウィンドウ内に表示される。ユー
ザは英語のテキストの部分の選択することができる。ユーザの選択に応答して、
リーディングウィザードは選択されたものを中国語のテキストに翻訳し、ポップ
アップ翻訳ウインドウまたはスクロール可能なボックス内にその中国語のテキス
トを提供する。
【0109】 図9は、ハイライト表示されている「母国語以外の言語」のテキストの一部を
含むユーザインタフェース900を示す。ハイライト表示されたテキストは、ユ
ーザインタフェースの第1のエリア内に表示される。翻訳ウィンドウ902のフ
ォーム内のユーザインタフェースの第2のエリアは母国語のテキストの少なくと
もいくつかの部分の翻訳部分を表示するように構成される。この例において、ハ
イライト表示されたテキストは「research in advanced natural language tech
nologies(高度な自然言語技術における探索)」を含んでいる。この例において
、ユーザは単語“advanced”を選択しており、リーディングシステムはハイライ
ト表示された句の一部を含むように単語を自動的に決定している。次いで、リー
ディングシステムは、ハイライト表示された句の最良の翻訳を翻訳ウインドウ9
02に自動的に示す。ユーザが選択した単語を含む句を自動的に決定し、次いで
句に対する少なくとも1つの翻訳を提供することにより、読者には単語の翻訳だ
けでなく、単語が使用される翻訳されたコンテキストも提供される。これは読者
に、読んでいる資料の理解を結果として容易にすることが可能なより多くの翻訳
された情報を与えることができる利点がある。
【0110】 翻訳ウインドウ902は、ハイライト表示されたテキストの少なくとも一部分
の近くに配置されることに留意されたい。この方法で翻訳ウインドウを配置する
ことにより、ユーザは、翻訳されたテキストを見るためにハイライト表示された
テキストから非常に遠くに注意を逸らすことを要求されることがない。これは、
ユーザの読む処理を望ましくない程度に遅くすることがないので有利である。翻
訳ウインドウは、選択されたテキストの他の翻訳を見せるために使用できるドロ
ップダウンアロー904を含むことにも留意されたい。一例として、図10を考
慮されたい。ここで、翻訳ウインドウ902がドロップダウンされており、ハイ
ライト表示された句の全ての翻訳を表示している。
【0111】 図11は、翻訳ウインドウ1102を有するユーザインタフェース1100を
示す。ここで、リーディングシステムは、単語「generated」が句の中にないこ
とを自動的に検出し、単語「generated」のみを翻訳する。リーディングシステ
ムは、翻訳ウインドウ1102内に多数の最も見込みのある翻訳を提供すること
もできる。例えば、3つの例示の見込みのある翻訳が示されている。例示では、
表示された翻訳は文脈依存(context sensitive)であり、文脈に従って格納さ
れている。従って、この例において、リーディングシステムは、単語の可能な翻
訳全てではなく、単語の最上位n個のみを示す。図12はユーザインタフェース
1100を示し、ここでは翻訳ウインドウ1102において、単語「generated
」の可能な翻訳全てがユーザに提供される。
【0112】 図13は、上述した実施形態の1つの特徴を例示する翻訳ウインドウ1302
を有するユーザインタフェース1300を示す。具体的には、ユーザに、選択さ
れた単語を含む文全体が翻訳されることを要求するかどうか、または選択された
単語のみが翻訳されることを要求するかどうかに関する選択を与えることができ
る。この例において、ユーザは翻訳のために単語「advanced」を選択するように
マウスを配置している。単語「advanced」はより長い句の一部を備えているので
、リーディングシステムは選択された単語を含む句を自動的に翻訳し、次いでユ
ーザに上述したような選択を提供する。しかしながら、この場合ユーザはリーデ
ィングシステムに対し、選択された単語のみを翻訳してほしい。ユーザは例えば
単語の選択を行うときに「Ctrl」キーの押下のような任意の適切な方法でこれを
行うことができる。
【0113】 結論 上述した実施形態はユーザが母国語以外の言語を読むことを支援し、母国語で
コミュニケーションする方がより楽なユーザが、母国語以外の言語の電子文書を
、早く、便利にかつ対象の焦点化および素早い吸収を促進するように、広範囲に
読むことを可能にする。(翻訳されたテキストを含む)翻訳ウインドウを翻訳さ
れるテキストに近接して配置することにより、ユーザの眼が翻訳されたテキスト
を確かめるために遠くへ移動することは要求されない。これは結果として、そう
でなければ例えばユーザが翻訳されたテキストを見るために遠くを一瞥すること
を要求された場合に存続するであろうユーザの知覚可能な気を散らすものを減少
させる。いくつかの実施形態において、マウスポイント翻訳処理によって、ユー
ザの対話はさらに高められる。ユーザは、マウスを配置してテキストの一部を選
択することにより、素早くそれらの選択を行うことができ、そこでシステムは翻
訳および翻訳されたテキストのユーザへの提供を自動的に実行する。
【0114】 本発明を構造的特徴および/または方法論的ステップに特有の言語で説明した
が、添付のクレームで定義された本発明は説明された特定の特徴またはステップ
に制限されるべきではない。むしろ、特定の特徴およびステップは、特許請求の
範囲に記載された発明を実施する好ましい形態として開示されている。
【図面の簡単な説明】
【図1】 言語間のリーディングウィザードを用いたリーディングシステムを実装するコ
ンピュータシステムのブロック図である。
【図2】 一実施形態による例示のシャローパーサのブロック図である。
【図3】 一実施形態において発生する処理の理解に有用な図である。
【図4】 図3の理解に有用な図である。
【図5】 一実施形態による方法のステップを説明する図である。
【図6】 一実施形態において発生する処理の理解に有用な図である。
【図7】 一実施形態による方法のステップを説明する図である。
【図8】 一実施形態による例示の翻訳ジェネレータのブロック図である。
【図9】 一実施形態による例示のユーザインタフェースを示す図である。
【図10】 一実施形態による例示のユーザインタフェースを示す図である。
【図11】 一実施形態による例示のユーザインタフェースを示す図である。
【図12】 一実施形態による例示のユーザインタフェースを示す図である。
【図13】 一実施形態による例示のユーザインタフェースを示す図である。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE,TR),OA(BF ,BJ,CF,CG,CI,CM,GA,GN,GW, ML,MR,NE,SN,TD,TG),AP(GH,G M,KE,LS,MW,MZ,SD,SL,SZ,TZ ,UG,ZW),EA(AM,AZ,BY,KG,KZ, MD,RU,TJ,TM),AE,AG,AL,AM, AT,AU,AZ,BA,BB,BG,BR,BY,B Z,CA,CH,CN,CO,CR,CU,CZ,DE ,DK,DM,DZ,EE,ES,FI,GB,GD, GE,GH,GM,HR,HU,ID,IL,IN,I S,JP,KE,KG,KP,KR,KZ,LC,LK ,LR,LS,LT,LU,LV,MA,MD,MG, MK,MN,MW,MX,MZ,NO,NZ,PL,P T,RO,RU,SD,SE,SG,SI,SK,SL ,TJ,TM,TR,TT,TZ,UA,UG,UZ, VN,YU,ZA,ZW

Claims (62)

    【特許請求の範囲】
  1. 【請求項1】 ユーザに、母国語以外の言語のテキストを選択させ、該選択
    されたテキストの母国語の翻訳を見せるように構成されているユーザインタフェ
    ースと、 選択されたテキストを構文解析して個々の翻訳単位にするためのパーサ、 前記翻訳単位に対する候補の単語の翻訳を選択するための単語翻訳セレクタ
    、および 前記候補の単語の翻訳を、前記ユーザインタフェースを介して前記ユーザに
    提供可能な前記母国語の対応する単語または句に翻訳するための翻訳ジェネレー
    タを有する言語間リーディングウィザードと を具備することを特徴とするリーディングシステム。
  2. 【請求項2】 前記パーサは個々の単語を形態的に処理して各単語の形態的
    語根を取得する形態的アナライザを具備することを特徴とする請求項1に記載の
    リーディングシステム。
  3. 【請求項3】 前記パーサは識別子を用いて個々の単語ををタグ付けするた
    めの品詞/単名詞句識別モジュールを具備することを特徴とする請求項1に記載
    のリーディングシステム。
  4. 【請求項4】 前記品詞/単名詞句識別モジュールは統計的モデルを具備す
    ることを特徴とする請求項3に記載のリーディングシステム。
  5. 【請求項5】 前記パーサは個々の単語に句拡張ルールを適用するための句
    拡張モジュールを具備することを特徴とする請求項1に記載のリーディングシス
    テム。
  6. 【請求項6】 前記翻訳ジェネレータは候補の単語の翻訳を前記対応する単
    語または句に翻訳するための辞書モジュールを具備することを特徴とする請求項
    1に記載のリーディングシステム。
  7. 【請求項7】 前記辞書モジュールは単語の辞書を具備することを特徴とす
    る請求項6に記載のリーディングシステム。
  8. 【請求項8】 前記辞書モジュールは句の辞書を具備することを特徴とする
    請求項6に記載のリーディングシステム。
  9. 【請求項9】 前記辞書モジュールは不規則な形態構造の辞書を具備するこ
    とを特徴とする請求項6に記載のリーディングシステム。
  10. 【請求項10】 前記翻訳ジェネレータは、前記候補の単語の翻訳を前記対
    応する単語または句に翻訳するために使用可能な1または複数のテンプレートを
    具備するテンプレートモジュールを具備することを特徴とする請求項1に記載の
    リーディングシステム。
  11. 【請求項11】 前記翻訳ジェネレータは、母国語以外の言語を母国語に翻
    訳するための多数のルールを含むルールモジュールを具備することを特徴とする
    請求項1に記載のリーディングシステム。
  12. 【請求項12】 前記翻訳ジェネレータは、1または複数の統計的モデルを
    具備することを特徴とする請求項1に記載のリーディングシステム。
  13. 【請求項13】 ブラウザとして埋め込まれていることを特徴とする請求項
    1に記載のリーディングシステム。
  14. 【請求項14】 ユーザに、英語のテキストを選択させ、該選択されたテキ
    ストの中国語の翻訳を見せるように構成されているユーザインタフェースと、 選択されたテキストを構文解析して個々の翻訳単位にするためのパーサ、 前記翻訳単位に対する候補の単語の翻訳を選択するための単語翻訳セレクタ
    、および 前記候補の単語の翻訳を、前記ユーザインタフェースを介して前記ユーザに
    提供可能な中国語の対応する単語または句に翻訳するための翻訳ジェネレータを
    有する言語間リーディングウィザードと を具備することを特徴とするリーディングシステム。
  15. 【請求項15】 ブラウザとして埋め込まれていることを特徴とする請求項
    14に記載のリーディングシステム。
  16. 【請求項16】 ユーザに、母国語以外の言語のテキストを選択させ、該選
    択されたテキストの母国語の翻訳を見せるように構成されているユーザインタフ
    ェースであって、母国語のテキストは前記ユーザにより見ることが可能なポップ
    アップウインドウを具備するユーザインタフェースと、 前記ユーザにより選択されている母国語以外のテキストを受け取り、および 前記母国語以外の言語のテキストを前記母国語のテキストに自動的に翻訳す
    るように構成されている言語間リーディングウィザードと を具備することを特徴とするリーディングシステム。
  17. 【請求項17】 前記ポップアップウインドウは前記ユーザにより選択され
    ているテキストに近接して表示されることを特徴とする請求項16に記載のリー
    ディングシステム。
  18. 【請求項18】 前記ポップアップウインドウは多数の翻訳を表示できるよ
    うにスクロール可能であり、前記ユーザにより選択されているテキストに近接し
    て表示されることを特徴とする請求項16に記載のリーディングシステム。
  19. 【請求項19】 ブラウザとして埋め込まれていることを特徴とする請求項
    16に記載のリーディングシステム。
  20. 【請求項20】 コンピュータ援用リーディング方法であって、 ユーザインタフェースを介して母国語以外の言語のテキストをユーザに提供し
    、 前記ユーザにより選択されたテキストを受け取り、 前記ユーザにより選択された前記テキストを処理して、前記母国語以外の言語
    から母国語に翻訳されたテキストを提供し、 前記ユーザインタフェースを介して前記翻訳されたテキストを前記ユーザに提
    供することを具備することを特徴とするコンピュータ援用リーディング方法。
  21. 【請求項21】 前記処理することは、 前記テキストを構文解析して翻訳単位にし、 1または複数の翻訳単位に対する形態的語根を取得することを具備することを
    特徴とする請求項20に記載のコンピュータ援用リーディング方法。
  22. 【請求項22】 前記処理することは、 前記テキストを構文解析して翻訳単位にし、 品詞タグ付けおよび単名詞句識別を使用して翻訳単位を特徴付けることを具備
    することを特徴とする請求項20に記載のコンピュータ援用リーディング方法。
  23. 【請求項23】 前記処理することは、 前記テキストを構文解析して翻訳単位にし、 貧した具付けおよび単名詞句識別を使用して翻訳単位を特徴付け、 前記特徴付けられた翻訳単位にルールベースの句拡張およびパターンマッチン
    グを適用してツリーリストを提供することを具備することを特徴とする請求項2
    0に記載のコンピュータ援用リーディング方法。
  24. 【請求項24】 前記処理することは、前記ツリーリストに基づいて、前記
    母国語の候補の単語の翻訳を生成することをさらに具備することを特徴とする請
    求項23に記載のコンピュータ援用リーディング方法。
  25. 【請求項25】 前記処理することは、前記母国語の候補の単語の翻訳を前
    記母国語の対応する単語および/または句に翻訳することをさらに具備すること
    を特徴とする請求項24に記載のコンピュータ援用リーディング方法。
  26. 【請求項26】 プロセッサにより実行されたときに、コンピュータに請求
    項20に記載の方法を実行させるコンピュータ可読命令をその上に有することを
    特徴とする1または複数のコンピュータ可読媒体。
  27. 【請求項27】 前記列挙された動作はブラウザにより実行されることを特
    徴とする請求項20に記載のコンピュータ援用リーディング方法。
  28. 【請求項28】 1または複数のコンピュータ可読媒体と、 ブラウザを実装するように構成されている前記媒体に組み入れられたコードで
    あって、前記ブラウザは、 ユーザインタフェースを介して英語のテキストをユーザに提供し、 前記ユーザにより選択されたテキストを受け取り、 前記ユーザにより選択された前記テキストを処理して、英語から中国語に翻
    訳されたテキストを提供し、および 前記ユーザインタフェースを介して前記翻訳されたテキストを前記ユーザに
    提供するように構成されているコードと を具備することを特徴とするリーディングシステム。
  29. 【請求項29】 前記ブラウザは、同じ英語のテキストの多数の翻訳を前記
    ユーザに提供するように構成されていることを特徴とする請求項28に記載のリ
    ーディングシステム。
  30. 【請求項30】 前記ブラウザは、前記翻訳されたテキストを前記ユーザに
    より選択された英語のテキストに近接する翻訳ウインドウ内に提供するように構
    成されていることを特徴とする請求項28に記載のリーディングシステム。
  31. 【請求項31】 前記ブラウザは、同じ英語のテキストの多数の翻訳を前記
    ユーザにより選択された英語のテキストに近接する翻訳ウインドウ内に提供する
    ように構成され、前記翻訳ウインドウは前記多数の翻訳の少なくともいくつかを
    与えるドロップダウン機能を有することを特徴とする請求項28に記載のリーデ
    ィングシステム。
  32. 【請求項32】 ユーザインタフェースを介して英語のテキストをユーザに
    提供し、 前記ユーザにより選択されたテキストを受け取り、 前記ユーザにより選択された前記テキストを処理して、英語から中国語に翻訳
    されたテキストを提供し、および 前記ユーザインタフェースを介して前記翻訳されたテキストを前記ユーザに提
    供することを具備することを特徴とするコンピュータ援用リーディング方法。
  33. 【請求項33】 前記処理することは、 前記テキストを構文解析して翻訳単位にし、 1または複数の翻訳単位に対する形態的語根を取得することを具備することを
    特徴とする請求項32に記載のコンピュータ援用リーディング方法。
  34. 【請求項34】 前記処理することは、 前記テキストを構文解析して翻訳単位にし、 品詞タグ付けおよび単名詞句識別を使用して翻訳単位を特徴付けることを具備
    することを特徴とする請求項32に記載のコンピュータ援用リーディング方法。
  35. 【請求項35】 前記処理することは、 前記テキストを構文解析して翻訳単位にし、 品詞タグ付けおよび単名詞句識別を使用して翻訳単位を特徴付け、 前記特徴付けられた翻訳単位にルールベースの句拡張およびパターンマッチン
    グを適用してツリーリストを提供することを具備することを特徴とする請求項3
    2に記載のコンピュータ援用リーディング方法。
  36. 【請求項36】 前記処理することは、前記ツリーリストに基づいて、中国
    語の候補の単語の翻訳を生成することをさらに具備することを特徴とする請求項
    35に記載のコンピュータ援用リーディング方法。
  37. 【請求項37】 前記処理することは、前記候補の単語の翻訳を中国語の対
    応する単語および/または句に翻訳することをさらに具備することを特徴とする
    請求項36に記載のコンピュータ援用リーディング方法。
  38. 【請求項38】 プロセッサにより実行されたときに、コンピュータに請求
    項32に記載の方法を実行させるコンピュータ可読命令をその上に有することを
    特徴とする1または複数のコンピュータ可読媒体。
  39. 【請求項39】 ユーザインタフェースにより提供された母国語以外の少な
    くとも1つの単語をユーザに選択させ、 対応する句が前記選択された単語の1つに関連するかを自動的に決定し、およ
    び 少なくとも前記選択された単語の1つまたは複数の母国語の翻訳を提供し、ま
    たは、前記選択された単語に関連する対応する句がある場合には、前記対応する
    句の少なくとも1つの母国語の翻訳を提供することを具備することを特徴とする
    コンピュータ援用リーディング方法。
  40. 【請求項40】 前記提供することは、前記対応する選択された少なくとも
    1つの単語に近接する翻訳ウインドウ内に前記翻訳を提供することを具備するこ
    とを特徴とする請求項39に記載のコンピュータ援用リーディング方法。
  41. 【請求項41】 前記翻訳ウインドウは、多数の異なる翻訳を提供できるよ
    うにスクロール可能であることを特徴とする請求項40に記載のコンピュータ援
    用リーディング方法。
  42. 【請求項42】 前記提供することは多数の最も可能性の高い翻訳を提供す
    ることを具備することを特徴とする請求項39に記載のコンピュータ援用リーデ
    ィング方法。
  43. 【請求項43】 前記提供することは最も可能性のある翻訳をコンテキスト
    によりソートすることをさらに具備することを特徴とする請求項42に記載のコ
    ンピュータ援用リーディング方法。
  44. 【請求項44】 ユーザが句の一部を具備する選択された単語のみを翻訳す
    ることを要求していることを示すユーザ入力を受け、 前記選択された単語のみの1または複数の翻訳を提供することをさらに具備す
    ることを特徴とする請求項39に記載のコンピュータ援用リーディング方法。
  45. 【請求項45】 プロセッサにより実行されたときに、コンピュータに請求
    項39に記載の方法を実行させるコンピュータ可読命令をその上に有することを
    特徴とする1または複数のコンピュータ可読媒体。
  46. 【請求項46】 1または複数のコンピュータ可読媒体と、 ブラウザを実装するように構成されている前記メディア上に組み入れられたコ
    ードであって、前記ブラウザは、 ユーザインタフェースにより提供された少なくとも1つの英語の単語をユー
    ザに選択させ、 対応する句が前記選択された少なくとも1つの英語の単語に関連付けられて
    いるかを自動的に決定し、および 前記選択された少なくとも1つの英語の単語の1つまたは複数の中国語の翻
    訳を提供し、または、選択された少なくとも1つの英語の単語に関連付けられた
    対応する句がある場合には、中国語の前記対応する句の少なくとも1つの翻訳を
    提供するように構成されているコードと を具備することを特徴とするリーディングシステム。
  47. 【請求項47】 母国語以外の言語のテキストを表示するように構成されて
    いる第1のエリアと、 前記テキストの少なくともいくつかの母国語で翻訳された部分を表示するよう
    に構成されている第2のエリアと を具備することを特徴とする言語間ユーザインタフェース。
  48. 【請求項48】 前記第2のエリアは、翻訳のためにユーザにより選択され
    ている少なくともいくつかのテキストに近接して配置されていることを特徴とす
    る請求項47に記載の言語間ユーザインタフェース。
  49. 【請求項49】 前記母国語以外の言語は英語を具備し、前記母国語は中国
    語を具備することを特徴とする請求項47に記載の言語間ユーザインタフェース
  50. 【請求項50】 前記第2のエリアはポップアップウインドウを具備するこ
    とを特徴とする請求項47に記載の言語間ユーザインタフェース。
  51. 【請求項51】 前記ポップアップウインドウは追加の翻訳を表示するため
    のドロップダウン機能を具備することを特徴とする請求項50に記載の言語間ユ
    ーザインタフェース。
  52. 【請求項52】 前記第2のエリアは同じテキストの多数の異なる翻訳を表
    示することを特徴とする請求項47に記載の言語間ユーザインタフェース。
  53. 【請求項53】 ユーザによる選択のためにその範囲内にテキストを表示可
    能であって、前記テキストは第1の言語で表示される第1のエリアと、 前記ユーザにより選択されたテキストに近接し、第2の異なる言語に翻訳され
    たテキストを表示するように構成され、前記翻訳されたテキストは前記ユーザに
    より選択されたテキストに対応する第2のエリアとを具備することを特徴とする
    言語間ユーザインタフェース。
  54. 【請求項54】 前記第2の言語は英語を具備し、前記第2の言語は中国語
    を具備することを特徴とする請求項53に記載の言語間ユーザインタフェース。
  55. 【請求項55】 前記第2のエリアはポップアップウインドウを具備するこ
    とを特徴とする請求項53に記載の言語間ユーザインタフェース。
  56. 【請求項56】 前記第2のエリアは、多数の翻訳を表示するためのドロッ
    プダウン機能を有するポップアップウインドウを具備することを特徴とする請求
    項53に記載の言語間ユーザインタフェース。
  57. 【請求項57】 前記第2のエリアは、同じテキストの多数の異なる翻訳を
    表示することを特徴とする請求項53に記載の言語間ユーザインタフェース。
  58. 【請求項58】 選択されたテキストを構文解析して個別の翻訳単位にする
    ためのパーサであって、識別子を用いて個々の単語をタグ付けする品詞/単名詞
    句識別モジュールを具備するパーサと、 前記翻訳単位に対する候補の単語の翻訳を選択するための単語翻訳セレクタ
    と、 前記候補の単語の翻訳を、ユーザインタフェースを介してユーザに提供する
    ことができる母国語の対応する単語または句に翻訳するための翻訳ジェネレータ
    と を具備する言語間リーディングウィザードを具備することを特徴とするリーデ
    ィングシステム。
  59. 【請求項59】 前記パーサは、個々の単語を形態的に処理して各単語の形
    態的語根を取得する形態的アナライザを具備することを特徴とする請求項58に
    記載のリーディングシステム。
  60. 【請求項60】 前記パーサは個々の単語に句拡張ルールを適用する句拡張
    モジュールを具備することを特徴とする請求項58に記載のリーディングシステ
    ム。
  61. 【請求項61】 1または複数のプロセッサにより実行されたときに、前記
    1つまたは複数のプロセッサに、 選択されたテキストを構文解析して個々の翻訳単位にするためのパーサであ
    って、識別子を用いて個々の単語をタグ付けする品詞/単名詞句識別モジュール
    を具備するパーサと、 前記翻訳単位に対する候補の単語の翻訳を選択するための単語翻訳セレクタ
    と、 前記候補の単語の翻訳を、ユーザインタフェースを介してユーザに提供可能
    な母国語の対応する単語または句に翻訳するための翻訳ジェネレータと を具備する言語間リーディングウィザードを実装させるコンピュータ可読命令
    をその上に有することを特徴とする1または複数のコンピュータ可読媒体。
  62. 【請求項62】 1または複数のプロセッサにより実行されたときに、前記
    1または複数のプロセッサに、 ユーザインタフェースを介して母国語以外の言語のテキストをユーザに提供さ
    せ、 前記ユーザにより選択されたテキストを受け取らせ、 前記テキストを構文解析して翻訳単位にし、 品詞タグ付けおよび単名詞句識別を使用して翻訳単位を特徴付け、 前記特徴付けされた翻訳単位にルールベースの句拡張およびパターンマッチ
    ングを適用してツリーリストを提供し、 前記ツリーリストに基づいて、前記母国語の候補の単語の翻訳を生成し、お
    よび 前記候補の単語の翻訳を母国語の対応する単語および/または句に翻訳して
    、前記母国語以外の言語から母国語に翻訳されたテキストを提供することにより
    選択された前記テキストを処理させ、および 前記ユーザインタフェースを介して翻訳されたテキストを前記ユーザに提供さ
    せるコンピュータ可読命令をその上に有することを特徴とする1または複数のコ
    ンピュータ可読媒体。
JP2001579130A 2000-04-24 2001-04-23 言語間リーディングウィザードを用いたコンピュータ援用リーディングシステムおよび方法 Pending JP2003532194A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US19928800P 2000-04-24 2000-04-24
US60/199,288 2000-04-24
PCT/US2001/013090 WO2001082111A2 (en) 2000-04-24 2001-04-23 Computer-aided reading system and method with cross-language reading wizard

Publications (2)

Publication Number Publication Date
JP2003532194A true JP2003532194A (ja) 2003-10-28
JP2003532194A5 JP2003532194A5 (ja) 2008-06-19

Family

ID=22736941

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001579130A Pending JP2003532194A (ja) 2000-04-24 2001-04-23 言語間リーディングウィザードを用いたコンピュータ援用リーディングシステムおよび方法

Country Status (6)

Country Link
US (4) US7315809B2 (ja)
JP (1) JP2003532194A (ja)
CN (1) CN100520768C (ja)
AU (1) AU2001255599A1 (ja)
HK (1) HK1055492A1 (ja)
WO (1) WO2001082111A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017204064A (ja) * 2016-05-10 2017-11-16 日本放送協会 読解支援装置及びプログラム
KR101863484B1 (ko) * 2015-03-27 2018-05-31 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 번역 정보 제공 방법 및 시스템

Families Citing this family (203)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
JP3522644B2 (ja) * 2000-04-28 2004-04-26 株式会社講談社 表示言語変換システム及び記憶媒体
US6985851B2 (en) * 2001-07-17 2006-01-10 Microsoft Corporation Method and apparatus for providing improved HMM POS tagger for multi-word entries and factoids
US7634397B2 (en) * 2002-06-27 2009-12-15 Siebel Systems, Inc. Single server instance, multi-lingual applications based on loosely coupled metadata and presentation layers
US20040024585A1 (en) * 2002-07-03 2004-02-05 Amit Srivastava Linguistic segmentation of speech
US20040004599A1 (en) * 2002-07-03 2004-01-08 Scott Shepard Systems and methods for facilitating playback of media
US20060100849A1 (en) * 2002-09-30 2006-05-11 Ning-Ping Chan Pointer initiated instant bilingual annotation on textual information in an electronic document
US8137105B2 (en) 2003-07-31 2012-03-20 International Business Machines Corporation Chinese/English vocabulary learning tool
US7412385B2 (en) * 2003-11-12 2008-08-12 Microsoft Corporation System for identifying paraphrases using machine translation
US7584092B2 (en) 2004-11-15 2009-09-01 Microsoft Corporation Unsupervised learning of paraphrase/translation alternations and selective application thereof
CN1950820A (zh) * 2004-03-02 2007-04-18 梅林格有限公司 嵌入式翻译文档方法和系统
JP2005293174A (ja) * 2004-03-31 2005-10-20 Toshiba Corp テキストデータ編集装置、テキストデータ編集方法及びテキストデータ編集プログラム
US7546235B2 (en) * 2004-11-15 2009-06-09 Microsoft Corporation Unsupervised learning of paraphrase/translation alternations and selective application thereof
US20060173829A1 (en) * 2005-01-10 2006-08-03 Neeman Yoni M Embedded translation-enhanced search
US7676357B2 (en) * 2005-02-17 2010-03-09 International Business Machines Corporation Enhanced Chinese character/Pin Yin/English translator
US8219907B2 (en) * 2005-03-08 2012-07-10 Microsoft Corporation Resource authoring with re-usability score and suggested re-usable data
JP2006276911A (ja) * 2005-03-25 2006-10-12 Fuji Xerox Co Ltd 電子機器およびプログラム
US9785329B2 (en) * 2005-05-23 2017-10-10 Nokia Technologies Oy Pocket computer and associated methods
US20070024646A1 (en) * 2005-05-23 2007-02-01 Kalle Saarinen Portable electronic apparatus and associated method
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7908132B2 (en) 2005-09-29 2011-03-15 Microsoft Corporation Writing assistance using machine translation techniques
JP2009511220A (ja) * 2005-10-17 2009-03-19 ディバージョナリー・セラピー・テクノロジーズ・ピーティーワイ・リミテッド ダイバージョナルセラピーの装置および方法ならびに対話型デバイス
US7822596B2 (en) * 2005-12-05 2010-10-26 Microsoft Corporation Flexible display translation
US20070174045A1 (en) * 2006-01-25 2007-07-26 International Business Machines Corporation Automatic acronym expansion using pop-ups
US20070219782A1 (en) * 2006-03-14 2007-09-20 Qing Li User-supported multi-language online dictionary
US20080019281A1 (en) * 2006-07-21 2008-01-24 Microsoft Corporation Reuse of available source data and localizations
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US9495358B2 (en) * 2006-10-10 2016-11-15 Abbyy Infopoisk Llc Cross-language text clustering
US9588958B2 (en) * 2006-10-10 2017-03-07 Abbyy Infopoisk Llc Cross-language text classification
US8144990B2 (en) 2007-03-22 2012-03-27 Sony Ericsson Mobile Communications Ab Translation and display of text in picture
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8260619B1 (en) 2008-08-22 2012-09-04 Convergys Cmg Utah, Inc. Method and system for creating natural language understanding grammars
WO2009036800A1 (en) * 2007-09-19 2009-03-26 Nokia Corporation Method of text translation and electronic device capable thereof
US20090083026A1 (en) * 2007-09-24 2009-03-26 Microsoft Corporation Summarizing document with marked points
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US20090162818A1 (en) * 2007-12-21 2009-06-25 Martin Kosakowski Method for the determination of supplementary content in an electronic device
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
WO2009146238A1 (en) * 2008-05-01 2009-12-03 Chacha Search, Inc. Method and system for improvement of request processing
KR100978581B1 (ko) * 2008-05-08 2010-08-27 엔에이치엔(주) 웹 페이지 열람 중에 편리하게 사전 서비스를 제공하기위한 방법 및 시스템
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US9262409B2 (en) * 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US8296125B2 (en) * 2008-10-17 2012-10-23 International Business Machines Corporation Translating source locale input string to target locale output string
US9323854B2 (en) * 2008-12-19 2016-04-26 Intel Corporation Method, apparatus and system for location assisted translation
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
CN101576878A (zh) * 2009-06-17 2009-11-11 董名垂 用户勾圈网页即时翻译系统及方法
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8520983B2 (en) * 2009-10-07 2013-08-27 Google Inc. Gesture-based selective text recognition
US20110097693A1 (en) * 2009-10-28 2011-04-28 Richard Henry Dana Crawford Aligning chunk translations for language learners
US8732577B2 (en) 2009-11-24 2014-05-20 Clear Channel Management Services, Inc. Contextual, focus-based translation for broadcast automation software
US8515185B2 (en) * 2009-11-25 2013-08-20 Google Inc. On-screen guideline-based selective text recognition
US20110167350A1 (en) * 2010-01-06 2011-07-07 Apple Inc. Assist Features For Content Display Device
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
WO2011089450A2 (en) 2010-01-25 2011-07-28 Andrew Peter Nelson Jerram Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
CN103429265A (zh) * 2010-05-25 2013-12-04 国家医疗保健研究所 用于治疗和预防hcv感染的抗包膜抗体和抗受体抗体组合物
US20120010870A1 (en) * 2010-07-09 2012-01-12 Vladimir Selegey Electronic dictionary and dictionary writing system
US8635059B2 (en) * 2010-11-15 2014-01-21 Google Inc. Providing alternative translations
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US9195652B2 (en) * 2011-06-08 2015-11-24 Accenture Global Services Limited Automated systems and methods for integrated multi-platform communication including real-time language translation
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
CN102955820A (zh) * 2011-08-30 2013-03-06 上海爱读信息技术有限公司 一种外语词汇积累的系统及其方法
KR20130034747A (ko) * 2011-09-29 2013-04-08 삼성전자주식회사 휴대 단말기의 사용자 인터페이스 제공 방법 및 장치
KR101475284B1 (ko) * 2011-11-29 2014-12-23 에스케이텔레콤 주식회사 작문 자동 평가를 위해 샬로우 파서를 이용한 오류 검출 장치 및 방법
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9536438B2 (en) * 2012-05-18 2017-01-03 Xerox Corporation System and method for customizing reading materials based on reading ability
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
CN103577397A (zh) * 2012-08-10 2014-02-12 阿里巴巴集团控股有限公司 计算机翻译数据处理方法及装置
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9256798B2 (en) * 2013-01-31 2016-02-09 Aurasma Limited Document alteration based on native text analysis and OCR
CN103218353B (zh) * 2013-03-05 2018-12-11 刘树根 母语人士学用其它语言文字之人工智能实现方法
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
EP3937002A1 (en) 2013-06-09 2022-01-12 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101482430B1 (ko) * 2013-08-13 2015-01-15 포항공과대학교 산학협력단 전치사 교정 방법 및 이를 수행하는 장치
US9678939B2 (en) * 2013-12-04 2017-06-13 International Business Machines Corporation Morphology analysis for machine translation
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9639526B2 (en) * 2014-01-10 2017-05-02 Microsoft Technology Licensing, Llc Mobile language translation of web content
US10394938B2 (en) 2014-04-30 2019-08-27 MBTE Holdings Sweden AB Visual searching and navigation
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
JP5748381B1 (ja) * 2014-07-31 2015-07-15 楽天株式会社 メッセージ処理装置、メッセージ処理方法、記録媒体およびプログラム
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US9852131B2 (en) * 2015-05-18 2017-12-26 Google Llc Techniques for providing visual translation cards including contextually relevant definitions and examples
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
CN105808527A (zh) 2016-02-24 2016-07-27 北京百度网讯科技有限公司 基于人工智能的定向翻译方法及装置
WO2017160746A1 (en) 2016-03-14 2017-09-21 Yakyapp Corporation Devices, systems, and methods for selectively providing contextual language translation
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US10409903B2 (en) 2016-05-31 2019-09-10 Microsoft Technology Licensing, Llc Unknown word predictor and content-integrated translator
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
WO2018018333A1 (zh) * 2016-07-24 2018-02-01 张鹏华 一种阅读英文时查询单词的方法和阅读系统
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
CN108075959B (zh) * 2016-11-14 2021-03-12 腾讯科技(深圳)有限公司 一种会话消息处理方法和装置
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
CN107679043A (zh) * 2017-09-22 2018-02-09 广州阿里巴巴文学信息技术有限公司 数据处理方法、装置及终端设备
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
CN108170660B (zh) * 2018-01-22 2021-08-06 北京百度网讯科技有限公司 多语言排版的显示方法、装置、浏览器、终端及介质
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US11076039B2 (en) 2018-06-03 2021-07-27 Apple Inc. Accelerated task performance
US11385916B2 (en) * 2020-03-16 2022-07-12 Servicenow, Inc. Dynamic translation of graphical user interfaces
US11580312B2 (en) 2020-03-16 2023-02-14 Servicenow, Inc. Machine translation of chat sessions
CN113221582B (zh) * 2021-04-29 2024-08-06 北京搜狗科技发展有限公司 一种翻译处理方法、装置和用于翻译处理的装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6170660A (ja) * 1984-09-14 1986-04-11 Hitachi Ltd 機械翻訳システムにおける多義表示・選択方法
JPH05225233A (ja) * 1992-02-13 1993-09-03 Matsushita Electric Ind Co Ltd 機械翻訳装置
JPH11161682A (ja) * 1997-09-29 1999-06-18 Toshiba Corp 情報検索装置、情報検索方法及び記録媒体
WO1999049383A1 (en) * 1998-03-20 1999-09-30 Nuvomedia, Inc. Electronic book system

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61255468A (ja) * 1985-05-08 1986-11-13 Toshiba Corp 機械翻訳処理装置
JPH0743719B2 (ja) * 1986-05-20 1995-05-15 シャープ株式会社 機械翻訳装置
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
JP3038079B2 (ja) 1992-04-28 2000-05-08 シャープ株式会社 自動翻訳装置
ES2143509T3 (es) * 1992-09-04 2000-05-16 Caterpillar Inc Sistema integrado de edicion y traduccion.
US5822720A (en) 1994-02-16 1998-10-13 Sentius Corporation System amd method for linking streams of multimedia data for reference material for display
JPH0877176A (ja) * 1994-09-07 1996-03-22 Hitachi Ltd 外国語翻訳装置
US5715468A (en) 1994-09-30 1998-02-03 Budzinski; Robert Lucius Memory system for storing and retrieving experience and knowledge with natural language
US5697789A (en) 1994-11-22 1997-12-16 Softrade International, Inc. Method and system for aiding foreign language instruction
US6139201A (en) * 1994-12-22 2000-10-31 Caterpillar Inc. Integrated authoring and translation system
US6516296B1 (en) 1995-11-27 2003-02-04 Fujitsu Limited Translating apparatus, dictionary search apparatus, and translating method
US6092036A (en) 1998-06-02 2000-07-18 Davox Corporation Multi-lingual data processing system and system and method for translating text used in computer software utilizing an embedded translator
US6092034A (en) * 1998-07-27 2000-07-18 International Business Machines Corporation Statistical translation system and method for fast sense disambiguation and translation of large corpora using fertility models and sense models
CN1250915A (zh) 1998-10-09 2000-04-19 英业达股份有限公司 即时翻译系统
US6327566B1 (en) 1999-06-16 2001-12-04 International Business Machines Corporation Method and apparatus for correcting misinterpreted voice commands in a speech recognition system
US6434518B1 (en) 1999-09-23 2002-08-13 Charles A. Glenn Language translator
JP2001101185A (ja) 1999-09-24 2001-04-13 Internatl Business Mach Corp <Ibm> 辞書の自動切り換えが可能な機械翻訳方法および装置並びにそのような機械翻訳方法を実行するためのプログラムを記憶したプログラム記憶媒体
US6778949B2 (en) * 1999-10-18 2004-08-17 Sony Corporation Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures
JP3522644B2 (ja) 2000-04-28 2004-04-26 株式会社講談社 表示言語変換システム及び記憶媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6170660A (ja) * 1984-09-14 1986-04-11 Hitachi Ltd 機械翻訳システムにおける多義表示・選択方法
JPH05225233A (ja) * 1992-02-13 1993-09-03 Matsushita Electric Ind Co Ltd 機械翻訳装置
JPH11161682A (ja) * 1997-09-29 1999-06-18 Toshiba Corp 情報検索装置、情報検索方法及び記録媒体
WO1999049383A1 (en) * 1998-03-20 1999-09-30 Nuvomedia, Inc. Electronic book system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101863484B1 (ko) * 2015-03-27 2018-05-31 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 번역 정보 제공 방법 및 시스템
US10176169B2 (en) 2015-03-27 2019-01-08 Baidu Online Network Technology (Beijing) Co., Ltd. Method and system for providing translation information
JP2017204064A (ja) * 2016-05-10 2017-11-16 日本放送協会 読解支援装置及びプログラム

Also Published As

Publication number Publication date
US20010056352A1 (en) 2001-12-27
US20050071173A1 (en) 2005-03-31
CN100520768C (zh) 2009-07-29
WO2001082111A2 (en) 2001-11-01
WO2001082111A3 (en) 2002-08-29
US7228268B2 (en) 2007-06-05
CN1426561A (zh) 2003-06-25
US7315809B2 (en) 2008-01-01
HK1055492A1 (en) 2004-01-09
US20050049881A1 (en) 2005-03-03
US7254527B2 (en) 2007-08-07
US7228269B2 (en) 2007-06-05
AU2001255599A1 (en) 2001-11-07
US20050055198A1 (en) 2005-03-10

Similar Documents

Publication Publication Date Title
JP2003532194A (ja) 言語間リーディングウィザードを用いたコンピュータ援用リーディングシステムおよび方法
US6859771B2 (en) System and method for identifying base noun phrases
US5878386A (en) Natural language parser with dictionary-based part-of-speech probabilities
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
JP4658420B2 (ja) 文字列の正規化表示を生成するシステム
US6101492A (en) Methods and apparatus for information indexing and retrieval as well as query expansion using morpho-syntactic analysis
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
Yeom et al. Unsupervised-learning-based keyphrase extraction from a single document by the effective combination of the graph-based model and the modified C-value method
Jabbar et al. An Analytical Analysis of Text Stemming Methodologies in Information Retrieval and Natural Language Processing Systems
Yadav et al. Graph-based extractive text summarization based on single document
JP4361299B2 (ja) 評価表現抽出装置、プログラム、及び記憶媒体
JP2003323425A (ja) 対訳辞書作成装置、翻訳装置、対訳辞書作成プログラム、および翻訳プログラム
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JP7415495B2 (ja) 文書処理プログラム、文書処理装置、及び文書処理方法
JP4213900B2 (ja) 文書分類装置と記録媒体
KR950013129B1 (ko) 기계번역장치 및 방법
JPH07325826A (ja) 日本語処理システム
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법
JP2001101207A (ja) 文書要約装置
JP2003022277A (ja) 文書検索装置及び文書検索方法
Zhang et al. Implementing Natural Language Processes to Natural Language Programming
Zaghal et al. Arabic morphological analyzer with text to voice
Krukaset et al. Thai Sentence Core Graph for Thai NLP
JPH1145280A (ja) 他言語文書検索システム、他言語文書検索プログラムが記憶された記憶媒体、及び他言語文書検索方法
JP2003173338A (ja) 辞書構築支援装置、辞書構築支援方法及び辞書構築支援プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080423

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080423

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110222

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110520

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120424

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120525