JP2003114889A - 翻訳対象のリソースと分野別辞書を関連付けるための方法、システムおよびプログラム - Google Patents

翻訳対象のリソースと分野別辞書を関連付けるための方法、システムおよびプログラム

Info

Publication number
JP2003114889A
JP2003114889A JP2001290620A JP2001290620A JP2003114889A JP 2003114889 A JP2003114889 A JP 2003114889A JP 2001290620 A JP2001290620 A JP 2001290620A JP 2001290620 A JP2001290620 A JP 2001290620A JP 2003114889 A JP2003114889 A JP 2003114889A
Authority
JP
Japan
Prior art keywords
field
pattern
resource
frequency
appearance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001290620A
Other languages
English (en)
Other versions
JP3452558B2 (ja
Inventor
Hiromi Hatori
洋美 羽鳥
Toshiro Kamiyama
淑朗 神山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2001290620A priority Critical patent/JP3452558B2/ja
Priority to US10/254,115 priority patent/US7089493B2/en
Publication of JP2003114889A publication Critical patent/JP2003114889A/ja
Application granted granted Critical
Publication of JP3452558B2 publication Critical patent/JP3452558B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 翻訳対象のリソースと分野別辞書との関連付
けを実現する。 【解決手段】 特定の分野と関連付けられたパターンの
データベースを準備し、翻訳対象のリソース内のパター
ンの出現頻度を算出する。所定の閾値を超える出現頻度
を有する分野が存在するかどうかを判定する。次に、最
大の出現頻度が他の分野の出現頻度と比較して突出して
いるかを判定する。両方の条件を満たす場合に、当該リ
ソースと当該最大の出現頻度を示す分野の分野別辞書を
関連付けする。当該関連付け情報の使用により適切な辞
書切り換えがされ、適切な自動翻訳を行うことができ
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ある言語の文章を
他の言語に自動翻訳するための技術に関し、より詳細に
は、翻訳対象のリソースを自動翻訳する際に使用する複
数の電子辞書を適切に切り換えるために翻訳対象のリソ
ースと分野別辞書を関連付ける技術に関する。
【0002】
【従来の技術】自動翻訳の技術分野において、特定の分
野について記載された文章に対してより適切な翻訳結果
を得るために、特定の分野の翻訳に適した訳語を用意し
た辞書(分野別辞書)を含む複数の電子辞書を準備し、
準備された複数の電子辞書の切り換えを行い自動翻訳を
行う手法が存在する。
【0003】例えば、”People enjoy c
herry trees thisseason.
(訳:人々は、この季節桜を楽しみます。)”という文
章においては、”this season”は「この季
節」と翻訳するのが適切である。これに対してスポーツ
分野の文脈、例えば、”He is a majorl
eaguer.He hit fifty homer
uns this season.(訳:彼はメジャー
リーガーです。彼は今シーズン50本ホームランを打ち
ました。)”という文章では、”this seaso
n”は「今シーズン」と翻訳するのが適切である。
【0004】この場合は、”this season”
に対して「今シーズン」と登録されたスポーツ分野の分
野別辞書を準備する。前者には一般的な(特定分野向け
でない)訳語が見出し語に関連付られて登録されている
基本辞書を適用して「この季節」と翻訳するようにす
る。後者にはスポーツ分野の分野別辞書を適用して自動
翻訳を行えば、それぞれ適切な翻訳が得られる。適用す
る電子辞書の切り換えが不適切であれば、当然、適切な
翻訳は得られない。より精度の高い翻訳を得るためには
分野別辞書を含む複数の電子辞書を適切に切り換えるこ
とが必要となる。
【0005】複数の電子辞書を切り換える従来の手法と
して、分野別に文脈の分野を判定するトリガーとなるパ
ターン(単に「パターン」という。)を用意しておき、
パターンが出現した場合に文脈をそのパターンが属する
分野のものであると判定して辞書を切り換える技術が特
開2001−110185に開示されている。
【0006】前述の後者の例であれば、例えば、”ma
jor leaguer”がスポーツ分野のパターンと
して準備しておけば、第1文を翻訳した時点で、文脈が
スポーツ分野と判定され、スポーツ分野の分野別辞書の
適用の優先順位が上げられる。そして、第2文の”th
is season”はスポーツ分野の分野別辞書を使
用して「今シーズン」と翻訳される。
【0007】しかし、この手法では、パターンが出現す
る以前の文章に対しては、適切な分野別辞書を使用する
ことができない。また、話題の変化に対応するために所
定の数の文章を翻訳する間にその分野別辞書のパターン
が出現しない場合に基本辞書が適用されるように設定が
されることがあり、その場合は第1文と第2文の間に所
定の数以上の文が存在する場合に、第2文が適切に翻訳
できないといった問題も生じ得る。
【0008】一方、近年ネットワーク技術、特にインタ
ーネットが普及し、人々はネットワーク上のリソースか
ら様々な情報を簡単に入手できるようになった。しか
し、ネットワーク上のリソースは様々な言語で記述され
ている。そのため、ユーザが慣れていない言語で書かれ
たリソースから情報を入手するのは困難を伴う。そこ
で、ネットワーク上のリソースの自動翻訳に対する要求
が高まっている。
【0009】ここで、ネットワーク上のリソースを自動
翻訳する際に複数の電子辞書を切り換える従来の手法と
して、URL(Uniform Resource L
ocatorの略。TCP/IPネットワーク上のリソ
ースのアドレス・ロケーションのこと。)をユーザが適
切と判定した特定の電子辞書と関連付けて登録し、登録
済みのURLを翻訳する場合は関連付けられた電子辞書
を使用するというものが存在する。この手法であれば、
パターンが出現する以前の文章や、所定の間隔でパター
ンが出現しない場合などにも対応可能である。
【0010】しかし、従来はURL登録はユーザが手作
業で行う必要があるため、当該手法は非常に多くの労力
をユーザに強いることとなっていた。また、いったん登
録をした後は、また手作業で修正が行われるまで、話題
が変化したURLに全く対応できず、不適切な翻訳がな
されるという問題もあった。
【0011】本発明の発明者はネットワーク上のリソー
スが以下の4種類に分類され得ることを発見した。すな
わち、(1)特定の分野に関する話題というわけではな
く、分野別辞書にマッチするパターンがほとんどない
「分野なし型」(2)ニュースのヘッドラインが1ペー
ジに収められているような場合で、複数の分野の話題が
同一ページ内に混在している「多重分野型」(3)同じ
URLであっても、コンテンツの更新とともに話題の分
野までも変わってしまう「分野変化型」(4)コンテン
ツが特定の分野の話題である「特定分野型」である。こ
れらのリソースのうち、「特定分野型」のものに分野別
辞書を適用すれば、適切な翻訳が得られる。なお、「特
定分野型」以外のリソースに分野別辞書を適用すると、
かえって不適切な翻訳が出力される場合が多い。
【0012】したがって、翻訳対象のリソースが「特定
分野型」であることを動的に判定して当該リソースに適
切な分野別辞書を関連付け、当該関連付けに基づいて自
動翻訳の際に電子辞書を適切に切り換えることができれ
ば、利便性および翻訳精度を向上し得ることが理解され
る。
【0013】
【発明が解決しようとする課題】本発明の目的は、翻訳
対象のリソースを適切な分野別辞書と関連付ける技術を
実現することである。
【0014】
【課題を解決するための手段】本発明の概略を説明すれ
ば、以下の通りである。すなわち前述の目的は、翻訳対
象のリソースと特定の分野の翻訳に適した訳語を用意し
た分野別辞書とを関連付けるための方法であって、特定
の前記分野と関連付けられたパターンのデータベースを
準備するステップと、分野ごとに前記リソースに含まれ
るパターンの出現頻度を算出するステップと、分野ごと
に前記パターンの出現頻度が所定の第1の閾値を超えて
いるかどうかを判定する第1の判定ステップと、前記第
1の判定ステップにおいて所定の第1の閾値を超えたと
判定された分野の中で最大のパターンの出現頻度を有す
る分野のパターンの出現頻度が他の分野のパターンの出
現頻度と比較して突出しているかどうかを判定する第2
の判定ステップと、前記第2の判定ステップにおいて最
大のパターンの出現頻度を有する分野のパターンの出現
頻度が他の分野のパターンの出現頻度と比較して突出し
ていると判定された場合に当該リソースと当該最大のパ
ターンの出現頻度を有する分野の分野別辞書とを関連付
けるステップとを有する方法により達成される。
【0015】前述の方法において、リソースは特定のア
ドレス・ロケーションを有するネットワーク上のリソー
スであり、関連付けるステップは、アドレス・ロケーシ
ョンと分野別辞書と関連付けることにより行われるよう
にすることができる。
【0016】また、前述の方法において、パターンは分
野別辞書の見出し語の全部または一部とすることができ
る。この構成によれば、パターンのデータベースを分野
別辞書と別に作成する労力を省くことができる。
【0017】さらに、前述の方法において、パターンの
出現頻度を算出するステップは、リソースに含まれるパ
ターンの出現数とリソースに含まれるセンテンス数との
比率を算出することにより行われるようにすることがで
きる。またさらに好適には、パターンの出現頻度を算出
するステップは、リソースを翻訳することにより行わ
れ、リソースの翻訳を行った部分に含まれるパターンの
出現数とリソースの翻訳を行った部分に含まれるセンテ
ンス数との比率を算出することにより行われるようにす
ることができる。
【0018】前述の方法において、パターンの出現頻度
を算出するステップは、パターンの出現頻度の算出のた
めのデータを蓄積するステップを含み、パターンの出現
頻度の算出は蓄積されたデータを使用して行われるよう
にすることができる。さらに、データを蓄積するステッ
プは、所定の基準前の蓄積データを削除するステップを
含むようにすることができる。
【0019】前述の方法において、データを蓄積するス
テップは、複数のユーザにより生成された前記パターン
の出現頻度の算出のためのデータを蓄積するサーバにパ
ターンの出現頻度の算出のためのデータを蓄積すること
により行われるようにすることができる。
【0020】前述の方法において、第2の判定ステップ
は、最大のパターンの出現頻度を有する分野のパターン
の出現頻度と全分野のパターンの出現頻度の総和との比
率が所定の第2の閾値を超えているかどうかを判定する
ことにより実現されるようにすることができる。
【0021】前述の方法は、前記リソースを含むサイト
に含まれる特定の分野別辞書と関連付けられたリソース
の出現頻度を分野ごとに算出するステップと、分野ごと
にリソースの出現頻度が所定の第3の閾値を超えている
かどうかを判定する第3の判定ステップと、第3の判定
ステップにおいて所定の第3の閾値を超えた分野の数が
あると判定された場合に当該サイトと当該分野の分野別
辞書とを関連付けるステップとをさらに含めることがで
きる。
【0022】なお、本発明は、前記した方法としての発
明の他、「コンピュータ・システム」あるいは「コンピ
ュータ・プログラム」として把握することも可能であ
る。
【0023】
【発明の実施の形態】本発明の実施の形態を図面に基づ
いて詳細に説明する。ただし、本発明は多くの異なる態
様で実施可能であり、本実施の形態の記載内容に限定し
て解釈すべきはでない。本実施の形態の全体を通して同
じ要素には同じ番号を付している。
【0024】本実施の形態では、主に方法またはシステ
ムについて説明するが、当業者であれば明らかな通り、
本発明はコンピュータで使用可能なプログラムとしても
実施できる。したがって、本発明は、ハードウェアとし
ての実施形態、ソフトウェアとしての実施形態またはソ
フトウェアとハードウェアとの組合せの実施形態をとる
ことができる。プログラムは、ハードディスク、CD−
ROM、光記憶装置または磁気記憶装置等の任意のコン
ピュータ可読媒体に記録できる。
【0025】図1は本発明による自動翻訳システムの実
施の形態の一例のブロック構成図であり、ワークステー
ションやパーソナルコンピュータなどの情報処理装置上
で実現されるものである。本実施の形態のシステムは、
入力部10、翻訳処理部20、出力部30、辞書切り換
え部40、分野判定情報記憶部50、辞書記憶部60が
含まれる。
【0026】入力部10は、インターネット・ブラウザ
に表示されたテキストと当該リソースが有するURLを
システムに取り込む機能などによりシステムに入力デー
タとなる翻訳対象の原文テキストとURL(TCP/I
Pネットワーク上のリソースのアドレス・ロケーショ
ン)を取り込む。
【0027】翻訳処理部20は、入力部10により取り
込まれた入力データを、辞書切り換え部40により選択
された辞書記憶部60に記憶された複数の電子辞書11
0乃至130のいずれかを使用し、特定のアルゴリズム
に従って自動翻訳を行い、翻訳結果のデータを出力部3
0へ引き渡す。翻訳のアルゴリズムは、本発明の本質的
部分でなく、かつ、様々なアルゴリズムが周知技術とし
て存在し当業者は適宜実現が可能であるので、ここでは
詳細な説明は省略する。また、翻訳処理部30は、分野
判定情報記憶部50に分野判定情報100を提供する機
能をも有する。
【0028】出力部30は、翻訳処理部により自動翻訳
した結果をディスプレイに表示する、あるいは、他のア
プリケーションに引き渡す等の機能を有する。
【0029】辞書切り換え部40は、分野判定情報記憶
部50に記憶された分野判定情報100等に基づいて、
辞書記憶部60に記憶された複数の電子辞書110乃至
130のいずれを翻訳処理部20が使用するかを選択
し、切り換える機能を有する。
【0030】分野判定情報記憶部50は、翻訳処理部2
0から提供された分野判定情報100を記憶し、必要に
応じて辞書切り換え部40へ提供する。
【0031】辞書記憶部60には複数の電子辞書のデー
タが記憶される。本実施の形態においては、辞書記憶部
60にはユーザ辞書110、基本辞書120、分野別辞
書130が記憶されている。基本辞書120には一般的
な(特定分野向けでない)訳語が見出し語に関連付られ
て登録されている。分野別辞書130には、コンピュー
タ・スポーツ・政治・芸術などの特定分野向けの訳語が
見出し語に関連付けられて登録されている。
【0032】さらに、ユーザはユーザ辞書110に自分
向けにカスタマイズした訳語を見出し語に関連付けて登
録することができる。なお、ユーザ辞書110は、いつ
いかなる場合も常に基本辞書・分野別辞書と比較して最
優先で適用されることになっている。従って、本願の発
明の詳細な説明における基本辞書・分野別辞書の優先順
位の変動に関する記載は、かかる理由によりユーザ辞書
を除外して記載されていることに留意されたい。
【0033】図2は、本発明の実施の形態の処理の流れ
の一例を示したフローチャートである。
【0034】本発明の実施の形態では、処理はステップ
200から開始され、ステップ210で入力部10によ
り翻訳対象の原文テキストとURLが取り込まれる。次
に、ステップ220(辞書優先順位変更処理(1))に
進み、ステップ210で取り込まれたURLに対する分
野判定情報が存在する場合は、当該URLを有するリソ
ースの訳文の生成において常に最優先で使用される分野
別辞書が分野判定情報に基づいて設定される。ステップ
220における処理の詳細は後述する。なお、分野判定
情報とは、以前に行った「分野判定情報の保存処理(後
述する)」で得られた当該リソースのURLと分野別辞
書の関連付けを表す情報である。
【0035】次に、ステップ230において入力された
原文から一文を切り出され(一文入力)、ステップ24
0において切り出された原文に対して原文解析が行われ
る(原文解析)。原文解析では、一文の中のどの部分が
主語で、どの部分が動詞であるかなどの解析が行われ、
文の構造が決定される。原文解析の技術は周知であり、
当業者は適宜設計を行い実施可能であるので、ここでは
詳細は省略する。
【0036】ステップ240における原文解析が完了し
た後、ステップ250(辞書優先順位変更処理(2))
において、従来の自動辞書切り換え処理が行われ、その
後、ステップ260で辞書の優先順位が最適に設定され
た状態で訳文の生成が行われる。ステップ250におけ
る処理の詳細は後述する。また、辞書の優先順位が最適
に設定された状態で訳文の生成に関する技術は周知であ
り、当業者は適宜実施可能であるので、ここでは詳細な
説明は省略する。
【0037】ステップ270に進み、ステップ230に
おいて切り出され、ステップ260で訳文が生成された
文が最後の文かどうかを判定する。最後の文でない場合
は、ステップ270からNOの矢印を通じてステップ2
30に戻りステップ230からステップ260が繰り返
し行われる。最後の文である場合は、ステップ270か
らYESの矢印を通じてステップ280に進み、分野判
定情報の保存を行った後に、ステップ290で処理は終
了する。ステップ280における分野判定情報の保存の
処理の詳細は後述する。
【0038】図3を使用して、図2のステップ220の
辞書優先順位変更処理(1)を詳細に説明する。辞書優
先順位変更処理(1)では、ステップ300において、
ステップ210で指定されたURLに該当する分野別判
定情報が分野判定情報記憶部50に存在するかどうかを
判定する。存在する場合は、ステップ300からYES
の矢印を通じてステップ310へ進み、対応する分野別
辞書をステップ260の訳文生成において最優先で使用
するように辞書の優先順位を変更し、ステップ230へ
進む。存在しない場合は、ステップ300からNOの矢
印を通じてステップ230へ進む。
【0039】図4を使用して、図2のステップ250の
辞書優先順位変更処理(2)を詳細に説明する。なお、
前述の通り、辞書優先順位変更処理(1)で設定された
分野別辞書がステップ260の訳文生成において常に最
優先で使用されるので、この辞書優先順位変更処理
(2)ではそれ以下の優先順位の辞書が対象となる。
【0040】まず、ステップ400において、ステップ
230において一文入力され、ステップ240において
原文解析されたデータに分野別に文脈の分野を判定する
トリガーとなるパターンが存在(ヒット)するかどうか
を判定する。パターンは分野別辞書の複合語の全部また
は一部を使用するとよい。ヒットした場合は、YESの
矢印を通じてステップ410に進み、ステップ410に
て分野別辞書の優先順位を基本辞書より上げる。そし
て、ステップ420で”ヒットしなかった文の数”を0
にした後、ステップ260へ進む。
【0041】ステップ400でパターンがヒットしなか
った場合は、NOの矢印を通じてステップ430へ進
む。ステップ430では、いずれかの分野別辞書が既に
基本辞書より優先順位が高いかどうかを判定する。いず
れの分野別辞書も基本辞書より優先順位が高くないと判
定された場合は、NOの矢印を通じてステップ260へ
即時に進む。いずれかの分野別辞書が基本辞書より優先
順位が高いと判断された場合は、YESの矢印を通じて
ステップ440へ進み、ステップ440にて”ヒットし
なかった文の数”をインクリメント(+1)する。そし
て、ステップ450へ進み、ステップ450で”ヒット
しなかった文の数”が所定の設定値を超えているかどう
かを判定する。ステップ450で所定の設定値を超えて
いると判定された場合は、それまでの分野の話題は終了
し別の分野の話題に移ったものと考えられるので、YE
Sの矢印を通じてステップ460へ進み、ステップ46
0でそれまで基本辞書より優先順位の高かった分野別辞
書の優先順位を基本辞書より下げる処理を行う。ステッ
プ450で所定の設定値を超えていないと判定された場
合は、まだ別の分野に移っていないと考えられるので、
NOの矢印を通じて即時にステップ260へ進む。
【0042】図5を使用して、図2のステップ280の
分野判定情報の保存処理を詳細に説明する。ステップ5
10で後述するパターンの出現頻度を算出するためのデ
ータである履歴情報、すなわち、URL、文の総数、ヒ
ットしたパターンの総数を蓄積する。履歴情報の蓄積
は、翻訳処理(ステップ200乃至270)における解
析結果を使用して行うとよい。ステップ520へ進み、
このURLの履歴情報が所定の回数分以上存在するかど
うかを判定する。なお、ここで言う1回分の履歴情報と
は、そのURLに対して1度翻訳を行った際に得られた
履歴情報を意味する。所定の回数分以上存在する場合
は、YESの矢印を通じてステップ530へ進み、陳腐
化している可能性の高いであろうことを考慮し、古いも
のから履歴情報を削除し、その後ステップ540へ進
む。所定の回数分以上存在しない場合は、削除等の処理
は行わず、NOの矢印を通じてそのままステップ540
へ進む。
【0043】ステップ540では、蓄積されているすべ
ての履歴情報から分野(分野別辞書)ごとのパターンの
出現頻度を求める。出現頻度は「ヒットしたパターンの
総数」を「センテンス(文)の総数」で割り、比率を求
めることにより算出すればよい。ステップ550へ進
み、ステップ540で求めた出現頻度を使用して、所定
の第1の閾値を越える出現頻度を有する分野が存在する
かどうかを判定する。存在しない場合は、NOの矢印を
通じてステップ290へそのまま進む。存在する場合
は、YESの矢印を通じてステップ560へ進み、ステ
ップ560でステップ550において所定の第1の閾値
を超えたと判定された分野の中で最大の出現頻度を有す
る分野の出現頻度が他の分野の出現頻度と比較して突出
しているかどうかを判定する。突出しているかどうか
は、前記最大の出現頻度を有する分野の出現頻度と全分
野の出現頻度の総和との比率が所定の第2の閾値を超え
ているかどうかを判定することができる。最大の出現頻
度を有する分野の出現頻度が他の分野の出現頻度と比較
して突出していない場合は、NOの矢印を通じてステッ
プ290へ進む。最大の出現頻度を有する分野の出現頻
度が他の分野の出現頻度と比較して突出している場合
は、YESの矢印を通じてステップ570へ進み、ステ
ップ570で当該リソースのURLと当該分野の分野別
辞書を関連付けた分野判定情報を分野判定情報記憶部へ
追加し、ステップ290へ進む。
【0044】ステップ550で、所定の第1の閾値を超
える出現頻度を持つ分野別辞書が存在することを分野別
判定情報を追加する条件にしているので「分野なし型」
のリソースが関連付けの対象から排除される。このステ
ップで、例えば、図6のように特定の分野(分野B)に
出現頻度が集中しているが第1の閾値を超えない場合を
「分野なし型」のリソースと判断して関連付けの対象か
ら排除することができる。
【0045】ステップ560で、最大のパターンの出現
頻度を有する分野のパターンの出現頻度が他の分野のパ
ターンの出現頻度と比較して突出していることを分野別
判定情報を追加する条件にしているので「多重分野型」
のリソースが関連付けの対象から排除される。例えば、
図7に示す、ステップ550でいう第1の閾値は超えて
いるが他の分野から出現頻度が突出していない分野(分
野B)を「多重分野型」のリソースと判断して関連付け
の対象から排除することできる。
【0046】また、すべての蓄積された履歴情報を使用
して分野判定を行うので、「分野変化型」のリソースに
対しては変化前後の両方の情報で相殺されるので突出し
た分野がなくなり分野判定されなくなる。以上の結果、
「特定分野型」のリソースに対してのみ対して分野判定
情報が追加され、「特定分野型」のリソースと適切な分
野別辞書の関連付けが行われる。
【0047】さらに好適な実施の形態として、複数のユ
ーザが生成した履歴情報を蓄積するサーバを設け、その
履歴情報に基づいて分野判定情報を生成するようにする
とよい。かかる構成によれば、単一のユーザの履歴情報
を使用している場合と比較して、履歴情報の更新が頻繁
に行われ、かつ、多くの種類のリソースの履歴情報が蓄
積されるのでより適切に、かつ、より多くのリソースに
対して分野別辞書を関連付けることができる。
【0048】さらに、同一のサイト(サーバのルート・
アドレス・ロケーション)内のリソースは同一の分野で
あることが多い。例えば、特許庁のサイト(http://ww
w.jpo.go.jp)内のリソースはほとんどが知的財産関係
の分野に属し、インターナショナル・ビジネス・マシー
ンズ・コーポレーション(出願人)のサイト(http://w
ww.ibm.com)内のリソースはコンピュータ関係の分野に
属する。
【0049】この特性を利用した好適な実施の形態とし
て、サイトに含まれる特定の分野別辞書と関連付けられ
ているリソースの出現頻度を分野別辞書ごとに算出し、
ある分野別辞書に関する出現頻度が所定の閾値を超えて
いると判定された場合に、当該サイトを当該特定の分野
別辞書と関連付けるようにすることができる。分野別辞
書ごとのリソースの出現頻度は、例えば、「その分野別
辞書に関連付けられたそのサイト内のリソースの総数」
を「履歴情報を有するそのサイト内のリソースの総数」
で割り、その比率を求めることにより算出すればよい。
この構成によれば、そのようなサイト内の履歴情報を持
たないリソースについても、当該サイトに関連付けられ
た分野別辞書を使用して自動翻訳することが可能とな
る。
【0050】なお、サイトと分野別辞書の関連付けにつ
いては、リソースと分野別辞書の関連付けにおいて「多
重分野型」のリソースを関連付けの対象から排除したの
と同様に、「多重分野型」のサイトを関連付けの対象か
ら排除すべく、最大のリソースの出現頻度を有する分野
のリソースの出現頻度が他の分野のリソースの出現頻度
と比較して突出していることを関連付けの条件とことも
できる。
【0051】上記の本発明の好適な実施例は、説明を目
的として記述されたものあって、すべての実施態様を記
述するものではなく、実施例に開示された形式に発明を
限定する意図ではない。上記の開示によれば、多くの変
更例とバリエーションが実現可能である。本発明の範囲
は発明の詳細な説明の記載により制限されるのではな
く、特許請求の範囲により定まるものであることに留意
されたい。上記の仕様、例、データにより本発明の一態
様の製造および使用が完全に説明される。本発明の多く
の実施例が本発明の精神と範囲を離れることなく実現さ
れる。
【0052】本発明によれば、一度翻訳処理を行ったリ
ソースの分野判定情報をフィードバックしてリソースと
分野別辞書の関連付けを行うことにより、より精度の高
い翻訳結果を得ることができる。一度翻訳処理が行わ
れ、分野別辞書と関連付けられているリソースに対して
は、従来の手法のようにパターンが出現するまでの文章
や、パターンが一定の間出現しない場合に適切に翻訳結
果が得られないといった問題を避け得る。また、ユーザ
が手作業でリソースと分野別辞書の関連付けを登録する
必要もない。本発明により、従来の技術と比較して、よ
り精度が高く、より利便性に優れた自動翻訳が可能とな
ることが理解される。
【図面の簡単な説明】
【図1】 本発明のリソースと分野別辞書を関連付ける
方法を適用するシステム構成の一例を示した概念図であ
る。
【図2】 本発明の実施の形態におけるリソースと分野
別辞書を関連付ける方法の処理の流れを示したフローチ
ャートである。
【図3】 本発明の実施の形態における辞書優先順位変
更処理(1)の流れをより詳細に示したフローチャート
である。
【図4】 本発明の実施の形態における辞書優先順位変
更処理(2)の流れをより詳細に示したフローチャート
である。
【図5】 本発明の実施の形態における分野判定情報の
保存処理の流れをより詳細に示したフローチャートであ
る。
【図6】 本発明の実施の形態における分野ごとの出現
頻度をあらわした第1のグラフの例である。
【図7】 本発明の実施の形態における分野ごとの出現
頻度をあらわした第2グラフの例である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 羽鳥 洋美 神奈川県大和市下鶴間1623番地14 日本ア イ・ビー・エム株式会社 大和事業所内 (72)発明者 神山 淑朗 神奈川県大和市下鶴間1623番地14 日本ア イ・ビー・エム株式会社 大和事業所内 Fターム(参考) 5B091 AA03 BA03 CC02 CC15 CC17 CD03 EA17

Claims (30)

    【特許請求の範囲】
  1. 【請求項1】 特定の分野と関連付けられたパターンの
    データベースを含むコンピュータ・システムにおいて、
    翻訳対象のリソースと特定の分野の翻訳に適した訳語を
    用意した分野別辞書とを関連付けるための方法であっ
    て、 前記分野ごとに前記リソースに含まれる前記パターンの
    出現頻度を算出するステップと、 前記分野ごとに前記パターンの出現頻度が所定の第1の
    閾値を超えているかどうかを判定する第1の判定ステッ
    プと、 前記第1の判定ステップにおいて所定の第1の閾値を超
    えたと判定された分野の中で最大のパターンの出現頻度
    を有する分野のパターンの出現頻度が他の分野のパター
    ンの出現頻度と比較して突出しているかどうかを判定す
    る第2の判定ステップと、 前記第2の判定ステップにおいて最大のパターンの出現
    頻度を有する分野の出現頻度が他の分野のパターンの出
    現頻度と比較して突出していると判定された場合に当該
    リソースと当該最大のパターンの出現頻度を有する分野
    の分野別辞書とを関連付けるステップと、 を有する方法。
  2. 【請求項2】 前記リソースは特定のアドレス・ロケー
    ションを有するネットワーク上のリソースであり、 前記関連付けるステップは、前記アドレス・ロケーショ
    ンと前記分野別辞書と関連付けることにより行われる、
    請求項1記載の方法。
  3. 【請求項3】 前記パターンは前記分野別辞書の見出し
    語の全部または一部である、請求項1記載の方法。
  4. 【請求項4】 前記パターンの出現頻度を算出するステ
    ップは、前記リソースに含まれる前記パターンの出現数
    と前記リソースに含まれるセンテンス数との比率を算出
    することにより行われる、請求項1記載の方法。
  5. 【請求項5】 前記パターンの出現頻度を算出するステ
    ップは、前記リソースを翻訳することにより行われ、前
    記リソースの翻訳を行った部分に含まれる前記パターン
    の出現数と前記リソースの翻訳を行った部分に含まれる
    センテンス数との比率を算出することにより行われる、
    請求項1記載の方法。
  6. 【請求項6】 前記パターンの出現頻度を算出するステ
    ップは、前記パターンの出現頻度の算出のためのデータ
    を蓄積するステップを含み、前記パターンの出現頻度の
    算出は蓄積されたデータを使用して行われる、請求項1
    記載の方法。
  7. 【請求項7】 前記データを蓄積するステップは、所定
    の基準前の蓄積データを削除するステップを含む、請求
    項6記載の方法。
  8. 【請求項8】 前記データを蓄積するステップは、複数
    のユーザにより生成された前記パターンの出現頻度の算
    出のためのデータを蓄積するサーバに前記パターンの出
    現頻度の算出のためのデータを蓄積することにより行わ
    れる、請求項7記載の方法。
  9. 【請求項9】 前記第2の判定ステップは、前記最大の
    出現頻度を有するパターンの分野の出現頻度と全分野の
    パターンの出現頻度の総和との比率が所定の第2の閾値
    を超えているかどうかを判定することにより実現され
    る、請求項1記載の方法。
  10. 【請求項10】 前記リソースを含むサイトに含まれる
    特定の分野別辞書と関連付けられたリソースの出現頻度
    を前記分野ごとに算出するステップと、 前記分野ごとに前記リソースの出現頻度が所定の第3の
    閾値を超えているかどうかを判定する第3の判定ステッ
    プと、 前記第3の判定ステップにおいて所定の第3の閾値を超
    えた分野があると判定された場合に当該サイトと当該分
    野の分野別辞書とを関連付けるステップと、 をさらに含む請求項1記載の方法。
  11. 【請求項11】 翻訳対象のリソースと特定の分野の翻
    訳に適した訳語を用意した分野別辞書とを関連付けるた
    めのコンピュータ・システムであって、 特定の前記分野と関連付けられたパターンのデータベー
    スと、 前記分野ごとに前記リソースに含まれる前記パターンの
    出現頻度を算出する手段と、 前記分野ごとに前記パターンの出現頻度が所定の第1の
    閾値を超えているかどうかを判定する第1の判定手段
    と、 前記第1の判定手段により所定の第1の閾値を超えたと
    判定された分野の中で最大のパターンの出現頻度を有す
    る分野のパターンの出現頻度が他の分野のパターンの出
    現頻度と比較して突出しているかどうかを判定する第2
    の判定手段と、 前記第2の判定手段により最大のパターンの出現頻度を
    有する分野のパターンの出現頻度が他の分野のパターン
    の出現頻度と比較して突出していると判定された場合に
    当該リソースと当該最大のパターンの出現頻度を有する
    分野の分野別辞書とを関連付ける手段と、 を有するコンピュータ・システム。
  12. 【請求項12】 前記リソースは特定のアドレス・ロケ
    ーションを有するネットワーク上のリソースであり、 前記関連付ける手段は、前記アドレス・ロケーションと
    前記分野別辞書と関連付ける、請求項11記載のコンピ
    ュータ・システム。
  13. 【請求項13】 前記パターンは前記分野別辞書の見出
    し語の全部または一部である、請求項11記載の方法。
  14. 【請求項14】 前記パターンの出現頻度を算出する手
    段は、前記リソースに含まれる前記パターンの出現数と
    前記リソースに含まれるセンテンス数との比率を算出す
    る、請求項11記載のコンピュータ・システム。
  15. 【請求項15】 前記パターンの出現頻度を算出する手
    段は、前記リソースを翻訳し、前記リソースの翻訳を行
    った部分に含まれる前記パターンの出現数と前記リソー
    スの翻訳を行った部分に含まれるセンテンス数との比率
    を算出する、請求項11に記載のコンピュータ・システ
    ム。
  16. 【請求項16】 前記パターンの出現頻度を算出する手
    段は、前記パターンの出現頻度の算出のためのデータを
    蓄積する手段を含み、前記パターンの出現頻度の算出に
    蓄積されたデータを使用する、請求項11に記載のコン
    ピュータ・システム。
  17. 【請求項17】 前記データを蓄積する手段は、所定の
    基準前の蓄積データを削除する手段を含む、請求項16
    に記載のコンピュータ・システム。
  18. 【請求項18】 前記データを蓄積する手段は、複数の
    ユーザにより生成された前記パターンの出現頻度の算出
    のためのデータを蓄積するサーバに前記パターンの出現
    頻度の算出のためのデータを蓄積する手段を含む、請求
    項17に記載の方法。
  19. 【請求項19】 前記第2の判定手段は、前記最大のパ
    ターンの出現頻度を有する分野のパターンの出現頻度と
    全分野のパターンの出現頻度の総和との比率が所定の第
    2の閾値を超えているかどうかを判定する、請求項11
    記載のコンピュータ・システム。
  20. 【請求項20】 前記リソースを含むサイトに含まれる
    特定の分野別辞書と関連付けられたリソースの出現頻度
    を前記分野ごとに算出する手段と、 前記分野ごとに前記リソースの出現頻度が所定の第3の
    閾値を超えているかどうかを判定する第3の判定手段
    と、 前記第3の判定手段により所定の第3の閾値を超えた分
    野があると判定された場合に当該サイトと当該分野の分
    野別辞書とを関連付ける手段と、 をさらに含む請求項11に記載のコンピュータ・システ
    ム。
  21. 【請求項21】 翻訳対象のリソースと特定の分野の翻
    訳に適した訳語を用意した分野別辞書とを関連付けるた
    めのコンピュータ・プログラムであって、特定の前記分
    野と関連付けられたパターンのデータベースをを有する
    コンピュータに、 前記分野ごとに前記リソースに含まれる前記パターンの
    出現頻度を算出する手順と、 前記分野ごとに前記パターンの出現頻度が所定の第1の
    閾値を超えているかどうかを判定する第1の判定手順
    と、 前記第1の判定手順において所定の第1の閾値を超えた
    と判定された分野の中で最大のパターンの出現頻度を有
    する分野のパターンの出現頻度が他の分野のパターンの
    出現頻度と比較して突出しているかどうかを判定する第
    2の判定手順と、 前記第2の判定手順において最大のパターンの出現頻度
    を有する分野のパターンの出現頻度が他のパターンの分
    野の出現頻度と比較して突出していると判定された場合
    に当該リソースと当該最大のパターンの出現頻度を有す
    る分野の分野別辞書とを関連付ける手順と、 を実行させるためのコンピュータ・プログラム。
  22. 【請求項22】 前記リソースは特定のアドレス・ロケ
    ーションを有するネットワーク上のリソースであり、 前記関連付ける手順は、前記アドレス・ロケーションと
    前記分野別辞書と関連付けることにより行われる、請求
    項21記載のコンピュータ・プログラム。
  23. 【請求項23】 前記パターンは前記分野別辞書の見出
    し語の全部または一部である、請求項21記載のコンピ
    ュータ・プログラム。
  24. 【請求項24】 前記パターンの出現頻度を算出する手
    順は、前記リソースに含まれる前記パターンの出現数と
    前記リソースに含まれるセンテンス数との比率を算出す
    ることにより行われる、請求項21記載のコンピュータ
    ・プログラム。
  25. 【請求項25】 前記パターンの出現頻度を算出する手
    順は、前記リソースを翻訳することにより行われ、前記
    リソースの翻訳を行った部分に含まれる前記パターンの
    出現数と前記リソースの翻訳を行った部分に含まれるセ
    ンテンス数との比率を算出することにより行われる、請
    求項21記載のコンピュータ・プログラム。
  26. 【請求項26】 前記パターンの出現頻度を算出する手
    順は、前記パターンの出現頻度の算出のためのデータを
    蓄積する手順を含み、前記パターンの出現頻度の算出は
    蓄積されたデータを使用して行われる、請求項21記載
    のコンピュータ・プログラム。
  27. 【請求項27】 前記データを蓄積する手順は、所定の
    基準前の蓄積データを削除する手順を含む、請求項26
    記載のコンピュータ・プログラム。
  28. 【請求項28】 前記データを蓄積する手順は、複数の
    ユーザにより生成された前記パターンの出現頻度の算出
    のためのデータを蓄積するサーバに前記パターンの出現
    頻度の算出のためのデータを蓄積することにより行われ
    る、請求項27記載のコンピュータ・プログラム。
  29. 【請求項29】 前記第2の判定手順は、前記最大のパ
    ターンの出現頻度を有する分野のパターンの出現頻度と
    全分野のパターンの出現頻度の総和との比率が所定の第
    2の閾値を超えているかどうかを判定することにより実
    現される、請求項21記載の方法。
  30. 【請求項30】 前記リソースを含むサイトに含まれる
    特定の分野別辞書と関連付けられたリソースの出現頻度
    を前記分野ごとに算出する手順と、 前記分野ごとに前記リソースの出現頻度が所定の第3の
    閾値を超えているかどうかを判定する第3の判定手順
    と、 前記第3の判定手順において所定の第3の閾値を超えた
    分野があると判定された場合に当該サイトと当該分野の
    分野別辞書とを関連付ける手順と、 をさらにコンピュータに実行させるための請求項21記
    載のコンピュータ・プログラム。
JP2001290620A 2001-09-25 2001-09-25 翻訳対象のリソースと分野別辞書を関連付けるための方法、システムおよびプログラム Expired - Fee Related JP3452558B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001290620A JP3452558B2 (ja) 2001-09-25 2001-09-25 翻訳対象のリソースと分野別辞書を関連付けるための方法、システムおよびプログラム
US10/254,115 US7089493B2 (en) 2001-09-25 2002-09-25 Method, system and program for associating a resource to be translated with a domain dictionary

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001290620A JP3452558B2 (ja) 2001-09-25 2001-09-25 翻訳対象のリソースと分野別辞書を関連付けるための方法、システムおよびプログラム

Publications (2)

Publication Number Publication Date
JP2003114889A true JP2003114889A (ja) 2003-04-18
JP3452558B2 JP3452558B2 (ja) 2003-09-29

Family

ID=19112897

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001290620A Expired - Fee Related JP3452558B2 (ja) 2001-09-25 2001-09-25 翻訳対象のリソースと分野別辞書を関連付けるための方法、システムおよびプログラム

Country Status (2)

Country Link
US (1) US7089493B2 (ja)
JP (1) JP3452558B2 (ja)

Families Citing this family (149)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060116865A1 (en) 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7904595B2 (en) 2001-01-18 2011-03-08 Sdl International America Incorporated Globalization management system and method therefor
US7203941B2 (en) * 2002-11-14 2007-04-10 Microsoft Corporation Associating a native resource with an application
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
JP3978221B2 (ja) * 2003-12-26 2007-09-19 松下電器産業株式会社 辞書作成装置および辞書作成方法
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
US8666725B2 (en) * 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
US7860873B2 (en) * 2004-07-30 2010-12-28 International Business Machines Corporation System and method for automatic terminology discovery
DE112005002534T5 (de) 2004-10-12 2007-11-08 University Of Southern California, Los Angeles Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet
JP4311365B2 (ja) * 2005-03-25 2009-08-12 富士ゼロックス株式会社 文書処理装置およびプログラム
US8676563B2 (en) * 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US7747427B2 (en) * 2005-12-05 2010-06-29 Electronics And Telecommunications Research Institute Apparatus and method for automatic translation customized for documents in restrictive domain
EP3534277B1 (en) 2006-02-17 2021-10-06 Google LLC Encoding and adaptive, scalable accessing of distributed models
US8943080B2 (en) * 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US20080168049A1 (en) * 2007-01-08 2008-07-10 Microsoft Corporation Automatic acquisition of a parallel corpus from a network
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US7895030B2 (en) * 2007-03-16 2011-02-22 International Business Machines Corporation Visualization method for machine translation
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8831928B2 (en) * 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
JP4349440B2 (ja) * 2007-06-07 2009-10-21 カシオ計算機株式会社 情報表示装置及び情報表示プログラム
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100017293A1 (en) * 2008-07-17 2010-01-21 Language Weaver, Inc. System, method, and computer program for providing multilingual text advertisments
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8990064B2 (en) * 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US9928296B2 (en) * 2010-12-16 2018-03-27 Microsoft Technology Licensing, Llc Search lexicon expansion
US10657540B2 (en) 2011-01-29 2020-05-19 Sdl Netherlands B.V. Systems, methods, and media for web content management
US9547626B2 (en) 2011-01-29 2017-01-17 Sdl Plc Systems, methods, and media for managing ambient adaptability of web applications and web services
US10580015B2 (en) 2011-02-25 2020-03-03 Sdl Netherlands B.V. Systems, methods, and media for executing and optimizing online marketing initiatives
US10140320B2 (en) 2011-02-28 2018-11-27 Sdl Inc. Systems, methods, and media for generating analytical data
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US20120253784A1 (en) * 2011-03-31 2012-10-04 International Business Machines Corporation Language translation based on nearby devices
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US9984054B2 (en) 2011-08-24 2018-05-29 Sdl Inc. Web interface including the review and manipulation of a web document and utilizing permission based control
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US9773270B2 (en) 2012-05-11 2017-09-26 Fredhopper B.V. Method and system for recommending products based on a ranking cocktail
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US10452740B2 (en) 2012-09-14 2019-10-22 Sdl Netherlands B.V. External content libraries
US11308528B2 (en) 2012-09-14 2022-04-19 Sdl Netherlands B.V. Blueprinting of multimedia assets
US11386186B2 (en) 2012-09-14 2022-07-12 Sdl Netherlands B.V. External content library connector systems and methods
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9916306B2 (en) 2012-10-19 2018-03-13 Sdl Inc. Statistical linguistic analysis of source content
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9977779B2 (en) * 2013-03-14 2018-05-22 Apple Inc. Automatic supplementation of word correction dictionaries
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN105264524B (zh) 2013-06-09 2019-08-02 苹果公司 用于实现跨数字助理的两个或更多个实例的会话持续性的设备、方法、和图形用户界面
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
CN103825952B (zh) * 2014-03-04 2017-07-04 百度在线网络技术(北京)有限公司 细胞词库推送方法和服务器
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
CN106610932A (zh) * 2015-10-27 2017-05-03 中兴通讯股份有限公司 一种语料处理方法和装置及语料分析方法和装置
US10614167B2 (en) 2015-10-30 2020-04-07 Sdl Plc Translation review workflow systems and methods
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
CN107402915A (zh) * 2017-07-17 2017-11-28 广州特道信息科技有限公司 多层语义的网络词库的生成方法及装置
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0378872A (ja) 1989-08-23 1991-04-04 Nec Corp 文書の分野推定システム
US5497319A (en) * 1990-12-31 1996-03-05 Trans-Link International Corp. Machine translation and telecommunications system
AU3969093A (en) * 1992-04-30 1993-11-29 Apple Computer, Inc. Method and apparatus for organizing information in a computer system
GB9220404D0 (en) * 1992-08-20 1992-11-11 Nat Security Agency Method of identifying,retrieving and sorting documents
US6278967B1 (en) * 1992-08-31 2001-08-21 Logovista Corporation Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis
JPH06348750A (ja) * 1993-06-11 1994-12-22 Matsushita Electric Ind Co Ltd 文書作成支援装置
US5848386A (en) * 1996-05-28 1998-12-08 Ricoh Company, Ltd. Method and system for translating documents using different translation resources for different portions of the documents
JP3450598B2 (ja) 1996-06-28 2003-09-29 株式会社東芝 専門用語辞書選択装置
US6311130B1 (en) * 1996-08-12 2001-10-30 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Computer implemented empirical mode decomposition method, apparatus, and article of manufacture for two-dimensional signals
US5956740A (en) * 1996-10-23 1999-09-21 Iti, Inc. Document searching system for multilingual documents
WO1998044433A1 (fr) * 1997-03-31 1998-10-08 Sanyo Electric Co., Ltd. Methode d'elaboration de document et appareillage pour traduction machine
US6167397A (en) * 1997-09-23 2000-12-26 At&T Corporation Method of clustering electronic documents in response to a search query
US6542888B2 (en) * 1997-11-26 2003-04-01 International Business Machines Corporation Content filtering for electronic documents generated in multiple foreign languages
JPH11175527A (ja) * 1997-12-15 1999-07-02 Fujitsu Ltd 出力制御装置及び出力制御方法
US6789230B2 (en) * 1998-10-09 2004-09-07 Microsoft Corporation Creating a summary having sentences with the highest weight, and lowest length
US6473753B1 (en) * 1998-10-09 2002-10-29 Microsoft Corporation Method and system for calculating term-document importance
US6584154B1 (en) * 1998-11-26 2003-06-24 Oki Electric Industry Co., Ltd. Moving-picture coding and decoding method and apparatus with reduced computational cost
US6381598B1 (en) * 1998-12-22 2002-04-30 Xerox Corporation System for providing cross-lingual information retrieval
US6625322B1 (en) * 1999-06-08 2003-09-23 Matsushita Electric Industrial Co., Ltd. Image coding apparatus
US6418434B1 (en) * 1999-06-25 2002-07-09 International Business Machines Corporation Two stage automated electronic messaging system
JP2001101185A (ja) 1999-09-24 2001-04-13 Internatl Business Mach Corp <Ibm> 辞書の自動切り換えが可能な機械翻訳方法および装置並びにそのような機械翻訳方法を実行するためのプログラムを記憶したプログラム記憶媒体
US6609131B1 (en) * 1999-09-27 2003-08-19 Oracle International Corporation Parallel partition-wise joins
US20040205671A1 (en) * 2000-09-13 2004-10-14 Tatsuya Sukehiro Natural-language processing system
JP2002108858A (ja) * 2000-09-20 2002-04-12 Internatl Business Mach Corp <Ibm> 機械翻訳方法、機械翻訳装置および記録媒体
US7017114B2 (en) * 2000-09-20 2006-03-21 International Business Machines Corporation Automatic correlation method for generating summaries for text documents
US20020040293A1 (en) * 2000-09-30 2002-04-04 Lee Soo Sung System and method for searching a web site having an English-based domain name mapped to another language-based domain name by employing a web browser
JP3768105B2 (ja) * 2001-01-29 2006-04-19 株式会社東芝 翻訳装置、翻訳方法並びに翻訳プログラム
JP3379090B2 (ja) * 2001-03-02 2003-02-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム
US20020169592A1 (en) * 2001-05-11 2002-11-14 Aityan Sergey Khachatur Open environment for real-time multilingual communication
US6910037B2 (en) * 2002-03-07 2005-06-21 Koninklijke Philips Electronics N.V. Method and apparatus for providing search results in response to an information search request

Also Published As

Publication number Publication date
US7089493B2 (en) 2006-08-08
JP3452558B2 (ja) 2003-09-29
US20030061570A1 (en) 2003-03-27

Similar Documents

Publication Publication Date Title
JP3452558B2 (ja) 翻訳対象のリソースと分野別辞書を関連付けるための方法、システムおよびプログラム
US10929487B1 (en) Customization of search results for search queries received from third party sites
US7693825B2 (en) Systems and methods for ranking implicit search results
US8650483B2 (en) Method and apparatus for improving the readability of an automatically machine-generated summary
US8041713B2 (en) Systems and methods for analyzing boilerplate
JP3703080B2 (ja) ウェブコンテンツを簡略化するための方法、システムおよび媒体
EP1225517A2 (en) System and methods for computer based searching for relevant texts
US8375286B2 (en) Systems and methods for displaying statistical information on a web page
US20070276801A1 (en) Systems and methods for constructing and using a user profile
JP5360842B2 (ja) ウェブ文書を表示する端末装置が実行するプログラム
JP2001166981A (ja) ハイパーテキスト解析装置および方法
KR100393176B1 (ko) 문서 자동 요약에 의한 인터넷 정보 검색 시스템 및 방법
JP4743766B2 (ja) 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム
JP2001076001A (ja) イベント情報提供方法
JP2010097271A (ja) 広告配信装置、システム及び方法
JP2000339322A (ja) ユーザ属性特定方法、ユーザ属性特定装置、および、その方法を記録した記録媒体
JP6235632B2 (ja) リアルタイム・ライティング支援装置
JP2001175657A (ja) 自然言語対話装置、その方法および記憶媒体
JP5338363B2 (ja) ハイパーリンク生成装置、方法及びプログラム
JP2002123553A (ja) ネットワークにおける検索結果の表示方法、検索結果表示のための検索方法、そのための検索装置及びそのためのクライアント
JPH10149364A (ja) 訳語選択装置と記憶媒体
JP2001142899A (ja) 話題別関心度計算方法及び装置及び話題別関心度計算プログラムを格納した記憶媒体
Zheng et al. A study of intents resolving for service discovery
JP2008250690A (ja) Webサーバ
Guglielmo et al. Assessment of anaerobic threshold and performance of swimmers in crawl sprints of 400m

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees