JPH0689302A - 辞書メモリ - Google Patents

辞書メモリ

Info

Publication number
JPH0689302A
JPH0689302A JP4239257A JP23925792A JPH0689302A JP H0689302 A JPH0689302 A JP H0689302A JP 4239257 A JP4239257 A JP 4239257A JP 23925792 A JP23925792 A JP 23925792A JP H0689302 A JPH0689302 A JP H0689302A
Authority
JP
Japan
Prior art keywords
word
likelihood
dictionary memory
words
activity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4239257A
Other languages
English (en)
Inventor
Hiroyuki Kaji
博行 梶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP4239257A priority Critical patent/JPH0689302A/ja
Priority to US08/113,679 priority patent/US5652898A/en
Publication of JPH0689302A publication Critical patent/JPH0689302A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 語と語の関連度知識の学習とそれを利用した
自然言語処理を高速に行う辞書メモリを提供する。 【構成】 語の出現情報を記憶するワードユニット1を
語に対応させて設け,語と語の関連度を記憶するリンク
2でワードユニット間を接続したネットワークを構成す
る。ワードユニットは語の出現情報に基づいて語の活性
度を決定し,リンクが活性度及び語と語の関連度に基づ
いて語の期待度を決定し,ワードユニットが入力レジス
タ4中の語の尤度をその期待度を加味して決定する。次
に,最尤ワード選択部3が選択した語がそれに対応する
ワードユニットによって出力レジスタ5にセットされ
る。また,リンクは語の尤度と活性度に基づいて語と語
の関連度を更新する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は自然言語処理用の辞書メ
モリに係わり,特に,語と語の関連度とテキスト中の語
の出現情報を記憶,更新する機能を有する辞書メモリに
関する。
【0002】
【従来の技術】自然言語の意味のあるテキストは意味的
に関連のある語から構成される。従って,同一テキスト
中に共起する語は限定されている。このことを利用して
テキスト処理の精度が向上できることはよく知られてい
る。例えば,機械翻訳システムにおいて語と語の共起関
係を利用して訳語を選択する方法が特開昭63−132
379号公報に開示されている。仮名漢字変換における
同音異語の選択,音声認識における語の同定,テキスト
のスペル誤りの訂正などにも同様の考え方が利用されて
いる。共起関係を利用したテキスト処理は,共起し得る
語の組を記憶した共起関係辞書を用意しておき,ある語
に関して複数の候補がある場合に,各候補と該語の近傍
に出現する語の組が共起関係辞書に含まれるかどうかを
チェックすることによって実現されている。
【0003】語と語の共起関係を利用する上での他の問
題点として,共起関係知識をどのようにして獲得してい
くかということがある。これに関しては,例えば特開平
2−42572号公報に,文を構文解析し,依存関係が
成立する語の組を共起関係辞書に登録する方法が開示さ
れている。この方法によればテキストから自動的に共起
関係知識を学習することができる。
【0004】
【発明が解決しようとする課題】上記の特開昭63−1
32379号の方法においては,広い範囲の文脈を見よ
うとすると,多くの語の組についてチェックしなければ
ならず,処理時間が増大するという問題がある。
【0005】また特開平2−42572号公報に開示さ
れる方法においては,獲得される語の組が依存関係とい
う強い関係が成立するものに限定される上に,構文的に
曖昧でないという条件が加わるので,学習の効率が低い
という問題がある。
【0006】本発明の目的は,共起関係知識を利用した
テキスト処理を高速化するとともに,共起関係知識の学
習効率を高めた自然言語処理用辞書メモリを提供するこ
とである。
【0007】
【課題を解決するための手段】上記目的を達成するた
め,本発明では,自然言語の各語に対応させたワードユ
ニットとワードユニット間を接続するリンクとからなる
ネットワークを構成する。外部の自然言語処理システム
とのインタフェースとして語とその尤度を格納する入力
レジスタ,および出力レジスタを設ける。ワードユニッ
トには,先行文脈および後続文脈中の語の出現情報を記
憶する語出現情報記憶手段と,先行文脈および後続文脈
中の出現情報に基づいて語の活性度を決定する活性度決
定手段と,外部から与えられる暫定尤度を語の期待度に
基づいて補正して尤度を決定する尤度決定手段をもたせ
る。リンクには,語と語の関連度を記憶する関連度記憶
手段と,語の活性度および語と語の関連度から語の期待
度を決定する期待度決定手段と,語の活性度に基づいて
語と語の関連度を更新する関連度更新手段をもたせる。
さらに,ワードユニットが出力する尤度の最大値を求め
る最尤ワード選択手段を設け,全てのワードユニットと
接続させる。
【0008】
【作用】入力レジスタに語の候補とそれぞれの暫定尤度
がセットされると,各手段が次のように動作する。活性
度決定手段が,語出現情報記憶手段に記憶されている情
報に基づいて,その時点における語の活性度を決定す
る。次に,期待度決定手段が,語の活性度および語と語
の関連度に基づいて語の期待度を決定する。さらに,尤
度決定手段が暫定尤度と期待度に基づいて語の尤度を決
定する。この結果を受けて,最尤ワード選択手段が尤度
最大の語を選択する。このようにして,先行文脈および
後続文脈中の語の出現情報を利用して,最大尤度の語が
選択され,出力レジスタにセットされる。さらに,関連
度更新手段が語の活性度に基づいて語と語の関連度を更
新する。これは,選択された語とその時点で活性度の高
い語との関連度を強める処理であり,関連度に語と語の
共起関係に関する知識が集積されていくことになる。な
お,以上の動作において,全てのワードユニットが並列
に動作し,同じく全てのリンクが並列に動作する。従っ
て,辞書メモリによる最尤ワードの決定,関連度の学習
とも高速に実現される。
【0009】
【実施例】本発明の1実施例の辞書メモリを以下に説明
する。図1はその全体構成を示す図である。主要な要素
はワードユニット1とリンク2である。ワードユニット
は,対象とする自然言語の語彙数Nと同数設けられ,そ
れぞれ一つの語に対応している。リンクの総数はN×N
個であって,任意のワードユニット間がリンクで接続さ
れている。また,一つの最尤ワード選択部3が設けら
れ,全てのワードユニットと接続されている。他の構成
要素としてp個の入力レジスタ4とq個の出力レジスタ
5がある。pは辞書メモリに入力する語の候補の数,q
は辞書メモリが出力する語の数であり,これらの値は辞
書メモリを使用する自然言語処理システムに応じて設定
すればよい。以上の構成要素,すなわちワードユニット
1,リンク2,最尤ワード選択部3,入力レジスタ4,
および出力レジスタ5はタイミング信号発生部6ととも
に共通バス7に接続されている。
【0010】ワードユニット1は,図2に示すように,
ワードレジスタ11,(s+t+1)個の尤度レジスタ
12と暫定尤度入力部13,活性度決定部14,期待度
マージ部15,尤度決定部16,ワード出力部17,尤
度レジスタシフト部18から構成される。sおよびtは
語の尤度決定に利用する後続文脈および先行文脈の範囲
を示すパラメータであり,それらの値は辞書メモリを使
用する自然言語処理システムに応じて設定すればよい。
第iワードユニットには第(1,i),第(2,i),
…,第(N,i)の合計N個のリンクからの期待度が入
力となる。第iワードユニットからは尤度が最尤ワード
選択部に出力され,活性度が第(i,1),第(i,
2),…,第(i,N)の合計N個のリンクに出力され
る。
【0011】リンク2は,図3に示すように,関連度レ
ジスタ21と期待度決定部22,関連度更新部23から
構成される。第(i,j)リンクには第iワードユニッ
トからの活性度が入力となり,第(i,j)リンクから
は期待度が第jワードユニットに出力される。
【0012】入力レジスタ4は図4(a)に示すように
入力ワード41とその暫定尤度42を格納する部分から
なる。出力レジスタ5も同様で,図4(b)に示すよう
に出力ワード51とその尤度52を格納する部分からな
る。
【0013】タイミング信号発生部6は,本辞書メモリ
を使用する外部のシステムとのデータ授受および辞書メ
モリ各部の動作のタイミングを制御する。外部から入力
レジスタに語の候補とそれらの暫定尤度が格納される
と,辞書メモリの各部は図5に示す順序で動作する。こ
の動作の間,入力レジスタおよび出力レジスタへの外部
からのアクセスは禁止される。図5に示す1サイクルの
動作が終了すると,入力レジスタおよび出力レジスタへ
の外部からのアクセスが可となる。外部のシステムは出
力レジスタに格納されている語と尤度を読み取り処理を
続ければよい。
【0014】以下,辞書メモリの各部の動作を説明す
る。
【0015】(1)暫定尤度入力部13 1サイクル中にp回動作を繰り返すが,第i回目には次
のように動作する。第i入力レジスタの入力ワード41
を読み込み,ワードレジスタ11と比較する。一致して
いれば,第i入力レジスタの暫定尤度42を読み込み,
第(−s)尤度レジスタ12に格納する。一致しなけれ
ば何もしない。なお,特殊な動作として,第i入力レジ
スタの入力ワード41が「9999」であるときには,
第(−s)から第tの全ての尤度レジスタ12の値を0
にする。これは,辞書メモリ中の語出現情報をリセット
する手段として設けられている。
【0016】(2)活性度決定部14 後続文脈中の語出現情報,すなわち第(−s),…,第
(−1)尤度レジスタの値,および先行文脈中の語出現
情報,すなわち第1,…,第t尤度レジスタの値に基づ
いて活性度を算出し,リンクに出力する。活性度の算出
方法は種々考えられるが,本実施例では活性度を次式で
算出する。ここに,Pr(i)は第i尤度レジスタの値
を表す。また,dは定数である。
【0017】(1−(s−1)・d)・Pr(−s) +(1−(s−2)・d)・Pr(−s+1) … +(1−d)・Pr(−2) +Pr(−1) +Pr(1) +(1−d)・Pr(2) … +(1−(t−2)・d)・Pr(t−1) +(1−(t−1)・d)・Pr(t) (3)期待度決定部22 入力側ワードユニットが出力する活性度と関連度レジス
タ21に記憶されている関連度に基づいて出力側ワード
ユニットに対応する語の期待度を算出し,ワードユニッ
トに出力する。期待度の算出方法は種々考えられるが,
本実施例では,活性度と関連度の積を期待度とする。
【0018】(4)期待度マージ部15 入力側の各リンクからの期待度を統合して,自ワードユ
ニットに対応する語の期待度を求め,尤度決定部に出力
する。期待度の統合方法は種々考えられるが,本実施例
では,各リンクからの期待度の最大値を求めるものとす
る。
【0019】(5)尤度決定部16 期待度マージ部15が出力する期待度に基づいて,第0
尤度レジスタ12の値を補正,更新すると同時に,更新
した尤度を最尤ワード選択部3に出力する。尤度の補正
方法は種々考えられるが,本実施例では,第0尤度レジ
スタの値と期待度との積を第0尤度レジスタの新しい値
とする。
【0020】(6)最尤ワード選択部3 最大の尤度を出力しているワードユニットのユニット番
号を決定し,該ユニット番号を共通バス7を通じて,全
ワードユニットおよび全リンクに送信する。
【0021】(7)ワード出力部17 1サイクル中にq回動作するが,第i回目には次のよう
に動作する。最尤ワード選択部3から受け取ったユニッ
ト番号が自ワードユニットのユニット番号であるかどう
かチェックする。自ワードユニットのユニット番号であ
れば,ワードレジスタ11の値と第0尤度レジスタ12
の値を第i出力レジスタの出力ワード51と尤度52に
それぞれ出力した上で,最尤ワード選択部3への出力を
0に変更する。自ユニットのユニット番号でなければ何
もしない。
【0022】(8)関連度更新部23 1サイクル中にq回動作するが,第i回目には次のよう
に動作する。最尤ワード選択部3から受け取ったユニッ
ト番号が自リンクの出力側ワードユニットのユニット番
号であるかどうかチェックする。自リンクの出力側ワー
ドユニットのユニット番号であれば,入力側ワードユニ
ットから出力されている活性度と第i出力レジスタの尤
度52に基づいて関連度を更新する。関連度の新しい値
の算出方法は種々考えられるが,本実施例では,入力側
ワードユニットの活性度と出力レジスタの尤度との積を
それまでの関連度の値に加算するものとする。
【0023】(9)尤度レジスタシフト部18 第(t−1)尤度レジスタの値を第t尤度レジスタに,
第(t−2)尤度レジスタの値を第(t−1)尤度レジ
スタに,…,第(−s)尤度レジスタの値を第(−s+
1)尤度レジスタにというように尤度レジスタの内容を
シフトする。ただし,第1尤度レジスタには第0尤度レ
ジスタの値をそのままシフトさせるのでなく,最尤ワー
ドの尤度を基準に正規化した値を格納するものとする。
すなわち,(第0尤度レジスタの値)/(第1出力レジ
スタの尤度の値)を格納する。また,第(−s)尤度レ
ジスタの値は0にする。
【0024】以上のように辞書メモリの各部が動作する
ことによって,入力レジスタよりsサイクル遅れて,語
の候補とそれらの尤度が出力レジスタに格納される。
【0025】本発明の辞書メモリはさまざまの自然言語
処理システムに利用できる。以下にその例を示す。
【0026】第1の例は音声認識システムである。音声
波形の処理,特徴抽出を経て音韻認識の結果を音韻ラテ
ィスの形で得る。音韻列表記を見出しとする単語辞書を
参照して音韻ラティスを単語ラティスに変換する。単語
ラティス中の単語には,音韻ラティス中の音韻に付され
た尤度に基づいて算出された尤度が付されている。音声
認識システムは,単語ラティスに含まれる単語とその尤
度を,時間軸に沿った順序で,本発明の辞書メモリに入
力する。辞書メモリは,入力された単語の尤度を先行あ
るいは後続の語との関連度に基づいて補正し,出力す
る。音声認識システムは,辞書メモリの出力に応じて単
語ラティス中の単語の尤度を更新した上で,単語ラティ
スから最尤の単語列を選択する。
【0027】第2の例は機械翻訳システムの訳語選択へ
の利用である。機械翻訳システムのソース言語解析部が
原文を解析し,原文中間表現を得る。原文中間表現で
は,ソース言語の単語が構成要素になっている。機械翻
訳システムのトランスファ部は,対訳辞書と構造変換規
則を用いて,原文中間表現を訳文中間表現に変換する。
ここで,通常,対訳辞書は一つのソース言語の単語に対
して複数のターゲット言語の訳語候補を示している。そ
こで,原文中間表現中の単語ごとに,順次,訳語候補を
本発明の辞書メモリに入力する。暫定尤度は全て1とし
て入力して構わない。辞書メモリは,原文中間表現中の
単語ごとに,順次,訳語候補の尤度を出力するので,機
械翻訳システムのトランスファ部は尤度の高い訳語候補
を選択する。このようにして訳文中間表現が得られる
と,機械翻訳システムのターゲット言語生成部が訳文中
間表現から訳文を生成する。
【0028】第3の例は,自然言語文の構文解析におけ
る曖昧生解消への利用である。ここで利用する辞書メモ
リはs=0,t=1とする。また,構文解析プログラム
は語の係り先の候補を全て求める方法を採用しているも
のとする。語wの係り先候補がw1,w2,…,wnで
あるとする。構文解析プログラムは,まず,辞書メモリ
に「9999」を入力し,次のサイクルで「w」を入力
し,次のサイクルで「w1,w2,…,wn」を入力す
る。このようにすれば,wだけが活性度の高い状態でw
1,w2,…,wnの尤度が決定されることになるの
で,w1,w2,…,wnのうちwとの関連度が高い語
が出力される。構文解析プログラムはこの結果に基づい
てwの係り先を決定することができる。
【0029】
【発明の効果】本発明によれば,語と語の共起関係知識
を語の関連度という形でテキストから自動的に獲得する
とともに,獲得した知識を利用して,自然言語処理にお
いて生じる語の曖昧性を解消する処理を高速に行うこと
ができる。
【図面の簡単な説明】
【図1】辞書メモリの全体構成図である。
【図2】ワードユニットの構成図である。
【図3】リンクの構成図である。
【図4】入力レジスタ及び出力レジスタの構成図であ
る。
【図5】1サイクルの動作の順序を示す図である。
【符号の説明】
1・・・ワードユニット、11・・・ワードレジスタ、
12・・・尤度レジスタ、13・・・暫定尤度入力部、
14・・・活性度決定部、15・・・期待度マージ部、
16・・・尤度決定部、17・・・ワード出力部、18
・・・尤度レジスタシフト部、2・・・リンク、21・
・・関連度レジスタ、22・・・期待度決定部、23・
・・関連度更新部、3・・・最尤ワード選択部、4・・
・入力レジスタ、41・・・入力ワード、42・・・暫
定尤度、5・・・出力レジスタ、51・・・出力ワー
ド、52・・・尤度、6・・・タイミング信号発生部、
7・・・共通バス

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】語と語の関連度を記憶する手段とテキスト
    中の語の出現情報を記憶する手段とを含むことを特徴と
    する辞書メモリ。
  2. 【請求項2】請求項1記載の辞書メモリであって,テキ
    スト中の語の出現情報に基づいて語の活性度を決定する
    手段を含むことを特徴とする辞書メモリ。
  3. 【請求項3】請求項2記載の辞書メモリであって,より
    近傍の文脈中に出現する語であるほど活性度を高くする
    ことを特徴とする辞書メモリ。
  4. 【請求項4】請求項2または3記載の辞書メモリであっ
    て,語と語の関連度は同一テキスト中に共起する可能性
    の大きさを表す情報であって,テキスト中に語が出現す
    ると,該語と他の語との関連度をその時点における語の
    活性度に基づいて更新する手段を含むことを特徴とする
    辞書メモリ。
  5. 【請求項5】請求項2,3または4記載の辞書メモリで
    あって,語と語の関連度と語の活性度に基づいて語の尤
    度を決定する手段を含むことを特徴とする辞書メモリ。
  6. 【請求項6】請求項2,3または4記載の辞書メモリで
    あって,テキスト中に出現する語の候補を入力する手段
    と,語と語の関連度と語の活性度に基づいて各候補の尤
    度を決定する手段と,各候補の尤度を出力する手段を含
    むことを特徴とする辞書メモリ。
  7. 【請求項7】請求項2,3または4記載の辞書メモリで
    あって,テキスト中に出現する語の候補をそれぞれの尤
    度とともに入力する手段と,語と語の関連度と語の活性
    度に基づいて各候補の尤度を補正する手段と,各候補の
    補正された尤度を出力する手段を含むことを特徴とする
    辞書メモリ。
  8. 【請求項8】請求項2,3または4記載の辞書メモリで
    あって,テキスト中に出現する語の候補を入力する手段
    と,語と語の関連度と語の活性度に基づいて各候補の尤
    度を決定し,最大尤度の語を選択する手段と,選択され
    た最大尤度の語を出力する手段を含むことを特徴とする
    辞書メモリ。
  9. 【請求項9】請求項2,3または4記載の辞書メモリで
    あって,テキスト中に出現する語の候補をそれぞれの尤
    度とともに入力する手段と,語と語の関連度と語の活性
    度に基づいて各候補の尤度を補正し,最大尤度の語を選
    択する手段と,選択された最大尤度の語を出力する手段
    を含むことを特徴とする辞書メモリ。
  10. 【請求項10】語に対応して設けられ,テキスト中の該
    対応する語の出現情報を記憶する手段を有するワードユ
    ニットと,語の対に対応して設けられ,該対をなす語と
    語の関連度を記憶する手段を有するリンクとから構成さ
    れるネットワーク構造をなすことを特徴とする辞書メモ
    リ。
JP4239257A 1992-09-08 1992-09-08 辞書メモリ Pending JPH0689302A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP4239257A JPH0689302A (ja) 1992-09-08 1992-09-08 辞書メモリ
US08/113,679 US5652898A (en) 1992-09-08 1993-08-31 Dictionary memory for text processing using word frequency and word recency occurrence information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4239257A JPH0689302A (ja) 1992-09-08 1992-09-08 辞書メモリ

Publications (1)

Publication Number Publication Date
JPH0689302A true JPH0689302A (ja) 1994-03-29

Family

ID=17042077

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4239257A Pending JPH0689302A (ja) 1992-09-08 1992-09-08 辞書メモリ

Country Status (2)

Country Link
US (1) US5652898A (ja)
JP (1) JPH0689302A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08129559A (ja) * 1994-11-02 1996-05-21 Nippon Telegr & Teleph Corp <Ntt> 曖昧検索用インデックス情報作成装置及び曖昧検索用インデックス情報作成方法

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0869470A (ja) * 1994-06-21 1996-03-12 Canon Inc 自然言語処理装置及びその方法
JP2817776B2 (ja) * 1995-05-25 1998-10-30 日本電気株式会社 単語変換装置
JPH09128396A (ja) * 1995-11-06 1997-05-16 Hitachi Ltd 対訳辞書作成方法
JPH1011434A (ja) * 1996-06-21 1998-01-16 Nec Corp 情報認識装置
US6260008B1 (en) * 1998-01-08 2001-07-10 Sharp Kabushiki Kaisha Method of and system for disambiguating syntactic word multiples
JP4438028B2 (ja) * 1998-07-27 2010-03-24 キヤノン株式会社 情報処理装置及びその方法、及びそのプログラムを記憶した記憶媒体
JP2001075964A (ja) 1999-08-31 2001-03-23 Sony Corp 情報処理装置および情報処理方法、並びに記録媒体
US7403888B1 (en) 1999-11-05 2008-07-22 Microsoft Corporation Language input user interface
US6848080B1 (en) 1999-11-05 2005-01-25 Microsoft Corporation Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors
US7047493B1 (en) 2000-03-31 2006-05-16 Brill Eric D Spell checker with arbitrary length string-to-string transformations to improve noisy channel spelling correction
US8744835B2 (en) * 2001-03-16 2014-06-03 Meaningful Machines Llc Content conversion method and apparatus
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
US8874431B2 (en) * 2001-03-16 2014-10-28 Meaningful Machines Llc Knowledge system method and apparatus
US7254530B2 (en) * 2001-09-26 2007-08-07 The Trustees Of Columbia University In The City Of New York System and method of generating dictionary entries
WO2003077151A2 (en) * 2002-03-05 2003-09-18 Siemens Medical Solutions Health Services Corporation A dynamic dictionary and term repository system
US7380203B2 (en) * 2002-05-14 2008-05-27 Microsoft Corporation Natural input recognition tool
JP4050950B2 (ja) * 2002-07-26 2008-02-20 富士通株式会社 対訳候補表示装置および対訳候補表示プログラム
US20040186704A1 (en) * 2002-12-11 2004-09-23 Jiping Sun Fuzzy based natural speech concept system
JP3765801B2 (ja) * 2003-05-28 2006-04-12 沖電気工業株式会社 対訳表現抽出装置、対訳表現抽出方法、および対訳表現抽出プログラム
US7734627B1 (en) 2003-06-17 2010-06-08 Google Inc. Document similarity detection
JP3890326B2 (ja) * 2003-11-07 2007-03-07 キヤノン株式会社 情報処理装置、情報処理方法ならびに記録媒体、プログラム
US7529668B2 (en) * 2004-08-03 2009-05-05 Sony Corporation System and method for implementing a refined dictionary for speech recognition
US7917355B2 (en) * 2007-08-23 2011-03-29 Google Inc. Word detection
CN101960451A (zh) * 2008-02-29 2011-01-26 夏普株式会社 信息处理装置、方法、以及程序
US8190477B2 (en) * 2008-03-25 2012-05-29 Microsoft Corporation Computing a time-dependent variability value
JP5382651B2 (ja) * 2009-09-09 2014-01-08 独立行政法人情報通信研究機構 単語対取得装置、単語対取得方法、およびプログラム
US8977538B2 (en) * 2010-09-13 2015-03-10 Richard Salisbury Constructing and analyzing a word graph
CN102722526B (zh) * 2012-05-16 2014-04-30 成都信息工程学院 基于词性分类统计的重复网页和近似网页的识别方法
US9201876B1 (en) * 2012-05-29 2015-12-01 Google Inc. Contextual weighting of words in a word grouping
CN103076893B (zh) * 2012-12-31 2016-08-17 百度在线网络技术(北京)有限公司 一种用于实现语音输入的方法与设备
US10490306B2 (en) 2015-02-20 2019-11-26 Cerner Innovation, Inc. Medical information translation system
CN105718935A (zh) * 2016-01-25 2016-06-29 南京信息工程大学 一种适宜于视觉大数据的词频直方图计算方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2546245B2 (ja) * 1986-11-25 1996-10-23 株式会社日立製作所 自然言語文生成方法
JPH01314373A (ja) * 1988-06-15 1989-12-19 Hitachi Ltd 機械翻訳システムにおける訳語選択方式
JPH0242572A (ja) * 1988-08-03 1990-02-13 Hitachi Ltd 共起関係辞書生成保守方法
JPH05197389A (ja) * 1991-08-13 1993-08-06 Toshiba Corp 音声認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08129559A (ja) * 1994-11-02 1996-05-21 Nippon Telegr & Teleph Corp <Ntt> 曖昧検索用インデックス情報作成装置及び曖昧検索用インデックス情報作成方法

Also Published As

Publication number Publication date
US5652898A (en) 1997-07-29

Similar Documents

Publication Publication Date Title
JPH0689302A (ja) 辞書メモリ
US5610812A (en) Contextual tagger utilizing deterministic finite state transducer
JP5377889B2 (ja) 言語処理装置およびプログラム
US5895446A (en) Pattern-based translation method and system
KR100911621B1 (ko) 한영 자동번역 방법 및 장치
US4641264A (en) Method for automatic translation between natural languages
US6778949B2 (en) Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures
EP0813156B1 (en) Method and apparatus for language translation
US5550934A (en) Apparatus and method for syntactic signal analysis
US20060129396A1 (en) Method and apparatus for automatic grammar generation from data entries
KR20030094632A (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
US5088039A (en) System for translating adverb phrases placed between two commas through a converter using tree-structured conversion rules
US5065318A (en) Method of translating a sentence including a compound word formed by hyphenation using a translating apparatus
Brugnara et al. Dynamic language models for interactive speech applications.
Galley et al. Hybrid natural language generation for spoken dialogue systems
JPH0261763A (ja) 機械翻訳装置
KR100327114B1 (ko) 문장골격을 기반으로 한 자동번역 시스템 및 그 방법
JP2000222406A (ja) 音声認識翻訳装置及び方法
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법
Reich Relational networks
KR100303171B1 (ko) 형태소 접속 그래프를 사용한 형태소 및 구문 분석 방법
Altunyurt et al. Towards combining rule-based and statistical part of speech tagging in agglutinative languages
KR100327109B1 (ko) 음절단위 조건확률을 이용한 한국어 자동 띄어쓰기 방법
JP3084864B2 (ja) 文章入力装置
JP2000214881A (ja) 音声認識言語モデル生成装置及び音声認識言語モデル生成方法