JPH09212509A - 単文類似度計算装置 - Google Patents

単文類似度計算装置

Info

Publication number
JPH09212509A
JPH09212509A JP8018466A JP1846696A JPH09212509A JP H09212509 A JPH09212509 A JP H09212509A JP 8018466 A JP8018466 A JP 8018466A JP 1846696 A JP1846696 A JP 1846696A JP H09212509 A JPH09212509 A JP H09212509A
Authority
JP
Japan
Prior art keywords
similarity
sentence
unit
sentences
weight value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8018466A
Other languages
English (en)
Inventor
Susumu Sai
進 崔
Junichi Fukumoto
淳一 福本
Tetsuo Kinoshita
哲男 木下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP8018466A priority Critical patent/JPH09212509A/ja
Publication of JPH09212509A publication Critical patent/JPH09212509A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 容易に単文類似度の特性を変更することがで
きる単文類似度計算装置を提供する。 【解決手段】 構文解析部4は入力された原文と参照文
の構文構造を解析し、これらの構文構造に基づいて、主
辞類似度計算部6は原文と参照文の主辞の類似度を求
め、構文構造類似度計算部7は原文と参照文の構文構造
の類似度を求め、構成単語類似度計算部8は原文と参照
文の構成単語の類似度を求める。単文類似度計算部12
は、重み付け設定部14を介して入力された各類似度の
重み値に基づいて単文類似度を求める。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、翻訳装置、情報検
索装置等において、2つの文の類似度を求める単文類似
度計算装置に関する。
【0002】
【従来の技術】翻訳装置等では、入力された文(原文)
を認識するために、原文の構文構造を求め、求めた原文
の構文構造と予め用例データベース等に登録しておいた
文(参照文)の構文構造とを類似度計算装置等を用いて
比較し、原文に近い参照文を選択するようになってい
る。
【0003】例えば特開平3−276367号公報に開
示されている翻訳方式では入力された原言語の文(原
文)の構造を解析して木状の依存構造(構文構造)を求
め、求めた依存構造と用例データベース中の用例文(参
照文)の依存構造の類似度を求め、原言語に最も近い用
例文を選択し、選択した用例文に対応する目的言語の文
に基づいて翻訳文を作成するようになっている。
【0004】構文構造は、部分依存構造であり、属性値
(格フレーム、否定、相、法、態及び名詞、動詞の意味
的な情報)のリストとして表されている。このため、こ
のような構文構造から類似度を求める類似度計算装置で
は、各属性値毎に原文の構文構造と参照文の構文構造の
距離を求め、予め設定した各属性値の重みに従って各属
性値毎の距離を合成して総合的な類似度を求めるように
なっている。
【0005】
【発明が解決しようとする課題】上述のような類似度計
算装置では、総合的な類似度を求める計算式、各属性値
の重み等は、システムの設計者が装置の設計時に設定す
るようになっている。
【0006】例えば情報検索装置の場合には構成単語間
の類似度が特に重要となり、また、例えば翻訳装置等の
類似単語を用いた言い方の同じ参照文を用いることがで
きる場合には構成単語間の類似度の他に構文類似度が重
要となるため、類似度の計算式、各属性値の重み等を変
更することが望まれるが、これらの値をシステムの設計
時に設定している場合には、ユーザが容易に設定を変更
することができなかった。
【0007】また、従来の類似度計算装置では、直接ユ
ーザが類似度等を直接確認することが考慮されておら
ず、各々の類似度の値が0.5、1、1.2、3.5等
といった直感的な理解が困難な数値となっている。この
ため、ユーザがこのような値だけで類似度を理解するこ
とが困難であった。
【0008】本発明は上述のような問題点に鑑みてなさ
れたものであり、ユーザが容易に類似度の特性を変更す
ることができる単文類似度計算装置を提供することを目
的とする。また、本発明はユーザが容易に類似度の値の
意味を理解することができる単文類似度計算装置を提供
することを目的とする。
【0009】
【課題を解決するための手段】本発明に係る単文類似度
計算装置は、外部から供給される第1の文と第2の文の
構文構造を求める構文解析手段と、各々第1の文と第2
の文の類似度のパラメータを求める複数のパラメータ計
算手段と、各パラメータ計算手段により求めた類似度の
パラメータの重み値を設定する重み値設定手段と、重み
値設定手段により設定された各パラメータの重み値に基
づいて、各パラメータから第1の文と第2の文の総合的
な類似度を求める合成手段とを備えている。
【0010】少なくとも複数のパラメータ計算手段の内
の1つが、第1の文と第2の文の主辞の類似度又は第1
の文と第2の文の構文構造の類似度又は第1の文と第2
の文の構成単語の類似度の内、いずれか1つのパラメー
タを算出する構成としてもよい。また、合成手段により
求めた総合的な類似度を百分率で表示する表示手段を備
える構成としてもよい。
【0011】
【発明の実施の形態】本発明の一実施形態に係る単文類
似度計算装置は、図1に示すように、外部から供給され
た原文(第1の文)及び参照文(第2の文)の構文構造
を抽出する構文構造抽出部y1と、第1の文と第2の文
の構文構造から主辞の類似度、構文の類似度、構成単語
の類似度等を計算する類似度計算部y2と、各々の類似
度から総合的な類似度を求める類似度合成部y3とから
構成される。このような単文類似度計算装置は、情報検
索システム、機械翻訳システム、用例ベース推論、故障
診断支援等において辞書データベース等に登録されてい
る文と入力された文との比較を行うために用いられる。
【0012】この図1に示すように、上述の構文構造抽
出部y1は、入力される第1及び第2の文を保持する第
1及び第2の日本語単文保持部1、2と、第1及び第2
の文の構文構造を解析する構文構造解析部3と、第1及
び第2の構文構造を保持する構文構造保持部4、5とを
備えている。
【0013】類似度計算部y2は、第1及び第2の文の
主辞の類似度を求める主辞類似度計算部6と、第1及び
第2の文の構文の類似度を求める構文類似度計算部7
と、第1及び第2の文の構成単語の類似度を求める構成
単語類似度計算部8と、主辞類似度を保持する主辞類似
度保持部9と、構文類似度を保持する構文類似度保持手
段10と、構成単語類似度を保持する構成単語類似度保
持部11とを備えている。
【0014】類似度合成部y3は、各類似度毎に独立に
設定される重み値に基づいて総合的な類似度を求める単
文類似度計算部12と、単文類似度を保持する単文類似
度保持部13と、外部から供給される指示に基づいて各
類似度毎の重み値を設定する重み付け設定部14を備え
ている。
【0015】上述の図1に示す主辞類似度計算部6は、
さらに図2に示すように、第1及び第2の文から主辞を
抽出する主辞抽出部6aと、抽出された各々の主辞の類
似度を計算する単語類似度計算部6bとを備えている。
ここで主辞とは、構文構造内の係り受け構造の受け側の
単語のことであり、単文の場合は述語(動詞)が主辞と
なるが、例えば「私の本」のような文節の場合では受け
る側の名詞である「本」が主辞となる。
【0016】また、構文類似度計算部7は、さらに図3
に示すように、第1及び第2の文の構文構造中の格フレ
ーム数を計数する格フレームカウント部16と、第1の
文と第2の文で共通の格フレーム数を検出する共通格フ
レームカウント部17と、第1及び第2の文の格フレー
ム数を保持する第1及び第2の格フレーム数保持部1
8、19と、共通の格フレーム数を保持する共通格フレ
ーム数保持部20と、各々の格フレーム数に応じて第1
の文と第2の文の構文類似度を求める構文類似度計算部
21とを備えている。
【0017】構成単語類似度計算部8は、さらに図4に
示すように、第1の文と第2の文とで共通の格フレーム
を抽出する共通格フレーム抽出部23と、単語類似度計
算部24と、単語類似度累算部25とを備えている。
【0018】上述のように構成された単文類似度計算装
置に第1及び第2の文が供給されると、供給された第1
及び第2の文は各々第1及び第2の日本語単文保持部
1、2に保持される。構文解析部3は、第1及び第2の
日本語単文保持部1、2に保持された第1及び第2の文
を読み出し、各々の文の構文構造を解析し、解析した第
1及び第2の文の構文構造を各々第1及び第2の構文構
造保持部4、5に供給する。例えば第1あるいは第2の
文が「家でご飯を食べる」であった場合、構文解析部3
による解析結果は「食べる(で/家、を/ご飯)」とな
る。ここで、「食べる」は文の主辞であり、「で」と
「を」は格フレーム、「家」と「ご飯」はそれぞれ格フ
レームに属する単語である。
【0019】上述のように第1及び第2の構文構造保持
部4、5に第1及び第2の文の構文構造が供給される
と、主辞類似度計算部6の主辞抽出部6aは第1及び第
2の構文構造保持部4、5に保持されている第1及び第
2の文の構文構造から各々の主辞となる単語を抽出し、
抽出した主辞を単語類似度計算部6bに供給する。この
単語類似度計算部6bは、例えば”Calculating Word S
imilarity based on Common Attribute,Total Semanti
c Distance and Concept frequency”:Jin CUI,Hiroshi
YASUHARA ,6th International Conference on Human-C
omputer Interaction HCI'95において提案されている単
語の概念、概念の頻度、上位概念等を用いた単語類似度
計算方法等により第1及び第2の分の主辞の類似度を求
めて主辞類似度保持部9に供給する。
【0020】一方、第1及び第2の文の構文構造が求め
られると、構文類似度計算部7の格フレームカウント部
16は第1及び第2の文の構文構造中の格フレーム数を
計数し、各々第1及び第2の格フレーム数保持部18、
19に供給する。このとき、共通格フレームカウント部
17は、第1及び第2の文で共通の格フレーム数を検出
し、共通格フレーム数保持部20に供給する。ここで、
共通の格フレームとは、構文構造上で同様の役割を果た
す共通の格フレームのことであり、必ずしも同一ではな
い。例えば上述の格フレーム「で/家」の代わりに「で
/レストラン」等であってもよい。
【0021】構文類似度計算部21は第1及び第2の格
フレーム数保持部18、19及び共通格フレーム数保持
部20に保持されている各々の格フレーム数に応じて第
1の文と第2の文の構文類似度を求め、構文類似度保持
部10に供給する。この構文類似度は次式により求め
る。
【0022】 構文類似度=共通する格フレーム数/(第1の文の格フレーム数+第2の文の 格フレーム数) ・・・式1 また、構成単語類似度計算部8の共通格フレーム抽出部
23は第1及び第2の文で共通の格フレームを抽出して
単語類似度計算部24に供給する。単語類似度計算部2
4は共通の格フレームの単語の類似度を求める。単語類
似度累算部25は、共通格フレーム抽出部23によって
抽出された全ての格フレームに対する単語の類似度を積
算し、求めた積算値を構成単語類似度保持部11に供給
する。
【0023】具体的には、この構成単語類似度を求める
処理は、図5に示すフローチャートに従って行われる。
すなわち、ステップS1において単語類似度累算部25
が累算値をリセットする。続くステップS2において共
通格フレーム抽出部23が第1及び第2の文中で共通の
格フレームを抽出する。そして、ステップS3において
単語類似度累算部25は共通の格フレームが存在するか
否かを判定し、共通の格フレームが存在すればステップ
S4に進み、共通の格フレームが無ければ構成単語類似
度の計算を終了する。
【0024】ステップS4において単語類似度計算部2
4は、共通格フレーム抽出部23により抽出した共通の
格フレームの単語の類似度を求める。続くステップS5
において単語類似度累算部25は、単語類似度計算部2
4からの単語類似度を累算してステップS2に戻る。こ
れにより、共通格フレーム抽出部23により全ての共通
格フレームが抽出されるまでの間、ステップS2〜ステ
ップS5の処理が繰り返され、ステップS3において共
通格フレームが無いと判定すると、単語類似度累算部2
5は構成単語類似度の計算を終了し、累算値を構成単語
類似度として構成単語類似度保持部11に供給する。
【0025】上述のように各々の類似度が求められ、主
辞類似度保持部9、構文類似度保持手段10及び構成単
語類似度保持部11に各々の類似度が供給されると、単
文類似度計算部12は重み付け設定部14により各類似
度毎に独立に設定される重み値に基づいて2つの文の総
合的な単文類似度を求め、単文類似度保持部13に供給
する。この単文類似度は次式により求める。
【0026】 単文類似度=1−exp{−[W(主辞)×主辞類似度+W(構文)×構文類 似度+W(構成単語)×構成単語類似度]} ・・・式2 この式2は成長曲線(又は飽和曲線)に基づいて設計し
たものである。ここで、右辺第2項のexp(x)は、
自然対数の底eのx乗を示している。また、W(主
辞)、W(構文)、W(構成単語)は各々主辞類似度、
構文類似度、構成単語類似度の重み値である。これらの
重み値は、ユーザが上述の重み付け設定手段W1を介し
て、各々0〜∞(無限大)までの範囲内で任意に設定す
ることができるようになっている。しかしながら、実際
には計算上の限界があり、また、あまり大きな値である
と重み値と類似度の積が大きくなり過ぎて、式2の右辺
第2項が0に近くなってしまう。このため、実際の文を
幾つか入力したときの単文類似度を求めて、重み値を設
定する。
【0027】例えば情報検索等において2つの文の類似
度を求めるような場合には、同義語があるか否かが最も
重要となるため、構成単語類似度が特に重要となり。こ
のような場合には、構成単語類似度の重み値を他の2つ
に比較して重く、すなわち値を大きくする。
【0028】また、翻訳装置では、例えば「犬」を主語
とする動作を示す文を翻訳するときに、「猫」を主語と
する翻訳例(参照文)を参照することができるが、参照
文の構文構造が原文と近似である必要がある。このよう
な場合では、構成単語類似度の他に構文類似度をも重視
する必要があるため、これらの類似度の重み値を大きく
する。
【0029】この単文類似度装置では、上述したように
ユーザが容易に主辞類似度、構文類似度、構成単語類似
度の重み値を設定することができるため、単文類似度の
特性を容易に調整することができる。従って、用途に応
じた単文類似度の特性の変更が容易となり、装置の汎用
性を向上させることができる。
【0030】上述の式2に示す単文類似度の値は2つの
文が全く異なる場合の0から2つの文が完全に一致する
場合の1までの間で変化する。このため、この単文類似
度を百分率で表すと、単文類似度が0%であるときは2
つの文が0%同じ、100%であるときは2つの文が1
00%同じであると判断することができる。従って、こ
のように単文類似度を百分率で表すことによりユーザあ
るいは外部の機器は2つの文がどの程度類似しているか
を容易に把握することができる。
【0031】また、上述のような単文類似度計算装置
は、図6に示すような構成の計算機システムにおいて制
御用ソフトウェアを実行することにより実現することが
できる。この計算機システムは、キーボード、ポインテ
ィングデバイス等からなる入力部30と、ディスク装置
等からなるストレージデバイス31と、ワークステーシ
ョン32と、ディスプレイ装置等からなる表示部33と
を備えている。
【0032】このような計算機システムにおいて制御用
ソフトウェアを実行すると、この計算機システムは、図
7に示す機能ブロック図のように機能する。すなわち、
この計算機システムは上述の図1に示す単文類似度計算
装置と同様な構成及び機能を有する類似度計算部34
と、計算機システム全体の制御を行うOS(OperatingS
ystem)等の制御に応じて入力部30からの入力、表示
部33に表示する画像等を制御するGUI(Graphical
User Interface)制御部35とを備えている。
【0033】このGUI制御部35は、入力部30等か
ら供給される第1及び第2の文、各類似度の重み値等の
入力を制御すると共に、入力された第1及び第2の文、
各類似度の重み値及び類似度計算部34によって求めら
れた単文類似度等を表示部30に表示するための制御等
を行う入力/表示部36を備えている。
【0034】この入力/表示部36は入力部30等を介
して入力される第1及び第2の文、各類似度の重み値、
類似度計算部34によって求められた単文類似度等に応
じた画像データを形成し、この画像データを表示部33
に供給して画像を表示させる。この画像は図8に示すよ
うに、上述の第1及び第2の文を表示する第1及び第2
の文表示ウィンドウ41、42と、主辞類似度の重み値
W(主辞)、構文類似度の重み値W(構文)、構成単語
類似度の重み値W(構成単語)を示す第1から第3のイ
ンジケータ43、44、45と、単文類似度を示す第4
のインジケータ46等からなる。
【0035】第1、第2及び第3のインジケータ43、
44、45はそれぞれ環状の目盛り部43a、44a、
45aと、指針部43b、44b、45bとから構成さ
れており、第4のインジケータ46は棒状の目盛り部4
6aと、指針部46bとから構成されている。
【0036】第1及び第2の文の類似度を求める際に、
図6に示す入力部30を介してユーザから各類似度の重
み値が供給されると、図7に示す入力/表示部36は、
供給された各類似度の重み値を類似度計算部34に供給
すると共に、図8に示す各指針部43b〜45bの先端
が各目盛り部43a〜45aの各類似度の重み値に対応
する位置を指示するように画像データを更新し、更新し
た画像データを表示部33に供給する。これにより、各
類似度の重み値に対応する画像が表示される。
【0037】また、第1及び第2の文が供給されると、
入力/表示部36は、供給された第1及び第2の文を類
似度計算部34を構成する第1及び第2の日本語単文保
持部1、2に供給すると共に、第1及び第2の文表示ウ
ィンドウ41、42内に第1及び第2の文に応じた画像
が表示されるように画像データを更新し、更新した画像
データを表示部33に供給する。これにより、第1及び
第2の文に応じた画像が表示される。
【0038】そして、類似度計算部34により第1の文
と第2の文の類似度が計算されると入力/表示部36は
類似度計算部34の単文類似度保持部13から単文類似
度を読み出し、図8に示す指針部46bの先端が、目盛
り部46a上の単文類似度に対応する位置を指示するよ
うに画像データを更新し、更新した画像データを表示部
33に供給する。これにより、単文類似度に対応する画
像が表示される。
【0039】上述のように各類似度の重み値、単文類似
度に基づく画像を表示する構成とすれば、ユーザは表示
を見ることによって各類似度及び重み値、単文類似度を
容易に把握することができる。従って、表示を確認しな
がら各類似度の調整等を行うことにより、操作の間違い
を防止することができ、作業性を向上させることができ
る。また、ユーザは各類似度の重み値を変更した後、単
文類似度に基づく画像を確認することにより、各重み値
に応じた単文類似度の変化を確認することができる。
【0040】なお、上述の実施形態では、主辞類似度、
構文類似度、構成単語類似度の3つの類似度の重み値を
変更する場合について説明したが、この他のパラメー
タ、例えば「〜である」、「〜であった」等の時制、
「〜である」、「〜でない」等の否定、あるいは相、
法、態等といったパラメータの類似度を、上述の各類似
度と同様にユーザからの入力に基づいて設定することが
できる構成とすることにより、単文類似度の特性を容易
に可変することができる。
【0041】
【発明の効果】本発明に係る単文類似度計算装置では、
複数のパラメータ計算手段により求めた類似度の各パラ
メータ毎に独立に設定される重み値に基づいて、各パラ
メータから第1及び第2の文の総合的な類似度を求める
構成としているため、各類似度の重み値を可変すること
により、第1及び第2の文の類似度の特性を容易に調整
することができる。
【0042】また、少なくとも複数のパラメータ計算手
段の内の1つが、第1の文と第2の文の主辞の類似度又
は第1の文と第2の文の構文構造の類似度又は第1の文
と第2の文の構成単語の類似度の内、いずれか1つのパ
ラメータを算出する構成とすることにより、類似度を求
めるための主要なパラメータを容易に変更することがで
きる。
【0043】また、総合的な類似度を百分率で表示する
表示手段を設けることによりユーザが類似度を容易に把
握することができる。
【図面の簡単な説明】
【図1】 本発明の第1の実施形態に係る単文類似度計
算装置の構成を示すブロック図である。
【図2】 上記単文類似度計算装置を構成する主辞類似
度計算部の詳細な構成を示すブロック図である。
【図3】 上記単文類似度計算装置を構成する構文類似
度計算部の詳細な構成を示すブロック図である。
【図4】 上記単文類似度計算装置を構成する構成単語
類似度計算部の詳細な構成を示すブロック図である。
【図5】 上記構成単語類似度計算部の動作を説明する
ためのフローチャートである。
【図6】 制御用ソフトウェアにより本発明に係る単文
類似度計算装置を実現する計算機システムの構成を示す
ブロック図である。
【図7】 上記計算機システムの動作を示す機能ブロッ
ク図である。
【図8】 単文類似度の計算時に上記計算機システムを
構成する表示部に表示される画像を示す図である。
【符号の説明】
3 構文解析部、6 主辞類似度計算部、7 構文類似
度計算部、8 構成単語類似度計算部、14 重み付け
設定部、y1 構文構造抽出部、y2 類似度計算部、
y3 類似度合成部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 外部から供給される第1文と第2の文の
    構文構造を求める構文解析手段と、 各々上記第1の文と第2の文の類似度のパラメータを求
    める複数のパラメータ計算手段と、 上記各パラメータ計算手段により求めた類似度のパラメ
    ータの重み値を設定する重み値設定手段と、 該重み値設定手段により設定された各パラメータの重み
    値に基づいて、各パラメータから第1の文と第2の文の
    総合的な類似度を求める合成手段とを備える単文類似度
    計算装置。
  2. 【請求項2】 少なくとも上記複数のパラメータ計算手
    段の内の1つは、上記第1の文と第2の文の主辞の類似
    度又は第1の文と第2の文の構文構造の類似度又は第1
    の文と第2の文の構成単語の類似度の内、いずれか1つ
    のパラメータを求めることを特徴とする請求項1に記載
    の単文類似度計算装置。
  3. 【請求項3】 さらに、上記合成手段により求めた総合
    的な類似度を百分率で表示する表示手段を備えることを
    特徴とする請求項1又は請求項2に記載の単文類似度計
    算装置。
JP8018466A 1996-02-05 1996-02-05 単文類似度計算装置 Pending JPH09212509A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8018466A JPH09212509A (ja) 1996-02-05 1996-02-05 単文類似度計算装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8018466A JPH09212509A (ja) 1996-02-05 1996-02-05 単文類似度計算装置

Publications (1)

Publication Number Publication Date
JPH09212509A true JPH09212509A (ja) 1997-08-15

Family

ID=11972425

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8018466A Pending JPH09212509A (ja) 1996-02-05 1996-02-05 単文類似度計算装置

Country Status (1)

Country Link
JP (1) JPH09212509A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000200285A (ja) * 1999-01-06 2000-07-18 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法、情報検索装置及び情報検索プログラムを記録した記録媒体
JP2012208924A (ja) * 2011-03-28 2012-10-25 Palo Alto Research Center Inc 適応的重み付けを用いた様々な文書間類似度計算方法に基づいた文書比較方法および文書比較システム
CN104699668A (zh) * 2015-03-26 2015-06-10 小米科技有限责任公司 确定词语相似度的方法及装置
CN107229939A (zh) * 2016-03-24 2017-10-03 北大方正集团有限公司 相似文档的判定方法和装置
JP2020161110A (ja) * 2019-03-25 2020-10-01 カシオ計算機株式会社 検索装置、検索方法、検索プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000200285A (ja) * 1999-01-06 2000-07-18 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法、情報検索装置及び情報検索プログラムを記録した記録媒体
JP2012208924A (ja) * 2011-03-28 2012-10-25 Palo Alto Research Center Inc 適応的重み付けを用いた様々な文書間類似度計算方法に基づいた文書比較方法および文書比較システム
CN104699668A (zh) * 2015-03-26 2015-06-10 小米科技有限责任公司 确定词语相似度的方法及装置
CN104699668B (zh) * 2015-03-26 2017-09-26 小米科技有限责任公司 确定词语相似度的方法及装置
CN107229939A (zh) * 2016-03-24 2017-10-03 北大方正集团有限公司 相似文档的判定方法和装置
JP2020161110A (ja) * 2019-03-25 2020-10-01 カシオ計算機株式会社 検索装置、検索方法、検索プログラム

Similar Documents

Publication Publication Date Title
US8010342B2 (en) Word usage analyzer
JP3429184B2 (ja) テキスト構造解析装置および抄録装置、並びにプログラム記録媒体
KR102128659B1 (ko) 키워드 추출 및 요약문 생성 시스템 및 방법
KR20060130597A (ko) 문제 정형화 및 데이터베이스로부터의 해결책 획득 방법
JP2015138351A (ja) 情報検索装置、情報検索方法および情報検索プログラム
JP2007140861A (ja) 情報処理システム、情報処理方法、およびプログラム
JPH09212509A (ja) 単文類似度計算装置
Shain Word frequency and predictability dissociate in naturalistic reading
KR100353549B1 (ko) 언어를 학습하기 위한 방법 및 시스템
JP6549173B2 (ja) 計算機システム及び文章データの検索方法
JP4435144B2 (ja) データ検索システム及びプログラム
JP2001265791A (ja) 電子書籍表示装置及び電子書籍表示プログラムを記憶した記憶媒体
JP5553037B2 (ja) 文章入力支援システム、文章入力支援装置、参照情報作成装置及びプログラム
JP2022019266A (ja) 文書生成装置
JP5302784B2 (ja) 機械翻訳方法、及びシステム
JP2004280756A (ja) 特許明細書分析システム及び特許明細書分析方法及びプログラムを記録したコンピュータ読み取り可能な記録媒体及びプログラム
JP2009075662A (ja) 検索支援装置
JP4074687B2 (ja) 要約文作成支援システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2005228033A (ja) 文書検索装置および方法
JP3149555B2 (ja) システム設計用目的変換装置
JPH03127266A (ja) 機械翻訳装置における単語間関係編集/学習装置
US20230135579A1 (en) Graph-based natural language optimization method and electronic apparatus
JP2010117832A (ja) 関係情報抽出装置、その方法、プログラム及び記録媒体
JP4417967B2 (ja) 用例データベース及び用例検索システム
JP2697403B2 (ja) 実行情報採取方式

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030610