JP2003150623A - 言語横断型特許文献検索方法 - Google Patents

言語横断型特許文献検索方法

Info

Publication number
JP2003150623A
JP2003150623A JP2001345184A JP2001345184A JP2003150623A JP 2003150623 A JP2003150623 A JP 2003150623A JP 2001345184 A JP2001345184 A JP 2001345184A JP 2001345184 A JP2001345184 A JP 2001345184A JP 2003150623 A JP2003150623 A JP 2003150623A
Authority
JP
Japan
Prior art keywords
language
search
patent document
classification
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001345184A
Other languages
English (en)
Inventor
Yoichi Nakatani
洋一 中谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Technology Corp
Original Assignee
NTT Data Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Technology Corp filed Critical NTT Data Technology Corp
Priority to JP2001345184A priority Critical patent/JP2003150623A/ja
Publication of JP2003150623A publication Critical patent/JP2003150623A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 多次元特許分類をベースとする第1言語のた
めの検索システムを採用している場合に、第2言語検索
システムのための適切なキーワードを見つけだすのを容
易にすることを課題とする。 【解決手段】 この言語横断型特許文献検索方法は、多
次元特許分類を用いて、第1言語の特許文献データベー
スを検索(S01)、スクリーニング(S02)し、得
られた適合文献から特徴単語を抽出する(S04)。つ
いで、この特徴単語を第2言語の特徴単語に翻訳する
(S05)。この特徴単語から、第2言語の特徴単語の
適切訳語を選択する(S06)。また、適合文献に付さ
れている特許分類を第2言語国の特許分類に変換する
(S12)。こうして得られた第2言語の特徴単語と第
2言語国特許分類とを用いて第2言語の特許文献データ
ベースを検索する(S08)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、コンピュータによ
る文献検索、特に特許文献を多言語にわたって検索する
ための特許情報検索方法に関する。
【0002】
【従来の技術】クロスランゲージ、クロスリンガル検索
システムと称して、クエリー言語を適切な訳語に翻訳す
るシステムを用いて、異なる言語間のデータベースを同
時に検索するシステムが多く提案されている。しかし、
これらは何れも、クエリーとして言語を用いるもので、
少なくとも母国言語のデータベースを分類による検索と
した多言語同時検索システムは未だ提案されていない。
【0003】
【発明が解決しようとする課題】第1言語(母国語)文
献データベースの検索システムが自然語による検索方法
を採っていないとき、例えばこのシステムが予め体系だ
てられた分類を使用するようなシステムである場合、第
1言語文献データの検索システムにおける検索では、自
然語クエリーを作成していないので、第2言語文献デー
タベースを検索する段階で新たにクエリー及びその要素
としての的確な第2言語単語を考えなければならなかっ
た。
【0004】また、特許文献の検索は、各国とも分類に
よる検索をベースとしており、検索実務者の間では、分
類のコンコーダンス表を用いて、外国言語データベース
で採用されている分類表を調べ分類検索する調査手法が
取られているが、調査対象毎に外国の適切な分類項目を
見付け出す作業は大変な労苦を伴うもので、特許調査を
専門にする者でなければ、これを利用することが非常に
困難であるとされている。その様な事情もあって、外国
言語データベースではキーワードによる検索が利用され
ることも多いが、しかし、本格的な調査において、キー
ワード検索を利用する場合には、探そうとする対象と関
連するキーワード群を種々の観点から想定して、行われ
るもので、検索の専門家でないと難しいとされている。
以上のように、本格的な外国特許文献調査をする際に
は、分類による検索、キーワードによる検索の何れを利
用するにしても、難しい問題があり、専門家を頼りにし
なければならなかった。この発明は、取り扱いになれた
母国分類により検索した第1言語データベースの検索結
果から選択した適合文献より、適合文献を代表する特徴
単語を抽出し、それをキーワードとして利用しようとす
るものである。
【0005】
【課題を解決するための手段】この発明の言語横断型特
許文献検索方法は、第1言語(母国言語)のデータベー
スを特許分類(多次元、特にFタームが、有効である)
により検索し、その検索結果である回答集合から適合文
献を選択したあと、その適合文献から、特徴単語を抽出
し、その特徴単語を適切な訳語に翻訳して外国の言語デ
ータベースを検索するための外国語のクエリーとし、外
国言語データベースを一連の処理によって同時に検索で
きるようにしたものである。
【0006】ストラスブール協定により、各国特許文献
には、世界共通の国際特許分類(IPC)が付与されて
いる。IPCは分類項目が7万項目と少なく、IPCの
みで膨大な特許文献を検索するには不十分であるが、項
目単位では概念的にまとめられた文献集合として捉える
ことが出来る。このため、特徴単語を適切な訳語に翻訳
して外国の言語データベースのクエリーとする検索と組
み合わせたとき、妥当性のあるヒット件数に絞り込むこ
とも可能となり、効率的な検索が期待できる。
【0007】IPCのクラスは120程度に分けられて
おり、各クラス単位では比較的均質な技術分野を構成し
ている。クラス単位に翻訳辞書、英単語頻度情報を整備
すれば、例えばBANK(銀行、土手)等の多義語に対
処でき、特徴単語を適切な訳語に翻訳することが出来
る。
【0008】以上のように、この発明は、母国言語のデ
ータベースを分類(特にFタームが有効である)により
検索し、その検索結果である回答集合から適合文献を選
択し、その適合文献より、特徴単語を抽出し、その特徴
単語を適切な訳語に翻訳して外国の言語データベースの
クエリーとして、外国言語データベースを同時に検索出
来るようにしたものであるが、加えて適合文献の保有す
るIPC情報を利用すれば、実用上の効果は大きい。な
お、特徴単語とは、単語一つの場合もあるが、多くの場
合特徴を表す複数の単語を指す場合が多い。
【0009】解決手段を以下に示す。すなわち、第1番
目の発明の解決手段である言語横断型特許文献検索方法
は、特許分類を用いて、第1言語の特許文献データベー
スを検索する第1検索工程と、上記第1検索工程におけ
る検索によって得られた文献群から適合文献をスクリー
ニングするスクリーニング工程と、上記スクリーニング
工程において得られた適合文献から特徴単語を抽出する
抽出工程と、上記抽出工程において抽出された第1言語
の特徴単語を第2言語の特徴単語に翻訳する特徴単語翻
訳工程と、上記第2言語の特徴単語を用いて第2言語の
特許文献データベースを検索する第2検索工程とを備え
たことを特徴とするものである。
【0010】第2番目の発明の解決手段である言語横断
型特許文献検索方法は、特許分類を用いて、第1言語の
特許文献データベースを検索する第1検索工程と、上記
第1検索工程における検索によって得られた文献群から
適合文献をスクリーニングするスクリーニング工程と、
上記スクリーニング工程において得られた適合文献から
特徴単語を抽出する抽出工程と、上記抽出工程において
抽出された第1言語の特徴単語を第2言語の特徴単語に
翻訳する特徴単語翻訳工程と、上記特徴単語翻訳工程に
おいて翻訳された第2言語の特徴単語から、更に適切訳
語が一義的に定まらない一部の第2言語の特徴単語を選
択する選択工程と、上記特徴単語翻訳工程及び更に上記
選択工程を経た第2言語の特徴単語を用いて第2言語の
特許文献データベースを検索する第2検索工程とを備え
たことを特徴とするものである。
【0011】第3番目の発明の解決手段である言語横断
型特許文献検索方法は、特許分類を用いて、第1言語の
特許文献データベースを検索する第1検索工程と、上記
第1検索工程における検索によって得られた文献群から
適合文献をスクリーニングするスクリーニング工程と、
上記スクリーニング工程において得られた適合文献から
特徴単語を抽出する抽出工程と、上記抽出工程において
抽出された第1言語の特徴単語を第2言語の特徴単語に
翻訳する特徴単語翻訳工程と、上記スクリーニング工程
において得られた適合文献に付されている国際特許分類
を任意のレベルに編集する分類編集工程と、上記第2言
語の特徴単語と上記分類編集工程で編集された国際特許
分類とを用いて第2言語の特許文献データベースを検索
する第2検索工程とを備えたことを特徴とするものであ
る。
【0012】第4番目の発明の解決手段である言語横断
型特許文献検索方法は、特許分類を用いて、第1言語の
特許文献データベースを検索する第1検索工程と、上記
第1検索工程における検索によって得られた文献群から
適合文献をスクリーニングするスクリーニング工程と、
上記スクリーニング工程において得られた適合文献から
特徴単語を抽出する抽出工程と、上記抽出工程において
抽出された第1言語の特徴単語を第2言語の特徴単語に
翻訳する特徴単語翻訳工程と、上記特徴単語翻訳工程に
おいて翻訳された第2言語の特徴単語から、更に適切訳
語が一義的に定まらない一部の第2言語の特徴単語を選
択する選択工程と、上記特徴単語翻訳工程、更に上記選
択工程を経た第2言語の特徴単語、及び上記分類編集工
程で編集された国際特許分類を用いて第2言語の特許文
献データベースを検索する第2検索工程とを備えたこと
を特徴とするものである。
【0013】第5番目の発明の解決手段は、第3番目又
は第4番目の言語横断型特許文献検索方法において、第
2国の特許分類と国際特許分類の対応関係が一義的に定
まらない分野については、上記分類編集工程にかえて、
国際特許分類を第2国の特許分類に変換する分類変換工
程を用いるようにしたことを特徴とするものである。
【0014】第6番目の発明の解決手段は、第1番目か
ら第5番目までのいずれかに記載された言語横断型特許
文献検索方法を、上記第2検索工程に続いて、更に、こ
の第2検索工程における検索によって得られた文献群か
ら適合文献をスクリーニングするスクリーニング工程を
備えるようにしたものである。
【0015】第7番目の発明の解決手段は、多次元特許
分類を用いて、第1言語の特許文献データベースを検
索、及びスクリーニングして適合文献を得、この適合文
献が保有している保有情報を第2言語の情報に変換し
て、変換した情報に基づいて第2言語のデータベースを
検索することを特徴とする言語横断型特許文献検索方法
である。
【0016】
【発明の実施の形態】以下、本発明の実施例を図面を用
いて説明する。図1はこの実施例における作業のフロー
を示す説明図である。図2は本発明の概要を説明するた
めの実施例のシステムブロック図である。本発明の言語
横断型特許文献検索方法は、第1言語特許文献の検索環
境は多次元特許分類によるとの前提に立つ。以下、この
実施例を図1によって説明し、その後図2を説明する。
【0017】この言語横断型特許文献検索方法がスター
ト(S00)すると、まず、第1検索工程(S01)に
入る。第1検索工程(S01)では、多次元特許分類、
例えば我が国において特許文献サーチツールとして標準
的に使用されている「Fターム」システム、を用いて、
第1言語(日本語)の特許文献データベースを検索して
検索回答を得る。スクリーニング工程(S02)では、
上記第1検索工程(S01)における検索回答の文献群
を表示し、表示された各文献が求めているものか否かを
判断することにより、適合文献をスクリーニングする。
スクリーニングにより選び出された適合文献からはその
文献の保有情報が抽出される(抽出工程、S03)。
【0018】ここで、保有情報とは、対応特許情報(優
先権番号)、国際特許分類(IPC)のクラスとサブグ
ループ、及び、明細書、要約、発明の名称等のテキスト
(後述の特徴単語を含んでいる)を指している。
【0019】対応特許情報とは、同一内容の特許文献が
日・英語で存在するもので、ここでは、JAPIO抄録
に対するPAJ及び優先権主張に基づいて出願され、日
・英語で存在する同一内容の特許文献(パテントファミ
リー文献)を指している。これらは、いわゆる対訳コー
パスであり、これら対訳コーパスには文意を考慮した正
しい単語または複合語の対訳が存在しているので、専門
用語の対訳辞書作成に利用することができる。専門用語
辞書作成に際しては、同一単語でも分野により、内容が
異なるケースも多いことを考慮して、例えば、比較的同
種の技術が集められているIPCのクラスを、一つの単
位として、対訳辞書を作成するとより妥当性の高い専門
辞書が作成できる。
【0020】また、第2言語DBの検索回答のスクリー
ニング時において、パテントファミリー文献の番号対応
テーブルを利用すれば、母国言語検索時に選定した適合
文献に対応する第2言語特許文献を優先的に選択するこ
とができ、スクリーニング効率が向上する。
【0021】上記テキストからは、日本語の特徴単語が
抽出(S04)される。特徴単語は、そのデータベース
内においてその文献を特徴づける単語あるいは単語群で
あって、tf法、tf−idf法、tf/TF法、SM
ART法などいくつかの特徴単語抽出の手法が開発され
ており、これらの手法を採用することができる。tf−
idf法は「データベース中の少数の文献に偏って多く
出現する単語はその文献の特徴を表していると仮定す
る」とするもので、現在多く用いられている手法であ
る。SMART法はtf−idf法に文書長に関する正
規化を加えて精緻化したものでtf−idf法よりも有
効であるとされているが、計算コストに問題が有るとさ
れている。最近「組み合わせ的確率モデルに基づく特徴
単語選択方法」(HGS法)が提案されており、これも
有効な手法の一つであるとされている。これら手法の詳
しい説明は「組み合わせ的確率モデルに基づく特徴単語
選択法」(第140回自然言語処理発表会 久光 徹、
丹羽芳樹)に記述されている。
【0022】こうして保有情報から抽出(S04)され
た第1言語(日本語)の特徴単語が日英辞書を用いて英
訳特徴単語(外国語特徴単語)に翻訳される(S0
5)。ここでは第1言語(日本語)の単語単位の翻訳に
はクラス毎の日英辞書が使用される。クラス毎の日英辞
書は、対訳語、特に対訳表現が一義的に定まるような日
英専門用語辞書で、対訳コーパスから生成される。生成
手法は、文節の対応関係が付いた対訳コーパスから共起
する単語列を対応付けることにより、対訳表現を自動的
に抽出するもので、「対訳コーパスを利用した対訳表現
の自動抽出方法」(松本 裕治、情報処理学会論文誌、
第38巻、第4号、1997)等に詳しく記載されてい
る。
【0023】一方、一義的に訳語が定まらない複合語等
の翻訳は、単なる対訳翻訳では充分でないため、更に選
択工程(S06)を設ける。選択工程(S06)では、
汎用の日英辞書とその文献が属するIPCクラス内での
共起頻度情報を基に英訳特徴単語の組み合わせ候補が作
成される。つまり、一義的な翻訳が不可能な専門用語に
ついては、日英辞書及びクラス毎の英単語共起頻度情報
を用いて、組み合わせ頻度の高い英訳特徴単語の組み合
わせ候補を提示し人による選択(S06)に供するよう
にする。なお、クラス毎の英単語頻度情報とは、第2言
語国(例:米国)特許データベースのIPCクラス単位
の文献集合において、共に出現する頻度(共起性が高
い)の高い単語の組み合わせを収集したもので、英語の
複合語、例えば電子図書館の正しい英訳がElectronic L
ibraryではなく、Digital Libraryであることを見付け
出す手がかり情報として利用するものである(参考:
「技術文書を対象とした言語横断情報検索のための複合
語翻訳」、藤井 敦、石川 徹也、情報処理学会論文誌
vol.41,No.4)。上記特徴単語翻訳工程(S05)、選
択工程(S06)を経て得られた単語と単語の組み合わ
せをもとに英語のキーワードが確定される(S07)。
【0024】一般にキーワード検索はノイズが多くスク
リーニング負担が大きいと言われている。保有情報の国
際特許分類(IPC)は、キーワードによる第2言語国
DB検索のノイズ除去のために、キーワードと組み合わ
せて利用しようとするものである。ところが、国際特許
分類は各国のサブグループの付与一致率が低く、メイン
グループレベルになると、比較的一致率が高くなると言
われている。また、米国特許分類(USC)、ヨーロッ
パ特許分類(ECLA)とIPCは分類の観点が相違し
ているため、対応関係が一義的に定まる分野もあれば、
定め難い分野もある。そこで、自国特許分類と国際特許
分類の対応関係が一義的に定まらない分野については、
国際特許分類抽出行程(S11)で抽出したIPCを分
類編集工程(S13)で、クラスレベル、メイングルー
プレベル、サブグループレベルに編集して利用するか、
または、そうでない分野については、USC、ECLA
等の外国特許分類に変換して(外国分類変換行程S1
2)利用する。いずれを使用するかは、検索作業者が選
択できるようにする。以上のような事情を考慮して、選
択された分類キーは、第2検索行程(S08)に送られ
る。
【0025】第2検索工程(S08)では、キーワード
として第2言語の特徴単語と上記分類変換工程(S1
2)において選択された分類キーとをクエリーとして組
み立てることにより第2言語の特許文献データベースを
検索する。
【0026】第2検索工程(S08)に続いて、この工
程でヒットした文献を表示し、スクリーニングするスク
リーニング工程(S09)に移る。更に、ヒット文献を
迅速に選定できるようにするため、保有情報から対応特
許情報を抽出し(S21)、これを検索回答のスクリー
ニング行程(S09)で利用できるようにする。更に、
また、第2検索工程(S08)で得られるのは第2言語
(外国語、英文)であるから、スクリーニング工程(S
09)において、自動翻訳システムを介在させ、第2言
語でヒットした文献記載事項の翻訳を第1言語(日本
語)で表示してスクリーニングを簡便に行えるようにす
ることができる。第2検索工程(S08)、スクリーニ
ング工程(S09)によって、目的とする第2言語特許
文献を求めて終了(S99)する。
【0027】次に、この発明のシステム実施例を図2に
より説明する。第1言語検索システムは、質問式入力部
1、日本語特許文献検索部2及び表示出力部3より構成
されており、通常一般にサービスされている日本語特許
文献検索システムと同じ構成を有している。また、一方
第2言語検索システム、例えば英語特許文献検索システ
ムは、翻訳語表示出力部9、英語特許文献検索部10及
び英語文献出力表示部11より構成されており、通常一
般に商用サービスされている英語特許文献検索システム
と同じタイプの検索システムである。この両システムの
間にあって、日本語特許文献検索システムを利用して得
た適合文献より、その適合文献が保有する特徴単語等の
情報を抽出し、翻訳・変換して英語特許文献検索システ
ムにインプットするシステム部がこの発明の主要部をな
している。
【0028】以下具体的に説明する。この発明において
は、質問式入力部1にFターム検索論理式が入力され、
日本語特許文献検索部2において検索された結果が表示
出力部3に表示される。検索作業者は、特許文献を一件
ずつ評価し適合文献を選択する。ここで選ばれる適合文
献は一件よりは数件あることが、広く特徴単語を拾うと
言う観点から好ましい。選択された適合文献は保有情報
抽出部4に送られる。保有情報抽出部4においては特許
文献毎に保有情報が抽出される。保有情報としては、ま
ず特許文献に記述された発明の特徴を表す特徴単語が抽
出される。合わせて、分類情報(IPCサブグループま
で)、文献番号(出願番号)が抽出される。
【0029】保有情報抽出部4における特徴単語の抽出
は、まず、適合文献の「要約」、「発明の名称」及び
「請求の範囲」の抽出、我が国の代表的な形態素解析ソ
フトである「茶筌」(http://chasen.aist-nara.ac.jp/
index.html.ja)による単語の分かち書き、最後に、H
GS法(先に説明した)による特徴単語の抽出の順に行
われる。最後に抽出された特徴単語は適合文献毎に重要
度順に10単語程度に絞られ保有される。
【0030】抽出された特徴単語は適合文献に付与され
ているIPCのクラス情報と共にクラス毎の日英専門辞
書5に送られる。クラス毎の日英専門辞書5は前述する
ように対訳コーパスより作成された、日英の対訳表現が
一義的に定まるような用語の辞書で、ここで対訳表現が
ない場合には日英辞書ファイル6に送られる。日英辞書
ファイル6により特徴単語は複数の英語単語に翻訳さ
れ、英訳特徴単語組み合わせ候補算出部8に送られる。
一方クラス毎の英単語共起頻度ファイル7には保有情報
抽出部4より適合文献のクラス情報が送られており、こ
れを利用して、クラスにおける複数の単語の共起頻度、
つまり、一緒に出現する頻度の高い組み合わ候補が、英
訳特徴単語組み合わせ候補算出部8において作成され
る。英訳特徴単語組み合わせ候補算出部8において作成
された、組み合わせ候補は翻訳語表示出力部9に送られ
る。翻訳語表示出力部9では、クラス毎の日英専門辞書
により一義的に翻訳された英訳単語及び複数の組み合わ
せ候補として提示された英訳単語をそれぞれ区別して表
示し、検索作業者の利用に供する。
【0031】検索作業者により選択された英訳単語は、
キーワードとして英語特許文献検索部10に入力され英
語特許文献の検索が行われる。一般にキーワードによる
検索では、異なるトピック間のキーワードを拾うためノ
イズが多くなると言われている。この発明の場合は、保
有情報抽出部4において抽出したIPCのサブグループ
情報を、キーワードと共に検索キーとして用いて、ノイ
ズの混入を少なくしている。
【0032】ところで、各国で付与されているIPC
の、サブグループレベルの付与一致率は低いと言われて
おり、一致率の高いメイングループレベルでの利用が好
ましい。ここでは、保有情報抽出部4で抽出されたサブ
クラス情報をIPC編集部12に送り、付与一致率の高
い任意のレベルに編集して検索キーとして利用できるよ
うにしている。
【0033】また、アメリカ特許分類(USC)、ヨー
ロッパ特許分類(ECLA)はそれぞれの特許庁が主た
る分類として利用しており、その付与精度は高い。そこ
で、コンコーダンス情報を基にIPCと、上述のUS
C、ECLAとの対応関係がそれぞれ一義的に定めるこ
とができる分野を抽出して、その対応分類テーブルを作
成しておき、このテーブルを基に対応分類算出部13に
より、適合文献の保有情報であるサブグループを、外国
分類、例えばUSCに変換して、検索キーとして利用で
きるようにしている。以上のようにキーワードに加えて
分類検索キーを用いて検索された回答は、検索作業者の
求めに応じて英語文献出力表示部11に出力表示され
る。
【0034】保有情報抽出部4で抽出された、文献番号
は対応特許番号蓄積部14に送られ、対応特許番号蓄積
部14では、文献番号の照合を行い、対応特許が存在す
る場合には保有情報抽出部4に対応特許番号を送ると共
に英語文献出力表示部11にも対応特許番号を出力し、
英語文献に対応する日本語適合文献が存在することを明
確にすると共に、その対応特許文献を表示するようにし
ている。また自動翻訳装置15は英語文献のスクリーニ
ング効率を上げるために設けたもので、検索作業者の希
望に応じて翻訳するように設けたものである。
【0035】以上の実施例に示すように、比較的取り扱
いに慣れた母国(第1言語)分類によって検索され、選
択抽出された適合文献は、検索作業者が、当初に意図し
た情報に最も近い内容の記事が記載されている文献であ
るので、その文献即ち適合文献を特徴付ける単語即ち特
徴単語の中には、検索者が無意識のうちに求めていた言
語情報または手掛かりとなる情報が含まれている。これ
ら言語情報のなかには直接に表現する単語もあれば、間
接的に示唆する、いわば連想的表現も含まれる。
【0036】換言すれば、第2検索工程はキーワードに
よるものであるから、このキーワードは網羅的に認識さ
れなければならない。このため、例えば、自転車に関す
る文献を探し出したいとき、単にキーワードを「bicycl
e」としただけでは、それが実質的に自転車に関するも
のであっても、明示的に「bicycle」と表現していない
文献はヒットしない。本格的な特許文献調査では、明示
的に「bicycle」を含まないが実質的に自転車(bicycl
e)について記述している文献をも含めて網羅的に探し
出す必要があるので、この場合「handlebar」、「chai
n」、「saddle」などの自転車を間接的に表す単語を可
能な限り考え出し、これらを基にクエリーを作成する必
要が生じる。このように網羅的に単語を考えることは専
門家でない限り非常に困難な作業であるとされている。
本発明では、第1検索工程(S01)を多次元特許分類
による検索(上のようなキーワード検索固有の問題は生
じない)としており、この成果から特徴単語を抽出して
いる。このため、これら特徴単語を参考にして、検索者
が意図する特許文献調査の目的に叶ったキーワードを引
き出すことができるので、検索者はキーワードをより網
羅的に含むクエリーを作成することができ、検索能率を
向上させることができる。
【0037】この実施例の言語横断型特許文献検索方法
では、多次元特許分類をベースとする第1言語の検索シ
ステムの成果、つまり適合文献の保有する情報、を利用
でき、また、これにより適切なキーワードが見つけだせ
るので、従来のように調査対象毎に外国の適切な分類項
目を見付け出す作業が必要なく、また、無からキーワー
ド案出の労苦も少なくなるため、特許調査を専門にする
者でなくても第2言語特許文献の検索を同時にしかも容
易に行うことができる。
【0038】
【発明の効果】本発明の言語横断型特許文献検索方法に
よれば、第1言語データベースを検索して得られた適合
文献の保有する情報を利用して適切なキーワード等を見
つけだすので、従来のように調査対象毎に外国の適切な
分類項目を見付け出す作業が必要なく、また、無からキ
ーワード案出の労苦も少なくなるため、特許調査を専門
にする者でなくても第2言語特許文献の検索を容易に行
うことができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の実施例における作業のフローを示す説
明図である。
【図2】本発明の概要を説明するための実施例のシステ
ムブロック図である。
【符号の説明】
1 質問式入力部 2 日本語特許文献検索部 3 表示出力部 4 保有情報抽出部 5 日英専門辞書 6 日英辞書ファイル 7 英単語共起頻度ファイル 8 候補算出部 9 翻訳語表示出力部 10 英語特許文献検索部 11 英語文献出力表示部 12 IPC編集部 13 対応分類算出部 14 対応特許番号蓄積部 15 自動翻訳装置

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 特許分類を用いて、第1言語の特許文献
    データベースを検索する第1検索工程と、 上記第1検索工程における検索によって得られた文献群
    から適合文献をスクリーニングするスクリーニング工程
    と、 上記スクリーニング工程において得られた適合文献から
    特徴単語を抽出する抽出工程と、 上記抽出工程において抽出された第1言語の特徴単語を
    第2言語の特徴単語に翻訳する特徴単語翻訳工程と、 上記第2言語の特徴単語を用いて第2言語の特許文献デ
    ータベースを検索する第2検索工程とを備えたことを特
    徴とする言語横断型特許文献検索方法。
  2. 【請求項2】 特許分類を用いて、第1言語の特許文献
    データベースを検索する第1検索工程と、 上記第1検索工程における検索によって得られた文献群
    から適合文献をスクリーニングするスクリーニング工程
    と、 上記スクリーニング工程において得られた適合文献から
    特徴単語を抽出する抽出工程と、 上記抽出工程において抽出された第1言語の特徴単語を
    第2言語の特徴単語に翻訳する特徴単語翻訳工程と、 上記特徴単語翻訳工程において翻訳された第2言語の特
    徴単語から、更に適切訳語が一義的に定まらない一部の
    第2言語の特徴単語を選択する選択工程と、 上記特徴単語翻訳工程及び更に上記選択工程を経た第2
    言語の特徴単語を用いて第2言語の特許文献データベー
    スを検索する第2検索工程とを備えたことを特徴とする
    言語横断型特許文献検索方法。
  3. 【請求項3】 特許分類を用いて、第1言語の特許文献
    データベースを検索する第1検索工程と、 上記第1検索工程における検索によって得られた文献群
    から適合文献をスクリーニングするスクリーニング工程
    と、 上記スクリーニング工程において得られた適合文献から
    特徴単語を抽出する抽出工程と、 上記抽出工程において抽出された第1言語の特徴単語を
    第2言語の特徴単語に翻訳する特徴単語翻訳工程と、 上記スクリーニング工程において得られた適合文献に付
    されている国際特許分類を任意のレベルに編集する分類
    編集工程と、 上記第2言語の特徴単語と上記分類編集工程で編集され
    た国際特許分類とを用いて第2言語の特許文献データベ
    ースを検索する第2検索工程とを備えたことを特徴とす
    る言語横断型特許文献検索方法。
  4. 【請求項4】 特許分類を用いて、第1言語の特許文献
    データベースを検索する第1検索工程と、 上記第1検索工程における検索によって得られた文献群
    から適合文献をスクリーニングするスクリーニング工程
    と、 上記スクリーニング工程において得られた適合文献から
    特徴単語を抽出する抽出工程と、 上記抽出工程において抽出された第1言語の特徴単語を
    第2言語の特徴単語に翻訳する特徴単語翻訳工程と、 上記特徴単語翻訳工程において翻訳された第2言語の特
    徴単語から、更に適切訳語が一義的に定まらない一部の
    第2言語の特徴単語を選択する選択工程と、 上記スクリーニング工程において得られた適合文献に付
    されている国際特許分類を任意のレベルに編集する分類
    編集工程と、 上記特徴単語翻訳工程、更に上記選択工程を経た第2言
    語の特徴単語、及び上記分類編集工程で編集された国際
    特許分類を用いて第2言語の特許文献データベースを検
    索する第2検索工程とを備えたことを特徴とする言語横
    断型特許文献検索方法。
  5. 【請求項5】 請求項3又は請求項4に記載された言語
    横断型特許文献検索方法において、 第2国の特許分類と国際特許分類の対応関係が一義的に
    定まる分野については、上記分類編集工程にかえて、国
    際特許分類を第2国の特許分類に変換する分類変換工程
    を用いるようにしたことを特徴とする言語横断型特許文
    献検索方法。
  6. 【請求項6】 請求項1から請求項5までのいずれかに
    記載された言語横断型特許文献検索方法は、上記第2検
    索工程に続いて、更に、 この第2検索工程における検索によって得られた文献群
    から適合文献をスクリーニングするスクリーニング工程
    を備えることを特徴とする言語横断型特許文献検索方
    法。
  7. 【請求項7】 特許分類を用いて、第1言語の特許文献
    データベースを検索、及びスクリーニングして適合文献
    を得、この適合文献が保有している保有情報を第2言語
    の情報に変換して、変換した情報に基づいて第2言語の
    データベースを検索することを特徴とする言語横断型特
    許文献検索方法。
JP2001345184A 2001-11-09 2001-11-09 言語横断型特許文献検索方法 Pending JP2003150623A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001345184A JP2003150623A (ja) 2001-11-09 2001-11-09 言語横断型特許文献検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001345184A JP2003150623A (ja) 2001-11-09 2001-11-09 言語横断型特許文献検索方法

Publications (1)

Publication Number Publication Date
JP2003150623A true JP2003150623A (ja) 2003-05-23

Family

ID=19158571

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001345184A Pending JP2003150623A (ja) 2001-11-09 2001-11-09 言語横断型特許文献検索方法

Country Status (1)

Country Link
JP (1) JP2003150623A (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009230327A (ja) * 2008-03-21 2009-10-08 Fujitsu Ltd 文書検索方法、文書検索装置、文書検索プログラムを記録した記録媒体
JP2010205268A (ja) * 2009-03-02 2010-09-16 Sdl Plc コンピュータ支援自然言語翻訳
JP2012123691A (ja) * 2010-12-09 2012-06-28 Sunflare Co Ltd 中継サーバ
JP2013058230A (ja) * 2012-11-05 2013-03-28 Fujitsu Ltd 文書検索方法、文書検索装置、文書検索プログラムを記録した記録媒体
US8620793B2 (en) 1999-03-19 2013-12-31 Sdl International America Incorporated Workflow management system
US8874427B2 (en) 2004-03-05 2014-10-28 Sdl Enterprise Technologies, Inc. In-context exact (ICE) matching
US8935150B2 (en) 2009-03-02 2015-01-13 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US9400786B2 (en) 2006-09-21 2016-07-26 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US9600472B2 (en) 1999-09-17 2017-03-21 Sdl Inc. E-services translation utilizing machine translation and translation memory
KR20190029339A (ko) * 2017-09-12 2019-03-20 특허법인 플러스 출원인 정보 채우기 시스템 및 방법
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8620793B2 (en) 1999-03-19 2013-12-31 Sdl International America Incorporated Workflow management system
US10216731B2 (en) 1999-09-17 2019-02-26 Sdl Inc. E-services translation utilizing machine translation and translation memory
US10198438B2 (en) 1999-09-17 2019-02-05 Sdl Inc. E-services translation utilizing machine translation and translation memory
US9600472B2 (en) 1999-09-17 2017-03-21 Sdl Inc. E-services translation utilizing machine translation and translation memory
US9342506B2 (en) 2004-03-05 2016-05-17 Sdl Inc. In-context exact (ICE) matching
US8874427B2 (en) 2004-03-05 2014-10-28 Sdl Enterprise Technologies, Inc. In-context exact (ICE) matching
US10248650B2 (en) 2004-03-05 2019-04-02 Sdl Inc. In-context exact (ICE) matching
US9400786B2 (en) 2006-09-21 2016-07-26 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
JP2009230327A (ja) * 2008-03-21 2009-10-08 Fujitsu Ltd 文書検索方法、文書検索装置、文書検索プログラムを記録した記録媒体
US8935148B2 (en) 2009-03-02 2015-01-13 Sdl Plc Computer-assisted natural language translation
US8935150B2 (en) 2009-03-02 2015-01-13 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US9262403B2 (en) 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
JP2010205268A (ja) * 2009-03-02 2010-09-16 Sdl Plc コンピュータ支援自然言語翻訳
JP2012123691A (ja) * 2010-12-09 2012-06-28 Sunflare Co Ltd 中継サーバ
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
JP2013058230A (ja) * 2012-11-05 2013-03-28 Fujitsu Ltd 文書検索方法、文書検索装置、文書検索プログラムを記録した記録媒体
KR20190029339A (ko) * 2017-09-12 2019-03-20 특허법인 플러스 출원인 정보 채우기 시스템 및 방법
KR102497151B1 (ko) * 2017-09-12 2023-02-07 특허법인 플러스 출원인 정보 채우기 시스템 및 방법
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US11321540B2 (en) 2017-10-30 2022-05-03 Sdl Inc. Systems and methods of adaptive automated translation utilizing fine-grained alignment
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11475227B2 (en) 2017-12-27 2022-10-18 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation

Similar Documents

Publication Publication Date Title
KR100572797B1 (ko) 데이터베이스 검색 방법, 데이터베이스 검색 시스템 및 컴퓨터 판독 가능 기록 매체
US9639609B2 (en) Enterprise search method and system
US9323827B2 (en) Identifying key terms related to similar passages
US6442540B2 (en) Information retrieval apparatus and information retrieval method
US6286000B1 (en) Light weight document matcher
KR100505848B1 (ko) 검색 시스템
US20050187923A1 (en) Intelligent search and retrieval system and method
US20070100818A1 (en) Multiparameter indexing and searching for documents
US20020032693A1 (en) Method and system of establishing electronic documents for storing, retrieving, categorizing and quickly linking via a network
JP2006048686A (ja) フレーズに基づく文書説明の生成方法
CN1434952A (zh) 根据有含义中心词检索信息的方法和系统
Küçük et al. Exploiting information extraction techniques for automatic semantic video indexing with an application to Turkish news videos
JP2003150623A (ja) 言語横断型特許文献検索方法
JP4621680B2 (ja) 定義付けシステムおよび方法
KR100659370B1 (ko) 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법
JP3249743B2 (ja) 文書検索システム
JP2002183195A (ja) 概念検索方式
Bhaskar et al. Cross lingual query dependent snippet generation
JP4034503B2 (ja) 文書検索システムおよび文書検索方法
Bosca et al. Query expansion via library classification system
Francom et al. Creating a web-based lexical corpus and information-extraction tools for the Semitic language Maltese
JPH0540783A (ja) 自然言語解析装置
JP2000011003A (ja) 公開文書要約装置およびそのためのプログラムを記録した記録媒体
JP4497338B2 (ja) 概念検索装置およびコンピュータプログラムを記録した記録媒体
JPH11250072A (ja) 情報分類方法及び装置及び情報分類プログラムを格納した記憶媒体