JP2017062618A - プログラム、情報処理装置及び情報処理方法 - Google Patents
プログラム、情報処理装置及び情報処理方法 Download PDFInfo
- Publication number
- JP2017062618A JP2017062618A JP2015187293A JP2015187293A JP2017062618A JP 2017062618 A JP2017062618 A JP 2017062618A JP 2015187293 A JP2015187293 A JP 2015187293A JP 2015187293 A JP2015187293 A JP 2015187293A JP 2017062618 A JP2017062618 A JP 2017062618A
- Authority
- JP
- Japan
- Prior art keywords
- dependency
- dependency structure
- document file
- text information
- extracted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
以下実施の形態を、図面を参照して説明する。図1は情報処理システムの概要を示す説明図である。情報処理システムは情報処理装置1、及び、端末装置2等を含む。情報処理装置1は、サーバコンピュータ、パーソナルコンピュータ、PDA(Personal Digital Assistant)、またはスマートフォン等である。以下、情報処理装置1をサーバコンピュータ1という。端末装置2は、パーソナルコンピュータ、PDA、またはスマートフォン等である。以下では端末装置2をコンピュータ2という。サーバコンピュータ1及びコンピュータ2はインターネット、公衆電話網、LAN(Local Area Network)等の通信網Nを介して相互に接続されている。
実施の形態2は、検索を実行する形態に関する。図11は係受け構造の入力イメージを示す説明図である。コンピュータ2はサーバコンピュータ1へアクセスし、図11に示す入力画面をダウンロードする。コンピュータ2のCPU21は、通信部26で受信した入力画面を、ブラウザ等により、表示部24に表示する。CPU21は、表示部24に、係受け元の単語を入力するための第1ボックス241、係受け先の単語を入力するための第2ボックス242、及び検索ボタン243等を表示する。
実施の形態3は対象となった係受け構造の頻度に応じて検索結果の表示を変化させる形態に関する。図14は対応DB153のレコードレイアウトを示す説明図である。CPU11は、対応ID及びカルテIDを対応DB153に記憶する場合、評価DB152に記憶した頻度の情報をも併せて記憶する。本実施形態では5回以上の頻度を有する対応IDを高、3回または4回の頻度を有する対応IDを中、2回の頻度を有する対応IDを低としている。図14の例では、カルテID「001」について、対応ID「P:001」は高、「P:003」は中、「P:005」は高と記憶されている。
図19は上述した形態のサーバコンピュータ1の動作を示す機能ブロック図である。CPU11が制御プログラム15Pを実行することにより、サーバコンピュータ1は以下のように動作する。抽出部191は、文書ファイルに含まれるテキスト情報の形態素解析を行い、前記テキスト情報に含まれる単語間の係受け構造を複数抽出する。特定部192は、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定する。記憶処理部193は、特定した係受け構造と前記文書ファイルとを関連付けて記憶部15に記憶する。受付部194は、所定の係受け構造の指定を受け付ける。抽出部195は、文書ファイルに含まれるテキスト情報の形態素解析を実行し、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定することで得られた、前記係受け構造と前記文書ファイルとの関連付け情報を複数の文書ファイルのそれぞれについて記憶する記憶部15を参照して、受け付けた前記所定の係受け構造に合致する文書ファイルを抽出する。
コンピュータに、
文書ファイルに含まれるテキスト情報の形態素解析を行い、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、
複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定し、
特定した係受け構造と前記文書ファイルとを関連付けて記憶部に記憶する
処理を実行させるプログラム。
(付記2)
係受け元の単語と、係受け先の単語と、前記係受け元の単語及び係受け先の単語を特定する識別情報とを対応付けて記憶し、
前記識別情報に対応付けて前記係受け元の単語及び係受け先の単語を抽出した頻度を記憶し、
所定の閾値を超える識別情報を特定する
処理を実行させる付記1に記載のプログラム。
(付記3)
前記記憶部には、複数の文書ファイルそれぞれについて特定した係受け構造が記憶されている
付記1または2に記載のプログラム。
(付記4)
所定の係受け構造の指定を受け付け、
前記記憶部を参照して、複数の文書ファイルから受け付けた前記所定の係受け構造に合致する文書ファイルを抽出する
処理を実行させる付記3に記載のプログラム。
(付記5)
係受け元の単語と係受け先の単語とを受け付け、
前記記憶部を参照して、複数の文書ファイルから受け付けた係受け元の単語と係受け先の単語に対応する識別情報に合致する文書ファイルを抽出する
処理を実行させる付記4に記載のプログラム。
(付記6)
記憶部に、RDFにより記述された前記特定した係受け構造と前記文書ファイルと関連付けて記憶する
処理を実行させる付記1から5のいずれか一つに記載のプログラム。
(付記7)
文書ファイルに対応付けて該文書ファイルに含まれるテキスト情報の記載対象となった対象人物を前記記憶部に記憶し、
前記記憶部を参照し抽出した文書ファイルに対応する対象人物を出力する
付記4から6のいずれか一つに記載のプログラム。
(付記8)
特定した係受け構造、該係受け構造の頻度及び前記文書ファイルを関連付けて記憶部に記憶し、
前記所定の係受け構造に合致する文書ファイルを抽出した後、各文書ファイルの前記所定の係受け構造の頻度に基づき、各文書ファイルをソートする
付記3から7のいずれか一つに記載のプログラム。
(付記9)
コンピュータに、
所定の係受け構造の指定を受け付け、
文書ファイルに含まれるテキスト情報の形態素解析を実行し、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定することで得られた、前記係受け構造と前記文書ファイルとの関連付け情報を複数の文書ファイルのそれぞれについて記憶する記憶部を参照して、受け付けた前記所定の係受け構造に合致する文書ファイルを抽出する
処理を実行させるプログラム。
(付記10)
文書ファイルに含まれるテキスト情報の形態素解析を行い、前記テキスト情報に含まれる単語間の係受け構造を複数抽出する抽出部と、
複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定する特定部と、
特定した係受け構造と前記文書ファイルとを関連付けて記憶部に記憶する記憶処理部と
を備える情報処理装置。
(付記11)
所定の係受け構造の指定を受け付ける受付部と、
文書ファイルに含まれるテキスト情報の形態素解析を実行し、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定することで得られた、前記係受け構造と前記文書ファイルとの関連付け情報を複数の文書ファイルのそれぞれについて記憶する記憶部を参照して、受け付けた前記所定の係受け構造に合致する文書ファイルを抽出する抽出部と
を備える情報処理装置。
(付記12)
コンピュータに、
文書ファイルに含まれるテキスト情報の形態素解析を行い、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、
複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定し、
特定した係受け構造と前記文書ファイルとを関連付けて記憶部に記憶する
処理を実行させる情報処理方法。
(付記13)
コンピュータに、
所定の係受け構造の指定を受け付け、
文書ファイルに含まれるテキスト情報の形態素解析を実行し、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定することで得られた、前記係受け構造と前記文書ファイルとの関連付け情報を複数の文書ファイルのそれぞれについて記憶する記憶部を参照して、受け付けた前記所定の係受け構造に合致する文書ファイルを抽出する
処理を実行させる情報処理方法。
1A 可搬型記録媒体
1B 半導体メモリ
2 コンピュータ
10A 読み取り部
11 CPU
12 RAM
13 入力部
14 表示部
15 記憶部
15P 制御プログラム
16 通信部
21 CPU
22 RAM
23 入力部
24 表示部
25 記憶部
25P 制御プログラム
26 通信部
151 カルテDB
152 評価DB
153 対応DB
191、195 抽出部
192 特定部
193 記憶処理部
194 受付部
241 第1ボックス
242 第2ボックス
243 検索ボタン
N 通信網
Claims (8)
- コンピュータに、
文書ファイルに含まれるテキスト情報の形態素解析を行い、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、
複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定し、
特定した係受け構造と前記文書ファイルとを関連付けて記憶部に記憶する
処理を実行させるプログラム。 - 係受け元の単語と、係受け先の単語と、前記係受け元の単語及び係受け先の単語を特定する識別情報とを対応付けて記憶し、
前記識別情報に対応付けて前記係受け元の単語及び係受け先の単語を抽出した頻度を記憶し、
所定の閾値を超える識別情報を特定する
処理を実行させる請求項1に記載のプログラム。 - 前記記憶部には、複数の文書ファイルそれぞれについて特定した係受け構造が記憶されている
請求項1または2に記載のプログラム。 - コンピュータに、
所定の係受け構造の指定を受け付け、
文書ファイルに含まれるテキスト情報の形態素解析を実行し、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定することで得られた、前記係受け構造と前記文書ファイルとの関連付け情報を複数の文書ファイルのそれぞれについて記憶する記憶部を参照して、受け付けた前記所定の係受け構造に合致する文書ファイルを抽出する
処理を実行させるプログラム。 - 文書ファイルに含まれるテキスト情報の形態素解析を行い、前記テキスト情報に含まれる単語間の係受け構造を複数抽出する抽出部と、
複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定する特定部と、
特定した係受け構造と前記文書ファイルとを関連付けて記憶部に記憶する記憶処理部と
を備える情報処理装置。 - 所定の係受け構造の指定を受け付ける受付部と、
文書ファイルに含まれるテキスト情報の形態素解析を実行し、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定することで得られた、前記係受け構造と前記文書ファイルとの関連付け情報を複数の文書ファイルのそれぞれについて記憶する記憶部を参照して、受け付けた前記所定の係受け構造に合致する文書ファイルを抽出する抽出部と
を備える情報処理装置。 - コンピュータに、
文書ファイルに含まれるテキスト情報の形態素解析を行い、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、
複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定し、
特定した係受け構造と前記文書ファイルとを関連付けて記憶部に記憶する
処理を実行させる情報処理方法。 - コンピュータに、
所定の係受け構造の指定を受け付け、
文書ファイルに含まれるテキスト情報の形態素解析を実行し、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定することで得られた、前記係受け構造と前記文書ファイルとの関連付け情報を複数の文書ファイルのそれぞれについて記憶する記憶部を参照して、受け付けた前記所定の係受け構造に合致する文書ファイルを抽出する
処理を実行させる情報処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015187293A JP6631122B2 (ja) | 2015-09-24 | 2015-09-24 | プログラム、情報処理装置及び情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015187293A JP6631122B2 (ja) | 2015-09-24 | 2015-09-24 | プログラム、情報処理装置及び情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017062618A true JP2017062618A (ja) | 2017-03-30 |
JP6631122B2 JP6631122B2 (ja) | 2020-01-15 |
Family
ID=58428753
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015187293A Active JP6631122B2 (ja) | 2015-09-24 | 2015-09-24 | プログラム、情報処理装置及び情報処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6631122B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003108582A (ja) * | 2001-09-27 | 2003-04-11 | Mitsubishi Electric Corp | 類義語抽出方法および文書検索装置 |
JP2004240576A (ja) * | 2003-02-04 | 2004-08-26 | Ricoh Co Ltd | キーフレーズ表現抽出装置、キーフレーズ表現抽出方法およびその方法をコンピュータに実行させるプログラム |
JP2009128948A (ja) * | 2007-11-19 | 2009-06-11 | Fuji Xerox Co Ltd | 文書データ解析装置およびプログラム |
-
2015
- 2015-09-24 JP JP2015187293A patent/JP6631122B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003108582A (ja) * | 2001-09-27 | 2003-04-11 | Mitsubishi Electric Corp | 類義語抽出方法および文書検索装置 |
JP2004240576A (ja) * | 2003-02-04 | 2004-08-26 | Ricoh Co Ltd | キーフレーズ表現抽出装置、キーフレーズ表現抽出方法およびその方法をコンピュータに実行させるプログラム |
JP2009128948A (ja) * | 2007-11-19 | 2009-06-11 | Fuji Xerox Co Ltd | 文書データ解析装置およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6631122B2 (ja) | 2020-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210319032A1 (en) | Systems and methods for contextual retrieval and contextual display of records | |
US10558754B2 (en) | Method and system for automating training of named entity recognition in natural language processing | |
EP3839785B1 (en) | Characterizing malware files for similarity searching | |
CN107085583B (zh) | 一种基于内容的电子文档管理方法及装置 | |
CA2932401A1 (en) | Systems and methods for in-memory database search | |
US20160070748A1 (en) | Method and apparatus for improved searching of digital content | |
US20190377765A1 (en) | Web page clustering method and device | |
US9317608B2 (en) | Systems and methods for parsing search queries | |
CN103703461A (zh) | 检测搜索查询的源语言 | |
US20170185653A1 (en) | Predicting Knowledge Types In A Search Query Using Word Co-Occurrence And Semi/Unstructured Free Text | |
JP2014112283A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
KR101651780B1 (ko) | 빅 데이터 처리 기술을 이용한 연관 단어 추출 방법 및 그 시스템 | |
US20210334314A1 (en) | Sibling search queries | |
CN112740202A (zh) | 使用内容标签执行图像搜索 | |
CN105550217B (zh) | 场景音乐搜索方法及场景音乐搜索装置 | |
KR20130021944A (ko) | 서술형 질의 응답 방법 및 장치 | |
US10884996B1 (en) | Systems and methods for optimizing automatic schema-based metadata generation | |
CN112487159A (zh) | 检索方法、检索装置及计算机可读存储介质 | |
JP6631122B2 (ja) | プログラム、情報処理装置及び情報処理方法 | |
CN114201607A (zh) | 一种信息处理的方法和装置 | |
JP5971794B2 (ja) | 特許調査支援装置、特許調査支援方法、およびプログラム | |
JP5394512B2 (ja) | 教師データ生成装置、方法及びプログラム | |
US20230015324A1 (en) | Retrieval device | |
US20160055174A1 (en) | Facilitating searching for geographic place names | |
WO2022009354A1 (ja) | 発明評価装置、発明評価方法、および発明評価プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180608 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190426 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190514 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190621 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191125 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6631122 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |