JP7305566B2 - 情報処理装置、情報処理システム、および情報処理プログラム - Google Patents
情報処理装置、情報処理システム、および情報処理プログラム Download PDFInfo
- Publication number
- JP7305566B2 JP7305566B2 JP2020007504A JP2020007504A JP7305566B2 JP 7305566 B2 JP7305566 B2 JP 7305566B2 JP 2020007504 A JP2020007504 A JP 2020007504A JP 2020007504 A JP2020007504 A JP 2020007504A JP 7305566 B2 JP7305566 B2 JP 7305566B2
- Authority
- JP
- Japan
- Prior art keywords
- causal relationship
- expression
- unit
- words
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/358—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- General Business, Economics & Management (AREA)
- Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
pp.3466-3473, 2017
・文献2:坂地他, 決算短信PDFからの原因・結果表現の抽出, 電子情報通信学会論文誌D, Vol.J98-D, N0.5, pp.811-822, 2015
上記実施形態では、取得部22Dは、ユーザに対して因果関係42および類似表現43を少なくとも含む表示画面50を提供し、ユーザによって入力または選択された一般化表現44を受付けることで、一般化表現44を取得する形態を一例として説明した。
10、11 情報処理装置
22A 対象文書取得部
22B 因果関係取得部
22C 類似表現取得部
22E 優先度判定部
22D、23D 取得部
22F 共起語取得部
22G 表示制御部
22H 受付部
22I 登録部
30 端末装置
40 文書
41 対象文書
42 因果関係
43 類似表現
44 一般化表現
45 共起語
Claims (12)
- 1または複数の文書から抽出された、関係を有する第1要素と第2要素との組からなる1または複数の因果関係が登録された因果関係管理情報から、特定の前記文書である対象文書に含まれる前記因果関係を取得する因果関係取得部と、
1または複数の前記文書に含まれる複数のワードの各々の特徴量が登録された特徴量管理情報に登録されているワードの各々の優先度を判定する優先度判定部と、
前記特徴量管理情報に基づいて、前記対象文書に含まれる前記因果関係の類似表現を取得する類似表現取得部と、
前記対象文書に含まれる前記因果関係および前記類似表現に基づいて、前記対象文書に含まれる前記因果関係の一般化表現を取得する取得部と、
を備え、
前記類似表現取得部は、
前記対象文書における前記因果関係を構成するワードの各々に前記特徴量が類似する他のワードの内、優先度が予め定められた第1優先度より高いワードの群を、前記因果関係の前記類似表現として取得する、
情報処理装置。 - 前記取得部は、
前記対象文書に含まれる前記因果関係および前記類似表現を含む表示画面を表示部に表示する表示制御部と、
前記表示画面に表示された前記因果関係の前記一般化表現の入力を受付ける受付部と、
受付けた前記一般化表現を該因果関係の前記一般化表現として登録する登録部と、
を有する、
請求項1に記載の情報処理装置。 - 前記表示制御部は、
前記対象文書に含まれる前記因果関係、前記類似表現、および、該因果関係の前記一般化表現の候補の選択画面、を含む前記表示画面を前記表示部に表示し、
前記受付部は、
前記選択画面の前記候補から選択された前記一般化表現の入力を受付ける、
請求項2に記載の情報処理装置。 - 前記取得部は、
前記対象文書に含まれる前記因果関係および前記類似表現から該因果関係の前記一般化表現を取得するための学習モデルを用いて、該因果関係の前記一般化表現を取得する、
請求項1に記載の情報処理装置。 - 前記類似表現取得部は、
前記特徴量管理情報に登録されているワードの内、前記対象文書における前記因果関係を構成するワードの各々に前記特徴量が類似するワードの群を、前記因果関係の前記類似表現として取得する、
請求項1~請求項4の何れか1項に記載の情報処理装置。 - 前記優先度判定部は、
前記対象文書が属するカテゴリを特定し、特定した該カテゴリ以外の他のカテゴリに属する前記文書に多く含まれるワードほど、高い優先度を判定する、
請求項1に記載の情報処理装置。 - 前記類似表現取得部は、
前記特徴量管理情報に登録されているワードの内、前記対象文書における前記因果関係を構成する予め定められた品詞のワードの各々に前記特徴量が類似するワードの群を、前記因果関係の前記類似表現として取得する、
請求項1~請求項6の何れか1項に記載の情報処理装置。 - 前記対象文書に含まれる前記因果関係を構成するワードに関する共起語を取得する共起語取得部を備え、
前記取得部は、
前記対象文書に含まれる前記因果関係、前記類似表現、および前記共起語、に基づいて、前記一般化表現を取得する、
請求項1~請求項7の何れか1項に記載の情報処理装置。 - 前記共起語取得部は、
複数のワードの各々の前記共起語を登録した共起管理情報における、前記対象文書に含まれる前記因果関係を構成するワードに関する前記共起語の内、選択を受付けたワードに対応する前記共起語を取得する、
請求項8に記載の情報処理装置。 - 前記因果関係取得部は、
前記因果関係管理情報から取得した複数の前記因果関係の内、選択された前記因果関係を取得する、
請求項1~請求項9の何れか1項に記載の情報処理装置。 - 情報処理装置と、前記情報処理装置と通信する端末装置と、を備えた情報処理システムであって、
前記情報処理装置は、
1または複数の文書から抽出された、関係を有する第1要素と第2要素との組からなる1または複数の因果関係が登録された因果関係管理情報から、特定の前記文書である対象文書に含まれる前記因果関係を取得する因果関係取得部と、
1または複数の前記文書に含まれる複数のワードの各々の特徴量が登録された特徴量管理情報に登録されているワードの各々の優先度を判定する優先度判定部と、
前記特徴量管理情報に基づいて、前記対象文書に含まれる前記因果関係の類似表現を取得する類似表現取得部と、
前記対象文書に含まれる前記因果関係および前記類似表現に基づいて、前記対象文書に含まれる前記因果関係の一般化表現を取得する取得部と、
を備え、
前記取得部は、
前記対象文書に含まれる前記因果関係および前記類似表現を含む表示画面を前記端末装置の表示部に表示する表示制御部と、
前記表示画面に表示された前記因果関係の前記一般化表現の入力を受付ける受付部と、
受付けた前記一般化表現を該因果関係の前記一般化表現として登録する登録部と、
を有し、
前記類似表現取得部は、
前記対象文書における前記因果関係を構成するワードの各々に前記特徴量が類似する他のワードの内、優先度が予め定められた第1優先度より高いワードの群を、前記因果関係の前記類似表現として取得する、
情報処理システム。 - コンピュータに実行させるための情報処理プログラムであって、
1または複数の文書から抽出された、関係を有する第1要素と第2要素との組からなる1または複数の因果関係が登録された因果関係管理情報から、特定の前記文書である対象文書に含まれる前記因果関係を取得する因果関係取得ステップと、
1または複数の前記文書に含まれる複数のワードの各々の特徴量が登録された特徴量管理情報に登録されているワードの各々の優先度を判定する優先度判定ステップと、
前記特徴量管理情報に基づいて、前記対象文書に含まれる前記因果関係の類似表現を取得する類似表現取得ステップと、
前記対象文書に含まれる前記因果関係および前記類似表現に基づいて、前記対象文書に含まれる前記因果関係の一般化表現を取得する一般化表現取得ステップと、
を含み、
前記類似表現取得ステップは、
前記対象文書における前記因果関係を構成するワードの各々に前記特徴量が類似する他のワードの内、優先度が予め定められた第1優先度より高いワードの群を、前記因果関係の前記類似表現として取得する、
情報処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020007504A JP7305566B2 (ja) | 2020-01-21 | 2020-01-21 | 情報処理装置、情報処理システム、および情報処理プログラム |
US17/005,420 US11599569B2 (en) | 2020-01-21 | 2020-08-28 | Information processing device, information processing system, and computer program product for converting a causal relationship into a generalized expression |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020007504A JP7305566B2 (ja) | 2020-01-21 | 2020-01-21 | 情報処理装置、情報処理システム、および情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021114234A JP2021114234A (ja) | 2021-08-05 |
JP7305566B2 true JP7305566B2 (ja) | 2023-07-10 |
Family
ID=76857023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020007504A Active JP7305566B2 (ja) | 2020-01-21 | 2020-01-21 | 情報処理装置、情報処理システム、および情報処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11599569B2 (ja) |
JP (1) | JP7305566B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7434125B2 (ja) | 2020-09-16 | 2024-02-20 | 株式会社東芝 | 文書検索装置、文書検索方法、及びプログラム |
CN113806452B (zh) * | 2021-09-17 | 2022-10-25 | 北京百度网讯科技有限公司 | 信息处理方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000293537A (ja) | 1999-04-09 | 2000-10-20 | Hitachi Ltd | データ分析支援方法および装置 |
JP2009059323A (ja) | 2007-09-04 | 2009-03-19 | Omron Corp | 知識生成システム |
JP2015032287A (ja) | 2013-08-07 | 2015-02-16 | 日本電信電話株式会社 | 行動目的抽出方法及び装置 |
JP2018190077A (ja) | 2017-04-28 | 2018-11-29 | 日本放送協会 | 発話生成装置、発話生成方法及び発話生成プログラム |
JP2019128925A (ja) | 2018-01-26 | 2019-08-01 | 株式会社日立製作所 | 事象提示システムおよび事象提示装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5034580B2 (ja) | 2007-03-15 | 2012-09-26 | オムロン株式会社 | 因果推論装置、その制御プログラムおよび制御方法 |
US9886427B2 (en) * | 2010-11-01 | 2018-02-06 | Koninklijke Philips N.V. | Suggesting relevant terms during text entry |
JP5683758B1 (ja) * | 2013-07-19 | 2015-03-11 | 楽天株式会社 | レコメンド情報提示装置、レコメンド情報提示方法及びレコメンド情報提示プログラム |
US20150310003A1 (en) * | 2014-04-28 | 2015-10-29 | Elwha Llc | Methods, systems, and devices for machines and machine states that manage relation data for modification of documents based on various corpora and/or modification data |
US10504030B2 (en) * | 2015-07-25 | 2019-12-10 | The Boeing Company | Systems, methods, and computer program products for generating a query specific Bayesian network |
US11068554B2 (en) * | 2019-04-19 | 2021-07-20 | Microsoft Technology Licensing, Llc | Unsupervised entity and intent identification for improved search query relevance |
-
2020
- 2020-01-21 JP JP2020007504A patent/JP7305566B2/ja active Active
- 2020-08-28 US US17/005,420 patent/US11599569B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000293537A (ja) | 1999-04-09 | 2000-10-20 | Hitachi Ltd | データ分析支援方法および装置 |
JP2009059323A (ja) | 2007-09-04 | 2009-03-19 | Omron Corp | 知識生成システム |
JP2015032287A (ja) | 2013-08-07 | 2015-02-16 | 日本電信電話株式会社 | 行動目的抽出方法及び装置 |
JP2018190077A (ja) | 2017-04-28 | 2018-11-29 | 日本放送協会 | 発話生成装置、発話生成方法及び発話生成プログラム |
JP2019128925A (ja) | 2018-01-26 | 2019-08-01 | 株式会社日立製作所 | 事象提示システムおよび事象提示装置 |
Also Published As
Publication number | Publication date |
---|---|
US20210224307A1 (en) | 2021-07-22 |
US11599569B2 (en) | 2023-03-07 |
JP2021114234A (ja) | 2021-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jung | Semantic vector learning for natural language understanding | |
US8630989B2 (en) | Systems and methods for information extraction using contextual pattern discovery | |
CN111373392B (zh) | 文献分类装置 | |
US8082264B2 (en) | Automated scheme for identifying user intent in real-time | |
US7747555B2 (en) | System and method for retrieving and intelligently grouping definitions found in a repository of documents | |
CN105210057B (zh) | 多语言商业标记管理以及音译合成 | |
JP5710581B2 (ja) | 質問応答装置、方法、及びプログラム | |
JP2003288362A (ja) | 特定要素ベクトル生成装置、文字列ベクトル生成装置、類似度算出装置、特定要素ベクトル生成プログラム、文字列ベクトル生成プログラム及び類似度算出プログラム、並びに特定要素ベクトル生成方法、文字列ベクトル生成方法及び類似度算出方法 | |
US20220358379A1 (en) | System, apparatus and method of managing knowledge generated from technical data | |
JP7305566B2 (ja) | 情報処理装置、情報処理システム、および情報処理プログラム | |
JP4631795B2 (ja) | 情報検索支援システム、情報検索支援方法および情報検索支援プログラム | |
CN111325018A (zh) | 一种基于web检索和新词发现的领域词典构建方法 | |
CN116797195A (zh) | 工单处理方法、装置、计算机设备和计算机可读存储介质 | |
Radoev et al. | A language adaptive method for question answering on French and English | |
KR102661438B1 (ko) | 인터넷 기사 크롤링, 글로벌 가치 사슬에 영향을 주는 이슈 기사의 요약 서비스를 제공하는 웹크롤러 시스템 | |
CN111126073B (zh) | 语义检索方法和装置 | |
JP4005343B2 (ja) | 情報検索システム | |
JP2011039576A (ja) | 特定情報検出装置、特定情報検出方法および特定情報検出プログラム | |
Little | Recognition of Latin scientific names using artificial neural networks | |
JP4711556B2 (ja) | 文章自動分類装置、文章自動分類プログラム、文章自動分類方法及び文章自動分類プログラムを記録したコンピュータ読取可能な記録媒体 | |
JP4953440B2 (ja) | 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体 | |
Chaabene et al. | Semantic annotation for the “on demand graphical representation” of variable data in Web documents | |
US20220366714A1 (en) | Inter-word score calculation apparatus, question and answer extraction system and inter-word score calculation method | |
Saneifar et al. | From terminology extraction to terminology validation: an approach adapted to log files | |
KR20180137394A (ko) | 문서로부터 용어를 추출하고 관리하는 장치를 이용한 용어 추출 및 관리 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230314 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230512 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230530 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230628 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7305566 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |