JP6814091B2 - 文書分類システムおよび文書分類方法 - Google Patents
文書分類システムおよび文書分類方法 Download PDFInfo
- Publication number
- JP6814091B2 JP6814091B2 JP2017095341A JP2017095341A JP6814091B2 JP 6814091 B2 JP6814091 B2 JP 6814091B2 JP 2017095341 A JP2017095341 A JP 2017095341A JP 2017095341 A JP2017095341 A JP 2017095341A JP 6814091 B2 JP6814091 B2 JP 6814091B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- classification
- classifications
- classified
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、文書分類システムの全体の機能構成を示したものであり、本実施形態の文書分類システムは、図1に示されるように、利用者端末10、AP(Application)サーバ100、DBサーバ200、文書分類サーバ300がネットワーク5で接続された形態である。
次に、単語の埋込み表現として、各単語にワードベクトルを設定する(S12、PH2)。
先ず、文書分類サーバ300は、DBサーバ200を介して、分類をおこなう文献(文献ファイル226)を読み込む(S21)。
なお、本実施形態では、文書の分類を付与し、その分類過程で出力された情報を用いて関連特許文献の表示を行っているが、分類付与を行わずに関連特許文献の表示のみを行ってもよい。特許情報を利用する企業、研究所においては、特許庁等が付与した分類を用いることができるため、新たに分類を付与する必要はないからである。
この場合においても、システム構成は図1と同様となる。付与した分類以外の分類根拠などは、公開されない情報が多いからである。まずは、特許庁が分類付与した特許文献(すなわち、教師データ)を用いて、学習モデル情報321を作成する。その後、モデル情報321を用いて、分類付与済みの特許文献について、分類付与処理を行う。これによってDBサーバ200の記憶部220に記憶される各情報が形成され、関連特許の表示が可能になる。
Claims (6)
- 文書に分類を付与する文書分類システムであって、
分類付与済み文書を教師データとして読み込んで作成したモデル情報を備え、
分類付与対象の文書を読み込み、前記モデル情報を用いて、前記分類付与対象の文書に複数の分類を付与する分類部と、
前記付与した複数の分類、および、前記分類付与対象の文書中の、前記複数の分類の各々を付与する根拠となった単語または文が強調された文書を出力する出力部を有し、
前記出力部は、前記複数の分類の類似度に応じて、前記複数の分類の各々を付与する根拠となった単語または文の強調の仕方を変えて出力することを特徴とする文書分類システム。 - 文書に分類を付与する文書分類システムであって、
分類付与済み文書を教師データとして読み込んで作成したモデル情報を備え、
分類付与対象の文書を読み込み、前記モデル情報を用いて、前記分類付与対象の文書に複数の分類を付与する分類部と、
前記付与した複数の分類、および、前記分類付与対象の文書中の、前記複数の分類の各々を付与する根拠となった単語または文が強調された文書を出力する出力部を有し、
前記出力部は、前記出力した文書中の前記強調された単語または文の何れかが外部より選択された場合、前記選択された単語または文の寄与が大きい分類が付与されている複数の文献の文献名を出力し、さらに、前記複数の文献の文献名の何れかが外部より選択された場合、前記選択された文献名の文献を出力することを特徴とする文書分類システム。 - 文書に分類を付与する文書分類システムであって、
分類付与済み文書を教師データとして読み込んで作成したモデル情報を備え、
分類付与対象の文書を読み込み、前記モデル情報を用いて、前記分類付与対象の文書に複数の分類を付与する分類部と、
前記付与した複数の分類、および、前記分類付与対象の文書中の、前記複数の分類の各々を付与する根拠となった複数の単語または文のリストを出力する出力部を有し、
前記出力部は、前記リスト中の前記複数の単語または文の何れかが外部より選択された場合、前記選択された単語または文の寄与が大きい分類が付与されている複数の文献の文献名を出力し、さらに、前記複数の文献の文献名の何れかが外部より選択された場合、前記選択された文献名の文献を出力することを特徴とする文書分類システム。 - 文書に分類を付与する文書分類方法であって、
分類付与済み文書を教師データとして読み込んで作成したモデル情報を作成するステップと、
分類付与対象の文書を読み込み、前記モデル情報を用いて、前記分類付与対象の文書に複数の分類を付与するステップと、
前記付与された複数の分類を表示するステップと、
前記分類付与対象の文書中の、前記複数の分類の各々を付与する根拠となった単語または文が強調された文書を表示するステップと、
前記複数の分類の類似度に応じて、前記複数の分類の各々を付与する根拠となった単語または文の強調の仕方を変えて表示するステップを有することを特徴する文書分類方法。 - 文書に分類を付与する文書分類方法であって、
分類付与済み文書を教師データとして読み込んで作成したモデル情報を作成するステップと、
分類付与対象の文書を読み込み、前記モデル情報を用いて、前記分類付与対象の文書に複数の分類を付与するステップと、
前記付与された複数の分類を表示するステップと、
前記分類付与対象の文書中の、前記複数の分類の各々を付与する根拠となった単語または文が強調された文書を表示するステップと、
前記強調された単語または文の何れかが外部より選択された場合、前記選択された単語または文の寄与が大きい分類が付与されている複数の文献の文献名を表示し、さらに、前記複数の文献の文献名の何れかが外部より選択された場合、前記選択された文献名の文献を表示することを特徴とする文書分類方法。 - 文書に分類を付与する文書分類方法であって、
分類付与済み文書を教師データとして読み込んで作成したモデル情報を作成するステップと、
分類付与対象の文書を読み込み、前記モデル情報を用いて、前記分類付与対象の文書に複数の分類を付与するステップと、
前記付与された複数の分類を表示するステップと、
前記分類付与対象の文書中の、前記複数の分類の各々を付与する根拠となった複数の単語または文のリストを表示するステップと、
前記リストの中の前記複数の単語または文の何れかが外部より選択された場合、前記選択された単語または文の寄与が大きい分類が付与されている複数の文献の文献名を表示し、さらに、前記複数の文献の文献名の何れかが外部より選択された場合、前記選択された文献名の文献を表示することを特徴とする文書分類方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017095341A JP6814091B2 (ja) | 2017-05-12 | 2017-05-12 | 文書分類システムおよび文書分類方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017095341A JP6814091B2 (ja) | 2017-05-12 | 2017-05-12 | 文書分類システムおよび文書分類方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018194881A JP2018194881A (ja) | 2018-12-06 |
JP6814091B2 true JP6814091B2 (ja) | 2021-01-13 |
Family
ID=64570847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017095341A Active JP6814091B2 (ja) | 2017-05-12 | 2017-05-12 | 文書分類システムおよび文書分類方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6814091B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7284371B2 (ja) * | 2018-12-13 | 2023-05-31 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP6733920B2 (ja) * | 2019-01-16 | 2020-08-05 | 株式会社エクサウィザーズ | 情報処理装置、表示方法およびプログラム |
JP6792751B2 (ja) * | 2019-03-05 | 2020-12-02 | 株式会社医療情報技術研究所 | 分類システム |
JP7179714B2 (ja) * | 2019-12-27 | 2022-11-29 | Kddi株式会社 | 説明装置、説明方法及び説明プログラム |
EP4152250A4 (en) * | 2020-05-15 | 2023-11-15 | Sony Group Corporation | INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD, AND INFORMATION PROCESSING SYSTEM |
JP7199028B2 (ja) * | 2020-12-28 | 2023-01-05 | パナソニックIpマネジメント株式会社 | 分類装置、分類方法、及び、コンピュータプログラム |
CN117836763A (zh) * | 2021-08-26 | 2024-04-05 | 株式会社半导体能源研究所 | 文件分类系统及文件分类方法 |
JP2023054506A (ja) * | 2021-10-04 | 2023-04-14 | 株式会社ラック | 情報検索システム、情報検索方法およびプログラム |
KR102427136B1 (ko) * | 2021-10-29 | 2022-08-01 | (주)제이엘케이 | 유사한 문장을 검색하기 위한 방법 및 장치 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006285499A (ja) * | 2005-03-31 | 2006-10-19 | Nec Corp | データマイニング装置、データマイニング方法およびそのプログラム |
JP4604097B2 (ja) * | 2008-03-11 | 2010-12-22 | 株式会社日立製作所 | 文書分類付与方法、システムまたはコンピュータプログラム |
JP2016206748A (ja) * | 2015-04-16 | 2016-12-08 | 株式会社日立製作所 | 分類付与方法および分類付与システム |
-
2017
- 2017-05-12 JP JP2017095341A patent/JP6814091B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018194881A (ja) | 2018-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6814091B2 (ja) | 文書分類システムおよび文書分類方法 | |
US11372935B2 (en) | Automatically generating a website specific to an industry | |
US8069173B2 (en) | Information processing apparatus and method of controlling the same, information processing method, and computer program | |
US9588955B2 (en) | Systems, methods, and software for manuscript recommendations and submissions | |
US20110270826A1 (en) | Document analysis system | |
KR102237274B1 (ko) | 키워드의 중요도에 의한 사용자간의 매칭정보를 제공하는 시스템 및 방법 | |
CN101681363A (zh) | 用于编辑和分类文档的系统和技术 | |
US20110004819A1 (en) | Systems and methods for user-driven document assembly | |
US20170109442A1 (en) | Customizing a website string content specific to an industry | |
JP2011076396A (ja) | メタデータ設定方法及びメタデータ設定システム、並びにプログラム | |
CN108153754B (zh) | 一种数据处理方法及其装置 | |
TW201508525A (zh) | 文件分類系統、文件分類方法及文件分類程式 | |
KR20010104872A (ko) | 개인별 메타 검색엔진 구축기능을 갖는 인터넷 사이트검색 서비스 시스템 | |
JP5008152B2 (ja) | 調達情報検索システム | |
JP4802125B2 (ja) | ウェブログ管理プログラム、ウェブログ管理装置およびウェブログ管理方法 | |
WO2019239543A1 (ja) | 質問応答装置、質問応答方法および記録媒体 | |
Babych et al. | Cross-language comparability and its applications for MT | |
JP2019114152A (ja) | 臨床検査結果編集装置 | |
CN112733527B (zh) | 建筑工程文档知识网络的构建方法及系统 | |
JP5574775B2 (ja) | アイデア整理支援装置およびアイデア整理支援プログラム | |
JP7103414B2 (ja) | 表示形式決定装置、表示形式決定方法およびプログラム | |
JP2005316881A (ja) | 図面検索のためのプログラム、図面検索装置及び図面検索結果表示方法 | |
KR100586561B1 (ko) | 모듈 삽입 프로그램을 이용한 홈페이지 생성 방법 및시스템 | |
Jin et al. | Design and implementation for report layout merging | |
JP2003173343A (ja) | 文書管理装置及び文書表示方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191121 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200630 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200817 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6814091 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |