JP7048024B1 - 情報処理装置、情報処理方法、および情報処理プログラム - Google Patents
情報処理装置、情報処理方法、および情報処理プログラム Download PDFInfo
- Publication number
- JP7048024B1 JP7048024B1 JP2021161872A JP2021161872A JP7048024B1 JP 7048024 B1 JP7048024 B1 JP 7048024B1 JP 2021161872 A JP2021161872 A JP 2021161872A JP 2021161872 A JP2021161872 A JP 2021161872A JP 7048024 B1 JP7048024 B1 JP 7048024B1
- Authority
- JP
- Japan
- Prior art keywords
- classification
- sentence
- information processing
- unit
- document data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 117
- 238000003672 processing method Methods 0.000 title claims description 6
- 238000007635 classification algorithm Methods 0.000 claims abstract description 16
- 230000008520 organization Effects 0.000 claims description 8
- 230000008707 rearrangement Effects 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 abstract description 18
- 238000000034 method Methods 0.000 abstract description 18
- 238000004458 analytical method Methods 0.000 abstract description 12
- 230000006870 function Effects 0.000 description 39
- 238000001914 filtration Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 12
- 239000003550 marker Substances 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000015654 memory Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000000877 morphologic effect Effects 0.000 description 6
- 238000002372 labelling Methods 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 4
- 238000005401 electroluminescence Methods 0.000 description 3
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000003936 working memory Effects 0.000 description 2
- 229910052729 chemical element Inorganic materials 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
まず、図1を参照して、情報処理システム10について説明する。図1は、情報処理システム10の装置構成の一例を示す図である。
次に、引き続き図1を参照して、情報処理装置100による文の分類機能について説明する。
次に、図2~図9を参照して、情報処理装置100の機能構成について説明する。図2は、情報処理装置100の機能構成の一例を示す図である。
まず、図3を参照して、図2に示される取得部52の機能について説明する。図3は、取得部52の機能を説明するための図である。
次に、図4を参照して、図2に示される分割部54の機能について説明する。図4は、分割部54の機能を概略的に示す図である。
次に、図5および図6を参照して、図2に示される分類付与部56の機能について説明する。
まず、図5を参照して、図2に示される企業分類付与部56Aの機能について説明する。図5は、企業分類付与部56Aの機能を概略的に示す図である。
次に、図6を参照して、図2に示される商品分類付与部56Bの機能について説明する。図6は、商品分類付与部56Bの機能を概略的に示す図である。
次に、図7および図8を参照して、図2に示される並び替え部58の機能について説明する。図7は、並び替え部58の機能を概略的に示す図である。
次に、図9を参照して、図2に示される出力部60の機能について説明する。図9は、出力部60の機能を概略的に示す図である。
図10および図11を参照して、上述の図1に示される情報処理装置100とユーザ端末200とのハードウェア構成について順に説明する。
まず、図10を参照して、情報処理装置100のハードウェア構成について順に説明する。図10は、情報処理装置100のハードウェア構成の一例を示す模式図である。
次に、図11を参照して、ユーザ端末200のハードウェア構成について順に説明する。図11は、ユーザ端末200のハードウェア構成の一例を示す模式図である。
次に、図12を参照して、情報処理装置100の制御構造について説明する。図12は、情報処理装置100が実行する処理の一部を表わすフローチャートである。
次に、図13~図19を参照して、変形例に従う情報処理装置100Aについて説明する。図13は、情報処理装置100Aの機能構成の一例を示す図である。
上述では、図1に示されるステップS2~S4の処理が情報処理装置100で実行される例について説明を行ったが、これらの処理は、必ずしも情報処理装置100によって処理される必要はない。これらの処理は、ユーザ端末200などの他のコンピュータによって実行されてもよい。
Claims (5)
- 情報処理装置であって、
複数の文書データを取得するための取得部と、
前記複数の文書データに含まれている文字列を文単位に分割するための分割部と、
第1分類アルゴリズムに従って、前記文単位に分割された複数の文の全部または一部の各文に、組織名に関する第1分類群の内のいずれかの第1分類を付与するための分類付与部とを備え、前記分類付与部は、さらに、第2分類アルゴリズムに従って、前記文単位に分割された複数の文の全部または一部の各文に、商品名に関する第2分類群の内のいずれかの第2分類を付与し、
前記第1分類および前記第2分類が付与された各文を、前記第1分類の種別および前記第2分類の一方の種別に並び替えた後に、前記第1分類の種別および前記第2分類の他方の種別に並び替えるための並び替え部と、
前記並び替え部によって並び替えられた各文を出力するための出力部とを備え、
前記出力部は、前記並び替え部による並び替え前における文の並び順が連続している文群であり、かつ、同種の第1分類および同種の第2分類が付与されている文群については、当該文群を統合して出力する、情報処理装置。 - 前記第2分類群が属するカテゴリーは、前記第1分類群が属するカテゴリーとは異なり、
前記並び替え部は、さらに、同種の第1分類が付与されている文の集合ごとに、前記第2分類が付与された各文を、前記第2分類の種別に並び替える、請求項1に記載の情報処理装置。 - 前記並び替え部は、前記第1分類の付与数を前記第1分類の種別にカウントし、前記第1分類が付与された各文を前記付与数が多い順に並び替える、請求項1または2に記載の情報処理装置。
- コンピュータによって実行される情報処理方法であって、
複数の文書データを取得するステップと、
前記複数の文書データに含まれている文字列を文単位に分割するステップと、
第1分類アルゴリズムに従って、前記文単位に分割された複数の文の全部または一部の各文に、組織名に関する第1分類群の内のいずれかの第1分類を付与するステップとを備え、前記付与するステップは、さらに、第2分類アルゴリズムに従って、前記文単位に分割された複数の文の全部または一部の各文に、商品名に関する第2分類群の内のいずれかの第2分類を付与するステップを含み、
前記第1分類および前記第2分類が付与された各文を、前記第1分類の種別および前記第2分類の一方の種別に並び替えた後に、前記第1分類の種別および前記第2分類の他方の種別に並び替えるステップと、
前記並び替えるステップで並び替えられた各文を出力するステップとを備え、
前記出力するステップは、前記並び替えるステップでの並び替え前における文の並び順が連続している文群であり、かつ、同種の第1分類および同種の第2分類が付与されている文群については、当該文群を統合して出力するステップを含む、情報処理方法。 - コンピュータによって実行される情報処理プログラムであって、
前記情報処理プログラムは、前記コンピュータに、
複数の文書データを取得するステップと、
前記複数の文書データに含まれている文字列を文単位に分割するステップと、
第1分類アルゴリズムに従って、前記文単位に分割された複数の文の全部または一部の各文に、組織名に関する第1分類群の内のいずれかの第1分類を付与するステップとを備え、前記付与するステップは、さらに、第2分類アルゴリズムに従って、前記文単位に分割された複数の文の全部または一部の各文に、商品名に関する第2分類群の内のいずれかの第2分類を付与するステップを含み、
前記第1分類および前記第2分類が付与された各文を、前記第1分類の種別および前記第2分類の一方の種別に並び替えた後に、前記第1分類の種別および前記第2分類の他方の種別に並び替えるステップと、
前記並び替えるステップで並び替えられた各文を出力するステップとを実行させ、
前記出力するステップは、前記並び替えるステップでの並び替え前における文の並び順が連続している文群であり、かつ、同種の第1分類および同種の第2分類が付与されている文群については、当該文群を統合して出力するステップを含む、情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021161872A JP7048024B1 (ja) | 2021-09-30 | 2021-09-30 | 情報処理装置、情報処理方法、および情報処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021161872A JP7048024B1 (ja) | 2021-09-30 | 2021-09-30 | 情報処理装置、情報処理方法、および情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7048024B1 true JP7048024B1 (ja) | 2022-04-05 |
JP2023051296A JP2023051296A (ja) | 2023-04-11 |
Family
ID=81259117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021161872A Active JP7048024B1 (ja) | 2021-09-30 | 2021-09-30 | 情報処理装置、情報処理方法、および情報処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7048024B1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004072527A (ja) | 2002-08-07 | 2004-03-04 | Seiko Epson Corp | 複合機、電子ファイリングシステムおよびスキャナ |
JP2005122510A (ja) | 2003-10-17 | 2005-05-12 | Nippon Telegr & Teleph Corp <Ntt> | 話題構造抽出方法及び装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体 |
JP2011002997A (ja) | 2009-06-18 | 2011-01-06 | Toshiba Corp | 医用情報システム |
JP2012141797A (ja) | 2010-12-28 | 2012-07-26 | Psp Corp | 医用レポート作成支援装置 |
JP2017068838A (ja) | 2015-09-29 | 2017-04-06 | パナソニックIpマネジメント株式会社 | 情報端末の制御方法及びプログラム |
-
2021
- 2021-09-30 JP JP2021161872A patent/JP7048024B1/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004072527A (ja) | 2002-08-07 | 2004-03-04 | Seiko Epson Corp | 複合機、電子ファイリングシステムおよびスキャナ |
JP2005122510A (ja) | 2003-10-17 | 2005-05-12 | Nippon Telegr & Teleph Corp <Ntt> | 話題構造抽出方法及び装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体 |
JP2011002997A (ja) | 2009-06-18 | 2011-01-06 | Toshiba Corp | 医用情報システム |
JP2012141797A (ja) | 2010-12-28 | 2012-07-26 | Psp Corp | 医用レポート作成支援装置 |
JP2017068838A (ja) | 2015-09-29 | 2017-04-06 | パナソニックIpマネジメント株式会社 | 情報端末の制御方法及びプログラム |
Non-Patent Citations (2)
Title |
---|
佐藤 郁哉,実践 質的データ分析入門,第1版,日本,株式会社新曜社 塩浦 ▲▼,2010年03月03日,pp. 38--46 |
門脇 香奈子,Excel完全ガイド 基本操作+疑問・困った解決+便利ワザ,第1版,日本,SBクリエイティブ株式会社 小川 淳,2018年06月20日,pp. 244--246 |
Also Published As
Publication number | Publication date |
---|---|
JP2023051296A (ja) | 2023-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7302646B2 (en) | Information rearrangement method, information processing apparatus and information processing system, and storage medium and program transmission apparatus therefor | |
CN102799610B (zh) | 网络信息收藏方法及系统 | |
TW567432B (en) | System and method for mining and statistical analyzing patent information | |
Trippe | Patinformatics: Tasks to tools | |
JP3577819B2 (ja) | 情報探索装置及び情報探索方法 | |
JP2000285140A (ja) | 文書処理装置、文書分類装置、文書処理方法、文書分類方法およびそれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
US20060288029A1 (en) | Sentence classification device and method | |
US20070088743A1 (en) | Information processing device and information processing method | |
US20150339298A1 (en) | Document management system, document management method, and document management program | |
CN106407344A (zh) | 一种生成搜索引擎优化标签的方法和系统 | |
EP0897158B1 (en) | Method for automatic processing of information materials for personified use | |
CN105488159A (zh) | 页面展示方法和页面展示装置 | |
Jankowska et al. | Relative N-gram signatures: Document visualization at the level of character N-grams | |
CN113919336A (zh) | 基于深度学习的文章生成方法、装置及相关设备 | |
JP3606556B2 (ja) | 情報整理方法、情報処理装置、記憶媒体、およびプログラム伝送装置 | |
JP6840597B2 (ja) | 検索結果要約装置、プログラム及び方法 | |
CN113886204A (zh) | 用户行为数据收集方法、装置、电子设备及可读存储介质 | |
JP7048024B1 (ja) | 情報処理装置、情報処理方法、および情報処理プログラム | |
CN102902705A (zh) | 定位数据中的歧义 | |
KR100616152B1 (ko) | 인터넷상에서 기사를 자동분류하여 타 웹사이트에 자동송출하는 제어방법 | |
TW201421265A (zh) | 智慧型新聞分析系統 | |
Di Corso et al. | Towards automated visualisation of scientific literature | |
JP2000020538A (ja) | 情報検索方法、情報検索装置および情報検索プログラム記憶媒体 | |
Alarte et al. | Site-level web template extraction based on DOM analysis | |
Lamba et al. | Tools and techniques for text mining and visualization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211109 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20211109 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220308 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220311 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7048024 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |