JP4202287B2 - 注目する情報について複数のタームを用いて記述されてなる文章テキストからなる情報オブジェクトをコンピュータで可視的に処理するためのシステム及びそのためのコンピュータソフトウエア - Google Patents
注目する情報について複数のタームを用いて記述されてなる文章テキストからなる情報オブジェクトをコンピュータで可視的に処理するためのシステム及びそのためのコンピュータソフトウエア Download PDFInfo
- Publication number
- JP4202287B2 JP4202287B2 JP2004073614A JP2004073614A JP4202287B2 JP 4202287 B2 JP4202287 B2 JP 4202287B2 JP 2004073614 A JP2004073614 A JP 2004073614A JP 2004073614 A JP2004073614 A JP 2004073614A JP 4202287 B2 JP4202287 B2 JP 4202287B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- book
- knowledge
- term
- textbook
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000012545 processing Methods 0.000 title claims description 33
- 239000011159 matrix material Substances 0.000 claims description 64
- 238000009825 accumulation Methods 0.000 claims description 22
- 238000011002 quantification Methods 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 14
- 238000000354 decomposition reaction Methods 0.000 claims description 9
- 239000000470 constituent Substances 0.000 claims description 5
- 230000035508 accumulation Effects 0.000 description 20
- 108090000623 proteins and genes Proteins 0.000 description 16
- 239000013598 vector Substances 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 10
- 230000010365 information processing Effects 0.000 description 8
- 238000012800 visualization Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000009897 systematic effect Effects 0.000 description 3
- 102000007982 Phosphoproteins Human genes 0.000 description 2
- 108010089430 Phosphoproteins Proteins 0.000 description 2
- 208000007014 Retinitis pigmentosa Diseases 0.000 description 2
- 208000014769 Usher Syndromes Diseases 0.000 description 2
- 210000003484 anatomy Anatomy 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 108091008695 photoreceptors Proteins 0.000 description 2
- 230000016732 phototransduction Effects 0.000 description 2
- 230000035479 physiological effects, processes and functions Effects 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 210000001525 retina Anatomy 0.000 description 2
- 230000004482 visual phototransduction Effects 0.000 description 2
- 108091006027 G proteins Proteins 0.000 description 1
- 102000030782 GTP binding Human genes 0.000 description 1
- 108091000058 GTP-Binding Proteins 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000006612 Transducin Human genes 0.000 description 1
- 108010087042 Transducin Proteins 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000012489 doughnuts Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
遺伝子ID(遺伝子オブジェクト):NM_002597
遺伝子定義:Homo sapiens phosducin(PDC),transcript variant 1,mRNA.
遺伝子を解説したテキスト:
Summary:This gene encodes a phosphoprotein,which is located in the outer and inner segments of the rod cells in the retina.This protein may participate in the regulation of visual phototransduction or in the integration of photoreceptor metabolism.It modulates the phototransduction cascade by interacting with the beta and gamma subunits of the retinal G−protein transducin.This gene is a potential candidate gene for retinitis pigmentosa and Usher syndrome type II.Alternatively spliced transcript variants encoding different isoforms have been identified.」
Claims (11)
- 注目する情報について複数のタームを用いて記述されてなる文章テキストからなる情報オブジェクトをコンピュータで可視的に処理するためのシステムであって、
知識に関して記述された複数の文章が、それらの知識を体系化するための所定の構成で集積的に収納されてなる教科書・書籍の電子データであって、知識を体系化する構成(目次)の情報と各構成に属する知識情報テキストとからなる電子データ、を格納する知識集積物格納部と、
ユーザから当該ユーザが注目する情報オブジェクトを受け取る注目情報受取部と、
前記情報オブジェクトの文章テキストと前記教科書・書籍の電子データの各構成に属する知識情報テキストとをそれらに含まれるタームに基づいて比較し、テキスト同士の相関性を定量化して定量化値として出力する定量化処理部と、
上記定量化処理部によって出力された定量化値を前記教科書・書籍の電子データの構成の情報に関連付けて前記教科書・書籍全体として表示することで、前記情報オブジェクトが前記教科書・書籍中のどの知識に関連しているかを上記定量化値で可視的に表示する定量化値表示処理部と
を有することを特徴とするシステム。 - 請求項1記載のシステムにおいて、
前記教科書・書籍の電子データの各構成とこの各構成に属する知識情報テキストに含まれるタームの頻度を示す頻度マトリックスを生成する頻度マトリックス生成部と、
前記頻度マトリックスに基づき、前記各構成と前記タームの特異値座標系を求める特異値分解部と、
をさらに有し、
前記定量化処理部は、前記注目する情報オブジェクトに含まれるタームを、前記特異値座標系にマッピングすることで、前記注目する情報オブジェクトと前記教科書・書籍の電子データの各構成に属する知識情報テキストとの関係を定量化するものである
ことを特徴とするシステム。 - 請求項2記載のシステムにおいて、
前記定量化処理部は、前記注目する情報オブジェクトに含まれるタームをその重要度に応じて集計する注目ターム集計部を有するものである
ことを特徴とするシステム。 - 請求項3記載のシステムにおいて、
前記注目ターム集計部は、前記注目する情報オブジェクトが含まれる母データでの前記タームの使用頻度・要度に応じて前記タームを集計するものである
ことを特徴とするシステム。 - 請求項3記載のシステムにおいて、
前記定量化処理部は、前記タームを、前記特異値座標系中で前記重要度に応じた位置にマッピングするものである
ことを特徴とするシステム。 - 請求項2記載のシステムにおいて、
ターム辞書を保持する辞書保持部をさらに有し、
前記頻度マトリックス生成部は、前記各構成中に属する知識情報テキスト中前記ターム辞書に含まれるタームのみを抽出して前記頻度マトリックスを生成するものである
ことを特徴とするシステム。 - 請求項1記載のシステムにおいて、
前記知識を体系化する構成の情報は、各ページ、節、章等の書籍の目次情報であり、前記構成に属する知識情報テキストは前記各目次に含まれる知識コンテンツである
ことを特徴とするシステム。 - 請求項7記載のシステムにおいて、
定量化値表示処理部は、上記定量化処理部によって定量化された値を、前記教科書・書籍の電子データの目次情報のうち任意の目次に関連付けて表示するものであることを特徴とするシステム。 - 請求項1記載のシステムにおいて、
さらに、前記定量化値に基づき、注目する情報オブジェクトと最も関連する前記教科書・書籍の電子データの構成位置を検索する位置検索部を有することを特徴とするシステム。 - 請求項1記載のシステムにおいて、
さらに、注目する情報オブジェクトと複数の教科書・書籍の電子データとの関係を処理し、
注目する情報オブジェクトと最も関連する教科書・書籍の電子データとその構成位置を検索する知識集積物・位置検索部を有することを特徴とするシステム。 - 注目する情報について複数のタームを用いて記述されてなる文章テキストからなる情報オブジェクトをコンピュータで可視的に処理するためのコンピュータソフトウエアであって、コンピュータ上で実行される以下の構成:
前記コンピュータに、知識に関して記述された複数の文章がそれらの知識を体系化するための所定の構成で集積的に収納されてなる教科書・書籍の電子データであって知識を体系化する構成の情報と各構成に属する知識情報テキストとからなる電子データ、を格納させる知識集積物格納部と、
前記コンピュータに、ユーザから当該ユーザが注目する情報オブジェクトを受け取らせる注目情報受取部と、
前記コンピュータに、前記情報オブジェクトの文章テキストと前記教科書・書籍の電子データの各構成に属する知識情報テキストとをそれらに含まれるタームに基づいて比較し、テキスト同士の相関性を定量化して定量化値として出力させる定量化処理部と、
前記コンピュータに、上記定量化処理部によって出力された定量化値を前記教科書・書籍の電子データの構成の情報に関連付けて前記教科書・書籍全体として表示させることで、前記情報オブジェクトが前記教科書・書籍中のどの知識に関連しているかを上記定量化値で可視的に表示させる定量化値表示処理部と
を有する
ことを特徴とするコンピュータソフトウエア。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004073614A JP4202287B2 (ja) | 2004-03-15 | 2004-03-15 | 注目する情報について複数のタームを用いて記述されてなる文章テキストからなる情報オブジェクトをコンピュータで可視的に処理するためのシステム及びそのためのコンピュータソフトウエア |
US11/039,176 US7903884B2 (en) | 2004-03-15 | 2005-01-20 | System and computer software program for visibly processing an observed information's relationship with knowledge accumulations |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004073614A JP4202287B2 (ja) | 2004-03-15 | 2004-03-15 | 注目する情報について複数のタームを用いて記述されてなる文章テキストからなる情報オブジェクトをコンピュータで可視的に処理するためのシステム及びそのためのコンピュータソフトウエア |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005259088A JP2005259088A (ja) | 2005-09-22 |
JP4202287B2 true JP4202287B2 (ja) | 2008-12-24 |
Family
ID=34918666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004073614A Expired - Lifetime JP4202287B2 (ja) | 2004-03-15 | 2004-03-15 | 注目する情報について複数のタームを用いて記述されてなる文章テキストからなる情報オブジェクトをコンピュータで可視的に処理するためのシステム及びそのためのコンピュータソフトウエア |
Country Status (2)
Country | Link |
---|---|
US (1) | US7903884B2 (ja) |
JP (1) | JP4202287B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7461073B2 (en) * | 2006-02-14 | 2008-12-02 | Microsoft Corporation | Co-clustering objects of heterogeneous types |
US7743058B2 (en) * | 2007-01-10 | 2010-06-22 | Microsoft Corporation | Co-clustering objects of heterogeneous types |
US8818979B2 (en) * | 2007-05-17 | 2014-08-26 | Valuenex Consulting Inc. | Document retrieving apparatus and document retrieving method |
US20110145714A1 (en) * | 2009-12-15 | 2011-06-16 | At&T Intellectual Property I, L.P. | System and method for web-integrated statistical analysis |
US20230153347A1 (en) * | 2011-07-05 | 2023-05-18 | Michael Stewart Shunock | System and method for annotating images |
US9639518B1 (en) | 2011-09-23 | 2017-05-02 | Amazon Technologies, Inc. | Identifying entities in a digital work |
US9613003B1 (en) | 2011-09-23 | 2017-04-04 | Amazon Technologies, Inc. | Identifying topics in a digital work |
US9471547B1 (en) | 2011-09-23 | 2016-10-18 | Amazon Technologies, Inc. | Navigating supplemental information for a digital work |
US9449526B1 (en) | 2011-09-23 | 2016-09-20 | Amazon Technologies, Inc. | Generating a game related to a digital work |
US9304584B2 (en) | 2012-05-31 | 2016-04-05 | Ca, Inc. | System, apparatus, and method for identifying related content based on eye movements |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03246764A (ja) * | 1990-02-26 | 1991-11-05 | Nippon Telegr & Teleph Corp <Ntt> | データベース検索システム |
US5301109A (en) * | 1990-06-11 | 1994-04-05 | Bell Communications Research, Inc. | Computerized cross-language document retrieval using latent semantic indexing |
JPH11134363A (ja) * | 1997-10-29 | 1999-05-21 | Ip Support:Kk | 特許情報処理方法及び特許情報処理システム |
JP3829506B2 (ja) * | 1998-11-27 | 2006-10-04 | セイコーエプソン株式会社 | 文書分類方法および文書分類装置ならびに文書分類処理プログラムを記録した記録媒体 |
JP3463010B2 (ja) * | 1999-09-17 | 2003-11-05 | Necエレクトロニクス株式会社 | 情報処理装置および情報処理方法 |
US7225180B2 (en) * | 2000-08-08 | 2007-05-29 | Aol Llc | Filtering search results |
JP2002358309A (ja) * | 2001-06-04 | 2002-12-13 | Hitachi Software Eng Co Ltd | プロファイルデータベース及びプロファイル作成方法 |
JP2002366557A (ja) * | 2001-06-11 | 2002-12-20 | Japan China Industrial Communications Co Ltd | 検索装置、コンピュータプログラム及び記録媒体 |
JP4495886B2 (ja) * | 2001-08-09 | 2010-07-07 | 株式会社日立製作所 | 音声入力認識文例集の管理方法 |
US20030130994A1 (en) * | 2001-09-26 | 2003-07-10 | Contentscan, Inc. | Method, system, and software for retrieving information based on front and back matter data |
JP2003203091A (ja) * | 2002-01-09 | 2003-07-18 | Seiko Epson Corp | 文書速読支援装置、文書速読支援方法、文書速読支援プログラムおよび記録媒体 |
US6907431B2 (en) * | 2002-05-03 | 2005-06-14 | Hewlett-Packard Development Company, L.P. | Method for determining a logical structure of a document |
JP2003330966A (ja) * | 2002-05-13 | 2003-11-21 | Nippon Telegr & Teleph Corp <Ntt> | 文書分析方法及び装置及び文書分析プログラム及び文書分析プログラムを格納した記憶媒体 |
JP4116329B2 (ja) * | 2002-05-27 | 2008-07-09 | 株式会社日立製作所 | 文書情報表示システム、文書情報表示方法及び文書検索方法 |
JP2004021445A (ja) * | 2002-06-14 | 2004-01-22 | Nri & Ncc Co Ltd | テキストデータ分析システム、テキストデータ分析方法およびコンピュータプログラム |
JP2004220111A (ja) * | 2003-01-09 | 2004-08-05 | Canon Inc | 文書要約装置 |
-
2004
- 2004-03-15 JP JP2004073614A patent/JP4202287B2/ja not_active Expired - Lifetime
-
2005
- 2005-01-20 US US11/039,176 patent/US7903884B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20050203889A1 (en) | 2005-09-15 |
JP2005259088A (ja) | 2005-09-22 |
US7903884B2 (en) | 2011-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rousseau | Journal evaluation: Technical and practical issues | |
KR102158352B1 (ko) | 정책정보 문서의 요지 정보 제공 방법, 정책정보 제공 시스템, 이를 위한 컴퓨터 프로그램 | |
US7451124B2 (en) | Method of analyzing documents | |
Shah et al. | Information extraction from full text scientific articles: where are the keywords? | |
JP5662961B2 (ja) | レビュー処理方法およびシステム | |
JP4066600B2 (ja) | 多言語文書検索システム | |
US7903884B2 (en) | System and computer software program for visibly processing an observed information's relationship with knowledge accumulations | |
Trappey et al. | An R&D knowledge management method for patent document summarization | |
KR20130056207A (ko) | 관계 정보 확장 장치, 관계 정보 확장 방법, 및 프로그램 | |
Weisser et al. | Pseudo-document simulation for comparing LDA, GSDMM and GPM topic models on short and sparse text using Twitter data | |
Wu et al. | Evaluation of negation and uncertainty detection and its impact on precision and recall in search | |
KR101377447B1 (ko) | 태그간 의미 분석을 이용한 다중 문서 요약 방법 및 시스템 | |
CN116308758B (zh) | 一种基于大数据的金融风险分析方法及系统 | |
CN111373386A (zh) | 相似度指标值计算装置、相似检索装置及相似度指标值计算用程序 | |
Alimova et al. | Russia and post-Soviet countries compared: Coverage of papers by Scopus and Web of Science, languages, and productivity of researchers | |
Bartol et al. | Nano language and distribution of article title terms according to power laws | |
Khan et al. | Metadata for Efficient Management of Digital News Articles in Multilingual News Archives | |
WO2022130579A1 (ja) | 類似度判定プログラム、類似度判定装置、及び、類似度判定方法 | |
Kaptein et al. | Word clouds of multiple search results | |
Ikeda et al. | Automatically Linking News Articles to Blog Entries. | |
JP5284761B2 (ja) | 文書検索装置及び方法及びプログラム及びプログラムを記録した記録媒体 | |
Jacsó | The problems with the subject categories schema in the EigenFactor database from the perspective of ranking journals by their prestige and impact | |
Roy et al. | Prioritization, clustering and functional annotation of MicroRNAs using latent semantic indexing of MEDLINE abstracts | |
Nitsche et al. | Development of an end-to-end deep learning pipeline | |
SivaKumar et al. | Indian languages IR using latent semantic indexing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070319 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070626 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070827 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080408 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080609 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081007 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081008 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4202287 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111017 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121017 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131017 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |