JP4621514B2 - テキスト群特定方法、プログラム、電子ファイル管理システム - Google Patents
テキスト群特定方法、プログラム、電子ファイル管理システム Download PDFInfo
- Publication number
- JP4621514B2 JP4621514B2 JP2005058483A JP2005058483A JP4621514B2 JP 4621514 B2 JP4621514 B2 JP 4621514B2 JP 2005058483 A JP2005058483 A JP 2005058483A JP 2005058483 A JP2005058483 A JP 2005058483A JP 4621514 B2 JP4621514 B2 JP 4621514B2
- Authority
- JP
- Japan
- Prior art keywords
- text group
- text
- character string
- old
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、マッチングの方法としてDPマッチングを採用することにより、計算量を少なくすることが出来るといった利点がある。なお、「DPマッチング」とは、動的計画法によるパターンマッチングを意味し、二つのパターンの要素間の対応付けを行いながら類似度を計算する方法を指すものである。
TF=テキスト群T1に含まれる「データ」の単語数/テキスト群T1に含まれる全ての単語数 ×
IDF=LOG(電子ファイルEFに含まれるテキスト群Tの総数/「データ」の単語を含むテキスト群Tの数)の計算式で求めることができる。
TF=文字列S1に含まれる「データ」の単語数/文字列S1に含まれる全ての単語数 ×
IDF=LOG(テキスト群T1に含まれる文字列Sの総数/「データ」の単語を含む文字列Sの数)で求めることができる。
60 データ処理部 70 更新手段
80 書き込み詳細情報 81 書き込み情報
82 位置情報 90 テキスト群特定情報
95 文字特定情報 100 クライアントPC
120 書き込み手段 130 送信手段
P 書き込み情報反映プログラム
DB1 電子ファイルデータベース DB2 書き込み情報データベース
T テキスト群 To 旧テキスト群
Tn 新テキスト群 Tv テキスト群特徴量
Sv 文字列特徴量 S 文字列
So 旧文字列 Sn 新文字列
Claims (5)
- 1以上のテキスト群を含む電子ファイルに書き込みを行うための情報端末と、当該情報端末に接続され、前記電子ファイルを記憶するサーバと、から構成されるネットワークシステムにおいて、更新前のテキスト文書に含まれるテキスト群である1以上の旧テキスト群に対して、当該テキスト文書が更新された更新後テキスト文書に含まれるテキスト群である1以上の新テキスト群を、それぞれ対応付けるテキスト群特定方法であって、
前記旧テキスト群および新テキスト群全てについて、それらの特徴量であるテキスト群特徴量を算出するテキスト群特徴量算出ステップと、
前記テキスト群特徴量を用いてマッチングを行い、前記各旧テキスト群と、前記各新テキスト群との対応付けを行うテキスト群マッチングステップと、
前記各旧テキスト群のテキスト群特徴量と、前記テキスト群マッチングステップによって当該各旧テキスト群に対応付けられた前記各新テキスト群のテキスト群特徴量との差異が、所定の閾値未満であるかを判定するテキスト群判定ステップと、
前記テキスト群判定ステップによって、前記両テキスト群特徴量の差異が前記所定の閾値未満であると判定された旧テキスト群と新テキスト群の組み合わせを、対応するテキスト群として特定するテキスト群特定ステップと、
を備え、
前記テキスト群マッチングステップによって、
新旧いずれか一方の1のテキスト群に対して、他方のn(nは2以上の整数)個のテキスト群が対応付けられた場合、
前記テキスト群判定ステップは、
前記1のテキスト群に対するn個の組み合わせについて、前記テキスト群特徴量の差異
が所定の閾値未満であるかを判定し、
前記テキスト群特定ステップは、
前記テキスト群特徴量の差異が所定の閾値未満であると判定された組み合わせが1つの
場合、当該組み合わせを対応するテキスト群として特定し、
前記テキスト群特徴量の差異が所定の閾値未満であると判定された組み合わせが複数の
場合、前記テキスト群特徴量の差異が最小となる組み合わせを対応するテキスト群として
特定することを特徴とするテキスト群特定方法。
- 前記テキスト群は、1以上の句読点および/または改行位置で区切られる文字列から構
成されており、
前記旧テキスト群に含まれる文字列である1以上の旧文字列と、当該旧テキスト群に対
応する新テキスト群に含まれる文字列である1以上の新文字列と、において、
前記各旧文字列および前記各新文字列の全てについて、それらの特徴量である文字列特
徴量を算出する文字列特徴量算出ステップと、
前記文字列特徴量を用いてマッチングを行い、前記各旧文字列と前記各新文字列との対応付けを行う文字列マッチングステップと、
前記各旧文字列の文字列特徴量と、前記文字列マッチングステップによって当該各旧文字列に対応付けられた前記各新文字列の文字列特徴量との差異が、所定の閾値未満であるかを判定する文字列判定ステップと、
前記文字列判定ステップによって、前記両文字列特徴量の差異が前記所定の閾値未満であると判定された旧文字列と新文字列の組み合わせを、対応する文字列として特定する文字列特定ステップと、
を備え、
前記文字列マッチングステップによって、
新旧いずれか一方の1の文字列に対して、他方のn(nは2以上の整数)個の文字列が対応付けられた場合、
前記文字列判定ステップは、
前記1の文字列に対するn個の組み合わせについて、前記文字列特徴量の差異が所定の
閾値未満であるかを判定し、
前記文字列特定ステップは、
前記文字列特徴量の差異が所定の閾値未満であると判定された組み合わせが1つの場合、当該組み合わせを対応する文字列として特定し、
前記文字列特徴量の差異が所定の閾値未満であると判定された組み合わせが複数の場合、前記文字列特徴量の差異が最小となる組み合わせを対応する文字列として特定することを特徴とする請求項1に記載のテキスト群特定方法。
- 前記テキスト群特徴量および前記文字列特徴量は、前記テキスト群および前記文字列を形態素解析して得られた各単語のTFIDF値を要素とする多次元ベクトルで表されることを特徴とする請求項1ないし2のいずれか1項に記載のテキスト群特定方法。
- コンピュータに、請求項1ないし2のいずれか1項に記載のテキスト群特定方法における各ステップを実行させるためのプログラム。
- 1以上のテキスト群を含む電子ファイルに書き込みを行うための情報端末と、当該情報端末に接続され、前記電子ファイルを記憶するサーバと、から構成される電子ファイル管理システムであって、電子ファイルを更新する以前のテキスト文書に含まれるテキスト群である1以上の旧テキスト群および、当該テキスト文書が更新された更新後テキスト文書に含まれるテキスト群である1以上の新テキスト群全てについて、それらの特徴量であるテキスト群特徴量を算出するテキスト群特徴量算出手段と、
前記テキスト群特徴量を用いてマッチングを行い、前記各旧テキスト群と、前記各新テキスト群との対応付けを行うテキスト群マッチング手段と、
前記各旧テキスト群のテキスト群特徴量と、前記テキスト群マッチングステップによって当該各旧テキスト群に対応付けられた前記各新テキスト群のテキスト群特徴量との差異が、所定の閾値未満であるかを判定するテキスト群判定手段と、
前記テキスト群判定手段によって、前記両テキスト群特徴量の差異が前記所定の閾値未満であると判定された旧テキスト群と新テキスト群の組み合わせを、対応するテキスト群として特定するテキスト群特定手段と、
を備え、
前記テキスト群マッチング手段によって、新旧いずれか一方の1のテキスト群に対して、他方のn(nは2以上の整数)個のテキスト群が対応付けられた場合、
前記テキスト群判定手段は、
前記1のテキスト群に対するn個の組み合わせについて、前記テキスト群特徴量の差異
が所定の閾値未満であるかを判定し、
前記テキスト群特定手段は、
前記テキスト群特徴量の差異が所定の閾値未満であると判定された組み合わせが1つの
場合、当該組み合わせを対応するテキスト群として特定し、
前記テキスト群特徴量の差異が所定の閾値未満であると判定された組み合わせが複数の
場合、前記テキスト群特徴量の差異が最小となる組み合わせを対応するテキスト群として
特定することを特徴とする電子ファイル管理システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005058483A JP4621514B2 (ja) | 2005-03-03 | 2005-03-03 | テキスト群特定方法、プログラム、電子ファイル管理システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005058483A JP4621514B2 (ja) | 2005-03-03 | 2005-03-03 | テキスト群特定方法、プログラム、電子ファイル管理システム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006244105A JP2006244105A (ja) | 2006-09-14 |
JP2006244105A5 JP2006244105A5 (ja) | 2008-02-14 |
JP4621514B2 true JP4621514B2 (ja) | 2011-01-26 |
Family
ID=37050462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005058483A Expired - Fee Related JP4621514B2 (ja) | 2005-03-03 | 2005-03-03 | テキスト群特定方法、プログラム、電子ファイル管理システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4621514B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5209340B2 (ja) * | 2008-02-22 | 2013-06-12 | 株式会社東芝 | レポート作成システム及びレポート作成装置 |
WO2021124525A1 (ja) | 2019-12-19 | 2021-06-24 | 日本電信電話株式会社 | 名称データ対応付け装置、名称データ対応付け方法及びプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003280903A (ja) * | 2002-03-26 | 2003-10-03 | Hitachi Software Eng Co Ltd | ソースプログラム比較情報生成システム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3477812B2 (ja) * | 1994-04-21 | 2003-12-10 | 富士ゼロックス株式会社 | 文書処理装置および方法 |
-
2005
- 2005-03-03 JP JP2005058483A patent/JP4621514B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003280903A (ja) * | 2002-03-26 | 2003-10-03 | Hitachi Software Eng Co Ltd | ソースプログラム比較情報生成システム |
Also Published As
Publication number | Publication date |
---|---|
JP2006244105A (ja) | 2006-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7552400B1 (en) | System and method for navigating within a graphical user interface without using a pointing device | |
US6389435B1 (en) | Method and system for copying a freeform digital ink mark on an object to a related object | |
US8200676B2 (en) | User interface for geographic search | |
US8510646B1 (en) | Method and system for contextually placed chat-like annotations | |
CN100429646C (zh) | 包括手写数据的电子文档的显示装置及方法 | |
US20080109762A1 (en) | Visual document user interface system | |
US20090249178A1 (en) | Document linking | |
US20070298399A1 (en) | Process and system for producing electronic book allowing note and corrigendum sharing as well as differential update | |
US20080021891A1 (en) | Searching a document using relevance feedback | |
JPH1196166A (ja) | 文書情報管理システム | |
US20180165253A1 (en) | Information architecture for the interactive environment | |
US20030074416A1 (en) | Method of establishing a navigation mark for a web page | |
EP1881417A1 (en) | Process and system for producing an electronic book | |
US7519579B2 (en) | Method and system for updating a summary page of a document | |
JP2006004298A (ja) | 文書処理装置、文書処理方法及び文書処理プログラム | |
US8943431B2 (en) | Text operations in a bitmap-based document | |
JP3356519B2 (ja) | 文書情報検索装置 | |
JP4683963B2 (ja) | 電子ファイル書き込みシステム、プログラム、電子ファイルへの書き込み情報反映方法 | |
JP4621514B2 (ja) | テキスト群特定方法、プログラム、電子ファイル管理システム | |
US7788283B2 (en) | On demand data proxy | |
JPH07129605A (ja) | 文書検索装置 | |
JP2016170676A (ja) | 電子ホワイトボードシステム、電子ホワイトボード検索結果表示方法およびそのプログラム | |
US11995129B2 (en) | System and method for annotating website content | |
KR20120134054A (ko) | 사용자 주석 처리 장치 및 그를 위한 전자책 서비스 시스템 및 방법 | |
US11430166B1 (en) | Facilitating generation of number-bullet objects |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20070404 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071221 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100407 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100420 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100617 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101019 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101101 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131105 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4621514 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |