JP4204609B2 - ウェブテキスト抽出結果生成システム、端末装置及びプログラム - Google Patents
ウェブテキスト抽出結果生成システム、端末装置及びプログラム Download PDFInfo
- Publication number
- JP4204609B2 JP4204609B2 JP2006229182A JP2006229182A JP4204609B2 JP 4204609 B2 JP4204609 B2 JP 4204609B2 JP 2006229182 A JP2006229182 A JP 2006229182A JP 2006229182 A JP2006229182 A JP 2006229182A JP 4204609 B2 JP4204609 B2 JP 4204609B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- address
- item
- unclassified
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000605 extraction Methods 0.000 title claims description 226
- 230000005540 biological transmission Effects 0.000 claims description 93
- 230000002093 peripheral effect Effects 0.000 claims description 54
- 239000000284 extract Substances 0.000 claims description 36
- 230000004044 response Effects 0.000 claims description 5
- 238000000034 method Methods 0.000 description 89
- 238000010586 diagram Methods 0.000 description 6
- 102100022440 Battenin Human genes 0.000 description 3
- 101000901683 Homo sapiens Battenin Proteins 0.000 description 3
- 101000984929 Homo sapiens Butyrophilin subfamily 1 member A1 Proteins 0.000 description 3
- 101100437920 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) BTN2 gene Proteins 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 235000012046 side dish Nutrition 0.000 description 1
Images
Landscapes
- Instructional Devices (AREA)
- Navigation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
よって、端末装置が上記未分類文字列を抽出結果として、登録用画面である、自分専用のウェブ画面(マイページ登録用の画面)上に表示すれば、上記端末装置の利用者は、表示している未分類文字列を適宜利用してマイページ用の情報の編集を行うことができる。
また、端末装置は、住所項目の内容を意味する住所文字列を複数抽出した場合、所定の優先順位に基づいて、1つの住所文字列を決定し、他の住所文字列を未分類文字列とする。そして、端末装置は、上記住所文字列に対応する地図画像をサーバ装置から取得する。これによれば、端末装置は、複数の住所文字列を抽出した場合に、利用者にとって所望の住所文字列を所定の優先順位に基づいて決定し、当該決定した住所文字列に対応する地図画像をサーバ装置から取得すると共に、他の住所文字列については、未分類文字列として保持するので、端末装置で決定した住所文字列に対応する地図画像を取得することを可能とするだけでなく、利用者に対して他の住所文字列を利用させることも可能とする。
よって、端末装置が上記未分類文字列を抽出結果として、自分専用のウェブ画面(マイページ登録用の画面)上に表示すれば、上記端末装置の利用者は、表示している未分類文字列を適宜利用してマイページ用の情報の編集を行うことができる。
また、端末装置は、住所項目の内容を意味する住所文字列を複数抽出した場合、所定の優先順位に基づいて、1つの住所文字列を決定し、他の住所文字列を未分類文字列とする。そして、端末装置は、上記住所文字列に対応する地図画像をサーバ装置から取得する。これによれば、端末装置は、複数の住所文字列を抽出した場合に、利用者にとって所望の住所文字列を所定の優先順位に基づいて決定し、当該決定した住所文字列に対応する地図画像をサーバ装置から取得すると共に、他の住所文字列については、未分類文字列として保持するので、端末装置で決定した住所文字列に対応する地図画像を取得することを可能とするだけでなく、利用者に対して他の住所文字列を利用させることも可能とする。
図1に、ウェブテキスト抽出結果生成システム1の概略構成を示す。図1に示すウェブテキスト抽出結果生成システム1は、端末装置2とサーバ3とがネットワーク4を介して接続しており、サーバ3は、地図画像等の各種情報を保持するデータベース5を有している。
次に、図2に示す処理システム1の内部構成について説明する。図示のように端末装置2は、送受信手段21、記憶手段22、入力手段23、表示手段24、文字列抽出範囲決定手段25、文字列抽出範囲の文字列取得手段26、文字列抽出手段27、文字列抽出結果記憶手段28、地図情報送信要求手段29、未分類文字列編集要求手段40、ウェブ画面表示手段41、地図情報更新要求手段42、ウェブ画面内容登録要求手段43、ウェブ画面送信要求手段44、地図情報取得手段45、ウェブ画面取得手段46、編集後未分類文字列取得手段47を有し、サーバ3は、送受信手段31、記憶手段32、未分類文字列編集手段33、住所検索手段34、地図画像検索手段35、周辺情報検索手段36、ウェブ画面内容登録手段37、地図情報送信手段38、未分類文字列編集結果送信手段39、ウェブ画面送信手段60を有している。
文字列抽出手段27は、文字列抽出プログラムを利用して、文字列抽出範囲内の文字列を解析し、項目毎に文字列を抽出する。文字列抽出結果記憶手段28は、項目毎に抽出した文字列を記憶手段22に記憶する。
次にウェブテキスト抽出方法について、具体的に述べる。図3は、ウェブテキスト抽出を行うウェブ画面(例えば、お気に入りの店の情報が表示されている画面)の例である。
次に、地図情報取得方法について説明する。
次に、未分類文字列編集結果取得方法について説明する。
次に、抽出結果の表示方法について説明する。端末装置2は、ウェブテキスト抽出処理終了後、ウェブ画面送信要求手段44によって、サーバ3に対してウェブ画面送信要求を行う。
地図情報再検索方法は、利用者が所望する住所文字列を抽出できなかった場合や住所文字列がなかった場合に、利用者が住所文字列を所定の領域(例えば、図4における住所表示領域ED3)に入力し、所定のボタン等(例えば、図4における再検索ボタンBTN1)を押下した後、端末装置2が当該所定の領域内に入力された住所文字列に該当する地図情報をサーバ3から取得する方法である。
次に、ウェブ画面登録方法について説明する。
次に、図5のフローチャートを用いて、「ウェブテキスト抽出処理」及び「ウェブテキスト抽出結果の表示及びデータベース登録」の説明を行う。因みに「ウェブテキスト抽出処理」は、ステップS1からステップS7までの処理であり、「ウェブテキスト抽出結果の表示及びデータベース登録」は、ステップS8からステップS10まで及びステップS16の処理である。
次に図5におけるステップS6の文字列抽出処理について、図6のフローチャートを用いて説明する。
(ルール1)図7の「項目を判断する文字列」について、左側の文字ほど優先度を高くする。
(ルール2)ルール1が同じ場合、行の先頭に近い文字を含む行ほど優先度が高い。
(ルール3)ルール2も同じ場合、ページ内で先の行ほど優先度が高い。
次に図5におけるステップS10の「ウェブ画面と文字列抽出結果等の表示処理」について、図9のフローチャートを用いて説明する。
[未分類文字列表示処理手順]
次に図9におけるステップS12の未分類文字列表示処理について、図10を用いて説明する。
次に図9におけるステップS13の地図情報表示処理について、図11を用いて説明する。
次に図11におけるステップS137の地図画像表示処理について、図12を用いて説明する。
次に図11におけるステップS138の周辺情報表示処理について、図13を用いて説明する。
次に図5におけるステップS16のウェブ画面のデータベース登録処理について、図14を用いて説明する。端末装置2は、データベース登録を意味する登録ボタン(図4における登録ボタンBTN2)が利用者によって押下されたか否か判定する。登録ボタンが押下されたことを検知した場合(ステップS151:Yes)、ウェブ画面内容登録要求手段43は、サーバ3に対して現在表示しているウェブ画面内容を送信すると共に、サーバ3へ登録要求する(ステップS152)。
上記の実施例では、文字列抽出範囲の指定について、利用者自身がマウス等の入力手段23により指定していたが、本発明の適用はこれには限られず、現在表示中のウェブ画面全体を自動的に文字列抽出範囲と決定してもよい。例えば、図15に示すように、利用者が文字列範囲を指定することなく、入力手段23を介して、「メニュー3」を指定した後に表示されるメニューM2から「文字列抽出」を指定した場合に、文字列抽出範囲決定手段25は、現在表示中のウェブ画面内の全テキストを文字列抽出範囲とみなしても良い。この場合、文字列抽出範囲の指定が不要なため、利用者が、簡易に文字列抽出処理の指定を行うことができる。
2 端末装置
3 サーバ
4 ネットワーク
5 データベース
Claims (9)
- ネットワークを介して通信可能に接続された端末装置及びサーバ装置から構成され、ウェブテキスト抽出結果を生成するウェブテキスト抽出結果生成システムであって、
前記端末装置は、
文字抽出対象用ウェブ画面上における文字列の抽出範囲を決定する抽出範囲決定手段と、
前記抽出範囲内の文字列を取得する文字列取得手段と、
前記抽出範囲内の文字列について解析を行い、前記抽出範囲の文字列について、住所項目を含む1又は複数の項目に対応する検索文字列を用いて、項目の内容を意味する文字列を抽出すると共に、前記項目の内容を意味する文字列以外の文字列を未分類文字列として抽出する文字列抽出手段と、
前記文字列抽出手段によって、未分類文字列として抽出された未分類文字列の編集要求を行う未分類文字列編集要求手段と、
編集済みの未分類文字列を取得する未分類文字列編集結果取得手段と、
前記抽出した文字列の内、前記住所項目の内容を意味する住所文字列を前記サーバ装置に送信すると共に、前記住所文字列に該当する地図画像を含む地図情報の送信要求を前記サーバ装置に行う地図情報送信要求手段と、
前記送信要求した地図情報を前記サーバ装置から取得する地図情報取得手段と、を備え、
前記サーバ装置は、
住所情報と位置情報とを関連付けた情報、位置情報と地図画像とを関連付けた情報及び地図画像を記憶するサーバ記憶手段と、
前記地図情報の送信要求に応じて、前記サーバ記憶手段を参照して前記住所文字列に該当する前記位置情報を検索する住所検索手段と、
前記サーバ記憶手段を参照して、前記位置情報に該当する前記地図画像を検索する地図画像検索手段と、
前記検索した地図画像を含む地図情報を前記端末装置へ送信する地図情報送信手段と、
前記端末装置から受信した前記未分類文字列を品詞毎に分解する未分類文字列編集手段と、
前記品詞毎に分解された未分類文字列のうち名詞のみを前記端末装置へ送信する未分類編集結果送信手段と、
を備え、
前記文字列抽出手段は、同一の住所項目で、当該住所項目の内容を意味する住所文字列を複数抽出した場合、所定の優先順位に基づいて、1つの住所文字列を項目の内容を意味する文字列として抽出するとともに、他の住所文字列を未分類文字列として抽出し、
前記地図情報送信要求手段は、前記抽出された1つの住所文字列を前記抽出された他の住所文字列に替えて前記サーバ装置への送信を可能とすることを特徴とするウェブテキスト抽出結果生成システム。 - 前記端末装置は、
複数種類の操作ボタン、情報入力領域、及び地図表示領域が設けられた利用者専用情報の登録用ウェブ画面の送信要求を前記サーバ装置に行うウェブ画面送信要求手段と、
前記送信要求した登録用ウェブ画面を取得するウェブ画面取得手段と、
前記登録用ウェブ画面上に前記抽出した文字列及び前記地図情報を表示するウェブ画面表示手段と、をさらに備え、
前記サーバ装置は、
前記登録用ウェブ画面の送信要求に応じて前記登録用ウェブ画面を前記端末装置へ送信するウェブ画面送信手段をさらに備え、
前記サーバ記憶手段は、前記登録用ウェブ画面を記憶することを特徴とする請求項1に記載のウェブテキスト抽出結果生成システム。 - 前記端末装置は、
前記複数種類の操作ボタンの内、第1の操作ボタンが選択されると、前記登録用ウェブ画面上の住所文字列を前記サーバ装置に送信すると共に、前記登録用ウェブ画面上の住所文字列に該当する地図情報の送信要求を前記サーバ装置に行う地図情報更新要求手段をさらに備え、
前記ウェブ画面表示手段は、前記登録用ウェブ画面上の住所文字列に該当する地図情報表示時に、既に別の地図情報が表示されている場合、前記別の地図情報を削除して、前記登録用ウェブ画面上の住所文字列に該当する地図情報の表示を行うことを特徴とする請求項2に記載のウェブテキスト抽出結果生成システム。 - 前記端末装置は、
前記複数種類の操作ボタンの内、第2の操作ボタンが選択されると、前記登録用ウェブ画面の内容を前記サーバ装置に送信すると共に、前記登録用ウェブ画面における情報入力領域内の文字列の内容の登録要求を行うウェブ画面内容登録要求手段をさらに備え、
前記サーバ装置は、
前記端末装置から受信した前記登録用ウェブ画面における内容を記憶するウェブ画面登録手段をさらに備えることを特徴とする請求項3に記載のウェブテキスト抽出結果生成システム。 - 前記文字列抽出手段は、同一項目で、項目の内容を意味する文字列を複数抽出した場合、所定の優先順位に基づいて、1つの文字列を項目の内容を意味する文字列として抽出し、他の文字列を未分類文字列として抽出することを特徴とする請求項1乃至4のいずれか一項に記載のウェブテキスト抽出結果生成システム。
- 前記文字列抽出手段は、前記抽出範囲の文字列から、都道府県を含む文字列を抽出した際に、別途、住所項目用の検索文字列を用いて住所項目の内容を意味する文字列を抽出していた場合には、前記都道府県を含む文字列を未分類文字列として抽出し、住所項目用の検索文字列を用いて住所項目の内容を意味する文字列を抽出していなかった場合には、前記都道府県を含む文字列を住所項目の内容を意味する文字列として抽出することを特徴とする請求項1乃至5のいずれか一項に記載のウェブテキスト抽出結果生成システム。
- 前記サーバ装置は、
前記位置情報に該当する周辺情報を取得する周辺情報検索手段をさらに備え、
前記地図情報は、前記周辺情報を含み、
前記サーバ記憶手段は、前記位置情報と周辺情報とを関連付けた情報を記憶することを特徴とする請求項1乃至6のいずれか一項に記載のウェブテキスト抽出結果生成システム。 - ネットワークを介してサーバと通信可能に接続され、ウェブテキスト抽出結果を生成する端末装置であって、
文字抽出対象用ウェブ画面上における文字列の抽出範囲を決定する抽出範囲決定手段と、
前記抽出範囲内の文字列を取得する文字列取得手段と、
前記抽出範囲内の文字列について解析を行い、前記抽出範囲の文字列について、住所項目を含む1又は複数の項目に対応する検索文字列を用いて、項目の内容を意味する文字列を抽出すると共に、前記項目の内容を意味する文字列以外の文字列を未分類文字列として抽出する文字列抽出手段と、
前記文字列抽出手段によって、未分類文字列として抽出された未分類文字列の編集要求を行う未分類文字列編集要求手段と、
編集済みの未分類文字列を取得する未分類文字列編集結果取得手段と、
前記抽出した文字列の内、前記住所項目の内容を意味する住所文字列を前記サーバ装置に送信すると共に、前記住所文字列に該当する地図画像を含む地図情報の送信要求を前記サーバ装置に行う地図情報送信要求手段と、
前記送信要求した地図情報を前記サーバ装置から取得する地図情報取得手段と、
を備え、
前記文字列抽出手段は、同一の住所項目で、当該住所項目の内容を意味する住所文字列を複数抽出した場合、所定の優先順位に基づいて、1つの住所文字列を項目の内容を意味する文字列として抽出するとともに、他の住所文字列を未分類文字列として抽出し、
前記地図情報送信要求手段は、前記抽出された1つの住所文字列を前記抽出された他の住所文字列に替えて前記サーバ装置への送信を可能とすることを特徴とする端末装置。 - ネットワークを介してサーバと通信可能に接続され、ウェブテキスト抽出結果を生成するコンピュータによって実行されるプログラムであって、
文字抽出対象用ウェブ画面上における文字列の抽出範囲を決定する抽出範囲決定手段と、
前記抽出範囲内の文字列を取得する文字列取得手段と、
前記抽出範囲内の文字列について解析を行い、前記抽出範囲の文字列について、住所項目を含む1又は複数の項目に対応する検索文字列を用いて、項目の内容を意味する文字列を抽出すると共に、前記項目の内容を意味する文字列以外の文字列を未分類文字列として抽出する文字列抽出手段と、
前記文字列抽出手段によって、未分類文字列として抽出された未分類文字列の編集要求を行う未分類文字列編集要求手段と、
編集済みの未分類文字列を取得する未分類文字列編集結果取得手段と、
前記抽出した文字列の内、前記住所項目の内容を意味する住所文字列を前記サーバ装置に送信すると共に、前記住所文字列に該当する地図画像を含む地図情報の送信要求を前記サーバ装置に行う地図情報送信要求手段と、
前記送信要求した地図情報を前記サーバ装置から取得する地図情報取得手段、として前記コンピュータを機能させ、
前記文字列抽出手段は、同一の住所項目で、当該住所項目の内容を意味する住所文字列を複数抽出した場合、所定の優先順位に基づいて、1つの住所文字列を項目の内容を意味する文字列として抽出するとともに、他の住所文字列を未分類文字列として抽出し、
前記地図情報送信要求手段は、前記抽出された1つの住所文字列を前記抽出された他の住所文字列に替えて前記サーバ装置への送信を可能とすることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006229182A JP4204609B2 (ja) | 2006-08-25 | 2006-08-25 | ウェブテキスト抽出結果生成システム、端末装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006229182A JP4204609B2 (ja) | 2006-08-25 | 2006-08-25 | ウェブテキスト抽出結果生成システム、端末装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008052554A JP2008052554A (ja) | 2008-03-06 |
JP4204609B2 true JP4204609B2 (ja) | 2009-01-07 |
Family
ID=39236543
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006229182A Expired - Fee Related JP4204609B2 (ja) | 2006-08-25 | 2006-08-25 | ウェブテキスト抽出結果生成システム、端末装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4204609B2 (ja) |
-
2006
- 2006-08-25 JP JP2006229182A patent/JP4204609B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008052554A (ja) | 2008-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2006318373A (ja) | タスク選択支援サーバ、及び、タスク選択支援方法 | |
JP6464604B2 (ja) | 検索支援プログラム、検索支援方法および検索支援装置 | |
JP4661159B2 (ja) | 情報提供システム,メタデータ収集解析サーバ,およびコンピュータプログラム | |
JP2003006225A (ja) | 情報提供方法及びそれに用いる情報提供装置並びに端末 | |
JPH096798A (ja) | 情報処理システムおよび情報処理方法 | |
JP5231514B2 (ja) | 行動支援情報提供装置、方法、及びプログラム | |
JP2006268690A (ja) | Faq提示・改善方法、faq提示・改善装置およびfaq提示・改善プログラム | |
JP4204610B2 (ja) | メモページ情報登録システム、サーバ装置及びプログラム | |
JP2001331486A (ja) | 通信上のウェブサイト統合検索方法及びその方法を行うようにプログラム化されたソフトウェアを格納した記録媒体 | |
JP2010181966A (ja) | レコメンド情報評価装置およびレコメンド情報評価方法 | |
JP2010225036A (ja) | 情報検索装置、及び情報検索プログラム | |
JP4204608B2 (ja) | ウェブテキスト抽出装置、方法及びプログラム | |
CN105988992B (zh) | 图标推送方法及装置 | |
JP4204609B2 (ja) | ウェブテキスト抽出結果生成システム、端末装置及びプログラム | |
WO2022184013A1 (zh) | 一种文档的编辑方法、装置、设备及存储介质 | |
JP2004246422A (ja) | 情報検索支援装置 | |
JP4215791B2 (ja) | メモページ情報表示システム、サーバ装置及びプログラム | |
JP2013122627A (ja) | 情報処理端末、サーバ装置、システム、およびプログラム | |
JP4195260B2 (ja) | Faq検索システム、方法及びプログラム | |
JP4722819B2 (ja) | 情報公開システムおよび情報公開方法 | |
JP5581807B2 (ja) | 情報処理システム及びそれに用いられるサーバ | |
JP5609640B2 (ja) | 検索システム、それに用いる装置、検索方法および検索用プログラム | |
JP2005056338A (ja) | 情報収集検索装置 | |
JP2022012911A (ja) | 処理装置及び情報処理方法 | |
JPWO2016117012A1 (ja) | 情報処理装置、情報処理方法および情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20080116 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20080214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080415 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080603 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080718 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20080807 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081007 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081014 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111024 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111024 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121024 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121024 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131024 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |