JP6575091B2 - 旅程推定装置及びプログラム - Google Patents

旅程推定装置及びプログラム Download PDF

Info

Publication number
JP6575091B2
JP6575091B2 JP2015058239A JP2015058239A JP6575091B2 JP 6575091 B2 JP6575091 B2 JP 6575091B2 JP 2015058239 A JP2015058239 A JP 2015058239A JP 2015058239 A JP2015058239 A JP 2015058239A JP 6575091 B2 JP6575091 B2 JP 6575091B2
Authority
JP
Japan
Prior art keywords
expenditure data
information
expenditure
itinerary
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015058239A
Other languages
English (en)
Other versions
JP2016177629A (ja
Inventor
洋 劉
洋 劉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2015058239A priority Critical patent/JP6575091B2/ja
Priority to US14/820,788 priority patent/US9811725B2/en
Priority to AU2015218443A priority patent/AU2015218443B2/en
Priority to CN201510570370.3A priority patent/CN105989461A/zh
Publication of JP2016177629A publication Critical patent/JP2016177629A/ja
Application granted granted Critical
Publication of JP6575091B2 publication Critical patent/JP6575091B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/109Time management, e.g. calendars, reminders, meetings or time accounting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は、旅程推定装置及びプログラムに関する。
特許文献1には、ワークフローでの申請に必要となる添付書類の添付の人為的なミスを抑制するための技術が開示されている。特許文献1に記載の技術では、ワークフローシステムで新規の申請を行う際に、当該申請に含まれる詳細データに添付すべき電子画像データの指定を受け付け、詳細データに添付すべき電子画像データが不足している場合には、当該申請データに添付する電子画像データを作成するためのスキャンチケットデータを作成する。スキャンチケットデータには、いずれの詳細データに作成された電子画像データを添付するかの指定がされており、サーバ装置はその情報に従って、作成された電子画像データを詳細データに添付する。
特開2012−89033号公報
本発明の目的は、独立して発行された複数の情報に基づいて人間がとった行動を推定するための情報群を取り出すことである。
本発明の請求項1に係る旅程推定装置は、旅程の起点又は終点となり得る場所を登録する登録部と、支出に関する情報を含む複数の支出データの各々から抽出された日付情報の時系列の順番に従って、前記複数の支出データを、1以上の支出データを含む支出データ群に分類する分類部と、分類された前記支出データ群に含まれる各支出データから抽出された日付情報を含む情報に基づいて、少なくとも日付を含む旅程を推定する推定部とを備え、前記分類部は、登録された前記場所を示す登録場所情報が抽出された支出データによって前記支出データ群同士を区分する分類をし、前記推定部は、一の前記支出データ群に含まれる各支出データから抽出された日付情報及び場所情報を含む情報に基づいて、1単位の旅程を推定する。
本発明の請求項2に係る旅程推定装置は、請求項1に係る構成において、前記分類部は、前記登録場所情報が抽出された支出データの中で、前記時系列の順番が奇数番目である支出データを前記起点、偶数番目である支出データを前記終点に対応させて、前記支出データ群同士を区分する分類をすることを特徴とする。
本発明の請求項3に係る旅程推定装置は、請求項1又は2に係る構成において、前記分類部は、抽出された日付情報が連続の関係にある2以上の支出データに含まれる、前記登録場所情報が抽出された支出データの中で、前記時系列の順番が先頭である支出データを前記起点、最後である支出データを前記終点に対応させて、前記支出データ群同士を区分することを特徴とする。
本発明の請求項4に係る旅程推定装置は、請求項1から請求項3のいずれか1項に係る構成において、前記分類部は、抽出された日付情報が連続の関係にある2つの支出データの各々から、前記登録場所情報が抽出された場合、前記時系列の順番が先である支出データを或る1単位の旅程の終点、後である支出データを別の1単位の旅程の終点に対応させて、前記支出データ群同士を区分することを特徴とする。
本発明の請求項5に係る旅程推定装置は、請求項項に係る構成において、前記分類部は、抽出された日付情報が連続の関係にある2以上の支出データを、同じ前記支出データ群に分類し、前記推定部は、一の前記支出データ群に含まれる各支出データから抽出された日付情報を含む情報に基づいて、1単位の旅程を推定することを特徴とする。
本発明の請求項6に係る旅程推定装置は、支出に関する情報を含む複数の支出データの各々から抽出された日付情報の時系列の順番に従って、前記複数の支出データを、1以上の支出データを含む支出データ群に分類する分類部と、分類された前記支出データ群に含まれる各支出データから抽出された日付情報を含む情報に基づいて、少なくとも日付を含む旅程を推定する推定部とを備え、前記分類部は、抽出された日付情報が連続の関係にある2以上の支出データを、同じ前記支出データ群に分類し、一の支出データと、前記時系列の順番が次である他の支出データとで、抽出された日付情報が連続の関係にない場合でも、各々から抽出された日付情報を宿泊の期間に含むことを示す支出データが存在したときは、当該一の支出データ、及び当該他の支出データを、同じ前記支出データ群に分類することを特徴とする。
本発明の請求項7に係る旅程推定装置は、請求項5又は6に係る構成において、旅程の起点又は終点となり得る場所を登録する登録部を備え、前記分類部は、一の支出データと、前記時系列の順番が次である他の支出データとで、抽出された日付情報が連続の関係にない場合でも、当該一の支出データ、及び当該他の支出データから抽出された場所情報が示す場所が共通し、且つ登録された前記場所からの遠隔地を示すときは、当該一の支出データ、及び当該他の支出データを、同じ前記支出データ群に分類することを特徴とする。
本発明の請求項8に係る旅程推定装置は、請求項1から請求項7のいずれか1項に係る構成において、前記推定部は、一の前記支出データ群に含まれる各支出データから抽出された複数の場所情報の地理的な関係から推定される移動の経路に基づいて、1単位の旅程を推定することを特徴とする。
本発明の請求項9に係る旅程推定装置は、支出に関する情報を含む複数の支出データの各々から抽出された日付情報の時系列の順番に従って、前記複数の支出データを、1以上の支出データを含む支出データ群に分類する分類部と、分類された前記支出データ群に含まれる各支出データから抽出された日付情報を含む情報に基づいて、少なくとも日付を含む旅程を推定する推定部とを備え、前記推定部は、一の支出データから抽出されなかった場所情報を、同じ前記支出データ群に分類された他の支出データから抽出された場所情報に基づいて補完することを特徴とする旅程推定装置。
本発明の請求項10に係る旅程推定装置は、支出に関する情報を含む複数の支出データの各々から抽出された日付情報の時系列の順番に従って、前記複数の支出データを、1以上の支出データを含む支出データ群に分類する分類部と、分類された前記支出データ群に含まれる各支出データから抽出された日付情報を含む情報に基づいて、少なくとも日付を含む旅程を推定する推定部とを備え、前記推定部は、一の支出データから抽出されなかった日付情報を、抽出された場所情報が示す場所が共通する他の支出データから抽出された日付情報に基づいて補完することを特徴とする。
本発明の請求項11に係る旅程推定装置は、支出に関する情報を含む複数の支出データの各々から抽出された日付情報の時系列の順番に従って、前記複数の支出データを、1以上の支出データを含む支出データ群に分類する分類部と、分類された前記支出データ群に含まれる各支出データから抽出された日付情報を含む情報に基づいて、少なくとも日付を含む旅程を推定する推定部とを備え、前記推定部は、画像に含まれる文字を認識して一の支出データから抽出された場所情報を、同じ前記支出データ群に含まれる他の支出データから抽出された場所情報に基づいて訂正することを特徴とする。
本発明の請求項12に係る旅程推定装置は、支出に関する情報を含む複数の支出データの各々から抽出された日付情報の時系列の順番に従って、前記複数の支出データを、1以上の支出データを含む支出データ群に分類する分類部と、分類された前記支出データ群に含まれる各支出データから抽出された日付情報を含む情報に基づいて、少なくとも日付を含む旅程を推定する推定部とを備え、前記推定部は、画像に含まれる文字を認識して一の支出データから抽出された日付情報を、抽出された場所情報が示す場所が共通する他の支出データから抽出された日付情報に基づいて訂正することを特徴とする。
本発明の請求項13に係る旅程推定装置は、請求項1から請求項12のいずれか1項に係る構成において、前記推定部は、前記複数の支出データから、旅程の推定に使用しない支出データを除外することを特徴とする。
本発明の請求項14に係る旅程推定装置は、請求項13に係る構成において、前記推定部は、一の前記支出データ群に含まれる各支出データから抽出された複数の場所情報の地理的な関係に基づいて、一部の場所情報が抽出された支出データを除外することを特徴とする。
本発明の請求項15に係る旅程推定装置は、請求項13又は請求項14に係る構成において、前記推定部は、前記支出データに含まれる前記支出の項目に基づいて、前記使用しない支出データを除外することを特徴とする。
本発明の請求項16に係る旅程推定装置は、請求項1から請求項15のいずれか1項に係る構成において、一の支出データから抽出されなかった情報が存在する場合、当該情報を問い合わせる問い合わせ部と、前記問い合わせに対する回答を受け付ける回答受付部と
を備え、前記推定部は、受け付けられた前記回答に基づいて、前記抽出されなかった情報を補完することを特徴とする。
本発明の請求項17に係る旅程推定装置は、請求項1から請求項16のいずれか1項に係る構成において、一の前記支出データ群に基づいて複数通りの旅程が推定された場合、当該複数通りの旅程を提示する提示部と、提示された前記複数通りの旅程の中からいずれかの旅程の選択を受け付ける選択受付部と受け付けられた前記選択に基づいて旅程の情報を出力する処理を行う出力処理部とを備えることを特徴とする
本発明の請求項18に係るプログラムは、コンピュータに、旅程の起点又は終点となり得る場所を登録するステップと、支出に関する情報を含む複数の支出データの各々から抽出された日付情報の時系列の順番に従って、前記複数の支出データを、1以上の支出データを含む支出データ群に分類するステップと、分類した前記支出データ群に含まれる各支出データから抽出された日付情報を含む情報に基づいて、少なくとも日付を含む旅程を推定するステップとを実行させるためのプログラムであって、前記分類するステップは、登録された前記場所を示す登録場所情報が抽出された支出データによって前記支出データ群同士を区分する分類をし、前記推定するステップは、一の前記支出データ群に含まれる各支出データから抽出された日付情報及び場所情報を含む情報に基づいて、1単位の旅程を推定することを特徴とする。
請求項1,19に係る発明によれば、複数の支出に関する支出データの各々から抽出された日付情報の時系列の順番に基づいて旅程を推定するための支出データ群に分類し、当該旅程を推定することができる。
請求項2に係る発明によれば、登録された旅程の起点又は終点となり得る場所を示す登録場所情報が抽出された支出データを手がかりとして、1単位の旅程の起点又は終点を推定することができる。
請求項3に係る発明によれば、登録場所情報が示す場所が、時系列の順番で交互に旅程の起点及び終点となる可能性が高いとの推定に基づいて、複数の支出データを支出データ群に分類することができる。
請求項4に係る発明によれば、日付情報が連続の関係にある2以上の支出データが存在した場合に、これらが1単位の旅程に係る支出データの可能性が高いとの推定に基づいて、複数の支出データを支出データ群に分類することができる。
請求項5に係る発明によれば、日付情報が連続の関係にある2つの支出データの各々から登録場所情報が抽出された場合に、これらが互いに異なる1単位の旅程に係る支出データである可能性が高いとの推定に基づいて、複数の支出データを支出データ群に分類することができる。
請求項6に係る発明によれば、日付情報が連続の関係にある2以上の支出データに基づいて、1単位の旅程を推定することができる。
請求項7に係る発明によれば、2以上の支出データにおいて日付情報が連続の関係にない場合でも、宿泊に関する支出データに基づいて、1単位の旅程を推定することができる。
請求項8に係る発明によれば、2以上の支出データにおいて日付情報が連続の関係にない場合でも、場所情報が示す場所の、登録された旅程の起点又は終点となり得る場所からの遠隔度合いに基づいて、1単位の旅程を推定することができる。
請求項9に係る発明によれば、複数の場所情報の地理的な関係から推定される移動の経路に基づいて、旅程を推定することができる。
請求項10に係る発明によれば、一の支出データから場所情報が抽出されなかった場合でも、同じ支出データ群に分類された他の支出データから抽出された場所情報に基づいて補完することができる。
請求項11に係る発明によれば、一の支出データから日付情報が抽出されなかった場合でも、他の支出データから抽出された日付情報で補完することができる。
請求項12に係る発明によれば、文字を認識する処理を原因として、一の支出データから正しく場所情報が抽出されなかった場合でも、同じ支出データ群に分類された他の支出データから抽出された場所情報に基づいて訂正することができる。
請求項13に係る発明によれば、文字を認識する処理を原因として、一の支出データから正しく日付情報が抽出されなかった場合でも、他の支出データから抽出された日付情報に基づいて訂正することができる。
請求項14に係る発明によれば、旅程の推定に使用しない支出データを除外することができる。
請求項15に係る発明によれば、複数の場所情報の地理的な関係に基づいて旅程に関係しない支出データを除外することができる。
請求項16に係る発明によれば、支出の項目に基づいて旅程に使用しない支出データを除外することができる。
請求項17に係る発明によれば、支出データから抽出されなかった情報が存在する場合でも、真の情報によって補完しやすくすることができる。
請求項18に係る発明によれば、旅程を複数通り推定した場合でも、真の旅程に応じた情報を出力しやすくすることができる。
請求項20に係る発明によれば、独立して発行された複数の情報に基づいて人間がとった行動を推定するための情報群を取り出すことができる。
本発明で扱われる文書の一例の説明図。 本発明の第1実施形態に係る旅程推定装置の機能構成を示すブロック図。 同実施形態に係る旅程推定装置のハードウェア構成を示すブロック図。 同実施形態に係る旅程推定装置が行う旅程の推定のための処理を示すフローチャート。 同実施形態に係る旅程推定装置が行う図4に続く処理を示すフローチャート。 同実施形態に係る支出データの説明図。 同実施形態に係る支出データの分類の説明図。 同実施形態に係る修正処理後の支出データの説明図。 同実施形態に係る出力処理部から出力される旅程の説明図。 本発明の第2実施形態に係る旅程推定装置が行う旅程の推定のための処理を示すフローチャート。 同実施形態に係る支出データの説明図。 同実施形態に係る支出データの分類の説明図。 同実施形態に係る修正処理後の支出データの説明図。 同実施形態に係る出力処理部から出力される旅程の説明図。 本発明の変形例1に係る旅程推定装置の機能構成を示すブロック図。 同変形例に係る旅程推定装置が行う問い合わせの説明図。 本発明の変形例2に係る旅程推定装置が行う補完処理の説明図。 本発明の変形例5に係る旅程推定装置の機能構成を示すブロック図。
人間がとった行動は、時間的又は/及び空間的に連続性のある複数の情報の集合によって跡を追うことができる。このため、人間の行動に伴って発行された複数の時点の情報が得られた場合、これらの情報の時間的又は/及び空間的な連続性を分析することによって、当該人間の行動を推定することが可能となる。このような発明者の知見の下、本発明は、独立して発行された複数の情報の各々から抽出された日付情報の連続性、又は抽出された複数の時点の場所情報の連続性に基づいて、発行された上記複数の情報を、人間(例えば一人の人間)がとった行動を推定するための1以上の情報を含む情報群に分類し、当該行動を推定することを主旨とする。当該行動として、或るまとまりのある人間の行動、より詳細にはひと続きの人間の行動がある。
以下、本発明の一態様として、商取引、特に金銭等の支出に伴って発行された文書に基づいて、旅行や出張、移住(引越し)等の目的で行われた旅の日程である、旅程を推定する発明を説明する。当該文書の代表例として、金銭を受け取ったことを証明するために、当該金銭の受取人によって発行される、領収証(レシートを含む。)がある。
支出に関する文書には、例えば、日付、場所、費目及び金額の情報が記載されている。文書に記載された日付は、例えば、商取引が行われた日(文書の発行日)、又は商品若しくはサービス(役務)が提供された日を示す。文書に記載された場所は、例えば、商取引が行われた場所、又は商品若しくはサービスが提供された場所を示す。費目は、支出の項目を示す。金額は、支出された金額を示す。支出に関する文書には、これらの全ての情報が記載されている場合もあれば、一部の情報のみが記載されている場合もある。
図1は、本発明で扱われる文書の一例を説明する図である。
図1(A)には、レシートを示す文書D1が示されている。文書D1は、「ハンバーガーショップ○○」によって発行されたレシートを示す。文書D1には、日付として「2015年2月15日」、時刻として「13時44分」、場所として「東京都中央区銀座・・・」、費目として「ハンバーガー」及び「ドリンク」、並びに金額として「¥400」と記載されている。
なお、場所を特定する情報は住所に限られず、文書D1に記載された店舗の名称の一部である「銀座店」や、電話番号である「03−1111−XXXX」に含まれる市外局番である「03」も、場所を特定する情報に該当する。
図1(B)には、領収証を示す文書D2が示されている。文書D2は、文書D1のような電子的処理ではなく、手書きによって発行された文書である。文書D2には、日付として「2015年2月16日」、場所として「大阪府大阪市・・・」、費目として「パソコンソフト」、及び金額として「¥25600」と記載されている。このように、手書きによって発行された文書にも、前述した支出に関する情報が記載されている。
図1(C)には、宿泊施設の領収証を示す文書D3が示されている。文書D3には、日付として「15/2/21」、場所として「福岡市博多区・・・」及び「博多店」、費目として「宿泊料」、並びに金額として「6200」と記載されている。文書D3には、更に、宿泊した期間を特定する日付として、到着日(チェックイン日)として「15.2.17」、出発日(チェックアウト日)として「15.2.21」と記載されている。即ち文書D3には、2015年2月17日から2月21日までが宿泊期間であることを示す情報が記載されている。
支出に関する文書は、金銭を受け取ったことを証明するための文書以外の文書も含む。当該文書は、例えば、金銭の支払いの対価として提供される、商品又はサービスに係る文書であってもよい。このような文書として、交通機関の切符や、スポーツやコンサート等のイベントのチケットがある。図1(D)には、特急列車の切符を示す文書D4が示されている。文書D4には、乗車日の日付として「2月15日」、発着の時刻として「6:00」及び「8:30」、発着の場所して「東京」及び「新大阪」、費目として「特急券」、金額として「¥13000」と記載されている。
支出に関する文書は、金銭の受取人以外の者によって発行された文書も含む。当該文書として、例えば、クレジットカードの管理会社や銀行等により発行される取引明細書がある。図1(E)には、クレジットカードの取引明細書を示す文書D5が示されている。文書D5には、日付として「15.2.21」、場所として「東京店」、費目として「レストラン○○東京店」、金額として「¥5000」の情報が記載されている。
以上のように、支出に関する文書には様々な文書がある。支出に関する文書は、支出に関する情報が記載された文書であれば、前掲した文書に限られない。このような文書の各々は、1回又は複数回の商取引に伴い、他の支出に関する文書とは独立して発行される。
続いて、支出に関する文書から得た情報を基に旅程を推定する旅程推定装置の実施形態を説明する。旅程推定装置は、例えば、企業に勤務するユーザが、当該企業に対して出張費の清算をする用途で使用される。即ち、企業では、社員の出張費等の経費を管理するために経費管理システムが導入されていることが通常であるが、このシステムにおいてユーザ(社員)は、出張の行程及び当該出張に関わる支出の履歴データ(expense report)をシステムに登録して精算申請をする必要がある。本発明の旅程推定装置は、このような場面において使用され得る。これ以外にも、旅程推定装置は、ユーザの個人的に自身がした旅の旅程を管理する用途で使用されてもよく、様々な用途で使用され得る。
[第1実施形態]
図2は、本発明の第1実施形態に係る旅程推定装置10の機能構成を示すブロック図である。旅程推定装置10は、撮像装置30と通信可能に接続される。撮像装置30は、文書群Dに含まれる各文書を撮像する。撮像装置30は、スキャナや、デジタルカメラ、スマートフォンで例示される通信端末装置等の、撮像機能を有するいかなる装置であってもよい。この場合、旅程推定装置10は、例えば、一個人をユーザとするパーソナルコンピュータ等の情報処理装置、又は、複数のユーザで共用されるサーバ装置によって実現される。
なお、撮像装置30は、旅程推定装置10と別個に設けられた装置であるが、撮像装置30の機能が旅程推定装置10に内蔵されてもよい。この場合、旅程推定装置10は、例えば、撮像機能(例えばスキャン機能)のほかに、コピー機能やプリンタ機能、ファクシミリ送信機能等の複数の機能を搭載した、画像形成装置によって実現されてもよい。
旅程推定装置10は、文字認識部11と、抽出部12と、登録部13と、分類部14と、推定部15と、提示部16と、選択受付部17と、出力処理部18とを備える。
文字認識部11は、撮像装置30が撮影した画像に含まれる文字を認識する。文字認識部11は、文書群Dに含まれる各文書を撮像して得られた画像に基づいて光学文字認識処理(以下「OCR処理」という。)を行い、文字コード(例えば、ASCII、Unicode、Shift_JIS等)を生成する。
抽出部12は、文字認識部11により認識された文字(文字コード)に基づいて、支出に関する情報を含むデータである支出データを抽出する。支出データは、ここでは、文書に記載された日付に応じた日付情報、場所に応じた場所情報、費目に応じた費目情報、及び金額の情報を含む。支出データは、1つの文書から1つだけ得られる場合もあれば、図1(E)で説明した取引明細書のように1つの文書から複数得られる場合もある。
登録部13は、旅程の起点又は終点となり得る場所を登録する。旅程の起点及び終点は、ここでは、ユーザの行動の拠点となる場所(即ち、ホームタウン)である。ホームタウンとしては、ユーザの自宅や勤務先、ユーザがよく利用する駅(例えば、自宅又は勤務先の最寄り駅)がある。登録部13により登録されたホームタウンを示す場所情報を、以下では「ホームタウン情報」という。ホームタウン情報は、本発明の登録場所情報の一例である。ホームタウン情報は、地名や駅名等の、文書に記載され得る場所を示す文字列で表されることが望ましい。
登録部13は、例えば、ユーザによって指定されたホームタウンを登録する。また、ホームタウンは、1人のユーザにつき1つ又は2つ以上登録される。
分類部14は、抽出部12により複数の支出データの各々から抽出された日付情報の時系列の順番に従って、当該複数の支出データを、1以上の支出データを含む支出データ群に分類する。この支出データ群のことを、以下では「グループ」と称す。本実施形態において、分類部14は、ホームタウン情報が抽出された支出データを境目としてグループ同士を区分する分類をする。
推定部15は、分類部14により生成された各グループに含まれる各支出データを特定し、各支出データから抽出された日付情報等に基づいて、旅程を推定する。推定部15は、少なくとも、抽出された日付情報に応じた日付を含む旅程を推定する。推定部15は、本実施形態では、一のグループに含まれる各支出データから抽出された日付情報を含む情報に基づいて、1単位の旅程を推定する。ここにおいて、1単位の旅程とは、起点の場所から開始し、終点の場所で終了する、1回の旅の日程のことをいう。
提示部16は、推定部15により1のグループに基づいて複数通りの旅程が推定された場合、当該複数通りの旅程をユーザに提示する手段である。
選択受付部17は、提示部16により提示された複数通りの旅程の中からユーザによるいずれかの選択を受け付ける。
出力処理部18は、推定部15により推定された旅程、又は選択受付部17により受け付けられた選択に基づいて、旅程の情報を出力する処理を行う。出力処理の具体的な内容は特に問わないが、例えば、旅程のデータの送信、記録(保存)、旅程を示す画像の表示、及び印刷のための処理のうちの1つ以上を含む。
図3は、旅程推定装置10のハードウェア構成を示すブロック図である。図3に示すように、旅程推定装置10は、制御部101と、操作部102と、NW通信部103と、表示部104と、記憶部105と、インタフェース部106とを備える。
制御部101は、演算処理装置としてのCPU(Central Processing Unit)、ROM(Read Only Memory)、及びワークエリアとしてのRAM(Random Access Memory)を含み、旅程推定装置10の各部を制御する制御手段である。CPUは、ROM又は記憶部105に記憶されたプログラムをRAMに読み出して実行する。
操作部102は、例えばキーボードやマウスを備え、ユーザによって操作される操作手段である。NW通信部103は、例えばモデムを備え、インターネット等のネットワークに接続して通信する通信手段である。表示部104は、例えば液晶ディスプレイを備え、各種の画像(画面)を表示する表示手段である。記憶部105は、例えばハードディスク装置を備え、各種のデータを記憶する記憶手段である。記憶部105は、例えば、OS(Operating System)や、図2で説明した旅程推定装置10の機能を実現するための旅程推定アプリケーションAP、登録されたホームタウン情報等を記憶する。インタフェース部106は、例えばケーブルを接続するためのコネクタを備え、当該ケーブルを介して撮像装置30と接続される。
図2で説明した文字認識部11、抽出部12、登録部13、分類部14、及び推定部15は、例えば制御部101によって実現される。提示部16は、例えば制御部101及び表示部104によって実現される。選択受付部17は、例えば制御部101及び操作部102により実現される。出力処理部18は、例えば制御部101、NW通信部103、及び表示部104によって実現される。
図4及び図5は、旅程推定装置10が行う旅程の推定のための処理を示すフローチャートである。図6は、支出データを説明する図である。以下で説明する処理に先立ち、登録部13は、予めホームタウン情報を登録しておく。ここでは、ホームタウン情報として、地名である「東京」と、駅名である「東京駅」及び「品川駅」とが登録されている。
撮像装置30により文書群Dの各文書が撮像されると、文字認識部11は、当該撮像された画像に基づいてOCR処理を行う(ステップS1)。OCR処理は、文書の撮像と並行して行われてもよいし、撮像が終了してから行われてもよい。
OCR処理が行われると、抽出部12は、画像から認識された文字に基づいて支出データを抽出する(ステップS2)。図6(A)には、ステップS2で抽出された複数の支出データが示されている。ここにおいて、一の支出データは、当該支出データを一意に識別する「ID」、ユーザを一意に識別する「ユーザ情報」、「日付情報」、「場所情報」、「費目情報」、及び「金額」の各情報を含む。IDの値は、支出データが生成された順、即ち撮像装置30により文書が撮像された順に、昇順に割り当てられる。ユーザ情報は、ここでは、同一のユーザを識別する「USER001」である。日付情報は、少なくとも文書に記載された日付を示す情報を含み、更に、当該文書に記載された時刻を示す情報を含む場合がある。
場所情報は、ここでは地名を示す情報である。文書の記載から地名を直接に特定することが不可能な場合は、別途設けられた図示せぬサーバを用いて、電話番号や店舗名等の別の情報から地名が割り出される構成が採用されてもよい。
なお、図6(A)において、ID「0012」の支出データの場所情報が「不明」となっている。この原因としては、文書に場所を示す情報の記載がないことや、抽出の失敗が考えられる。
費目情報は、ここでは「飲食」のように、文書に記載された費目を上位の概念で表された情報となっているが、これよりも下位概念化(細分化)した情報で表されてもよい。例えば、費目情報は、日付情報に含まれる時刻の情報や金額の高低から、「朝食」、「昼食」、「夕食」という具合に細分化されてもよい。また、「中華料理」や「イタリア料理」等のような、飲食の内容に応じた細分化がなされてもよい。
分類部14は、ステップS2で抽出された支出データを日付情報の時系列の順番に従って並べ替える、ソート処理を行う(ステップS3)。ソート処理では、日付情報が早い順となるように、支出データが並べ替えられる。図6(B)には、図6(A)で説明した複数の支出データに対するソート処理の結果が示されている。この段階の支出データは、日付情報の時系列の順番に従って並べ替えられてはいるものの、未だ一固まりのデータである。なお、ソート処理では、同じ日付情報の支出データが複数ある場合、時刻の順番も加味される。時刻の情報が抽出されなかった場合は、特定の時刻(例えば0:00)とみなされてもよいし、費目情報等を参照して適当な時刻が推定されてもよい。後者の場合、例えば、費目情報が「夕食」の場合は、時刻を「19:00」と推定されればよい。
続いて、分類部14は、複数の支出データの各支出データをグループに分類するための処理を開始する。
まず、分類部14は、グループに未分類の支出データのうち、ソート順が最先である支出データに着目する(ステップS4)。ここでは、分類部14は、ID「0010」の支出データに着目する。
次に、分類部14は、着目した支出データから抽出された場所情報が、ホームタウン情報を示すかどうかを判定する(ステップS5)。図6(B)に示すように、ID「0010」の支出データからは、場所情報として「東京」が抽出されている。よって、分類部14は、ステップS5で「YES」と判定する。次に、分類部14は、抽出された場所情報を、旅行の起点に対応させるかどうかを判定する(ステップS6)。分類部14は、以下で説明する判定条件(C11)〜(C13)に基づいて、ステップS6の判定を行う。
(C11)ホームタウン情報が抽出された支出データの中で、ソート順が奇数番目である支出データを起点、偶数番目である支出データを終点に対応させる。
(C12)抽出された日付情報が連続の関係にある2以上の支出データに含まれる、ホームタウン情報が抽出された支出データの中で、ソート順が先頭である支出データを起点、最後である支出データを終点に対応させる。
(C13)抽出された日付情報が連続の関係にある2つの支出データの各々から、ホームタウン情報が抽出された場合、ソート順が先である支出データを或る1単位の旅程の終点、後である支出データを別の1単位の旅程の終点に対応させる。
判定条件(C11)を採用する理由は、次のとおりである。ユーザがホームタウンを起点として旅を開始し、ホームタウンを終点として旅を終了した場合において、旅の開始時点と終了時点に発行された支出に関する文書が存在したとする。この場合、ホームタウン情報が抽出された支出データに着目すると、ソート順で、旅程の起点に対応するものと、旅程の終点に対応するものとが、交互に現われる可能性が高いと推定される。
判定条件(C12)を採用する理由は、次のとおりである。日付情報が連続の関係にある2以上の支出データが存在した場合に、これらは1単位の旅程に係る支出データと推定される。このため、日付情報が先頭であるホームタウン情報が抽出された支出データが起点に対応し、最後であるホームタウン情報が抽出された支出データが終点に対応する可能性が高いと推定される。ここにおいて、日付情報の連続の関係は、日付情報が示す日付が時系列の順番で連続する(即ち1日違いである)関係に加え、日付情報が示す日付が時系列の順番で同じ(即ち同日を示す)関係を含む。
判定条件(C13)を採用する理由は、次のとおりである。日付情報が連続の関係にある2つの支出データの各々から、ホームタウン情報が抽出された場合、当該2つの支出データの間に別の支出データが存在しないことから、これらが同じ旅程に係る支出データとは考え難い。よって、当該2つの支出データは、互いに異なる旅程に係る支出データと推定される。このため、日付情報が先である支出データが或る1単位の旅程の終点に対応し、後である支出データが別の1単位の旅程の終点に対応する可能性が高いと推定される。ユーザが旅を終えてホームタウンに戻った後、直ぐに次の旅を開始した場合に、判定条件(C13)を満たしやすくなる。
ステップS6では、分類部14は、例えば、判定条件(C11)〜(C13)のうち2以上の判定条件で判定結果が重複した場合に、当該判定結果を最終的な判定結果とする。これ以外にも、分類部14は、特定の判定条件(例えば、判定条件(C12))の重み付けを相対的に重くして、最終的な判定結果を求めてもよい。
ID「0010」の支出データの場合、分類部14は、少なくとも判定条件(C11)及び(C12)に基づいて、旅程の起点に対応させると判定する(ステップS6;YES)。
ステップS6で「YES」と判定した場合、分類部14は、支出データを旅程の起点に対応させて、新規に作成したグループに分類する(ステップS7)。図7は、支出データの分類を説明する図である。図7に示すように、分類部14は、ID「0010」の支出データを、グループG1に分類する。
なお、図7の「ホームタウン」と記された欄においては、旅程の起点に対応する支出データについては「起点」、終点に対応する支出データについては「終点」、起点及び終点のいずれにも対応しない支出データについては「−」(ハイフン)と記されている。
次に、分類部14は、ソート順が次の支出データが存在するかどうかを判定する(ステップS8)。ここではステップS8で「YES」と判定し、分類部14はステップS4の処理に戻す。そして、分類部14は、グループに未分類の支出データのうち、ソート順が最先の支出データに着目する(ステップS4)。ここでは、分類部14は、ID「0009」の支出データに着目する。
次に、分類部14は、着目した支出データから抽出された場所情報が、ホームタウン情報を示すかどうかを判定する(ステップS5)。図6(B)に示すように、ID「0009」の支出データからは、場所情報として「小田原」が抽出されている。よって、分類部14は、ステップS5で「NO」と判定する。ステップS5で「NO」と判定した場合、分類部14は、支出データを作成中のグループに追加する(ステップS9)。図7に示すように、分類部14は、ID「0009」の支出データを、グループG1に分類する。
そして、分類部14は、ステップS8の処理に進み、ソート順が次の支出データが存在するかどうかを判定する。次のステップS4では、分類部14は、ID「0004」の支出データに着目する。
ID「0004」の支出データからは、場所情報として「東京」が抽出されている。よって、分類部14は、ステップS5で「YES」と判定する。そして、分類部14は、抽出された場所情報を、旅行の起点に対応させるかどうかを判定する(ステップS6)。ここでは、少なくとも判定条件(C11)及び(C12)に基づいて、分類部14は支出データを旅程の終点に対応させる判定する。よって、分類部14は、ステップS6で「NO」と判定し、支出データを旅程の終点に対応させて、作成中のグループに分類する(ステップS10)。図7に示すように、分類部14は、ID「0004」の支出データを、グループG1に分類する。そして、分類部14は、1グループの作成を完了する(ステップS11)。ここでは、グループG1に分類される支出データが確定される。
次に、分類部14は、ソート順が次の支出データが存在するかどうかを判定する(ステップS12)。分類部14は、ここでは「YES」と判定し、ステップS4の処理に戻す。以降、分類部14は、ステップS4〜S12の処理を繰り返し行うことにより、全ての支出データをいずれか1つのグループに分類する。
図7に示すように、分類部14は、ID「0013」,「0014」,「0005」の支出データを、グループG2に分類する。また、分類部14は、判定条件(C11),(C13)に基づいて、ID「0013」の支出データを旅程の起点、ID「0005」の支出データを旅程の終点に対応させる。更に、分類部14は、ID「0006」,「0015」,「0008」,「0002」,「0001」,「0011」,「0012」,「0007」,「0003」の支出データを、グループG3に分類する。また、分類部14は、ID「0006」の支出データを旅程の起点、ID「0003」の支出データを旅程の終点に対応させる。
図7に示すように、ここでは、グループG1〜G3の各々において、ホームタウン情報が抽出された支出データが起点、又は終点のいずれかに対応しているが、このようにならない場合もある。分類部14は、ステップS7又はS9で支出データを分類した後、ソート順が次の支出データが存在しないと判定した場合は(ステップS8;NO)、その時点で1グループの作成を完了する。この場合、分類部14は、直前のステップS7又はS9で分類した支出データを、旅程の終点に対応させる。例えば、ユーザがホームタウン以外の場所に移住した場合、この場所が旅程の終点となる。
また、旅程の起点に対応させるべき、ホームタウン情報が抽出された支出データが存在しない場合は、分類部14は、グループに未分類でソート順が最先の支出データを、旅程の起点に対応させる。
以上のようにして、分類部14による支出データの分類が終了すると、推定部15は、グループ毎に1単位の旅程を推定する(図5のステップS13)。分類部14によって生成された各グループは、支出データによって構成されているが、ある共通の性質を有した支出データの集合体に過ぎない。推定部15は、各グループに含まれる支出データの内容を分析することにより、これら支出データによって裏付けられる人間(ユーザ)の行動、即ち旅程を推定する。本実施形態の推定部15は、各グループに含まれる支出データを分析することにより、何月何日にユーザはどこに位置したか、どこからどこへ移動したか、各日においてユーザはどのような支出を行ったか等を推定する。従って、推定される旅程は、旅における人間の行動の情報、例えば、日付と関連づけられたユーザが滞在した場所、複数の場所間の移動の経路、当該移動に用いられた交通手段、宿泊地、及び旅費の情報が含まれる。
推定部15は、1のグループの各支出データから抽出された複数の場所情報の地理的な関係から推定される移動の経路に基づいて、旅程を推定する。この移動経路の推定では、複数の時点の場所情報の連続性が考慮される。例えば同じ日付情報を含む支出データが2つ存在し、一方の場所情報が「東京」、他方の場所情報が「大阪」を示す場合、推定部15は、当該日付情報が示す日に、「東京」−「大阪」間の移動があったと推定する。同じ日付情報を含む支出データが3つ存在し、各々から「東京」、「大阪」、「福岡」を示す場所情報が抽出された場合、推定部15は、これら3つの場所情報の地理上の位置の連続性に基づいて、「東京」→「大阪」→「福岡」という経路の移動、又は「福岡」→「大阪」→「東京」という経路の移動を推定する。図1(D)で説明した文書D4のように、各場所に滞在した時刻の情報が得られた場合、推定部15はこの時刻の情報に基づいて移動経路を推定する。
旅費について、推定部15は、例えば飲食費、交通費、及び宿泊費等の、費目情報から特定される項目毎の旅費を算出する。ただし、これらの項目はあくまで一例であり、例えば更に細分化されてもよい。
続いて、推定部15は、複数の支出データの各支出データを修正する修正処理を行う。本実施形態の修正処理は、除外処理、訂正処理、及び補完処理を含む。除外処理は、旅程の推定に使用しない支出データを除外する処理である。訂正処理は、OCR処理における文字の認識を原因とした誤りを含む情報(文字)を訂正する処理である。補完処理は、支出データから抽出されなかった情報を補完する処理である。図8は、修正処理後の支出データを説明する図である。
まず、推定部15は、除外処理を行う(ステップS14)。除外処理のアルゴリズムは予め決められているが、本実施形態では、以下の除外条件(C21)及び(C22)に基づいて行われる。
(C21)一のグループに含まれる各支出データから抽出された複数の場所情報の地理的な関係に基づいて、一部の場所情報が抽出された支出データを除外する。
(C22)支出データから抽出された費目情報に基づいて、旅程の推定に使用しない支出データを除外する。
除外条件(C21)に基づく除外処理は、複数の場所情報のうち、地理的な関係から移動が不可能な場所を示す場所情報が抽出された支出データを除外するための処理である。例えば、図7に示すID「0001」の支出データの場所情報は「福岡」であるが、同じグループG3に含まれる他の支出データの場所情報は、多くが或る程度の距離が離れた「大阪」又は「神戸」を示している。このため、ID「0001」の支出データが、グループG3から推定される旅程に係る支出データではないと推定される。よって、推定部15は、図8に示すように、ID「0001」の支出データを除外する。例えば、他人に対して発行された文書が紛れ込んだ場合に、この除外処理が行われる。
除外条件(C22)に基づく除外処理は、旅費に含めるべきではない費目の金額を、当該旅費に含めないようにするための処理である。例えば、旅程推定装置10が出張費の清算の用途で使用される場合、タバコ等の嗜好品に係る費用を旅費に含めない場合がある。そこで、推定部15は、特定の費目情報が抽出された支出データを除外する。
次に、推定部15は、訂正処理を行う(ステップS15)。訂正処理のアルゴリズムは予め決められているが、本実施形態では、以下の訂正条件(C31)に基づいて行われる。
(C31)一の支出データから抽出された場所情報を、同じグループに含まれる他の支出データから抽出された場所情報に基づいて訂正する。
図7に示すように、ID「0008」の支出データから抽出された場所情報は、「大坂」となっている。しかしながら、これと同じグループG3には、場所情報として「大阪」が抽出された支出データとして、ID「0015」及び「0008」の支出データが含まれている。推定部15は、同じグループの2以上の他の支出データから同じ場所情報が抽出された場合に、訂正処理を行う。よって、推定部15は、図8に示すように、ID「0008」の支出データから抽出された場所情報を、「大坂」から「大阪」に訂正する。
仮に、グループG3に場所情報が「大阪」である支出データが含まれない場合には、推定部15は、「大坂」から「大阪」への訂正をしない。その理由は、現に「大坂」という場所を訪問した可能性や、店舗名等の場所を意味しない情報を場所情報として認識した可能性があるからである。
次に、推定部15は、補完処理を行う。補完処理のアルゴリズムは予め決められているが、本実施形態では、以下の補完条件(C41)に基づいて行われる。
(C41)一の支出データから抽出されなかった場所情報を、同じグループに分類された他の支出データから抽出された場所情報に基づいて補完する。
図7に示すように、ID「0012」の支出データの場所情報が「不明」となっている。しかしながら、当該支出データとソート順が隣り合う、同じグループG3のID「0011」,「0007」の支出データからは、場所情報として「神戸」が抽出されている。この場合、推定部15は、図8に示すように、ID「0012」の支出データの場所情報として、「神戸」を補完する。このように、推定部15は、ソート順で前後に隣り合う場所情報が一致した場合は、当該場所情報で補完する補完処理を行う。隣り合う場所情報が相違する場合は、推定部15は、日付情報が近い一方の支出データの場所情報で補完するとよい。
なお、除外処理、訂正処理、及び補完処理が実行される順番は、変更されてもよい。
次に、推定部15は、複数通りの旅程を推定したグループがあるかどうかを判定する(ステップS17)。1グループにつき1通りの旅程を推定した場合は、推定部15は、ステップS17で「NO」と判定する。この場合、出力処理部18は、修正処理後の旅程に確定して、当該旅程のデータを出力する出力処理を行う(ステップS20)。
図9は、出力処理部18から出力される旅程を説明する図である。
図9に示すように、グループG1から推定された「旅程1」には、2014/9/20に東京に滞在し、2014/9/21に小田原に滞在して宿泊し、2014/9/22に東京に滞在したことを示す情報が含まれる。「移動経路」の情報は、ここでは「東京」→「小田原」→「東京」となっている。「旅費」は、費目情報「飲食」に対応する飲食代「1150JPY」と、費目情報「タクシー」に対応する交通費「2840JPY」と、費目情報「ホテル」に対応する宿泊費「7800JPY」と、これらの総額である「11790JPY」との各情報が含まれている。グループG2から推定された「旅程2」、及びグループG3から推定された「旅程3」にも、旅におけるユーザの行動の情報が含まれる。
なお、図9で説明した旅程の情報はあくまで一例である。例えば、日付情報に含まれる時刻の情報に基づいて、何月何日にユーザがどこに位置していたかだけでなく、何時何分にユーザがどこに位置していたかまでが示されているような、より詳細な旅程が推定されてもよい。また、図9で説明した情報のうちの一部の情報が省略されてもよい。例えば、経費処理においては支出額が重要であるが、単に大雑把な旅程を把握したい用途の場合には、日付と移動経路のみが示された旅程も考えられる。更に、旅程の情報は、文字情報で表現されることに限られず、例えば、画像情報(例えば地図)や音声情報、その他の人間又はコンピュータが解釈可能な情報の組み合わせによって表現されてもよい。
ステップS17において、推定部15が複数通りの旅程を推定したグループがあると判定した場合(ステップS17;NO)、提示部16は、推定された複数通りの旅程を提示する(ステップS18)。選択受付部17は、提示された複数通りの旅程の中からいずれかの選択を受け付ける(ステップS19)。出力処理部18は、選択された旅程の情報を出力する出力処理を行う(ステップS20)。
ここで、グループG3において、ID「0012」の支出データからみて、ソート順が前の支出データの場所情報が「神戸」で、後の支出データの場所情報が「大阪」であり、且つ、日付情報の離れ具合が同じであった場合を考える。この場合、補完すべき場所情報が「神戸」と「大阪」との2通りとなる。そこで、推定部15は、場所情報「神戸」で補完処理を行った場合と、場所情報「大阪」で補完処理を行った場合との2通りで旅程を推定し、これらを提示する。ユーザは、提示された2通りの旅程のうち、真の(即ち事実に即した)旅程を選択する。出力処理部18は、選択された旅程に確定して、当該旅程の情報を出力する出力処理を行う。
これにより、旅程推定装置10は、真の旅程の情報を出力しやすくなる。旅程の選択に係るユーザの手間は増えるが、旅程の推定の精度が向上する。
旅程推定装置10は、補完処理と関係なく複数通りの旅程を推定した場合も、ステップS18〜S20の処理ステップを実行する。
以上、旅程推定装置10が、日本語で発行された文書に係る支出データに基づいて、日本国内の旅程を推定する場合を説明したが、日本語以外の言語で発行された文書に係る支出データに基づいて、日本国外を含む旅程を推定してもよい。
以上説明した第1実施形態の旅程推定装置10によれば、複数の支出データの各々から抽出された日付情報の時系列の順番に基づいて、当該複数の支出情報をグループに分類して、各グループから1単位の旅程を推定し得る。このため、ユーザには、旅程の情報を一からコンピュータ装置に入力する手間が強いられない。また、ユーザは、多数の支出に関する文書が手元にある場合でも、旅程に関する文書であるか否かを判別したり、撮像させるときの日付の順番を考慮したりしなくてよい。例えば、ユーザの財布に多数のレシートや領収書が無秩序に溜まっている場合でも、ユーザは旅程に関するか否かを判別することなく、財布に入っている全てのレシート等を一括して本実施形態の旅程推定装置10の入力に乗せれば、除外処理により旅程に無関係な文書は自動的に除外される上に、推定旅程が出力されてくる。よって、ユーザにとって、旅程の情報を得るために必要な工数の増大が抑制される。更に、旅程推定装置10によれば、ホームタウン情報が抽出された支出データを手がかりとして、旅程の起点又は終点を推定するため、1単位の旅程を精度良く推定し得る。また、除外処理、修正処理、及び補完処理を含む修正処理によっても、真の旅程を推定する精度が高くなる。
[第2実施形態]
次に、本発明の第2実施形態を説明する。本実施形態の旅程推定装置10は、支出データのグループの分類に関する構成が、上述した第1実施形態と相違する。旅程推定装置10の機能構成は、図1に示す構成と大略同じであるが、分類部14は、抽出された日付情報が連続の関係にある2以上の支出データを、同一のグループに分類する。本実施形態では、登録部13に相当する機能が省略されてもよい。旅程推定装置10のハードウェア構成は、図1に示す構成と同じである。本実施形態において、上述した第1実施形態と同じ符号を付した要素は、上述した第1実施形態と同じ要素を表す。
以下、上述した第1実施形態と相違する点を中心に、旅程推定装置10が行う旅程の推定に関する処理を説明する。
図10は、旅程推定装置10が行う旅程の推定のための処理を示すフローチャートである。図11は、支出データを説明する図である。
撮像装置30により文書群Dの各文書が撮像されると、文字認識部11は、当該撮像された画像に基づいてOCR処理を行う(ステップS1)。OCR処理が行われると、抽出部12は、画像から認識された文字に基づいて支出データを抽出する(ステップS2)。図11(A)には、ステップS2で抽出された複数の支出データが示されている。次に、分類部14は、ステップS2で抽出された支出データを、日付情報の時系列の順番に従って並べ替えるソート処理を行う(ステップS3)。図11(B)には、図11(A)で説明した複数の支出データに対するソート処理の結果が示されている。
続いて、分類部14は、複数の支出データの各支出データをグループに分類するための処理を開始する。
まず、分類部14は、グループに未分類の支出データのうち、ソート順が最先である支出データに着目する(ステップS4)。ここでは、分類部14は、ID「0010」の支出データに着目する。
次に、分類部14は、ステップS4で着目した支出データと、ソート順が次の支出データとで、日付情報が連続の関係にあるかどうかを判定する(ステップS21)。ここでは、ID「0010」の支出データの日付情報「2014/09/20 08:41」と、ソート順が次のID「0009」の支出データの日付情報「2014/09/21」とが連続の関係にあるので、分類部14は、ステップS21で「YES」と判定する。この場合、分類部14は、着目した支出データと、ソート順が次の支出データとを同一のグループに分類する(ステップS22)。分類部14は、図12に示すように、ID「0009」及び「0010」の支出データを、グループG4に分類する。次に、分類部14は、ステップS4で着目した支出データから、ソート順が2つ後の支出データが存在するかどうかを判定する(ステップS23)。当該2つ後の支出データは、グループに未分類の支出データである。ここではステップS23で「YES」と判定し、分類部14はステップS4の処理に戻す。
次に、分類部14は、ステップS4でID「0009」の支出データに着目する。そして、分類部14は、ID「0009」の支出データの日付情報と、ソート順が次のID「0004」の支出データの日付情報とが連続の関係にあるかどうかを判定する(ステップS21)。ここでも、分類部14は、ステップS21「YES」と判定し、ID「0004」の支出データをグループG4に分類する(ステップS22)。
次に、分類部14は、ステップS4でID「0004」の支出データに着目する。そして、分類部14は、ID「0004」の支出データの日付情報と、ID「0013」の支出データの日付情報とが、連続の関係にあるかどうかを判定する(ステップS21)。支出データであるID「0004」の支出データの日付情報「2014/09/22 08:34」と、出情報であるID「0013」の支出データの日付情報「2014/11/05 09:36」とは、連続の関係にない。よって、分類部14は、ステップS21で「NO」と判定する。
次に、分類部14は、ステップS4で着目した支出データから抽出された日付情報の前後を宿泊期間に含むことを示す、宿泊に関する支出データがあるかどうかを判定する(ステップS24)。図1(C)で説明したように、ホテル等の宿泊施設の領収証には、宿泊の期間を特定するための日付が記載されていることがある。このような文書の存在は、宿泊期間中においては、ユーザが宿泊施設のある場所に滞在したと推定される。
ここで、ID「0009」の支出データの費目情報が「ホテル」であり、宿泊期間が9/21〜9/22であったとする。この場合、分類部14は、ステップS21で「YES」と判定する。次に、分類部14は、支出データから特定される宿泊数が、日付情報の非連続日数以上(即ち、宿泊数≧非連続日数)かどうかを判定する(ステップS25)。ここでは、宿泊期間は9/21〜9/22であるから、宿泊数は「2」である。これに対し、日付情報の非連続日数は、「2014/09/22 08:34」から「2014/11/05 09:36」までの日数であるから、宿泊数よりも多い。よって、分類部14は、ステップS25で「NO」と判定する。この場合、分類部14は、1グループの作成を完了する(ステップS11)。ここでは、グループG4に分類される支出データが確定されることになる。
次に、分類部14は、ソート順が次である支出データが存在するかどうかを判定する(ステップS12)。分類部14は、ステップS12で「YES」と判定し、ステップS4の処理に戻す。
以降も、分類部14は、ステップS4〜S12の処理ステップを繰り返し行う。分類部14は、図12に示すように、ID「0013」の支出データをグループG5に分類した後は、ステップS4でID「0014」の支出データに着目する。この場合、ID「0014」の支出データの日付情報「2014/11/06」と、ソート順が次であるID「0005」の支出データの日付情報「2014/11/08 12:11」とが連続の関係にない。よって、分類部14は、ステップS21で「NO」と判定する。
次に、分類部14は、ステップS4で着目した支出データから抽出された日付情報の前後を宿泊期間に含むことを示す、宿泊に関する支出データがあるかどうかを判定する(ステップS24)。ここで、ID「0014」の支出データの費目情報が「ホテル」となっており、宿泊期間が、11/6〜11/7であったとする。この場合、分類部14は、ステップS21で「YES」と判定する。
次に、分類部14は、支出データから特定された宿泊数が、日付情報の非連続日数以上かどうかを判定する(ステップS25)。ここでは、宿泊期間は11/6〜11/7であるから、宿泊数は「2」である。これに対し、日付情報の非連続日数は、「2014/11/06」から「2014/11/08 12:11」までの日数「2」である。よって、分類部14は、ステップS25で「YES」と判定する。この場合、分類部14は、宿泊最終日(即ち出発日)を示す日付情報、又は宿泊期間中の日付情報が抽出された支出データを、同じグループに分類する(ステップS26)。ここでは、分類部14は、宿泊最終日を示す日付情報である11/8、又は宿泊期間中の日付情報である11/6〜11/7が抽出された支出データを、グループG5に分類する。これにより、ID「0005」の支出データの日付情報は、ID「0014」の支出データの日付情報と連続の関係にないが、同一のグループG2に分類される。次に、分類部14は、ステップS23に進み、ステップS4で着目した支出データから、ソート順が2つ後の支出データが存在するかどうかを判定することになる。
グループG6の作成に関し、ID「0011」の支出データと、ID「0001」の支出データとは、日付情報が連続の関係にない。しかし、ID「0011」の支出データの費目情報が「ホテル」に関するもので、且つ、その宿泊期間が、11/12〜11/13であったとする。この場合、宿泊数が「2」であり、日付情報の非連続日数が「2」である。よって、分類部14は、ステップS25で「YES」と判定し、宿泊最終日を示す日付情報である11/14、又は宿泊期間中の日付情報である11/12〜11/13が抽出された支出データを、同じグループに分類する。ここでは、分類部14は、ID「0001」の支出データは、ID「0011」の支出データとは日付情報が連続の関係にないが、同一のグループG6に分類する。
なお、本実施形態においても、分類部14は、ホームタウン情報に基づいて支出データをグループに分類してもよい。この場合、分類部14は、ステップS22で「YES」と判定した後、ソート順が次の支出データの場所情報がホームタウン情報を示すかどうかを判定する。ホームタウン情報を示すと判定した場合、分類部14は、ステップS11で1グループの作成を完了する。ホームタウン情報を示さないと判定した場合、分類部14は、ステップS23に進み、2つ後の支出データの有無を判定する。
以上のようにして、分類部14による支出データの分類が終了すると、推定部15は、図5で説明したステップS13に進み、グループ毎に1単位の旅程を推定する。以降、旅程推定装置10では、上述した第1実施形態と同じく、ステップS13〜S20の処理が実行される。図13は、修正処理後の支出データを説明する図である。図13に示すように、修正処理によりID「0002」の支出データの場所情報は、「大坂」から「大阪」に修正され、補完処理によりID「0012」の支出データ場所情報として「神戸」が補完されている。更に、除外条件(C22)に基づく除外処理により、ID「0008」の支出データが除外されている。
図14は、出力処理部18から出力される旅程を説明する図である。本実施形態の旅程の情報は、大略、上述した第1実施形態と同じ方法で生成される。
図14に示すように、グループG4からは「旅程4」として、2014/9/20に東京に滞在し、2014/9/21に小田原に滞在して2泊し、2014/9/23に東京に滞在したことを示す情報が含まれる。ここでは、2014/9/23への東京の滞在が、括弧書きで示されている。また、移動経路についても、旅程の終点に関する部分が、括弧書きとなっている。その理由は、9/23に、ホームタウンである東京に戻ったことを示す支出データがないためである。「旅程4」では、ID「0009」の宿泊に関する支出データに基づいて、宿泊最終日が旅程の終了日と推定されている。
グループG5から推定された「旅程5」、及びグループG6から推定された「旅程6」にも、旅におけるユーザの行動の情報が含まれる。グループG5では11/7の支出データ、グループG6では11/13の支出データがないが、前述した宿泊に関する支出データに基づいて、1単位の旅程が推定されている。
以上説明した第2実施形態の旅程推定装置10によれば、日付情報が連続の関係にある2以上の支出データに基づいて1単位の旅程を推定するため、旅程を精度良く推定し得る。また、旅程推定装置10によれば、日付情報が連続の関係にない場合でも、宿泊に関する支出データに基づいて、1単位の旅程を精度良く推定し得る。
[変形例]
本発明は、上述した実施形態と異なる形態で実施してもよい。また、以下に示す変形例は、各々を組み合わせてもよい。
(変形例1)
旅程推定装置10は、支出データから抽出されなかった情報が存在する場合に、ユーザにこの情報を問い合わせるための構成を備えてもよい。支出データから情報が抽出されない場合とは、文書にその情報の記載がない場合や、OCR処理を原因とした文字の認識の誤り等により、文書に情報の記載はあるものの当該情報が抽出されなかった場合等がある。
図15は、本変形例の旅程推定装置10の機能構成を示すブロック図である。本変形例の旅程推定装置10は、上述した実施形態の機能に加え、問い合わせ部19、及び回答受付部20を備える。
問い合わせ部19は、一の支出データから抽出されなかった情報が存在する場合、当該情報をユーザに問い合わせる。回答受付部20は、問い合わせ部19による問い合わせに対する回答を受け付ける手段である。推定部15は、回答受付部20により受け付けられた回答に基づいて、抽出されなかった情報を補完する。推定部15は、補完した情報を用いて旅程を推定する。
なお、問い合わせ部19は、例えば制御部101及び表示部104により実現され、回答受付部20は、例えば制御部101及び操作部102により実現される。
図16は、本変形例の旅程推定装置10が行う問い合わせを説明する図である。ここでは、図6で説明したID「0011」の支出データの場所情報を問い合わせるための問合せ画面Cが示されている。問い合わせ部19は、図16に示すように、ID「0011」の支出データから抽出された日付情報、費目情報、及び金額を表示して、場所情報を問い合わせる。ここでは、問い合わせ部19は、補完処理により推定した場所情報に基づいて「場所は「神戸」でよろしいですか?」というメッセージと、「はい」と記された操作子の画像B1と、「自分で修正」と記された操作子の画像B2とを表示する。ユーザは、提示された場所情報が正しいと判断した場合は、画像B1を選択する操作を行うことにより、回答する。ユーザは、提示された場所情報が誤っていると判断した場合は、画像B2を選択する操作を行って、真の情報を回答する。
なお、問い合わせ部19は、場所情報の候補が複数ある場合には、抽出された日付情報が近い支出データの場所情報を優先的に表示してもよい。ここでの優先的な表示とは、例えば、画面の上部に表示する等、より少ない操作で場所情報を選択可能にしたり、ユーザに視認させやくしたりする表示のことをいう。
ここでは、補完処理で推定した場所情報が表示されるが、この表示がなくてもよい。旅程推定装置10では、日付情報、費目情報、金額が抽出されたかった場合も、抽出されなかった情報を問い合わせてもよい。
問い合わせ部19の問い合わせのタイミングは、特に問わない。問い合わせ部19は、例えば、旅程を推定する過程で不明の情報が存在すると判定した場合に、随時プロンプトを表示する等して、問い合わせをしてもよい。また、問い合わせのタイミングは、例えば、ステップS16の処理が終了したタイミングであってもよいし、ステップS13で旅程を推定するタイミングで問い合わせてもよい。
本変形例の旅程推定装置10によれば、真の情報によって補完しやすくなる。また、本変形例の機能は、上述した第2実施形態の旅程推定装置10で実現されてもよい。
(変形例2)
上述した実施形態の補完処理は、場所情報を補完する処理であったが、日時情報を補完する補完処理が行われてもよい。この場合の補完処理のアルゴリズムは予め決められているが、以下の補完条件(C42)に基づいて行われる。
(C42)一の支出データから抽出されなかった日付情報を、抽出された場所情報が示す場所が共通する他の支出データから抽出された日付情報に基づいて補完する。
ここでいう場所の共通とは、場所情報が共通することに加え、「福岡」と、福岡の一部の地区である「博多区」のように、地域が共通することも含んでいてもよい。図17に示すように、仮にID「0008」の支出データの日付情報が「不明」である場合、この支出データを分類すべきグループが不明である。そこで、推定部15は、ID「0008」の支出データの場所情報「大阪」と共通する場所を示す場所情報が抽出された支出データとして、ID「0015」及び「0002」の支出データを特定する。ID「0015」の支出データの日付情報は「2014/11/10 15:17」であり、ID「0002」の支出データの日付情報は「2014/11/11 12:16」である。よって、推定部15は、ID「0008」の支出データの日付情報を、これらの支出データから抽出された日付情報で補完する。ここでは、推定部15は、「11/10」及び「11/11」に基づいて補完する。例えば、推定部15は、これら2つの日付情報の一方で補完して旅程を推定する。
(変形例3)
上述した実施形態の訂正処理は、場所情報を訂正する処理であったが、日時情報を訂正する訂正処理が行われてもよい。この場合の訂正処理のアルゴリズムは予め決められているが、以下の補完条件(C32)に基づいて行われる。
(C32)一の支出データから抽出された日付情報を、抽出された場所情報が示す場所が共通する他の支出データから抽出された日付情報に基づいて訂正する。
支出データの日付情報にOCR処理を原因とした誤りが含まれる場合、この支出データは本来分類されるべきグループに分類されない。そこで、推定部15は、抽出された場所情報が示す場所が共通する他の支出データが存在する場合、当該支出データから抽出された日付情報で補完する。例えば、文字認識部11が、場所情報を「福岡」と認識し、日付情報である「6/5」を、誤って「6/S」(アルファベットの「S」)と認識したとする。この場合、分類部14は、場所情報として「福岡」が抽出された2つ以上の支出データから、日付情報として「6/5」が抽出されている場合に、「6/S」を「6/5」に訂正する。
(変形例4)
上述した第2実施形態に関し、旅程推定装置10は、支出データから抽出された場所情報が示す場所が、ホームタウンから遠隔地かどうかに基づいて、グループの分類を行ってもよい。本変形例では、登録部13がホームタウンを登録するものとする。
ユーザが旅行や出張等の目的でホームタウンからの遠隔地を訪れる場合、同じ場所を、例えば数日違いで訪れる可能性は低いと推定される。上述した第2実施形態のグループG6では、ホームタウンが「東京」であるのに対して、日付情報が11/10と11/12で、場所情報がともに遠隔地の「大阪」である2つの支出データが存在する。この場合、11/10〜11/11の期間の宿泊を示す文書がないとしても、ユーザがこの場所で宿泊し、これらの支出データが、同じ旅程で発行された支出に関する文書に対応すると推定される。これに対し、日付情報が11/10と11/12で、場所情報が遠隔地でない「横浜」である支出データが存在しても、これが同じ旅で発行されたと推定し難い。
そこで、分類部14は、一の支出データから抽出された日付情報と、ソート順が次である支出情報から抽出された日付情報とが連続の関係にない場合でも、これらの支出データから抽出された場所情報が示す場所が共通し、且つホームタウンからの遠隔地を示すときは、これらの支出データを、同じグループに分類する。ホームタウンからの遠隔地か否かは、典型的には、当該ホームタウンと遠隔地との距離によって定まる。ただし、距離だけで定まるのではなく、例えば、ホームタウンからその場所を訪れるための交通機関を加味してもよい。例えば、分類部14は、距離が同じであっても交通の便が悪い場所を遠隔地とし、交通の便が良い場所を遠隔地でないとして分類する。本変形例によれば、図14で説明した「旅程6」について、旅程推定装置10は、更に「2014/11/10〜11 大阪(宿泊2泊)」という情報を含む旅程を推定する。この変形例の旅程推定装置10によれば、真の旅程を推定する精度が高くなる。
(変形例5)
旅程推定装置10は、図2で説明した機能構成の全てを備えなくてもよい。図18に示すように、旅程推定装置10は、少なくとも、分類部14と、推定部15とを備えていればよい。この場合において、文字認識部11、抽出部12、登録部13、提示部16、選択受付部17、及び出力処理部18の少なくとも一部の機能が、外部装置によって実現されたり、一部の機能が省略されたりしてもよい。
本変形例の旅程推定装置10の一態様として、文書から支出データを得る構成が採用されなくてもよい。最近では、領収証や、クレジットカード管理会社や銀行等の取引明細書、切符や各種チケットが電子化されていることも珍しくない。そこで、旅程推定装置10は、支出に関する情報を含む電子データである支出データを、外部装置から取得し、当該支出データに基づいて旅程を推定してもよい。このような支出データにも、図1で説明した文書の場合と同じ性質の日付情報、場所情報、費目情報、及び金額等の情報が含まれ得るからである。例えば支出データは、クレジットカードの一種であるコーポレートカードの明細データに含まれるデータから抽出されてもよい。コーポレートカードの明細データにはカードの使用者毎の支出データが含まれるため、本変形例の旅程推定装置10は、当該使用者毎の支出データに基づいて旅程を推定することも可能である。
また、本変形例の旅程推定装置10の別の一態様として、文書から支出データを得る構成と、支出に関する情報を含む電子データを外部装置から取得する構成と、を備えてもよい。本発明は、文書から得られる支出データと、外部装置から得られる支出に関する電子データと、が混在していても適用可能であるからである。
更に、推定部15の一部の機能が省略されてもよい。推定部15は、例えば、除外処理、訂正処理、及び補完処理の1つ以上を行わないようにしてもよいし、これらの処理に関する前述した一部の条件が省略されてもよい。
また、支出データから抽出される対象の情報は、少なくとも日付情報を含んでいればよく、場所情報、費目情報、及び金額のうちの一部が抽出の対象外となっていてもよい。
(変形例6)
更に、本発明は、発行された複数の情報の各々から抽出された日付情報の連続性、又は抽出された複数の時点の場所情報の連続性に基づいて、発行された複数の情報を、1以上の情報を含む情報群にそれぞれ分類する情報分類方法として特定し得る。即ち、これらの複数の情報は、情報間のつながりや上記情報群への分類を考慮せず発行される。一の情報群には、人間がとったあるまとまりのある行動、例えばひと続きの行動を推定する手がかりとなる情報が含まれるが、それ以外の情報が含まれる場合もある。日付情報の連続性は、2つ以上の日付情報が、予め定められた連続的な関係によって特定されるとよい。場所情報の連続性は、複数の時点の場所情報が、予め定められた連続的な関係によって特定されるとよい。当該連続的な関係は、場所情報が示す場所の地理上の位置に基づき定められる。上述した実施形態では、本発明の情報分類方法を、旅程を推定する発明に適用していたが、旅以外の人間の行動を推定する発明にも適用し得る。
(変形例7)
上述した各実施形態の旅程推定装置10が実現する各機能は、それぞれ、1又は複数のハードウェア回路により実現されてもよいし、コンピュータに同機能を実現させるための1又は複数のプログラムを実行することにより実現されてもよいし、これらの組み合わせにより実現されてもよい。旅程推定装置10の機能がプログラムを用いて実現される場合、このプログラム(例えば、旅程推定アプリケーションAP)は、磁気記録媒体(磁気テープ、磁気ディスク(HDD、FD(Flexible Disk))等)、光記録媒体(光ディスク等)、光磁気記録媒体、半導体メモリ等のコンピュータに読み取り可能な記録媒体に記憶した状態で提供されてもよいし、インターネット等の通信回線を介して配信されてもよい。
10…旅程推定装置、11…文字認識部、12…抽出部、13…登録部、14…分類部、15…推定部、16…提示部、17…選択受付部、18…出力処理部、19…問い合わせ部、20…回答受付部、30…撮像装置。

Claims (18)

  1. 旅程の起点又は終点となり得る場所を登録する登録部と、
    支出に関する情報を含む複数の支出データの各々から抽出された日付情報の時系列の順番に従って、前記複数の支出データを、1以上の支出データを含む支出データ群に分類する分類部と、
    分類された前記支出データ群に含まれる各支出データから抽出された日付情報を含む情報に基づいて、少なくとも日付を含む旅程を推定する推定部とを備え、
    前記分類部は、登録された前記場所を示す登録場所情報が抽出された支出データによって前記支出データ群同士を区分する分類をし、
    前記推定部は、一の前記支出データ群に含まれる各支出データから抽出された日付情報及び場所情報を含む情報に基づいて、1単位の旅程を推定する
    ことを特徴とする旅程推定装置。
  2. 前記分類部は、前記登録場所情報が抽出された支出データの中で、前記時系列の順番が奇数番目である支出データを前記起点、偶数番目である支出データを前記終点に対応させて、前記支出データ群同士を区分する分類をする
    ことを特徴とする請求項に記載の旅程推定装置。
  3. 前記分類部は、抽出された日付情報が連続の関係にある2以上の支出データに含まれる、前記登録場所情報が抽出された支出データの中で、前記時系列の順番が先頭である支出データを前記起点、最後である支出データを前記終点に対応させて、前記支出データ群同士を区分する
    ことを特徴とする請求項1又は2に記載の旅程推定装置。
  4. 前記分類部は、抽出された日付情報が連続の関係にある2つの支出データの各々から、前記登録場所情報が抽出された場合、前記時系列の順番が先である支出データを或る1単位の旅程の終点、後である支出データを別の1単位の旅程の終点に対応させて、前記支出データ群同士を区分する
    ことを特徴とする請求項1から請求項3のいずれか1項に記載の旅程推定装置。
  5. 前記分類部は、抽出された日付情報が連続の関係にある2以上の支出データを、同じ前記支出データ群に分類し、
    前記推定部は、一の前記支出データ群に含まれる各支出データから抽出された日付情報を含む情報に基づいて、1単位の旅程を推定する
    ことを特徴とする請求項1に記載の旅程推定装置。
  6. 支出に関する情報を含む複数の支出データの各々から抽出された日付情報の時系列の順番に従って、前記複数の支出データを、1以上の支出データを含む支出データ群に分類する分類部と、
    分類された前記支出データ群に含まれる各支出データから抽出された日付情報を含む情報に基づいて、少なくとも日付を含む旅程を推定する推定部とを備え、
    前記分類部は、抽出された日付情報が連続の関係にある2以上の支出データを、同じ前記支出データ群に分類し、一の支出データと、前記時系列の順番が次である他の支出データとで、抽出された日付情報が連続の関係にない場合でも、各々から抽出された日付情報を宿泊の期間に含むことを示す支出データが存在したときは、当該一の支出データ、及び当該他の支出データを、同じ前記支出データ群に分類する
    ことを特徴とする旅程推定装置。
  7. 旅程の起点又は終点となり得る場所を登録する登録部を備え、
    前記分類部は、一の支出データと、前記時系列の順番が次である他の支出データとで、抽出された日付情報が連続の関係にない場合でも、当該一の支出データ、及び当該他の支出データから抽出された場所情報が示す場所が共通し、且つ登録された前記場所からの遠隔地を示すときは、当該一の支出データ、及び当該他の支出データを、同じ前記支出データ群に分類する
    ことを特徴とする請求項5又は6に記載の旅程推定装置。
  8. 前記推定部は、一の前記支出データ群に含まれる各支出データから抽出された複数の場所情報の地理的な関係から推定される移動の経路に基づいて、1単位の旅程を推定する
    ことを特徴とする請求項1から請求項7のいずれか1項に記載の旅程推定装置。
  9. 支出に関する情報を含む複数の支出データの各々から抽出された日付情報の時系列の順番に従って、前記複数の支出データを、1以上の支出データを含む支出データ群に分類する分類部と、
    分類された前記支出データ群に含まれる各支出データから抽出された日付情報を含む情報に基づいて、少なくとも日付を含む旅程を推定する推定部とを備え、
    前記推定部は、一の支出データから抽出されなかった場所情報を、同じ前記支出データ群に分類された他の支出データから抽出された場所情報に基づいて補完する
    ことを特徴とする旅程推定装置。
  10. 支出に関する情報を含む複数の支出データの各々から抽出された日付情報の時系列の順番に従って、前記複数の支出データを、1以上の支出データを含む支出データ群に分類する分類部と、
    分類された前記支出データ群に含まれる各支出データから抽出された日付情報を含む情報に基づいて、少なくとも日付を含む旅程を推定する推定部とを備え、
    前記推定部は、一の支出データから抽出されなかった日付情報を、抽出された場所情報が示す場所が共通する他の支出データから抽出された日付情報に基づいて補完する
    ことを特徴とする旅程推定装置。
  11. 支出に関する情報を含む複数の支出データの各々から抽出された日付情報の時系列の順番に従って、前記複数の支出データを、1以上の支出データを含む支出データ群に分類する分類部と、
    分類された前記支出データ群に含まれる各支出データから抽出された日付情報を含む情報に基づいて、少なくとも日付を含む旅程を推定する推定部とを備え、
    前記推定部は、画像に含まれる文字を認識して一の支出データから抽出された場所情報を、同じ前記支出データ群に含まれる他の支出データから抽出された場所情報に基づいて訂正する
    ことを特徴とする旅程推定装置。
  12. 支出に関する情報を含む複数の支出データの各々から抽出された日付情報の時系列の順番に従って、前記複数の支出データを、1以上の支出データを含む支出データ群に分類する分類部と、
    分類された前記支出データ群に含まれる各支出データから抽出された日付情報を含む情報に基づいて、少なくとも日付を含む旅程を推定する推定部とを備え、
    前記推定部は、
    画像に含まれる文字を認識して一の支出データから抽出された日付情報を、抽出された場所情報が示す場所が共通する他の支出データから抽出された日付情報に基づいて訂正する
    ことを特徴とする旅程推定装置。
  13. 前記推定部は、前記複数の支出データから、旅程の推定に使用しない支出データを除外する
    ことを特徴とする請求項1から請求項12のいずれか1項に記載の旅程推定装置。
  14. 前記推定部は、一の前記支出データ群に含まれる各支出データから抽出された複数の場所情報の地理的な関係に基づいて、一部の場所情報が抽出された支出データを除外する
    ことを特徴とする請求項13に記載の旅程推定装置。
  15. 前記推定部は、前記支出データに含まれる前記支出の項目に基づいて、前記使用しない支出データを除外する
    ことを特徴とする請求項13又は請求項14に記載の旅程推定装置。
  16. 一の支出データから抽出されなかった情報が存在する場合、当該情報を問い合わせる問い合わせ部と、
    前記問い合わせに対する回答を受け付ける回答受付部と
    を備え、
    前記推定部は、受け付けられた前記回答に基づいて、前記抽出されなかった情報を補完する
    ことを特徴とする請求項1から請求項15のいずれか1項に記載の旅程推定装置。
  17. 一の前記支出データ群に基づいて複数通りの旅程が推定された場合、当該複数通りの旅程を提示する提示部と、
    提示された前記複数通りの旅程の中からいずれかの旅程の選択を受け付ける選択受付部と、
    受け付けられた前記選択に基づいて旅程の情報を出力する処理を行う出力処理部と
    を備えることを特徴とする請求項1から請求項16のいずれか1項に記載の旅程推定装置。
  18. コンピュータに、
    旅程の起点又は終点となり得る場所を登録するステップと、
    支出に関する情報を含む複数の支出データの各々から抽出された日付情報の時系列の順番に従って、前記複数の支出データを、1以上の支出データを含む支出データ群に分類するステップと、
    分類した前記支出データ群に含まれる各支出データから抽出された日付情報を含む情報に基づいて、少なくとも日付を含む旅程を推定するステップとを実行させるためのプログラムであって、
    前記分類するステップは、登録された前記場所を示す登録場所情報が抽出された支出データによって前記支出データ群同士を区分する分類をし、
    前記推定するステップは、一の前記支出データ群に含まれる各支出データから抽出された日付情報及び場所情報を含む情報に基づいて、1単位の旅程を推定する
    ことを特徴とするプログラム。
JP2015058239A 2015-03-20 2015-03-20 旅程推定装置及びプログラム Active JP6575091B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2015058239A JP6575091B2 (ja) 2015-03-20 2015-03-20 旅程推定装置及びプログラム
US14/820,788 US9811725B2 (en) 2015-03-20 2015-08-07 Itinerary estimation device and method, non-transitory computer-readable medium, and information classification method
AU2015218443A AU2015218443B2 (en) 2015-03-20 2015-08-25 Itinerary estimation device and method, program, and information classification method
CN201510570370.3A CN105989461A (zh) 2015-03-20 2015-09-09 行程估计装置和方法以及信息分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015058239A JP6575091B2 (ja) 2015-03-20 2015-03-20 旅程推定装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2016177629A JP2016177629A (ja) 2016-10-06
JP6575091B2 true JP6575091B2 (ja) 2019-09-18

Family

ID=56923950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015058239A Active JP6575091B2 (ja) 2015-03-20 2015-03-20 旅程推定装置及びプログラム

Country Status (4)

Country Link
US (1) US9811725B2 (ja)
JP (1) JP6575091B2 (ja)
CN (1) CN105989461A (ja)
AU (1) AU2015218443B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6298910B1 (ja) * 2017-03-29 2018-03-20 株式会社リクルートホールディングス 顧客の利用シーンを判定するためのシステム、方法、及びプログラム
JP6899074B2 (ja) * 2017-12-07 2021-07-07 トヨタ自動車株式会社 管理システム、管理方法、及び管理プログラム
CN108805519B (zh) * 2018-05-18 2021-09-28 赵崇标 纸质日程表电子化生成方法、装置及电子日程表生成方法
US11144715B2 (en) * 2018-11-29 2021-10-12 ProntoForms Inc. Efficient data entry system for electronic forms

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002083100A (ja) * 2000-07-03 2002-03-22 Ntt Docomo Inc 移動経路情報生成方法、移動経路情報生成装置、交通費算出方法、交通費算出装置、プログラム及び記録媒体
JP2003022352A (ja) * 2001-07-06 2003-01-24 Toshiba Eng Co Ltd 出張管理システム
AU2003280003A1 (en) * 2002-10-21 2004-07-09 Leslie Spero System and method for capture, storage and processing of receipts and related data
US7693794B2 (en) * 2003-06-13 2010-04-06 Sap Ag Computer system and computer-implemented method for creating travel-expense statements
US20080208643A1 (en) * 2007-02-22 2008-08-28 Amadeus S.A.S Follow your stars
US8503797B2 (en) * 2007-09-05 2013-08-06 The Neat Company, Inc. Automatic document classification using lexical and physical features
JP2009199137A (ja) * 2008-02-19 2009-09-03 Brother Ind Ltd 無線タグ及び経路書類作成システム
JP5454183B2 (ja) * 2010-02-04 2014-03-26 株式会社デンソー 行程計画装置、その方法、およびそのプログラム
JP5268164B2 (ja) 2010-10-21 2013-08-21 キヤノンマーケティングジャパン株式会社 情報処理システム、情報処理方法、情報処理装置及びプログラム
JP5785869B2 (ja) * 2011-12-22 2015-09-30 株式会社日立製作所 行動属性分析プログラムおよび装置
JP2014029601A (ja) * 2012-07-31 2014-02-13 Mizuho Information & Research Institute Inc 交通費精算システム、交通費精算方法及び交通費精算プログラム
US20140101004A1 (en) * 2012-10-08 2014-04-10 Tina Marseille Aggregation of related data items
US20140101002A1 (en) * 2012-10-08 2014-04-10 Carsten Schmitt Intelligent handling of unstructured data items
JP6021624B2 (ja) * 2012-12-12 2016-11-09 株式会社日本総合研究所 行動支援装置、行動支援方法、およびプログラム

Also Published As

Publication number Publication date
CN105989461A (zh) 2016-10-05
JP2016177629A (ja) 2016-10-06
US9811725B2 (en) 2017-11-07
AU2015218443B2 (en) 2017-06-29
US20160275346A1 (en) 2016-09-22
AU2015218443A1 (en) 2016-10-06

Similar Documents

Publication Publication Date Title
JP6575091B2 (ja) 旅程推定装置及びプログラム
US20180172458A1 (en) Travel planning system, travel planning method, and program
US9064239B2 (en) Printing system and business partner selection method that selects optimum business partner capable of delivering high-quality printed materials
CN105468580A (zh) 基于关注点信息提供服务的方法和装置
JP6243261B2 (ja) 買物支援装置及びプログラム
US20170293965A1 (en) Shopping support device and shopping support method
JP5145820B2 (ja) 買物支援システム、およびプログラム
US20180068369A1 (en) Shopping support device and shopping support method
WO2020175599A1 (ja) プログラム、情報処理方法及びサーバ装置
US20150108213A1 (en) Shopping support device and shopping support method
JP6649235B2 (ja) 業務支援システム、業務支援装置、及びプログラム
JPWO2018172906A1 (ja) 行動管理方法、行動管理装置、並びに決済補助コンピュータ
JP6223118B2 (ja) 買物支援システム
US8867093B2 (en) Printing system and business partner selection method that selects an optimum business partner capable of delivering high-quality printed materials
JP6180343B2 (ja) サーバ装置、及びプログラム
KR101839210B1 (ko) 구인 구직 정보 제공 방법 및 장치
JP4372750B2 (ja) エントリデータ管理装置及びエントリデータ管理方法、プログラム、並びに記録媒体
KR102224587B1 (ko) 여행 계획 생성 관리 서비스 제공 방법 및 여행 계획 생성 관리 서비스 제공 시스템
JP6329876B2 (ja) 旅行パッケージプラン提供システム及び旅行パッケージプラン提供方法
KR102527365B1 (ko) 물품 배송 서비스 시스템, 서버 및 방법
JP7476961B2 (ja) 情報処理装置、情報処理方法及びプログラム
US20230015057A1 (en) Information Processing Device, Information Processing Method and Non-Transitory Computer-Readable Storage Medium
JP2019079343A (ja) 情報提供方法、情報提供プログラム及び電子機器
JP2007058259A (ja) スケジュール登録装置及びスケジュール登録方法
US20230379869A1 (en) Retrieval apparatus, retrieval method, and non-transitory storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190507

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190723

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190805

R150 Certificate of patent or registration of utility model

Ref document number: 6575091

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350