JP2013097395A5 - - Google Patents

Download PDF

Info

Publication number
JP2013097395A5
JP2013097395A5 JP2011236417A JP2011236417A JP2013097395A5 JP 2013097395 A5 JP2013097395 A5 JP 2013097395A5 JP 2011236417 A JP2011236417 A JP 2011236417A JP 2011236417 A JP2011236417 A JP 2011236417A JP 2013097395 A5 JP2013097395 A5 JP 2013097395A5
Authority
JP
Japan
Prior art keywords
word string
word
teacher
words
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011236417A
Other languages
English (en)
Other versions
JP2013097395A (ja
JP5834772B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2011236417A priority Critical patent/JP5834772B2/ja
Priority claimed from JP2011236417A external-priority patent/JP5834772B2/ja
Priority to US13/656,893 priority patent/US20130110499A1/en
Publication of JP2013097395A publication Critical patent/JP2013097395A/ja
Publication of JP2013097395A5 publication Critical patent/JP2013097395A5/ja
Application granted granted Critical
Publication of JP5834772B2 publication Critical patent/JP5834772B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

上記目的を達成するため、本願発明に係る情報処理装置は、
複数の単語を有する単語列を取得する単語列取得部と、
前記単語列取得部が取得した語列に含まれる1以上の単語を含む部分単語列を複数抽出する抽出部と、
単語列を構成する単語と単語との間である語間それぞれで単語列が区切れる場合と区切れない場合とのそれぞれの区切り方に対応する区切パターンを、前記抽出部が抽出した部分単語列それぞれについて取得し、当該区切パターンに対応する区切り方で当該部分単語列が区切れる確からしさの程度を示す区切確率係数を、当該抽出した区切パターンそれぞれについて取得する確率係数取得部と、
前記確率係数取得部が取得した区切確率係数に基づいて、前記単語列取得部が取得した単語列を分割する分割部と、
を備えることを特徴とする。

Claims (7)

  1. 複数の単語を有する単語列を取得する単語列取得部と、
    前記単語列取得部が取得した語列に含まれる1以上の単語を含む部分単語列を複数抽出する抽出部と、
    単語列を構成する単語と単語との間である語間それぞれで単語列が区切れる場合と区切れない場合とのそれぞれの区切り方に対応する区切パターンを、前記抽出部が抽出した部分単語列それぞれについて取得し、当該区切パターンに対応する区切り方で当該部分単語列が区切れる確からしさの程度を示す区切確率係数を、当該抽出した区切パターンそれぞれについて取得する確率係数取得部と、
    前記確率係数取得部が取得した区切確率係数に基づいて、前記単語列取得部が取得した単語列を分割する分割部と、
    を備えることを特徴とする情報処理装置。
  2. 前記単語列と同一カテゴリに属する単語列であって、当該単語列の語間のそれぞれで単語列が区切れるか否かを定義した教師単語列を記憶している教師単語列記憶部を備え、
    前記確率係数取得部は、前記教師単語列記憶部から前記区切パターンと同じパターンを有する教師単語列を抽出し、抽出した教師単語列の数に基づいて区切確率係数を取得する、
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 記抽出部が抽出した部分単語列についての前記区切確率係数を取得するために十分な数の教師単語列が前記教師単語列記憶部にあるか判別する判別部をさらに備え、
    前記抽出部は、前記判別部が前記区切確率係数を取得するために十分な数の教師単語列がないと判別すると、当該抽出した部分単語列の部分単語列をさらに抽出する、
    ことを特徴とする請求項に記載の情報処理装置。
  4. 前記教師単語列記憶部に記憶されている教師単語列の数が十分でない場合であって、前記抽出した部分単語列の単語数が1の場合には、前記確率係数取得部は、前記区切確率係数に規定値を設定する、
    ことを特徴とする請求項3に記載の情報処理装置。
  5. 前記抽出部が抽出する部分単語列がそれぞれ同一数の単語から構成される、
    ことを特徴とする請求項1乃至4の何れか一項に記載の情報処理装置。
  6. 前記語列と前記教師単語列とが献立を表現する単語列である、
    ことを特徴とする請求項乃至の何れか一項に記載の情報処理装置。
  7. コンピュータに、
    複数の単語を有する単語列を取得する処理、
    前記取得した語列に含まれる1以上の単語を含む部分単語列を複数抽出する処理、
    単語列を構成する単語と単語との間である語間それぞれで単語列が区切れる場合と区切れない場合とのそれぞれの区切り方に対応する区切パターンを、前記抽出した部分単語列それぞれについて取得し、当該区切パターンに対応する区切り方で当該部分単語列が区切れる確からしさの程度を示す区切確率係数を、当該抽出した区切パターンそれぞれについて取得する処理、
    前記取得した区切確率係数に基づいて、前記取得した単語列を分割する処理
    を実行させることを特徴とするプログラム。
JP2011236417A 2011-10-27 2011-10-27 情報処理装置及びプログラム Active JP5834772B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011236417A JP5834772B2 (ja) 2011-10-27 2011-10-27 情報処理装置及びプログラム
US13/656,893 US20130110499A1 (en) 2011-10-27 2012-10-22 Information processing device, information processing method and information recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011236417A JP5834772B2 (ja) 2011-10-27 2011-10-27 情報処理装置及びプログラム

Publications (3)

Publication Number Publication Date
JP2013097395A JP2013097395A (ja) 2013-05-20
JP2013097395A5 true JP2013097395A5 (ja) 2014-12-04
JP5834772B2 JP5834772B2 (ja) 2015-12-24

Family

ID=48619319

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011236417A Active JP5834772B2 (ja) 2011-10-27 2011-10-27 情報処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5834772B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5870744B2 (ja) * 2012-02-20 2016-03-01 カシオ計算機株式会社 情報処理装置及びプログラム
JP5927955B2 (ja) * 2012-02-06 2016-06-01 カシオ計算機株式会社 情報処理装置及びプログラム
JP5978645B2 (ja) * 2012-02-22 2016-08-24 カシオ計算機株式会社 情報処理装置、データ表示装置及びプログラム
JP6056291B2 (ja) * 2012-09-11 2017-01-11 カシオ計算機株式会社 情報処理装置、データ表示装置及びプログラム
JP6055267B2 (ja) * 2012-10-19 2016-12-27 株式会社フュートレック 文字列分割装置、モデルファイル学習装置および文字列分割システム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3622503B2 (ja) * 1998-05-29 2005-02-23 株式会社日立製作所 特徴文字列抽出方法および装置とこれを用いた類似文書検索方法および装置並びに特徴文字列抽出プログラムを格納した記憶媒体および類似文書検索プログラムを格納した記憶媒体
JP2001249922A (ja) * 1999-12-28 2001-09-14 Matsushita Electric Ind Co Ltd 単語分割方式及び装置
JP4754247B2 (ja) * 2004-03-31 2011-08-24 オセ−テクノロジーズ ビーブイ 複合語を構成する単語を割り出す装置及びコンピュータ化された方法
CN102859515B (zh) * 2010-02-12 2016-01-13 谷歌公司 复合词拆分

Similar Documents

Publication Publication Date Title
JP2008287744A5 (ja)
JP2016508264A5 (ja)
JP2016528567A5 (ja)
JP2013097395A5 (ja)
JP2018124681A5 (ja) 演算処理装置、方法、およびプログラム
MX2016004667A (es) Metodo y dispositivo para construir una plantilla, metodo y dispositivo para identificar informacion.
CN105264518B (zh) 数据处理装置及故事模型构建方法
WO2014210548A3 (en) Extracting card data using card art
JP2018128996A5 (ja)
WO2016177337A8 (en) System and method for image segmentation
JP2014016822A5 (ja) 画像処理装置、画像処理方法、プログラム
RU2013111932A (ru) Система и способ для автоматической регистрации анатомических точек в объемных медицинских изображениях
WO2015102919A3 (en) Modular image analysis system and method
WO2015191746A8 (en) Systems and methods for a database of software artifacts
GB2529981A (en) System and method for generating a rhythmic accompaniment for a musical performance
GB201302725D0 (en) Methods of graph processing
CN104217224B8 (zh) 使用多机器学习核的光刻热点检测
JP2013175108A5 (ja)
JP2014016800A5 (ja)
RU2017145307A (ru) Кодирование коэффициентов преобразования
JP2017188137A5 (ja)
JP6397385B2 (ja) 学習装置、探索装置、方法、及びプログラム
JP2013538482A5 (ja)
EP2746989A3 (en) Document processing device, image processing apparatus, document processing method and computer program product
JP2012243033A5 (ja)