JP2013097395A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2013097395A5 JP2013097395A5 JP2011236417A JP2011236417A JP2013097395A5 JP 2013097395 A5 JP2013097395 A5 JP 2013097395A5 JP 2011236417 A JP2011236417 A JP 2011236417A JP 2011236417 A JP2011236417 A JP 2011236417A JP 2013097395 A5 JP2013097395 A5 JP 2013097395A5
- Authority
- JP
- Japan
- Prior art keywords
- word string
- word
- teacher
- words
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Description
上記目的を達成するため、本願発明に係る情報処理装置は、
複数の単語を有する単語列を取得する単語列取得部と、
前記単語列取得部が取得した単語列に含まれる1以上の単語を含む部分単語列を複数抽出する抽出部と、
単語列を構成する単語と単語との間である語間それぞれで単語列が区切れる場合と区切れない場合とのそれぞれの区切り方に対応する区切パターンを、前記抽出部が抽出した部分単語列それぞれについて取得し、当該区切パターンに対応する区切り方で当該部分単語列が区切れる確からしさの程度を示す区切確率係数を、当該抽出した区切パターンそれぞれについて取得する確率係数取得部と、
前記確率係数取得部が取得した区切確率係数に基づいて、前記単語列取得部が取得した単語列を分割する分割部と、
を備えることを特徴とする。
複数の単語を有する単語列を取得する単語列取得部と、
前記単語列取得部が取得した単語列に含まれる1以上の単語を含む部分単語列を複数抽出する抽出部と、
単語列を構成する単語と単語との間である語間それぞれで単語列が区切れる場合と区切れない場合とのそれぞれの区切り方に対応する区切パターンを、前記抽出部が抽出した部分単語列それぞれについて取得し、当該区切パターンに対応する区切り方で当該部分単語列が区切れる確からしさの程度を示す区切確率係数を、当該抽出した区切パターンそれぞれについて取得する確率係数取得部と、
前記確率係数取得部が取得した区切確率係数に基づいて、前記単語列取得部が取得した単語列を分割する分割部と、
を備えることを特徴とする。
Claims (7)
- 複数の単語を有する単語列を取得する単語列取得部と、
前記単語列取得部が取得した単語列に含まれる1以上の単語を含む部分単語列を複数抽出する抽出部と、
単語列を構成する単語と単語との間である語間それぞれで単語列が区切れる場合と区切れない場合とのそれぞれの区切り方に対応する区切パターンを、前記抽出部が抽出した部分単語列それぞれについて取得し、当該区切パターンに対応する区切り方で当該部分単語列が区切れる確からしさの程度を示す区切確率係数を、当該抽出した区切パターンそれぞれについて取得する確率係数取得部と、
前記確率係数取得部が取得した区切確率係数に基づいて、前記単語列取得部が取得した単語列を分割する分割部と、
を備えることを特徴とする情報処理装置。 - 前記単語列と同一カテゴリに属する単語列であって、当該単語列の語間のそれぞれで単語列が区切れるか否かを定義した教師単語列を記憶している教師単語列記憶部を備え、
前記確率係数取得部は、前記教師単語列記憶部から前記区切パターンと同じパターンを有する教師単語列を抽出し、抽出した教師単語列の数に基づいて区切確率係数を取得する、
ことを特徴とする請求項1に記載の情報処理装置。 - 前記抽出部が抽出した部分単語列についての前記区切確率係数を取得するために十分な数の教師単語列が前記教師単語列記憶部にあるか判別する判別部をさらに備え、
前記抽出部は、前記判別部が前記区切確率係数を取得するために十分な数の教師単語列がないと判別すると、当該抽出した部分単語列の部分単語列をさらに抽出する、
ことを特徴とする請求項2に記載の情報処理装置。 - 前記教師単語列記憶部に記憶されている教師単語列の数が十分でない場合であって、前記抽出した部分単語列の単語数が1の場合には、前記確率係数取得部は、前記区切確率係数に規定値を設定する、
ことを特徴とする請求項3に記載の情報処理装置。 - 前記抽出部が抽出する部分単語列がそれぞれ同一数の単語から構成される、
ことを特徴とする請求項1乃至4の何れか一項に記載の情報処理装置。 - 前記単語列と前記教師単語列とが献立を表現する単語列である、
ことを特徴とする請求項2乃至4の何れか一項に記載の情報処理装置。 - コンピュータに、
複数の単語を有する単語列を取得する処理、
前記取得した単語列に含まれる1以上の単語を含む部分単語列を複数抽出する処理、
単語列を構成する単語と単語との間である語間それぞれで単語列が区切れる場合と区切れない場合とのそれぞれの区切り方に対応する区切パターンを、前記抽出した部分単語列それぞれについて取得し、当該区切パターンに対応する区切り方で当該部分単語列が区切れる確からしさの程度を示す区切確率係数を、当該抽出した区切パターンそれぞれについて取得する処理、
前記取得した区切確率係数に基づいて、前記取得した単語列を分割する処理、
を実行させることを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011236417A JP5834772B2 (ja) | 2011-10-27 | 2011-10-27 | 情報処理装置及びプログラム |
US13/656,893 US20130110499A1 (en) | 2011-10-27 | 2012-10-22 | Information processing device, information processing method and information recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011236417A JP5834772B2 (ja) | 2011-10-27 | 2011-10-27 | 情報処理装置及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2013097395A JP2013097395A (ja) | 2013-05-20 |
JP2013097395A5 true JP2013097395A5 (ja) | 2014-12-04 |
JP5834772B2 JP5834772B2 (ja) | 2015-12-24 |
Family
ID=48619319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011236417A Active JP5834772B2 (ja) | 2011-10-27 | 2011-10-27 | 情報処理装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5834772B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5870744B2 (ja) * | 2012-02-20 | 2016-03-01 | カシオ計算機株式会社 | 情報処理装置及びプログラム |
JP5927955B2 (ja) * | 2012-02-06 | 2016-06-01 | カシオ計算機株式会社 | 情報処理装置及びプログラム |
JP5978645B2 (ja) * | 2012-02-22 | 2016-08-24 | カシオ計算機株式会社 | 情報処理装置、データ表示装置及びプログラム |
JP6056291B2 (ja) * | 2012-09-11 | 2017-01-11 | カシオ計算機株式会社 | 情報処理装置、データ表示装置及びプログラム |
JP6055267B2 (ja) * | 2012-10-19 | 2016-12-27 | 株式会社フュートレック | 文字列分割装置、モデルファイル学習装置および文字列分割システム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3622503B2 (ja) * | 1998-05-29 | 2005-02-23 | 株式会社日立製作所 | 特徴文字列抽出方法および装置とこれを用いた類似文書検索方法および装置並びに特徴文字列抽出プログラムを格納した記憶媒体および類似文書検索プログラムを格納した記憶媒体 |
JP2001249922A (ja) * | 1999-12-28 | 2001-09-14 | Matsushita Electric Ind Co Ltd | 単語分割方式及び装置 |
JP4754247B2 (ja) * | 2004-03-31 | 2011-08-24 | オセ−テクノロジーズ ビーブイ | 複合語を構成する単語を割り出す装置及びコンピュータ化された方法 |
CN102859515B (zh) * | 2010-02-12 | 2016-01-13 | 谷歌公司 | 复合词拆分 |
-
2011
- 2011-10-27 JP JP2011236417A patent/JP5834772B2/ja active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008287744A5 (ja) | ||
JP2016508264A5 (ja) | ||
JP2016528567A5 (ja) | ||
JP2013097395A5 (ja) | ||
JP2018124681A5 (ja) | 演算処理装置、方法、およびプログラム | |
MX2016004667A (es) | Metodo y dispositivo para construir una plantilla, metodo y dispositivo para identificar informacion. | |
CN105264518B (zh) | 数据处理装置及故事模型构建方法 | |
WO2014210548A3 (en) | Extracting card data using card art | |
JP2018128996A5 (ja) | ||
WO2016177337A8 (en) | System and method for image segmentation | |
JP2014016822A5 (ja) | 画像処理装置、画像処理方法、プログラム | |
RU2013111932A (ru) | Система и способ для автоматической регистрации анатомических точек в объемных медицинских изображениях | |
WO2015102919A3 (en) | Modular image analysis system and method | |
WO2015191746A8 (en) | Systems and methods for a database of software artifacts | |
GB2529981A (en) | System and method for generating a rhythmic accompaniment for a musical performance | |
GB201302725D0 (en) | Methods of graph processing | |
CN104217224B8 (zh) | 使用多机器学习核的光刻热点检测 | |
JP2013175108A5 (ja) | ||
JP2014016800A5 (ja) | ||
RU2017145307A (ru) | Кодирование коэффициентов преобразования | |
JP2017188137A5 (ja) | ||
JP6397385B2 (ja) | 学習装置、探索装置、方法、及びプログラム | |
JP2013538482A5 (ja) | ||
EP2746989A3 (en) | Document processing device, image processing apparatus, document processing method and computer program product | |
JP2012243033A5 (ja) |