JP5398638B2 - 記号入力支援装置、記号入力支援方法、及びプログラム - Google Patents
記号入力支援装置、記号入力支援方法、及びプログラム Download PDFInfo
- Publication number
- JP5398638B2 JP5398638B2 JP2010119800A JP2010119800A JP5398638B2 JP 5398638 B2 JP5398638 B2 JP 5398638B2 JP 2010119800 A JP2010119800 A JP 2010119800A JP 2010119800 A JP2010119800 A JP 2010119800A JP 5398638 B2 JP5398638 B2 JP 5398638B2
- Authority
- JP
- Japan
- Prior art keywords
- symbol
- sentence
- input
- insertion position
- input support
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Input From Keyboards Or The Like (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、前記記号入力支援装置は、前記挿入記号選定手段により特定された記号と挿入位置とを用いて、前記入力文に記号を挿入する文字列変換手段を更に備えるようにしてもよい。
図1は本発明の実施の形態における、入力された文字列の適切な位置に文脈に沿った記号を挿入する記号入力支援装置10の機能構成図を示す。
以下、図5に示すフローチャートを参照して、図1の構成を有する記号入力支援装置10の動作の概要を説明する。
次に、記号出現頻度学習部3の処理動作について詳細に説明する。
記号出現頻度学習部3は、学習用データ格納部6に格納された記号一覧の記号を含むテキスト集合を用いて学習を行うことにより、与えられた入力文の最適な位置に、文脈に沿った記号を挿入するためのモデルを学習結果として生成する。この学習では、テキスト集合に出現する記号一覧の記号それぞれについて、単語との共起情報、該記号がどのようなコンテクストによって出現したかというコンテクスト情報、該記号と記号ごとに与えられた語義辞書中の語との共起情報を算出し、算出結果を学習結果格納部7に格納する。
図7に、共起する単語と、共起関係の算出結果の例を示す。例えば、図7において、IDが1の欄の記号と単語(送る)の共起関係は、上記式の算出結果としての確率(3/1000)として表されている。
図8に、左右の語との共起関係の算出結果の例を示し、図9に、左右の品詞ごとの共起関係の算出結果の例を示す。
(挿入記号選定部4の動作詳細)
次に、挿入記号選定部4の処理動作を詳細に説明する。
以下、図13のフローチャートに沿って、挿入記号選定部4が実行する形態素区切りごとの記号特定処理(図10のステップ32)をより詳細に説明する。
ステップ42) 挿入記号選定部4は、特定の記号入力位置候補に、記号一覧中の各記号(c1, c2, c3, ..., cj)が挿入された場合の、共起単語情報、コンテクスト情報、記号辞書中の語との共起情報を、学習結果格納部7に格納された学習結果を用いて算出し、該記号が入力文に挿入された場合の文特徴量を記号ごとに算出する。算出方法は、式(9)のとおりであり、文特徴量は記号の出現確率として算出される。なお、文特徴量の算出において、要素ベクトルの各ベクトル要素であるP(xt|ci)が存在しない場合は、0または、微小な値を与える。
ステップ44)挿入記号選定部4は、ステップ43で特定された記号の、該記号が入力文に挿入された場合の文特徴量が、予め定めた閾値以上であるか否かを確認する。
次に、図14のフローチャートに沿って、挿入記号選定部4が実行する内容語形態素ごとの記号特定処理(図10のステップ33)をより詳細に説明する。
(文字列変換部5の動作詳細)
続いて、文字列変換部5の処理動作を詳細に説明する。
本実施の形態に係る技術によれば、記号を特定する際に、事前に、記号と文特徴量の関係性や、記号と出現位置の関係性、記号と役割の関係性を学習し、学習結果に基づいて挿入を行うため、文章の内容を考慮し、記号の実際の使われ方を反映した結果を得ることができる。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
2 出力部
3 記号出現頻度学習部
4 挿入記号選定部
5 文字列変換部
6 学習用データ格納部
7 学習結果格納部
8 語義辞書格納部
9 変換候補記号格納部
10 記号入力支援装置
Claims (9)
- 入力文に記号を挿入するための記号入力支援装置であって、
学習用の文中の各記号について、共起する単語との出現頻度を表す共起単語情報と、コンテクスト情報と、当該記号と記号ごとに与えられた所定の辞書中の語との共起情報とを算出し、算出結果を学習結果として学習結果格納手段に格納する記号出現頻度学習手段と、
前記入力文中における記号挿入位置候補の位置ごとに、挿入対象である各記号について、前記学習結果格納手段に格納された前記学習結果を用いて、前記記号挿入位置候補の各位置に記号を挿入した場合における文特徴量を算出し、当該文特徴量に基づき、挿入に最も適した記号と挿入位置を特定し、当該記号と挿入位置とを変換候補記号格納手段に格納する挿入記号選定手段と、
を備えたことを特徴とする記号入力支援装置。 - 前記挿入記号選定手段は、前記入力文において前記記号挿入位置候補の位置に記号が挿入された場合における、共起単語情報、コンテクスト情報、前記所定の辞書中の語との共起情報を、前記学習結果を用いて求め、これらの情報に基づく記号出現確率を前記文特徴量として算出することを特徴とする請求項1に記載の記号入力支援装置。
- 前記挿入記号選定手段により特定された記号と挿入位置とを用いて、前記入力文に記号を挿入する文字列変換手段を更に備えたことを特徴とする請求項1又は2に記載の記号入力支援装置。
- 前記文字列変換手段は、前記挿入記号選定手段により、複数の同一の記号が特定された場合において、当該複数の同一の記号に対応するそれぞれの文特徴量に基づいて、当該複数の同一の記号のうちの1つの記号を選択し、当該記号を、前記入力文における当該記号に対応する挿入位置に挿入することを特徴とする請求項3に記載の記号入力支援装置。
- 入力文に記号を挿入するための記号入力支援装置が実行する記号入力支援方法であって、
学習用の文中の各記号について、共起する単語との出現頻度を表す共起単語情報と、コンテクスト情報と、当該記号と記号ごとに与えられた所定の辞書中の語との共起情報とを算出し、算出結果を学習結果として学習結果格納手段に格納する記号出現頻度学習ステップと、
前記入力文中における記号挿入位置候補の位置ごとに、挿入対象である各記号について、前記学習結果格納手段に格納された前記学習結果を用いて、前記記号挿入位置候補の各位置に記号を挿入した場合における文特徴量を算出し、当該文特徴量に基づき、挿入に最も適した記号と挿入位置を特定し、当該記号と挿入位置とを変換候補記号格納手段に格納する挿入記号選定ステップと、
を備えたことを特徴とする記号入力支援方法。 - 前記挿入記号選定ステップにおいて、前記記号入力支援装置は、前記入力文において前記記号挿入位置候補の位置に記号が挿入された場合における、共起単語情報、コンテクスト情報、前記所定の辞書中の語との共起情報を、前記学習結果を用いて求め、これらの情報に基づく記号出現確率を前記文特徴量として算出することを特徴とする請求項5に記載の記号入力支援方法。
- 前記挿入記号選定ステップにより特定された記号と挿入位置とを用いて、前記入力文に記号を挿入する文字列変換ステップを更に備えたことを特徴とする請求項5又は6に記載の記号入力支援方法。
- 前記文字列変換ステップにおいて、前記記号入力支援装置は、前記挿入記号選定ステップにより、複数の同一の記号が特定された場合において、当該複数の同一の記号に対応するそれぞれの文特徴量に基づいて、当該複数の同一の記号のうちの1つの記号を選択し、当該記号を、前記入力文における当該記号に対応する挿入位置に挿入することを特徴とする請求項7に記載の記号入力支援方法。
- コンピュータに、請求項5ないし8のうちいずれか1項に記載の記号入力支援方法における各ステップを実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010119800A JP5398638B2 (ja) | 2010-05-25 | 2010-05-25 | 記号入力支援装置、記号入力支援方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010119800A JP5398638B2 (ja) | 2010-05-25 | 2010-05-25 | 記号入力支援装置、記号入力支援方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011248538A JP2011248538A (ja) | 2011-12-08 |
JP5398638B2 true JP5398638B2 (ja) | 2014-01-29 |
Family
ID=45413732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010119800A Expired - Fee Related JP5398638B2 (ja) | 2010-05-25 | 2010-05-25 | 記号入力支援装置、記号入力支援方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5398638B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130159919A1 (en) | 2011-12-19 | 2013-06-20 | Gabriel Leydon | Systems and Methods for Identifying and Suggesting Emoticons |
US9043196B1 (en) | 2014-07-07 | 2015-05-26 | Machine Zone, Inc. | Systems and methods for identifying and suggesting emoticons |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5290570B2 (ja) * | 2007-12-26 | 2013-09-18 | 京セラ株式会社 | 絵文字入力支援装置、絵文字入力支援方法、およびプログラム |
JPWO2009122779A1 (ja) * | 2008-04-03 | 2011-07-28 | 日本電気株式会社 | テキストデータ処理装置、方法、プログラム |
JP5267450B2 (ja) * | 2009-12-28 | 2013-08-21 | 株式会社デンソー | 電子機器及びプログラム |
-
2010
- 2010-05-25 JP JP2010119800A patent/JP5398638B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011248538A (ja) | 2011-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190287142A1 (en) | Method, apparatus for evaluating review, device and storage medium | |
CN110634487B (zh) | 一种双语种混合语音识别方法、装置、设备及存储介质 | |
US9626152B2 (en) | Methods and systems for recommending responsive sticker | |
US8935148B2 (en) | Computer-assisted natural language translation | |
CN110705206B (zh) | 一种文本信息的处理方法及相关装置 | |
EP2329489A1 (en) | Stochastic phoneme and accent generation using accent class | |
CN114595327A (zh) | 数据增强方法和装置、电子设备、存储介质 | |
JP5564705B2 (ja) | 文構造解析装置、文構造解析方法および文構造解析プログラム | |
JP2007156545A (ja) | 記号列変換方法、単語翻訳方法、その装置およびそのプログラム並びに記録媒体 | |
CN116561275A (zh) | 对象理解方法、装置、设备及存储介质 | |
KR20170008357A (ko) | 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 | |
Yessenbayev et al. | KazNLP: A pipeline for automated processing of texts written in Kazakh language | |
CN116579327B (zh) | 文本纠错模型训练方法、文本纠错方法、设备及存储介质 | |
JP5398638B2 (ja) | 記号入力支援装置、記号入力支援方法、及びプログラム | |
Pereira-Noriega et al. | Ship-LemmaTagger: Building an NLP toolkit for a Peruvian native language | |
CN112559711A (zh) | 一种同义文本提示方法、装置及电子设备 | |
KR20120045906A (ko) | 코퍼스 오류 교정 장치 및 그 방법 | |
CN108021609B (zh) | 文本情感分类方法、装置、计算机设备和存储介质 | |
Almansor et al. | Transferring informal text in arabic as low resource languages: State-of-the-art and future research directions | |
KR102519955B1 (ko) | 토픽 키워드의 추출 장치 및 방법 | |
JP4478042B2 (ja) | 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置 | |
CN115034209A (zh) | 文本分析方法、装置、电子设备以及存储介质 | |
JP5538268B2 (ja) | 文書要約装置、文書要約方法、及びプログラム | |
JP5320326B2 (ja) | 記号変換装置、記号変換方法、記号変換プログラム | |
JP5302784B2 (ja) | 機械翻訳方法、及びシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121106 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20131001 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131007 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131015 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131022 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5398638 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |