JP6300512B2 - 判定装置、判定方法、及び、プログラム - Google Patents
判定装置、判定方法、及び、プログラム Download PDFInfo
- Publication number
- JP6300512B2 JP6300512B2 JP2013262880A JP2013262880A JP6300512B2 JP 6300512 B2 JP6300512 B2 JP 6300512B2 JP 2013262880 A JP2013262880 A JP 2013262880A JP 2013262880 A JP2013262880 A JP 2013262880A JP 6300512 B2 JP6300512 B2 JP 6300512B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- conversion
- text
- type
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 32
- 238000006243 chemical reaction Methods 0.000 claims description 260
- 238000012937 correction Methods 0.000 claims description 31
- 238000001514 detection method Methods 0.000 description 36
- 230000006854 communication Effects 0.000 description 14
- 238000012545 processing Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 11
- 238000012546 transfer Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000010365 information processing Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
Description
特許文献1 特開2010−176237号公報
12 制御部
14 記憶部
20 文字列生成部
22 取得部
24 判定部
26 修正部
30 文字列リスト
32 誤変換文字列リスト
34 正常変換文字列リスト
110 判定装置
1900 コンピュータ
2000 CPU
2010 ROM
2020 RAM
2030 通信インターフェイス
2040 ハードディスクドライブ
2050 メモリドライブ
2070 入出力チップ
2075 グラフィック・コントローラ
2080 表示部
2082 ホスト・コントローラ
2084 入出力コントローラ
2090 メモリカード
Claims (12)
- 入力されたテキストの種類を判定する判定装置であって、
予め定められた種類のテキストに用いられうる文字列を記憶する記憶装置から前記文字列を取得する取得部と、
入力されたテキスト中に前記文字列が含まれるか否かに基づいて、前記テキストの種類を判定する判定部と、
を備え、
前記取得部は、変換前の文字列の文字コード種別を誤って認識して他の文字コード種別の文字列に誤変換した誤変換文字列を前記記憶装置から取得し、
前記判定部は、入力されたテキスト中に前記誤変換文字列が含まれることを条件として文字コード種別の誤変換を検出する
判定装置。 - 前記判定部は、閾値以上の長さまたは数の前記誤変換文字列が入力されたテキスト中に含まれることを条件として文字コード種別の誤変換を検出する
請求項1に記載の判定装置。 - 前記取得部は、誤変換の種類に対応付けられた誤変換文字列を前記記憶装置から取得し、
前記判定部は、入力されたテキスト中に含まれる誤変換文字列がいずれの種類の誤変換に対応するものであるかに基づいて、誤変換の種類を判定する
請求項1または2に記載の判定装置。 - 前記判定部が判定した誤変換の種類に基づいて、入力されたテキストを変換前の文字コード種別のテキストに戻す修正部を更に備える請求項3に記載の判定装置。
- 前記修正部は、前記判定部が判定した誤変換の種類に基づいて、変換前の文字コード種別に戻したテキストを変換後の文字コード種別の文字列に再変換する請求項4に記載の判定装置。
- 入力されたテキストの種類を判定する判定装置であって、
予め定められた種類のテキストに用いられうる文字列を記憶する記憶装置から前記文字列を取得する取得部と、
入力されたテキスト中に前記文字列が含まれるか否かに基づいて、前記テキストの種類を判定する判定部と、
を備え、
前記取得部は、変換前の文字列の文字コード種別を正しく認識して他の文字コード種別の文字列に変換した正常変換文字列を前記記憶装置から取得し、
前記判定部は、入力されたテキスト中に前記正常変換文字列が含まれることを条件として文字コード種別が正しく変換されたことを検出する
判定装置。 - 入力されたテキストの種類を判定する判定装置であって、
予め定められた種類のテキストに用いられうる文字列を記憶する記憶装置から前記文字列を取得する取得部と、
入力されたテキスト中に前記文字列が含まれるか否かに基づいて、前記テキストの種類を判定する判定部と、
を備え、
前記取得部は、変換前の文字列の文字コード種別を正しく認識して他の文字コード種別の文字列に変換した正常変換文字列を前記記憶装置から取得し、
前記判定部は、入力されたテキストを1以上の文字コード種別で逆変換したテキストに前記正常変換文字列が含まれることを条件として、入力されたテキストの種類を判定する
判定装置。 - 前記取得部は、前記正常変換文字列の文字コード種別を前記記憶装置から取得し、
前記判定部は、前記正常変換文字列の文字コード種別に基づいて、入力されたテキストの誤変換を検出する
請求項7に記載の判定装置。 - コンピュータが入力されたテキストの種類を判定する判定方法であって、
前記コンピュータが、予め定められた種類のテキストに用いられうる文字列を記憶する記憶装置から前記文字列を取得する取得段階と、
前記コンピュータが、入力されたテキスト中に前記文字列が含まれるか否かに基づいて、前記テキストの種類を判定する判定段階と、
を備え、
前記取得段階において、前記コンピュータが、変換前の文字列の文字コード種別を誤って認識して他の文字コード種別の文字列に誤変換した誤変換文字列を前記記憶装置から取得し、
前記判定段階において、前記コンピュータが、入力されたテキスト中に前記誤変換文字列が含まれることを条件として文字コード種別の誤変換を検出する
判定方法。 - コンピュータが入力されたテキストの種類を判定する判定方法であって、
前記コンピュータが、予め定められた種類のテキストに用いられうる文字列を記憶する記憶装置から前記文字列を取得する取得段階と、
前記コンピュータが、入力されたテキスト中に前記文字列が含まれるか否かに基づいて、前記テキストの種類を判定する判定段階と、
を備え、
前記取得段階において、前記コンピュータが、変換前の文字列の文字コード種別を正しく認識して他の文字コード種別の文字列に変換した正常変換文字列を前記記憶装置から取得し、
前記判定段階において、前記コンピュータが、入力されたテキスト中に前記正常変換文字列が含まれることを条件として文字コード種別が正しく変換されたことを検出する
判定方法。 - コンピュータが入力されたテキストの種類を判定する判定方法であって、
前記コンピュータが、予め定められた種類のテキストに用いられうる文字列を記憶する記憶装置から前記文字列を取得する取得段階と、
前記コンピュータが、入力されたテキスト中に前記文字列が含まれるか否かに基づいて、前記テキストの種類を判定する判定段階と、
を備え、
前記取得段階において、前記コンピュータが、変換前の文字列の文字コード種別を正しく認識して他の文字コード種別の文字列に変換した正常変換文字列を前記記憶装置から取得し、
前記判定段階において、前記コンピュータが、入力されたテキストを1以上の文字コード種別で逆変換したテキストに前記正常変換文字列が含まれることを条件として、入力されたテキストの種類を判定する
判定方法。 - コンピュータに、請求項9から11のいずれか一項に記載の判定方法を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013262880A JP6300512B2 (ja) | 2013-12-19 | 2013-12-19 | 判定装置、判定方法、及び、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013262880A JP6300512B2 (ja) | 2013-12-19 | 2013-12-19 | 判定装置、判定方法、及び、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015118625A JP2015118625A (ja) | 2015-06-25 |
JP6300512B2 true JP6300512B2 (ja) | 2018-03-28 |
Family
ID=53531261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013262880A Active JP6300512B2 (ja) | 2013-12-19 | 2013-12-19 | 判定装置、判定方法、及び、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6300512B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04267429A (ja) * | 1991-02-21 | 1992-09-24 | Nec Software Ltd | コード変換処理方式 |
JP2907124B2 (ja) * | 1996-05-17 | 1999-06-21 | 日本電気株式会社 | ソースユニットのファイル転送時におけるコード体系の自動識別方式 |
US6157905A (en) * | 1997-12-11 | 2000-12-05 | Microsoft Corporation | Identifying language and character set of data representing text |
WO2002095614A1 (fr) * | 2001-05-24 | 2002-11-28 | Izumi Suzuki | Procede d'identification d'un systeme de code de type langage ou par caracteres |
-
2013
- 2013-12-19 JP JP2013262880A patent/JP6300512B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015118625A (ja) | 2015-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108089974B (zh) | 利用定义的输入格式来测试应用 | |
JP6044963B2 (ja) | 情報処理装置、方法及びプログラム | |
US10452700B1 (en) | Systems and methods for parsing log files using classification and plurality of neural networks | |
JP5936240B2 (ja) | データ処理装置、データ処理方法、およびプログラム | |
US9626354B2 (en) | Systems and methods for using tone indicator in text recognition | |
US10083172B2 (en) | Native-script and cross-script chinese name matching | |
US9870351B2 (en) | Annotating embedded tables | |
US10896287B2 (en) | Identifying and modifying specific user input | |
US9164964B2 (en) | Context-aware text document analysis | |
JPWO2014050981A1 (ja) | テキスト情報監視用辞書作成装置、テキスト情報監視用辞書作成方法、及び、テキスト情報監視用辞書作成プログラム | |
US9495638B2 (en) | Scalable, rule-based processing | |
JP6252296B2 (ja) | データ識別方法、データ識別プログラム及びデータ識別装置 | |
US9892107B2 (en) | Associating mentioned items between documents | |
JP6300512B2 (ja) | 判定装置、判定方法、及び、プログラム | |
US9990339B1 (en) | Systems and methods for detecting character encodings of text streams | |
CN112748930A (zh) | 编译检测方法、装置、设备及存储介质 | |
WO2018179729A1 (ja) | インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法 | |
CN117892724B (zh) | 一种文本检测方法、装置、设备及存储介质 | |
US20230377358A1 (en) | Method and apparatus for dechipering obfuscated text for cyber security | |
CN113505570B (zh) | 参考文献参见落空的审校方法、装置、设备及存储介质 | |
US11356853B1 (en) | Detection of malicious mobile apps | |
JP7388677B2 (ja) | 入力支援装置、入力支援方法、及びプログラム | |
US10943056B1 (en) | System and method for identifying location of content within an electronic document | |
WO2022123716A1 (ja) | 述語項構造修正プログラム、述語項構造修正方法、および情報処理装置 | |
KR101900813B1 (ko) | 문법에 의하여 생성된 입력으로 제어흐름을 처방하기 위한 동적 제어흐름 분석 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161020 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20161020 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20161020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170815 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170810 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170919 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180227 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6300512 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |