JP7079419B2 - 情報処理方法及び情報処理装置 - Google Patents
情報処理方法及び情報処理装置 Download PDFInfo
- Publication number
- JP7079419B2 JP7079419B2 JP2019570177A JP2019570177A JP7079419B2 JP 7079419 B2 JP7079419 B2 JP 7079419B2 JP 2019570177 A JP2019570177 A JP 2019570177A JP 2019570177 A JP2019570177 A JP 2019570177A JP 7079419 B2 JP7079419 B2 JP 7079419B2
- Authority
- JP
- Japan
- Prior art keywords
- nickname
- registration information
- information processing
- searched
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 65
- 238000003672 processing method Methods 0.000 title claims description 16
- 238000000034 method Methods 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 11
- 230000006870 function Effects 0.000 description 4
- 244000205754 Colocasia esculenta Species 0.000 description 2
- 235000006481 Colocasia esculenta Nutrition 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4931—Directory assistance systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9038—Presentation of query results
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/55—Aspects of automatic or semi-automatic exchanges related to network data storage and management
- H04M2203/558—Databases
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Game Theory and Decision Science (AREA)
- Business, Economics & Management (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
意図推定部4は、テキストデータから呼び名とコマンドを抽出する。コマンドは、ドライバすなわち発話者が希望する制御を示す単語などである。具体的には、意図推定部4は、テキストデータから、呼び名データベース1に登録された呼び名と同じ呼び名を抽出する。また、コマンドについても同様に、予めデータベース(図示せず)に登録されたコマンドと同じコマンドを抽出する。
意図推定部4は、ステップS5で抽出した呼び名を含む登録情報を検索し(S7)、そのような登録情報が存在するか否かを判定し(S9)、存在する場合は(S9:YES)、その登録情報を読み出す。なお、呼び名を含む登録情報がユーザデータベース2に1つだけ存在する場合は、後述のステップS11、S13を省略できる。
例えば、名字「日産」、名前「花子」を含む登録情報と、名字「日産」、名前「直子」を含む登録情報とが検索された場合、検索結果出力部5は、ステップS5で抽出した呼び名「お母さん」を用い、「「お母さん」は「日産」「花子」さんですか、それとも、「日産」「直子」さんですか?」というように音声を出力する(S11)。
また、ドライバが電話中に、「お母さん、次の日曜日に時間ある?」又は「いっちゃん、次の日曜日に時間ある?」のように発話すると(S23)、音声認識部3が、ドライバの発話の音声を音声認識し、テキストデータに変換する(S25)。
2 ユーザデータベース(データベース)
3 音声認識部
4 意図推定部
5 検索結果出力部
6 データベース更新部
7 電話処理部
8 声紋識別部
100 情報処理装置
Claims (11)
- データベースから登録情報を検索する情報処理装置の情報処理方法であって、
前記情報処理装置は、
発話者の音声をテキストデータに変換し、
前記テキストデータから呼び名を抽出し、
前記呼び名を含む登録情報を前記データベースから検索し、
前記呼び名を含む登録情報が前記データベースに存在しない場合には前記呼び名に対応する条件を満たす登録情報を前記データベースから検索し、
検索した前記呼び名に対応する条件を満たす登録情報を前記発話者に提示する
ことを特徴とする情報処理方法。 - 前記呼び名は人名を示す呼び名であり、
前記呼び名に対応する条件は、名字、性別、住所、及び電話番号のうちの少なくともいずれかを含む
ことを特徴とする請求項1記載の情報処理方法。 - 前記情報処理装置は、
前記呼び名と、検索した前記呼び名に対応する条件を満たす登録情報に含まれている人物の名前とを対応付けて前記発話者に提示する
ことを特徴とする請求項1記載の情報処理方法。 - 前記情報処理装置は、
前記呼び名と、検索した前記呼び名に対応する条件を満たす登録情報に含まれている人物の名前とを対応付けて前記発話者に提示し、
前記発話者から肯定的な回答があった場合には、前記登録情報に対応付けて前記呼び名を記録する
ことを特徴とする請求項1記載の情報処理方法。 - 前記情報処理装置は、
検索した前記登録情報に前記呼び名を書き込む
ことを特徴とする請求項1記載の情報処理方法。 - 前記情報処理装置は、
前記発話者が希望する制御を示すコマンドを前記テキストデータから抽出し、
検索した前記登録情報を用いて、前記コマンドに応じた制御を行う
ことを特徴とする請求項1乃至5のいずれかに記載の情報処理方法。 - 前記情報処理装置は、
前記呼び名で呼ばれる対象者との電話中の前記発話者の音声を前記テキストデータに変換し、
前記テキストデータから呼び名を抽出し、
前記対象者の電話番号を検出し、
前記電話番号を含む登録情報を前記データベースから検索し、
検索した前記電話番号を含む前記登録情報が前記データベースに存在する場合は、前記電話番号を含む前記登録情報に前記呼び名を書き込む
ことを特徴とする請求項1乃至6のいずれかに記載の情報処理方法。 - 前記情報処理装置は、
検索した前記電話番号を含む前記登録情報が前記データベースに存在しない場合は、前記電話番号と前記呼び名とを含む登録情報を前記データベースに生成する
ことを特徴とする請求項7記載の情報処理方法。 - 前記情報処理装置は、
前記呼び名で呼ばれる対象者との対話中の前記発話者の音声を前記テキストデータに変換し、
前記テキストデータから呼び名を抽出し、
前記発話者との対話中の前記対象者の音声から声紋を検出し、
前記声紋を含む前記登録情報を前記データベースから検索し、
検索した前記登録情報に前記呼び名を書き込む
ことを特徴とする請求項1乃至8のいずれかに記載の情報処理方法。 - 前記情報処理装置は、
検索した複数の前記登録情報を前記発話者に提示し、
前記発話者が選択した前記登録情報に前記呼び名を書き込む
ことを特徴とする請求項1又は9記載の情報処理方法。 - 登録情報を記憶するデータベースと、
発話者の音声をテキストデータに変換する音声認識部と、
前記テキストデータから呼び名を抽出し、前記呼び名を含む登録情報を前記データベースから検索し、前記呼び名を含む登録情報が前記データベースに存在しない場合には前記呼び名に対応する条件を満たす登録情報を前記データベースから検索する意図推定部と、
検索した前記呼び名に対応する条件を満たす登録情報を前記発話者に提示する検索結果出力部と
を備えることを特徴とする情報処理装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/004036 WO2019155526A1 (ja) | 2018-02-06 | 2018-02-06 | 情報処理方法及び情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019155526A1 JPWO2019155526A1 (ja) | 2021-01-28 |
JP7079419B2 true JP7079419B2 (ja) | 2022-06-02 |
Family
ID=67548238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019570177A Active JP7079419B2 (ja) | 2018-02-06 | 2018-02-06 | 情報処理方法及び情報処理装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11200905B2 (ja) |
EP (1) | EP3751562A4 (ja) |
JP (1) | JP7079419B2 (ja) |
CN (1) | CN111868711A (ja) |
WO (1) | WO2019155526A1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006174111A (ja) | 2004-12-16 | 2006-06-29 | Matsushita Electric Ind Co Ltd | 電話装置 |
JP2007259275A (ja) | 2006-03-24 | 2007-10-04 | Nec Corp | 通信端末におけるニックネーム登録方法及びその装置 |
JP2012222798A (ja) | 2011-04-14 | 2012-11-12 | Nakayo Telecommun Inc | 通話音声履歴機能つき電話端末 |
JP2015079237A (ja) | 2013-10-15 | 2015-04-23 | トヨタ自動車株式会社 | 音声認識方法および音声認識システム |
JP2015115844A (ja) | 2013-12-13 | 2015-06-22 | キヤノンマーケティングジャパン株式会社 | 取次支援システム、取次支援方法、およびプログラム |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6901431B1 (en) * | 1999-09-03 | 2005-05-31 | Cisco Technology, Inc. | Application server providing personalized voice enabled web application services using extensible markup language documents |
US7013280B2 (en) * | 2001-02-27 | 2006-03-14 | International Business Machines Corporation | Disambiguation method and system for a voice activated directory assistance system |
US20030125869A1 (en) * | 2002-01-02 | 2003-07-03 | International Business Machines Corporation | Method and apparatus for creating a geographically limited vocabulary for a speech recognition system |
US7590536B2 (en) * | 2005-10-07 | 2009-09-15 | Nuance Communications, Inc. | Voice language model adjustment based on user affinity |
US8010343B2 (en) * | 2005-12-15 | 2011-08-30 | Nuance Communications, Inc. | Disambiguation systems and methods for use in generating grammars |
US8374862B2 (en) * | 2006-08-30 | 2013-02-12 | Research In Motion Limited | Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance |
KR100897553B1 (ko) * | 2007-01-04 | 2009-05-15 | 삼성전자주식회사 | 사용자의 기기 사용 패턴을 이용한 음성 인식 방법 및 장치 |
EP2158540A4 (en) * | 2007-06-18 | 2010-10-20 | Geographic Services Inc | NAME SYSTEM FOR SELECTING GEOGRAPHICAL CHARACTERISTICS |
US10241644B2 (en) * | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9117448B2 (en) * | 2009-07-27 | 2015-08-25 | Cisco Technology, Inc. | Method and system for speech recognition using social networks |
JP2011180729A (ja) * | 2010-02-26 | 2011-09-15 | Sony Corp | 情報処理装置、キーワード登録方法及びプログラム |
US8606579B2 (en) | 2010-05-24 | 2013-12-10 | Microsoft Corporation | Voice print identification for identifying speakers |
US8744995B1 (en) * | 2012-07-30 | 2014-06-03 | Google Inc. | Alias disambiguation |
CN103780771A (zh) * | 2012-10-23 | 2014-05-07 | 华为技术有限公司 | 语音业务的处理方法和装置 |
US10593326B2 (en) * | 2013-04-25 | 2020-03-17 | Sensory, Incorporated | System, method, and apparatus for location-based context driven speech recognition |
JP6346281B2 (ja) | 2014-07-04 | 2018-06-20 | クラリオン株式会社 | 車載対話型システム、及び車載情報機器 |
US9544412B2 (en) * | 2015-03-09 | 2017-01-10 | Ford Global Technologies, Llc | Voice profile-based in-vehicle infotainment identity identification |
CN105933493A (zh) * | 2016-04-20 | 2016-09-07 | 乐视控股(北京)有限公司 | 一种陌生来电处理方法、装置及移动终端 |
CN105872177A (zh) * | 2016-05-31 | 2016-08-17 | 努比亚技术有限公司 | 一种确定联系人与机主关系的称谓的系统及方法 |
CN106657537A (zh) * | 2016-12-07 | 2017-05-10 | 努比亚技术有限公司 | 一种终端语音搜索通话记录装置及方法 |
CN106603792B (zh) * | 2017-01-20 | 2019-09-06 | 上海傲硕信息科技有限公司 | 一种号码查找设备 |
-
2018
- 2018-02-06 CN CN201880087369.7A patent/CN111868711A/zh active Pending
- 2018-02-06 WO PCT/JP2018/004036 patent/WO2019155526A1/ja unknown
- 2018-02-06 EP EP18905724.3A patent/EP3751562A4/en not_active Ceased
- 2018-02-06 US US16/967,158 patent/US11200905B2/en active Active
- 2018-02-06 JP JP2019570177A patent/JP7079419B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006174111A (ja) | 2004-12-16 | 2006-06-29 | Matsushita Electric Ind Co Ltd | 電話装置 |
JP2007259275A (ja) | 2006-03-24 | 2007-10-04 | Nec Corp | 通信端末におけるニックネーム登録方法及びその装置 |
JP2012222798A (ja) | 2011-04-14 | 2012-11-12 | Nakayo Telecommun Inc | 通話音声履歴機能つき電話端末 |
JP2015079237A (ja) | 2013-10-15 | 2015-04-23 | トヨタ自動車株式会社 | 音声認識方法および音声認識システム |
JP2015115844A (ja) | 2013-12-13 | 2015-06-22 | キヤノンマーケティングジャパン株式会社 | 取次支援システム、取次支援方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JPWO2019155526A1 (ja) | 2021-01-28 |
US11200905B2 (en) | 2021-12-14 |
US20200365161A1 (en) | 2020-11-19 |
EP3751562A1 (en) | 2020-12-16 |
EP3751562A4 (en) | 2020-12-16 |
WO2019155526A1 (ja) | 2019-08-15 |
CN111868711A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3168033B2 (ja) | 音声テレフォン・ダイヤリング | |
US20060215821A1 (en) | Voice nametag audio feedback for dialing a telephone call | |
US8948724B2 (en) | Communication terminal offering privacy protection for hands-free functionality using an analysis process | |
US8369492B2 (en) | Directory dialer name recognition | |
EP1171870B1 (en) | Spoken user interface for speech-enabled devices | |
US6925154B2 (en) | Methods and apparatus for conversational name dialing systems | |
US8635068B2 (en) | System and method for recognizing speech with dialect grammars | |
US6731737B2 (en) | Directory assistance system | |
KR101664080B1 (ko) | 음성 다이얼링 시스템 및 방법 | |
US20060190260A1 (en) | Selecting an order of elements for a speech synthesis | |
KR100742408B1 (ko) | 화자 종속 음성 인식 방법 및 음성 인식 시스템 | |
US20060020464A1 (en) | Speech recognition application or server using iterative recognition constraints | |
JP7079419B2 (ja) | 情報処理方法及び情報処理装置 | |
JPWO2018088534A1 (ja) | 電子機器、電子機器の制御方法及び電子機器の制御プログラム | |
US7283964B1 (en) | Method and apparatus for voice controlled devices with improved phrase storage, use, conversion, transfer, and recognition | |
JP5376072B1 (ja) | 車載情報システムおよび音声認識適応方法 | |
JP2000338991A (ja) | 認識率信頼性表示機能付き音声操作電話装置及びその音声認識方法 | |
JPH1168920A (ja) | 音声電話番号設定装置 | |
JP4466171B2 (ja) | 情報検索装置 | |
JP5143062B2 (ja) | 悪意の第三者からの不当呼を判定する方法及び電話自動応対装置 | |
JP2005159395A (ja) | 電話受け付け翻訳システム | |
KR101734244B1 (ko) | 음성 다이얼링 시스템 및 방법 | |
JP3140084B2 (ja) | 練習機能付き音声ダイヤル装置 | |
JPH0511200U (ja) | 音声認識装置 | |
JP4380978B2 (ja) | 通信システム、通信端末装置、通信方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A5211 Effective date: 20200804 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200908 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200908 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220421 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220504 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7079419 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |