CN102982061A - 信息处理设备、信息处理方法和程序 - Google Patents
信息处理设备、信息处理方法和程序 Download PDFInfo
- Publication number
- CN102982061A CN102982061A CN2012102300374A CN201210230037A CN102982061A CN 102982061 A CN102982061 A CN 102982061A CN 2012102300374 A CN2012102300374 A CN 2012102300374A CN 201210230037 A CN201210230037 A CN 201210230037A CN 102982061 A CN102982061 A CN 102982061A
- Authority
- CN
- China
- Prior art keywords
- key word
- information
- character information
- item
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 9
- 238000003672 processing method Methods 0.000 title claims abstract description 7
- 238000012545 processing Methods 0.000 claims abstract description 26
- 238000003860 storage Methods 0.000 claims description 21
- 238000000605 extraction Methods 0.000 claims description 10
- 239000000284 extract Substances 0.000 abstract description 5
- 238000000034 method Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 17
- 238000004891 communication Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 230000005055 memory storage Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000014759 maintenance of location Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- QFTYEBTUFIFTHD-UHFFFAOYSA-N 1-[6,7-dimethoxy-1-[1-(6-methoxynaphthalen-2-yl)ethyl]-3,4-dihydro-1H-isoquinolin-2-yl]-2-piperidin-1-ylethanone Chemical compound C1=CC2=CC(OC)=CC=C2C=C1C(C)C(C1=CC(OC)=C(OC)C=C1CC1)N1C(=O)CN1CCCCC1 QFTYEBTUFIFTHD-UHFFFAOYSA-N 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/685—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
- G06F16/3326—Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
- G06F16/3328—Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages using graphical result space presentation or visualisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
提供了信息处理设备、信息处理方法和程序。该信息处理设备包括显示器、输入单元和控制器。输入单元配置为接收用户的第一关键字的输入。控制器配置为从配置为存储通过语音识别处理从多个语音信息项转换成的多个字符信息项的数据库中检索包括输入的第一关键字的第一字符信息,提取包括在通过检索获取的第一字符信息中并且与第一关键字不同的第二关键字,以及控制显示器,以显示包括以其标识获取的第一字符信息的第一标识信息和包括在第一字符信息中的第二关键字的项的列表。
Description
技术领域
本公开涉及能够根据字符串检索并显示语音信息的信息处理设备以及信息处理方法和用于信息处理设备的程序。
背景技术
过去,公知根据用户输入的关键字检索包括表示关键字的语音的语音信息的技术。例如,第2010-277036号日本未决专利申请公开了利用语音数据校准输入的搜索字符串、计算语音数据相对于搜索字符串的相似性并以较高相似性顺序输出语音数据的候选的技术。
此外,第2011-087005号日本未决专利申请(下面称为专利文献2)公开了一种为了提取文本关于语音呼叫执行语音识别处理以及删除文本的冗余部分以将产生的文本转换为概述文本,并与呼叫历史信息一起显示概述文本的技术。
发明内容
在专利文献2公开的技术中,用户通过观看概述文本可以掌握过去呼叫的内容。然而,由于概述文本具有特定长度,所以掌握其内容要花费时间。
鉴于上述情况,希望提供能够允许用户更容易地掌握检索的语音信息的内容的信息处理设备、信息处理方法和程序。
根据本公开实施例,提供了一种信息处理设备,包括:显示器、输入单元和控制器。输入单元配置为接收用户的第一关键字的输入。控制器配置为从配置为存储通过语音识别处理从多个语音信息项转换成的多个字符信息项的数据库检索包括输入的第一关键字的第一字符信息。此外,该控制器配置为提取包括在通过检索获取的第一字符信息中的并且与第一关键字不同的第二关键字。此外,该控制器配置为控制显示器,以显示包括以其标识获取的第一字符信息的第一标识信息和包括在第一字符信息中的第二关键字的项的列表。
利用该配置,信息处理设备检索包括用户输入的关键字的语音信息项,并且当显示检索结果的列表时,显示包括在语音信息项中的其他关键字,因此,允许用户容易地掌握检索的语音信息项的内容。在显示的显示区小的情况下这是有效的,并且语音信息项的所有内容不显示为检索结果。在这种情况下,可以作为字符串或者作为语音输入第一关键字。此外,语音信息指的是例如其中记录语音呼叫的信息,但是并不局限于此。语音信息可以是包括在视频内容中的语音数据。标识信息指的是例如位于语音呼叫另一端的一方的名称和电话号码以及呼叫的日期和时间,但是并不局限于此。数据库可以提供在信息处理设备内,也可以在网络外(例如,作为服务器)。换句话说,检索处理包括由信息处理设备搜索包括在信息处理设备中的数据库的情况和请求外部数据库(服务器)进行检索并接收其结果的情况。
控制器可以在接收到用户选择包括在所显示的项中的第二关键字的操作时,从数据库中检索包括第二关键字的第二字符信息。此外,控制器可以提取包括在通过检索获取的第二字符信息中并且与第二关键字不同的第三关键字。此外,控制器可以控制显示器,以显示包括以其标识获取的第二字符信息的第二标识信息和包括在第二字符信息中的第三关键字的项的列表。
利用该配置,在包括在检索的语音信息中的另一个字符串用作密钥的情况下,信息处理设备根据用户输入的字符串检索另一语音信息项,因此,连续检索其中用户感兴趣的语音信息项,并且用户可以掌握其内容。
数据库可以存储通过概括多个字符信息项而获得的多个概述信息项。在这种情况下,当接收到用户选择所显示的项之一的操作时,控制器可以从数据库中获取对应于所选项的概述信息项,并且控制显示器以显示所获取的概述信息项。
利用该配置,信息处理设备允许用户选择显示的项,因此,用户可以比第二关键字更可靠地掌握语音信息项的内容。
控制器可以控制显示器,以在包括在概述信息项中的第三关键字可选择的状态下显示概述信息项。此外,控制器可以在接收到用户选择所显示的第三关键字的操作时,从数据库中检索包括第三关键字的第三字符信息。此外,控制器可以提取包括在通过检索获取的第三字符信息中并且与第三关键字不同的第四关键字。此外,控制器可以控制显示器,以显示包括以其标识获取的第三字符信息的第三标识信息和包括在第四字符信息中的第四关键字的项的列表。
利用该配置,在选择包括在概述信息项中的字符串的情况下,信息处理设备向用户提供与字符串相关的项的新列表。
当接收到用户指定所显示的概述信息项的任意位置的操作时,控制器从对应于在指定位置显示的字符串的重放位置重放对应于字符信息项的多个语音信息项之一,作为概述信息项的概述源。
利用该配置,信息处理设备允许用户指定概述信息项的任意位置,因此,使得从对应于任意位置的位置重放语音信息项,并且用户在没有任意改变的情况下掌握语音信息项的内容。
根据本公开另一实施例,提供了一种信息处理方法,该方法包括接收用户的第一关键字的输入。从配置为存储通过语音识别处理从多个语音信息项转换成的多个字符信息项的数据库检索包括输入的第一关键字的第一字符信息。提取包括在通过检索获取的第一字符信息中的并且与第一关键字不同的第二关键字。显示包括以其标识获取的第一字符信息的第一标识信息和包括在第一字符信息中的第二关键字的项的列表。
根据本公开又一实施例,提供了一种使得信息处理设备执行如下步骤的程序:接收用户的第一关键字的输入;从配置为存储通过语音识别处理从多个语音信息项转换成的多个字符信息项的数据库检索包括输入的第一关键字的第一字符信息;提取包括在检索获取的第一字符信息中的并且与第一关键字不同的第二关键字;以及显示包括以其标识获取的第一字符信息的第一标识信息和包括在第一字符信息中的第二关键字的项列表。
如上所述,根据本公开,用户可以更容易地掌握检索的语音信息的内容。
根据对附图所示的本发明的最佳实施例所做的详细描述,本公开的这些以及其他目的、特征和优点更加显而易见。
附图说明
图1是示出根据本公开实施例的呼叫历史检索系统的概况的示意图;
图2是示出呼叫历史检索系统中的服务器的配置的框图;
图3是示出呼叫历史检索系统中的用户终端的配置的框图;
图4是示出用户终端的软件配置和服务器的软件配置的功能框图;
图5是示出用户终端在根据关键字检索语音呼叫数据的处理中的操作过程的流程图;
图6是示出服务器在根据关键字检索语音呼叫数据的处理中的操作过程的流程图;
图7是示出显示语音呼叫的检索结果的显示屏幕的示例的示意图;以及
图8是示出显示从检索结果中选择的语音呼叫的详细信息的显示屏幕的示例的示意图。
具体实施方式
下面将参考附图描述本公开的实施例。
[系统概况]
图1是示出根据本公开实施例的语音呼叫历史检索系统的配置的概况的示意图。
如图1所示,该系统由服务器100和用户终端200构成。服务器100和用户终端200通过诸如因特网50的网络互相通信。
网络上可以存在多个用户终端200。用户终端200是诸如智能电话、移动电话和平板PC(个人计算机)的典型移动终端,但是可以是任意信息处理设备,包括台式个人计算机和膝上型个人计算机、电子书阅读器、便携式A/V(音频/视频)设备等。
用户终端200的用户利用用户终端200与另一用户终端的用户进行语音呼叫。该语音呼叫数据作为呼叫历史存储在用户终端200中。
服务器100从用户终端200获取语音呼叫数据,并且通过语音识别处理将该语音呼叫数据转换为字符信息,然后存储。
用户终端200根据用户输入的关键字通过服务器100检索过去的语音呼叫,并且显示检索结果。
[服务器的硬件配置]
图2是示出服务器100的硬件配置的示意图。如图2所示,服务器100包括:CPU(中央处理单元)11、ROM(只读存储器)12、RAM(随机存取存储器)13、输入与输出接口15、以及将上述部件互相连接的总线14。
CPU11在需要时访问RAM13等,并且在执行各种类型的计算处理的同时,对服务器100的各个模块执行总体控制。ROM12是非易失性存储器,其中固定存储CPU11要执行的操作系统和诸如程序的固件和各种参数。RAM13用作CPU11的工作区等,并且临时存储操作系统、执行时的各种应用以及正在处理的各种类型的数据。
显示器16、操作接收单元17、存储装置18、通信单元19等连接到输入与输出接口15。
显示器16是采用例如LCD(液晶显示器)、OELD(有机电致发光显示器)、CRT(阴极射线管)等的显示装置。
操作接收单元17包括诸如鼠标的指示装置、键盘、触摸板以及其他输入装置。如果操作接收单元17是触摸板,则触摸板可以与显示器16集成形成。
存储装置18是诸如HDD(硬盘驱动器)、闪速存储器(SSD(固态驱动器))和其它固态存储器的非易失性存储器。存储装置18存储OS、各种应用以及各种类型的数据。特别地,在该实施例中,存储装置18存储从用户终端200接收到的语音呼叫数据和通过对语音呼叫数据执行语音识别处理而获得的字符数据。
通信单元19是用于有线地连接到因特网50或者LAN(局域网)的NIC(网络接口卡)等,并且与用户终端200执行通信处理。
[用户终端的硬件配置]
图3是示出用户终端200的硬件配置的示意图。如图3所示,用户终端200包括:显示器21、触摸板22、通信单元23、天线24、CPU23、扬声器26、麦克风27、RAM28以及闪速存储器29。
显示器21例如由液晶显示器、EL(电致发光)显示器等配置。显示器21与触摸板22集成形成。触摸板22的示例包括电阻式触摸板和电容式触摸板,但是触摸板可以具有任意制式。在显示器21上(触摸板22)显示过去的语音呼叫的历史信息的列表,这将在后面描述。
通信单元23执行通过天线24发射和接收的无线电波的变频、调制和解调。天线24发射和接收用于呼叫和电子邮件的分组通信等的无线电波。此外,当语音呼叫数据发送到服务器100时也使用通信单元23。
扬声器26包括数模转换器、放大器等。扬声器26对从CPU25输入的语音呼叫数据执行数模转换处理和放大处理,并且通过接收机(未示出)输出语音。
麦克风27包括模数转换器等。麦克风27将从通过麦克风从用户输入的模拟语音数据转换为数字语音数据,并且将其输出到CPU25。输出到CPU25的数字语音数据被编码,然后,通过通信单元23和天线24发送。
RAM28是用作CPU25的工作区的非易失性存储器。RAM28临时存储CPU25的处理使用的各种程序和各种类型的数据。
闪速存储器29是其内存储了CPU25进行处理所需的各种程序和各种类型的数据的非易失性存储器。特别地,在该实施例中,闪速存储器29存储用于显示呼叫历史和语音呼叫数据的列表的应用和数据。
CPU25对用户终端200的各个单元执行总体控制,并且根据各种程序执行各种计算。例如,CPU25与服务器100交换数据,以执行根据通过触摸板22输入的字符串(关键字)检索语音呼叫数据的处理,并且将检索结果显示在显示器21上。
[服务器和用户终端的软件配置]
图4是示出向服务器100和用户终端200的每个提供的功能(软件)的配置的框图。
如图4所示,用户终端200包括:呼叫记录单元41、主存储区42、发送与接收处理单元43、搜索字输入单元44以及检索结果显示单元45。此外,服务器100包括呼叫相关信息存储单元46和语音字符转换单元47。
呼叫记录单元41将用户的语音呼叫数据存储在主存储区42内。
发送与接收处理单元43将存储在主存储区42内的语音呼叫数据发送到服务器100的呼叫相关信息存储单元46,并且将已经发送语音呼叫数据的事实通知给语音字符转换单元47。
呼叫相关信息存储单元46存储从发送与接收处理单元43发送的语音呼叫数据。
语音字符转换单元47对接收到的语音呼叫数据执行语音识别处理,以将语音呼叫数据转换为字符数据。转换的字符数据存储在呼叫相关信息存储单元35内。
搜索字输入单元44接收用户的搜索关键字的输入。
检索结果显示单元45将根据搜索关键字从呼叫相关信息存储单元46检索的语音呼叫数据的列表显示在显示器21上。
[服务器和用户终端的操作]
接着,将描述如上配置的服务器100和用户终端200的操作。下面将在假定服务器100的CPU 11和用户终端200的CPU 25是操作主体的情况下进行描述。然而,这些操作还可以与向服务器100和用户终端200提供的其他硬件和软件(应用)配合地执行。
图5是示出用户终端200在根据关键字检索语音呼叫数据的处理中的操作过程的流程图。此外,图6是示出服务器200在该检索处理中的操作过程的流程图。
如图5所示,用户终端200的CPU 25首先接收用户的关键字的输入(步骤51)。例如,用户利用键盘(包括软键盘)在显示器21上显示的框内输入关键字。在此,用户可以通过麦克风27利用语音输入关键字。
随后,CPU 25将输入的关键字发送到服务器100(步骤52)。在利用语音输入关键字的情况下,将其语音数据发送到服务器100。
同时,如图6所示,在从用户终端200接收到关键字时(步骤61),CPU11从呼叫相关信息存储单元46中检索包括关键字的语音呼叫数据(步骤62)。在此,在从用户终端200发送的关键字是语音数据的情况下,CPU 11利用语音字符转换单元47将语音数据转换为字符串,然后进行检索。
然后,CPU 11根据检索结果产生包括关键字的语音呼叫数据的列表(步骤63)。在这种情况下,CPU 11从呼叫相关信息存储单元46提取概述信息和重要关键字。概述信息是通过将语音呼叫数据项转换为字符而获得的字符信息的内容的概述。重要关键字包括在字符信息中。然后,CPU 11将提取的概述信息和重要关键字添加到检索语音呼叫数据的列表(步骤64)。下面将详细描述概述信息和重要关键字。
然后,CPU 11将列表发送到用户终端200(步骤65)。
同时,如图5所示,在从服务器100接收到语音呼叫数据的列表时(步骤53),用户终端200的CPU 25将列表显示在显示器21上,作为根据关键字的语音呼叫历史的检索结果(步骤54)。
图7是示出显示语音呼叫历史的检索结果的显示屏幕的示例的示意图。
如图7所示,在检索结果显示屏幕上,用于标识根据关键字检索的语音呼叫数据的语音呼叫数据项71显示为列表。在语音呼叫数据项71中,例如,显示位于该语音呼叫另一端的一方的名称(注册名)和电话号码以及呼叫的日期和时间。例如,可以以呼叫的日期和时间的较早顺序或者以所包括的关键字的数目的较高顺序来显示语音呼叫数据项71。
此外,在每个语音呼叫数据项71中,显示与上面描述的搜索关键字不同并且包括在语音呼叫数据中的重要关键字。
重要关键字72例如是在词法(morphological)分析处理等中由语音字符转换单元47从转换为字符的语音呼叫数据中提取的名词。重要关键字72被加下划线,以指示有下划线的重要关键字72是可选的(例如能够接收点选(tap)操作)。
返回去参考图5,当在显示器21(触摸板22)上接收到用户的点选操作的输入时(步骤55),CPU 25确定是否在对应于语音呼叫数据项71之一中的重要关键字72的部分上进行了点选(步骤56)。
当确定在对应于重要关键字72的部分进行了点选时(“是”),CPU 25执行在步骤52和后续步骤以该重要关键字72作为新搜索关键字执行的检索处理,并且作为检索结果以与图7所示的相同方式显示从服务器100接收到的语音呼叫数据的新的列表。
当确定没有在对应于重要关键字72的部分进行点选时(“否”),即,点选是选择语音呼叫数据项71的特定一个的操作,CPU 25显示所选的语音呼叫数据项的详细信息(步骤57)。
图8是示出显示语音呼叫数据的详细信息的显示屏幕的示例的示意图。
如图8所示,在详细信息显示屏幕上,除了位于另一端的一方(在注册的情况下)的电话号码和图像、呼叫的日期和时间、总通话时间、以及指示呼出或者呼入的信息之外,还显示通过转换所选的语音呼叫数据而获得的字符信息的概述信息81。
语音字符转换单元47根据存储在呼叫相关信息存储单元46中的字符信息创建概述信息81,并存储在呼叫相关信息存储单元46中。当从服务器100接收语音呼叫数据列表时,同时接收概述信息81。概述信息81可以由任意方法创建,但是例如可以通过将包括字符信息中的特定名词的语句互相组合而创建。
在概述信息81中,在利用不同颜色、字体等区分讲话者的同时显示字符信息。语音字符转换单元47预先执行这种讲话者的区分,并且作为元数据添加。通过与诸如作为信源的语音呼叫数据的波形的语音特征(声学图案)进行比较进行这种区分。作为选择地,可以利用概述信息81中的每个语句中的字符等指示每个讲话者。
此外,在概述信息81中,以可选状态显示包括在其中的重要关键字82。重要关键字82对应于显示在上述检索结果显示屏幕上的重要关键字72。
此外,重放按钮83也显示在示出详细信息的显示屏幕上。尽管图5的流程图中未描述,但是响应于按下重放按钮83,从开头重放作为信源的语音呼叫数据。因此,即使字符信息具有转换错误,用户也可以顺应该错误。此外,例如,还将用于返回到(转移到)检索结果显示屏幕的历史按钮73显示在详细信息显示屏幕的左上部。
返回去参考图5,当在详细信息显示屏幕上接收到用户的点选操作的输入时(步骤58),CPU 25根据点选操作的位置来执行不同处理(步骤59)。
具体地说,当确定请求操作的位置(挑选位置)处于对应于概述信息81中的重要关键字82的部分时,CPU 25执行在步骤52和后续步骤以该重要关键字82作为新搜索关键字执行的检索处理。然后,CPU 25以图7所示方式相同的方式显示从服务器100接收到的语音呼叫数据的新的列表,作为检索结果。
此外,当确定点选位置位于概述信息81中的重要关键字82之外的部分时,CPU 25从对应于在点选位置显示的字符串的位置开始重放语音呼叫数据。例如,通过预先从服务器100与概述信息81等一起接收概述信息81中的字符串和语音呼叫数据的重放位置之间的对应信息,CPU 25区分显示在点选位置的字符串。
此外,当确定点选位置位于历史按钮73上时,CPU 25再次显示图7所示的检索结果显示屏幕。
[结论]
如上所述,根据该实施例,用户终端200与服务器100配合地根据用户输入的关键字检索语音呼叫数据,并且当检索结果显示为列表时,用户终端200还显示搜索关键字之外的重要关键字72。因此,用户容易根据用户输入的关键字与重要关键字71之间的关系来掌握语音呼叫数据的内容。
[修改例]
本公开并不局限于上面描述的实施例,并且可以进行各种修改,而不脱离本公开的实质范围。
在上述实施例中,检索目标是语音呼叫数据,但是并不局限于此。例如,运动图像内容中的音乐数据、语音数据等都可以作为要检索的目标。
在上述实施例中,服务器100执行将语音呼叫数据转换为字符的处理和存储语音呼叫数据和通过转换语音呼叫数据而获得的字符信息的处理。然而,在用户终端200具有足够存储容量和计算能力的情况下,服务器100执行的处理可以由用户终端200执行。
在上述实施例中,用户终端200进行语音呼叫,然后,临时存储其语音呼叫数据,从而将其发送到服务器100。然而,用于进行语音呼叫的设备可以用户终端200以外的设备。在这种情况下,用户终端200例如通过网络从已经进行语音呼叫的设备接收语音呼叫数据,也可以通过记录介质存储接收到的语音呼叫数据。
图7所示的检索结果显示屏幕和图8所示的详细信息显示屏幕的用户界面的布局并不局限于附图所示的布局,并且可以采用各种布局。
在上述实施例中,本公开应用于用户终端200。然而,本公开可应用于音频播放器、电视设备、游戏机、汽车导航设备、记录与再现设备以及任意其他信息处理设备。
[其他]
应当注意,本公开可以采用下面的配置。
(1)一种信息处理设备,包括:
显示器;
输入单元,配置为接收用户的第一关键字是输入;以及
控制器,配置为:
从配置为存储通过语音识别处理从多个语音信息项转换成的多个字符信息项的数据库检索包括输入的第一关键字的第一字符信息,
提取包括在通过检索获取的第一字符信息中并且与第一关键字不同的第二关键字,以及
控制显示器,以显示包括以其标识获取的第一字符信息的第一标识信息和包括在第一字符信息中的第二关键字的项的列表。
(2)根据(1)所述的信息处理设备,其中
控制器
在接收到用户选择包括在所显示的项中的第二关键字的操作时,从数据库中检索包括第二关键字的第二字符信息,
提取包括在通过检索获取的第二字符信息中并且与第二关键字不同的第三关键字,以及
控制显示器,以显示包括以其标识获取的第二字符信息的第二标识信息和包括在第二字符信息中的第三关键字的项的列表。
(3)根据(1)或者(2)所述的信息处理设备,其中
数据库存储通过概括多个字符信息项而获得的多个概述信息项,以及
控制器
在接收到用户选择所显示的项之一的操作时,从数据库中检索对应于所选的项的概述信息项,以及
控制显示器,以显示所获取的概述信息项。
(4)根据(3)所述的信息处理设备,其中
控制器
控制显示器,以在包括在概述信息项中的第三关键字可选择的状态下显示概述信息项,
在接收到用户选择所显示的第三关键字的操作时,从数据库中检索包括第三关键字的第三字符信息,
提取包括在通过检索获取的第三字符信息中并且与第三关键字不同的第四关键字,以及
控制显示器,以显示包括以其标识获取的第三字符信息的第三标识信息和包括在第三字符信息中的第四关键字的项列表。
(5)根据(3)或者(4)所述的信息处理设备,其中
控制器在接收到用户指定所显示的概述信息项的任意位置的操作时,从与显示在指定位置的字符串对应的重放位置重发对应于字符信息项的多个语音信息项之一,作为概述信息项的概述源。
本公开含有与于2011年7月11日在日本专利局提交的第JP2011-152712号日本优先权专利申请披露的主题有关的主题,在此通过引用包括该专利申请的全部内容。
本领域内技术人员应当明白,根据设计要求和其他因素,可以设想各种修改、组合、部分组合和变型,然而,它们均落入所附权利要求书或者其等同的范围内。
Claims (7)
1.一种信息处理设备,包括:
显示器;
输入单元,配置为接收用户的第一关键字的输入;以及
控制器,配置为:
从配置为存储通过语音识别处理从多个语音信息项转换成的多个字符信息项的数据库中检索包括输入的第一关键字的第一字符信息,
提取包括在通过检索获取的第一字符信息中并且与第一关键字不同的第二关键字,以及
控制显示器,以显示包括以其标识获取的第一字符信息的第一标识信息和包括在第一字符信息中的第二关键字的项的列表。
2.根据权利要求1所述的信息处理设备,其中
所述控制器
在接收到用户选择包括在所显示的项中的第二关键字的操作时,从数据库中检索包括第二关键字的第二字符信息,
提取包括在通过检索获取的第二字符信息中并且与第二关键字不同的第三关键字,以及
控制所述显示器,以显示包括以其标识获取的第二字符信息的第二标识信息和包括在第二字符信息中的第三关键字的项的列表。
3.根据权利要求1所述的信息处理设备,其中
所述数据库存储通过概括多个字符信息项而获得的多个概述信息项,以及
所述控制器
在接收到用户选择所显示的项之一的操作时,从数据库中检索对应于所选的项的概述信息项,以及
控制所述显示器,以显示所获取的概述信息项。
4.根据权利要求3所述的信息处理设备,其中
所述控制器
控制所述显示器,以在包括在概述信息项中的第三关键字可选择的状态下显示概述信息项,
在接收到用户选择所显示的第三关键字的操作时,从数据库中检索包括第三关键字的第三字符信息,
提取包括在通过检索获取的第三字符信息中并且与第三关键字不同的第四关键字,以及
控制显示器,以显示包括以其标识获取的第三字符信息的第三标识信息和包括在第三字符信息中的第四关键字的项的列表。
5.根据权利要求3所述的信息处理设备,其中
所述控制器在接收到用户指定所显示的概述信息项的任意位置的操作时,从与显示在指定位置的字符串对应的重放位置重放对应于字符信息项的多个语音信息项之一,作为概述信息项的概述源。
6.一种信息处理方法,包括:
接收用户的第一关键字的输入;
从配置为存储通过语音识别处理从多个语音信息项转换成的多个字符信息项的数据库中检索包括输入的第一关键字的第一字符信息,
提取包括在通过检索获取的第一字符信息中并且与第一关键字不同的第二关键字,以及
显示包括以其标识获取的第一字符信息的第一标识信息和包括在第一字符信息中的第二关键字的项的列表。
7.一种使得信息处理设备执行如下步骤的程序:
接收用户的第一关键字的输入;
从配置为存储通过语音识别处理从多个语音信息项转换成的多个字符信息项的数据库中检索包括输入的第一关键字的第一字符信息,
提取包括在通过检索获取的第一字符信息中并且与第一关键字不同的第二关键字,以及
显示包括以其标识获取的第一字符信息的第一标识信息和包括在第一字符信息中的第二关键字的项的列表。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011152712A JP5799621B2 (ja) | 2011-07-11 | 2011-07-11 | 情報処理装置、情報処理方法及びプログラム |
JP2011-152712 | 2011-07-11 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102982061A true CN102982061A (zh) | 2013-03-20 |
Family
ID=47519677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012102300374A Pending CN102982061A (zh) | 2011-07-11 | 2012-07-04 | 信息处理设备、信息处理方法和程序 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9824143B2 (zh) |
JP (1) | JP5799621B2 (zh) |
CN (1) | CN102982061A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103354089A (zh) * | 2013-06-25 | 2013-10-16 | 天津三星通信技术研究有限公司 | 一种语音通信管理方法及其装置 |
CN107123418A (zh) * | 2017-05-09 | 2017-09-01 | 广东小天才科技有限公司 | 一种语音消息的处理方法及移动终端 |
CN112567440A (zh) * | 2018-08-16 | 2021-03-26 | 索尼公司 | 信息处理装置、信息处理方法和程序 |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8606576B1 (en) * | 2012-11-02 | 2013-12-10 | Google Inc. | Communication log with extracted keywords from speech-to-text processing |
JP6217003B2 (ja) * | 2013-05-31 | 2017-10-25 | 株式会社北電子 | 端末装置、睡眠言動記録方法及び睡眠言動記録プログラム |
USD737833S1 (en) | 2013-06-09 | 2015-09-01 | Apple Inc. | Display screen or portion thereof with graphical user interface |
JP6248444B2 (ja) * | 2013-07-19 | 2017-12-20 | 富士通株式会社 | 情報処理プログラム、装置、及び方法 |
KR20150011879A (ko) * | 2013-07-23 | 2015-02-03 | 삼성전자주식회사 | 휴대 단말기에서 일정을 등록하는 방법 및 장치 |
CN103777917A (zh) * | 2013-11-07 | 2014-05-07 | 张钦强 | 一种便携语音输入设备 |
US9122636B2 (en) * | 2013-11-27 | 2015-09-01 | Sandisk Enterprise Ip Llc | Hard power fail architecture |
WO2015178715A1 (en) * | 2014-05-23 | 2015-11-26 | Samsung Electronics Co., Ltd. | System and method of providing voice-message call service |
KR20160024630A (ko) * | 2014-08-26 | 2016-03-07 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 통화 정보 표시 방법 |
JP5855202B1 (ja) * | 2014-10-20 | 2016-02-09 | ヤフー株式会社 | 検索装置、検索方法及び検索プログラム |
JP2016146522A (ja) * | 2015-02-06 | 2016-08-12 | カシオ計算機株式会社 | データ出力装置、データ出力方法及びプログラム |
JP2016189121A (ja) * | 2015-03-30 | 2016-11-04 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
USD825612S1 (en) | 2016-07-27 | 2018-08-14 | Apple Inc. | Display screen or portion thereof with graphical user interface |
USD962954S1 (en) | 2016-09-06 | 2022-09-06 | Apple Inc. | Display screen or portion thereof with graphical user interface |
JP6865701B2 (ja) * | 2017-04-18 | 2021-04-28 | 日本放送協会 | 音声認識誤り修正支援装置およびそのプログラム |
KR102394912B1 (ko) * | 2017-06-09 | 2022-05-06 | 현대자동차주식회사 | 음성 인식을 이용한 주소록 관리 장치, 차량, 주소록 관리 시스템 및 음성 인식을 이용한 주소록 관리 방법 |
USD851112S1 (en) * | 2017-12-11 | 2019-06-11 | Citrix Systems, Inc. | Display screen or portion thereof with graphical user interface |
USD924912S1 (en) | 2019-09-09 | 2021-07-13 | Apple Inc. | Display screen or portion thereof with graphical user interface |
KR102317742B1 (ko) * | 2019-11-29 | 2021-10-27 | 삼성전자 주식회사 | 서버 및 그 제어방법과, 영상처리장치 및 그 제어방법 |
CN111581410B (zh) * | 2020-05-29 | 2023-11-14 | 上海依图网络科技有限公司 | 图像检索方法及其装置、介质和系统 |
KR102418798B1 (ko) * | 2020-10-29 | 2022-07-08 | 삼성전자 주식회사 | 서버 및 그 제어방법과, 영상처리장치 및 그 제어방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060277210A1 (en) * | 2005-06-06 | 2006-12-07 | Microsoft Corporation | Keyword-driven assistance |
CN201355842Y (zh) * | 2006-02-10 | 2009-12-02 | 斯皮沃克斯有限公司 | 一种大规模、用户独立、装置独立的语音讯息系统 |
US20100145939A1 (en) * | 2008-12-05 | 2010-06-10 | Yahoo! Inc. | Determining related keywords based on lifestream feeds |
Family Cites Families (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05143647A (ja) * | 1991-11-22 | 1993-06-11 | Nippon Telegr & Teleph Corp <Ntt> | データベース検索処理方法 |
JPH05189488A (ja) * | 1992-01-08 | 1993-07-30 | Anritsu Corp | 文書検索方法及び装置 |
US6199076B1 (en) * | 1996-10-02 | 2001-03-06 | James Logan | Audio program player including a dynamic program selection controller |
US7596606B2 (en) * | 1999-03-11 | 2009-09-29 | Codignotto John D | Message publishing system for publishing messages from identified, authorized senders |
CA2323538A1 (en) * | 1999-12-08 | 2001-06-08 | At&T Corp. | System and method for gisting, browsing and searching voicemail using automatic speech recognition |
US6697796B2 (en) * | 2000-01-13 | 2004-02-24 | Agere Systems Inc. | Voice clip search |
US6507643B1 (en) * | 2000-03-16 | 2003-01-14 | Breveon Incorporated | Speech recognition system and method for converting voice mail messages to electronic mail messages |
US20060271365A1 (en) * | 2000-09-18 | 2006-11-30 | International Business Machines Corporation | Methods and apparatus for processing information signals based on content |
US7039585B2 (en) * | 2001-04-10 | 2006-05-02 | International Business Machines Corporation | Method and system for searching recorded speech and retrieving relevant segments |
JPWO2003039123A1 (ja) * | 2001-11-01 | 2005-02-24 | 富士通株式会社 | 電子メールシステムおよび電子メール送信方法 |
US20030220784A1 (en) * | 2002-05-24 | 2003-11-27 | International Business Machines Corporation | System and method for automated voice message transcription and delivery |
US8209185B2 (en) * | 2003-09-05 | 2012-06-26 | Emc Corporation | Interface for management of auditory communications |
US20050069095A1 (en) * | 2003-09-25 | 2005-03-31 | International Business Machines Corporation | Search capabilities for voicemail messages |
JP2005210497A (ja) * | 2004-01-23 | 2005-08-04 | Mitsubishi Electric Corp | 携帯情報端末 |
US7478044B2 (en) * | 2004-03-04 | 2009-01-13 | International Business Machines Corporation | Facilitating navigation of voice data |
US7814155B2 (en) * | 2004-03-31 | 2010-10-12 | Google Inc. | Email conversation management system |
US7941491B2 (en) * | 2004-06-04 | 2011-05-10 | Messagemind, Inc. | System and method for dynamic adaptive user-based prioritization and display of electronic messages |
WO2006053167A1 (en) * | 2004-11-11 | 2006-05-18 | Yahoo! Inc. | Search system presenting active abstracts including linked terms |
WO2007052285A2 (en) * | 2005-07-22 | 2007-05-10 | Yogesh Chunilal Rathod | Universal knowledge management and desktop search system |
US8503624B2 (en) * | 2005-09-28 | 2013-08-06 | Cisco Technology, Inc. | Method and apparatus to process an incoming message |
US7698140B2 (en) * | 2006-03-06 | 2010-04-13 | Foneweb, Inc. | Message transcription, voice query and query delivery system |
WO2007121441A2 (en) * | 2006-04-17 | 2007-10-25 | Vovision Llc | Methods and systems for correcting transcribed audio files |
WO2008024797A2 (en) * | 2006-08-21 | 2008-02-28 | Pinger, Inc. | Graphical user interface for managing voice messages |
EP1895745B1 (de) * | 2006-08-31 | 2015-04-22 | Swisscom AG | Verfahren und Kommunikationssystem zum kontinuierlichen Aufnehmen von Umgebungsdaten |
JP2008152605A (ja) * | 2006-12-19 | 2008-07-03 | Toyohashi Univ Of Technology | プレゼンテーション解析装置およびプレゼンテーション視聴システム |
AU2008204404B2 (en) * | 2007-01-09 | 2013-05-30 | Spinvox Limited | Detection of unanswered call in order to give calling party the option to alternatively dictate a text message for delivery to the called party |
US8644463B2 (en) * | 2007-01-10 | 2014-02-04 | Tvg, Llc | System and method for delivery of voicemails to handheld devices |
US8447285B1 (en) * | 2007-03-26 | 2013-05-21 | Callwave Communications, Llc | Methods and systems for managing telecommunications and for translating voice messages to text messages |
KR100898142B1 (ko) * | 2007-06-26 | 2009-05-19 | 박근섭 | 컨텐츠에 관련된 정보 키워드/정보 컨텐츠 제공 방법 및검색 방법 그리고 그 시스템 |
US8238528B2 (en) * | 2007-06-29 | 2012-08-07 | Verizon Patent And Licensing Inc. | Automatic analysis of voice mail content |
US8600343B2 (en) * | 2007-07-25 | 2013-12-03 | Yahoo! Inc. | Method and system for collecting and presenting historical communication data for a mobile device |
US20090097493A1 (en) * | 2007-10-12 | 2009-04-16 | Gururaja Patil | Queuing mixed messages for configurable searching |
US8756282B2 (en) * | 2007-11-19 | 2014-06-17 | Mastercard International Incorporated | Interpersonal communication enhancer |
US20090210778A1 (en) * | 2008-02-19 | 2009-08-20 | Kulas Charles J | Video linking to electronic text messaging |
US20090319504A1 (en) * | 2008-06-18 | 2009-12-24 | Motorola, Inc. | Method and Apparatus for Providing Enhanced Search Results to a User of a Communication Device |
JP5359109B2 (ja) * | 2008-08-12 | 2013-12-04 | 富士通株式会社 | キーワード抽出プログラム,キーワード抽出方法及びキーワード抽出装置 |
US20100125791A1 (en) * | 2008-11-14 | 2010-05-20 | Rebelvox, Llc | User interface for a telecommunication and multimedia management system and method |
US8345832B2 (en) * | 2009-01-09 | 2013-01-01 | Microsoft Corporation | Enhanced voicemail usage through automatic voicemail preview |
JP2010277036A (ja) | 2009-06-01 | 2010-12-09 | Mitsubishi Electric Corp | 音声データ検索装置 |
US8676172B2 (en) * | 2009-06-29 | 2014-03-18 | Nokia Solutions And Networks Oy | Generating relational indicators based on analysis of telecommunications events |
CN102483917B (zh) * | 2009-07-15 | 2016-03-16 | 谷歌公司 | 针对显示文本的命令 |
JP2011087005A (ja) | 2009-10-13 | 2011-04-28 | Neikusu:Kk | 通話音声要約生成システム、その方法及び通話音声要約生成プログラム |
US20110117893A1 (en) * | 2009-11-13 | 2011-05-19 | Go800, LLC | Methods of Connecting A Phone User Telephonically By Text Keyword Using A Keyword Database |
US8412695B2 (en) * | 2009-11-30 | 2013-04-02 | Infosys Technologies Limited | Method and system for providing context aware communication |
US20110131207A1 (en) * | 2009-12-01 | 2011-06-02 | Sony Ericsson Mobile Communications Ab | Text messaging hot topics |
US8983039B2 (en) * | 2010-05-05 | 2015-03-17 | Suinno Oy | Caller ID surfing |
US9361604B2 (en) * | 2010-09-23 | 2016-06-07 | Avaya Inc. | System and method for a context-based rich communication log |
US9251508B2 (en) * | 2010-12-09 | 2016-02-02 | At&T Intellectual Property I, L.P. | Intelligent message processing |
US20120198355A1 (en) * | 2011-01-31 | 2012-08-02 | International Business Machines Corporation | Integrating messaging with collaboration tools |
US9471605B2 (en) * | 2011-06-21 | 2016-10-18 | International Business Machines Corporation | Contact recommendation system for a user communication |
-
2011
- 2011-07-11 JP JP2011152712A patent/JP5799621B2/ja not_active Expired - Fee Related
-
2012
- 2012-07-02 US US13/539,693 patent/US9824143B2/en not_active Expired - Fee Related
- 2012-07-04 CN CN2012102300374A patent/CN102982061A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060277210A1 (en) * | 2005-06-06 | 2006-12-07 | Microsoft Corporation | Keyword-driven assistance |
CN201355842Y (zh) * | 2006-02-10 | 2009-12-02 | 斯皮沃克斯有限公司 | 一种大规模、用户独立、装置独立的语音讯息系统 |
US20100145939A1 (en) * | 2008-12-05 | 2010-06-10 | Yahoo! Inc. | Determining related keywords based on lifestream feeds |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103354089A (zh) * | 2013-06-25 | 2013-10-16 | 天津三星通信技术研究有限公司 | 一种语音通信管理方法及其装置 |
CN103354089B (zh) * | 2013-06-25 | 2015-10-28 | 天津三星通信技术研究有限公司 | 一种语音通信管理方法及其装置 |
CN107123418A (zh) * | 2017-05-09 | 2017-09-01 | 广东小天才科技有限公司 | 一种语音消息的处理方法及移动终端 |
CN112567440A (zh) * | 2018-08-16 | 2021-03-26 | 索尼公司 | 信息处理装置、信息处理方法和程序 |
Also Published As
Publication number | Publication date |
---|---|
US20130019176A1 (en) | 2013-01-17 |
JP5799621B2 (ja) | 2015-10-28 |
US9824143B2 (en) | 2017-11-21 |
JP2013020411A (ja) | 2013-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102982061A (zh) | 信息处理设备、信息处理方法和程序 | |
JP5087273B2 (ja) | 設定可能な情報特定システム及び方法 | |
US9756170B2 (en) | Keyword based message handling | |
US20210358480A1 (en) | Information processing device, information processing method, and program | |
US8548444B2 (en) | Linking a name to a phone number in a text message based on a contact list in a mobile device | |
CN103841656A (zh) | 移动终端及其数据提供方法 | |
US20140184514A1 (en) | Input processing method and apparatus | |
CN102782751A (zh) | 社会网络中的数字媒体语音标签 | |
CN110325987B (zh) | 语境语音驱动深度书签 | |
EP3029567B1 (en) | Method and device for updating input method system, computer storage medium, and device | |
EP3115907A1 (en) | Common data repository for improving transactional efficiencies of user interactions with a computing device | |
CN110830362A (zh) | 一种生成内容的方法、移动终端 | |
WO2013127319A1 (en) | Method and apparatusfor text searching on a touchterminal | |
CN107885826A (zh) | 多媒体文件播放方法、装置、存储介质及电子设备 | |
CN108595107B (zh) | 一种界面内容处理方法及移动终端 | |
CN110941752B (zh) | 信息搜索方法、数据处理方法及设备 | |
CN107845384A (zh) | 一种语音识别方法 | |
CN106888308A (zh) | 一种语音处理方法及移动终端 | |
CN107885827B (zh) | 文件获取方法、装置、存储介质及电子设备 | |
US20100149190A1 (en) | Method, apparatus and computer program product for providing an input order independent character input mechanism | |
CN109948155B (zh) | 一种多意图的选择方法及装置、终端设备 | |
KR102347070B1 (ko) | 단말기의 정보 처리 방법 및 장치 | |
CN101727204A (zh) | 一种通信终端上的文字输入系统、方法及通信终端 | |
KR20150096207A (ko) | 전자 장치 및 전자 장치의 대화 메시지에서 의미개체 추출 및 이용방법 | |
CN105320707B (zh) | 基于即时通信的热词提示方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20130320 |