一种语音处理方法、装置及电子设备与流程

文档序号:37819325发布日期:2024-04-30 17:29阅读:13来源:国知局
一种语音处理方法、装置及电子设备与流程

本技术涉及计算机,可用于金融领域,特别涉及一种语音处理方法、装置及电子设备。


背景技术:

1、语音问答系统是指利用语音的交互方式实现人机对话的系统,随着人工智能技术的发展,语音问答系统在通用领域的准确率不断提高,被广泛应用在数字客服、智能助手等多个领域。现有的语音问答系统可以分为两类,一类是采用生成式预训练(generativepre-training,gpt)模型的通用问答系统,其回答内容具有丰富性、灵活性,多被用于日常闲聊场景中;另一种是采用知识图谱的特定技术领域的问答模型。

2、通用问答系统受识别精度和问答知识库的限制,对于特定技术领域的专业性问题的回复准确性较低;采用知识图谱的特定技术领域的问答模型虽然能够较为准确地回复特定技术领域的专业性问题,但是对于非专业性问题的回复则较为死板,在无法根据知识图谱确定回复文本的情况下通常采用固定句式进行回复,例如“这个问题我无法理解,请输入新的问题”,这就要求所提问题必须是专业性问题。


技术实现思路

1、本说明书提供一种语音处理方法、装置及电子设备,以解决现有的语音问答系统的回复准确性较低或者不够丰富、灵活的问题。

2、为解决上述技术问题,本说明书第一方面提供一种语音处理方法,包括:获取用户的当前语音信息对应的当前语音文本;采用实体匹配模型对所述当前语音文本进行处理;在匹配到实体名称的情况下,将实体变量的取值设置为匹配到的实体名称;在未匹配到实体名称的情况下,保持实体变量的取值不变;将所述当前语音文本输入分类器;所述分类器用于确定所述当前语音文本的问题类型,所述问题类型包括专业问题的分类标识、无法识别出问题分类;将所述分类器输出的问题类型作为问题类型变量的取值;根据实体变量的当前取值、问题类型变量的当前取值,选择当前语音信息的答复策略;所述答复策略包括根据目标领域的知识图谱生成答复文本、调用通用模型生成答复文本;采用选择的答复策略生成答复文本,并根据答复文本播放答复语音。

3、在一些实施例中,根据实体变量的当前取值、问题类型变量的当前取值,选择当前语音信息的答复策略,包括:在实体变量的当前取值是目标领域的实体名称、问题类型变量为专业问题分类标识的情况下,选择答复策略为根据目标领域的知识图谱生成答复文本;在实体变量的当前取值不是目标领域的实体名称,或者问题类型变量不是专业问题分类标识的情况下,选择调用通用模型生成答复文本。

4、在一些实施例中,所述知识图谱包括节点和节点之间的关系,所述节点对应于匹配到的实体名称,所述节点之间的关系对应于所述分类器输出的专业问题分类标识。

5、在一些实施例中,获取用户的当前语音信息对应的当前语音文本,包括:获取用户的当前语音信息;对所述当前语音信息进行识别,得到当前识别文本;采用预先建立的专业名词库对所述当前识别文本进行纠错处理,将纠错处理后的识别文本作为当前语音信息对应的当前语音文本。

6、在一些实施例中,采用预先建立的专业名词库对所述当前识别文本进行纠错处理,包括:利用标点符号将当前识别文本切分成多个短句;将各个短句进一步切分成多个短语;计算每个短语分别与专业名词库中各个专业名词之间的相似度;在最大相似度大于预定相似度的情况下,采用最大相似度对应的专业名词替换当前语音文本中所述最大相似度对应的短语。

7、在一些实施例中,计算每个短语分别与专业名词库中各个专业名词之间的相似度,包括采用如下方法计算当前短语分别与专业名词库中各个专业名词之间的相似度:将当前短语和专业名词库中各个专业名词中的中文大写数字串替换为阿拉伯数字串;将替换后的当前短语和替换后的各个专业名词转换为读音标识数组,计算当前短语对应的读音标识数组分别与各个专业名词对应的读音标识数组之间的第一相似度;将替换后的当前短语和替换后的各个专业名称转换为字形数组,计算当前短语对应的字形数组分别与各个专业名词对应的字形数组之间的第二相似度;对于当前短语与同一专业名词对应的第一相似度、第二相似度,保留所述第一相似度和所述第二相似度中的最大值。

8、在一些实施例中,所述目标领域为金融领域,所述知识图谱和专业名词库是根据金融产品信息构建的。

9、本说明书第二方面提供一种语音处理装置,包括获取单元,用于获取用户的当前语音信息对应的当前语音文本;匹配单元,用于采用实体匹配模型对所述当前语音文本进行处理;第一设置单元,用于在匹配到实体名称的情况下,将实体变量的取值设置为匹配到的实体名称;在未匹配到实体名称的情况下,保持实体变量的取值不变;处理单元,用于将所述当前语音文本输入分类器;所述分类器用于确定所述当前语音文本的问题类型,所述问题类型包括专业问题的分类标识、无法识别出问题分类;第二设置单元,用于将所述分类器输出的问题类型作为问题类型变量的取值;选择单元,用于根据实体变量的当前取值、问题类型变量的当前取值,选择当前语音信息的答复策略;所述答复策略包括根据目标领域的知识图谱生成答复文本、调用通用模型生成答复文本;答复单元,用于采用选择的答复策略生成答复文本,并根据答复文本播放答复语音。

10、在一些实施例中,所述选择单元包括:第一选择子单元,用于在实体变量的当前取值是目标领域的实体名称、问题类型变量为专业问题分类标识的情况下,选择答复策略为根据目标领域的知识图谱生成答复文本;第二选择子单元,用于在实体变量的当前取值不是目标领域的实体名称,或者问题类型变量不是专业问题分类标识的情况下,选择调用通用模型生成答复文本。

11、在一些实施例中,所述知识图谱包括节点和节点之间的关系,所述节点对应于匹配到的实体名称,所述节点之间的关系对应于所述分类器输出的专业问题分类标识。

12、在一些实施例中,所述获取单元包括:第一获取子单元,用于获取用户的当前语音信息;识别子单元,用于对所述当前语音信息进行识别,得到当前识别文本;纠错子单元,用于采用预先建立的专业名词库对所述当前识别文本进行纠错处理,将纠错处理后的识别文本作为当前语音信息对应的当前语音文本。

13、在一些实施例中,所述纠错子单元包括:第一切分子单元,用于利用标点符号将当前识别文本切分成多个短句;第二切分子单元,用于将各个短句进一步切分成多个短语;计算子单元,用于计算每个短语分别与专业名词库中各个专业名词之间的相似度;替换子单元,用于在最大相似度大于预定相似度的情况下,采用最大相似度对应的专业名词替换当前语音文本中所述最大相似度对应的短语。

14、在一些实施例中,所述计算子单元包括:第一替换子单元,用于将当前短语和专业名词库中各个专业名词中的中文大写数字串替换为阿拉伯数字串;第一转换子单元,用于将替换后的当前短语和替换后的各个专业名词转换为读音标识数组,计算当前短语对应的读音标识数组分别与各个专业名词对应的读音标识数组之间的第一相似度;第二转换子单元,用于将替换后的当前短语和替换后的各个专业名称转换为字形数组,计算当前短语对应的字形数组分别与各个专业名词对应的字形数组之间的第二相似度;选取子单元,用于对于当前短语与同一专业名词对应的第一相似度、第二相似度,保留所述第一相似度和所述第二相似度中的最大值。

15、在一些实施例中,所述目标领域为金融领域,所述知识图谱和专业名词库是根据金融产品信息构建的。

16、本说明书第三方面提供一种电子设备,包括:存储器和处理器,所述处理器和所述存储器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而实现第一方面任一项所述的语音处理方法。

17、本说明书第四方面提供一种计算机存储介质,所述计算机存储介质存储有计算机程序指令,所述计算机程序指令被执行时实现第一方面任一项所述的语音处理方法。

18、本说明书第五方面提供一种计算机程序产品,包含有计算机程序,所述计算机程序被处理器执行时实现第一方面任一项所述方法的语音处理方法。

19、本说明书提供的语音处理方法、装置及电子设备,采用实体匹配模型对用户当前语音信息的当前语音文本进行处理,采用实体名称匹配结果更新实体变量的取值,然后根据当前语音文本、实体变量的取值进一步确定当前语音文本的问题类型,并更新问题类型变量的取值;根据实体变量的当前取值、问题类型变量的当前取值选择当前语音信息的答复策略。本方案能够根据语音信息的具体内容确定答复策略,提高答复策略与用户语音信息的匹配度准确性;通过设置实体变量、问题类型变量使得用户在提问时能够采用简略的提问方式、简洁的自然语言,使问答过程更符合人类问答沟通过程中的表达习惯,提高语音处理方法的适用范围;本方案根据匹配到的实体名称、当前语音文本一同确定当前语音文本的问题类型,对于用户提问时省略信息的情况也能够较为准确地确定问题类型,进而提高答复的准确性。

20、本方案在匹配到实体名称的情况下,将实体变量的取值设置为匹配到的实体名称;在未匹配到实体名称的情况下,保持实体变量的取值不变,这对于用户问题在目标领域、非目标领域之间随意切换的情况也能够较为有针对性地确定答复策略,提高对于每个问题的答复准确性、灵活性。

21、本方案既能够匹配出目标领域的实体名称,也能够匹配出非目标领域的实体名称,只有在未识别到实体名称的情况下才会继承之前的实体变量的取值,而不是仅识别目标领域的实体名称、在未识别到实体名称的情况下继承之前的实体变量的取值。相比于后者,前者所述的本方案能够更为准确地确定是否需要继承之前的实体变量,而后者方案对于当前语句中实际有非目标领域的实体的情况下也会继承之前的实体变量,若之前的实体变量为目标领域的实体名称,那么就会错误地识别当前语句中包含目标领域的实体变量,从而导致答复策略选择不合适,进而导致答复准确率较低或者答复的灵活性较差。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1
imtoken助记词怎么填-imtoken钱包没有收益-imtoken矿工费太贵了-im钱包官网:token.im