本发明涉及数据处理,特别涉及一种用户语音留言的智能处理方法及系统。
背景技术:
1、现有政务平台存在留言功能,这其中除了文字留言之外,还包括语音留言,语音留言功能可以为政务平台带来更多的便利性和多样性,有助于扩大用户参与和提高服务质量。但是语音数据一般需要转录为文字,以方便后台人员根据留言信息进行反馈、处理和分析,因此,语音留言的转录是至关重要的。
2、目前的语音转录技术虽然具有较高的准确率,但还存在一定的识别误差,尤其是存在部分情况下转录文字难以理解的问题,导致需要后台人员进行人工转录。因此,需要进一步提高语音自动转录为文字的准确率。
技术实现思路
1、为了解决现有技术的上述问题,本发明提供一种用户语音留言的智能处理方法及系统,能够提高语音自动转录为文字的准确率。
2、为了达到上述目的,本发明采用的技术方案为:
3、第一方面,本发明提供一种用户语音留言的智能处理方法,包括步骤:
4、获取用户的语音留言数据和政务留言标签;
5、提取所述政务留言标签相关联的高频词汇,在使用第一语音转录模型对所述语音留言数据进行转录时,提高所述高频词汇的权重数值,得到第一文字信息,所述第一语音转录模型的训练数据为文本;
6、对所述第一文字信息进行分词,得到多个第一词汇,并根据所述第一词汇和所述语音留言数据的对应关系,将所述语音留言数据划分为每一个词汇对应的语音留言片段,使用第二语音转录模型对所述语音留言片段进行转录,得到每一个语音留言片段的第二词汇,所述第二语音转录模型的训练数据为单词汇;
7、依次判断所述第一词汇和所述第二词汇是否相同,若相同,则将所述第一文字信息输出为最终转录文本进行输出,否则将所述第二词汇替换所述第一文字信息中的第一词汇之后形成第二文字信息,使用自然语言处理技术对所述第一文字信息和所述第二文字信息进行逻辑判断,保留其中逻辑判断结果更好的文字信息中的词汇,在完成所有词汇的判断之后,得到并输出最终转录文本。
8、本发明的有益效果在于:首先本发明在进行语音转录文字的过程中提高了政务留言标签相关联的高频词汇的权重数值,使得本发明在不同政务场景下都具有针对性适配,因此能够提高语音自动转录为文字的准确率。其次本发明通过适用文本的和适用词汇的不同语音转录模型对语音留言数据进行语音转录,且是通过文本的语音转录模型所识别出来的第一词汇来进行语音留言片段的划分,使得语音分段更加快速准确;之后通过逻辑合理性选择其中较为合理的文字信息进行保留,从而兼顾了局部和整体,从而能够进一步地提高语音自动转录为文字的准确率。
9、可选地,所述政务留言标签为用户所选择的政务处理事项以及事件发生位置和事件发生时间,所述事件发生时间相关联的高频词汇为当前时间在预设时间范围内的所有时间。
10、可选地,所述提取所述政务留言标签相关联的高频词汇包括步骤:
11、从同一政务留言标签下的所有留言数据中提取符合预设规则的词汇作为高频词汇,所述预设规则包括预设排序之前或者是用于排序的预设分数之上。
12、可选地,所述提取所述政务留言标签相关联的高频词汇还包括步骤:
13、获取所述用户的历史留言数据,从所述历史留言数据中提取符合预设规则的词汇作为高频词汇。
14、可选地,所述第一语音转录模型和所述第二语音转录模型均是基于深度全序列卷积神经网络。
15、可选地,所述提高所述高频词汇的权重数值为:
16、将所述高频词汇作为自定义词汇表,使得所述第一语音转录模型会优先考虑所述自定义词汇表。
17、可选地,所述得到第一文字信息之后包括步骤:
18、将所述第一文字信息作为初始文字信息,对所述初始文字信息中的文字进行符号识别,将识别出来为符号的文字由文字形态替换为符号形态,以形成二次文字信息,所述符号包括标点符号和表情;
19、使用自然语言处理技术对所述初始文字信息和所述二次文字信息进行逻辑判断,将其中逻辑判断结果更好的文字信息作为最终的第一文字信息进行输出。
20、根据上述描述可知,能够使得语音转录文字的结果和用户实际表达的内容更加相近,且能更符合现有的文字表达形式。
21、可选地,还包括步骤:
22、当得到所述最终转录文本时,根据所述政务留言标签相关联的高频词汇提取同一高频词汇的其他政务留言数据,根据所有其他政务留言数据在处理后的事件反馈结果对所述最终转录文本进行优先级排序显示。
23、根据上述描述可知,根据事件反馈结果进行优先级排序显示,能够提前处理一些事态比较严重的留言。
24、可选地,还包括步骤:
25、在所述最终转录文本中,当所述第一语音转录模型所得到的第一词汇的概率数值小于预设文字阈值,或者是当所述第二语音转录模型所得到的第二词汇的概率数值小于预设词汇阈值,则对所述最终转录文本中的词汇进行提醒式显示。
26、第二方面,本发明提供一种用户语音留言的智能处理系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面的一种用户语音留言的智能处理方法。
27、其中,第二方面所提供的一种用户语音留言的智能处理系统所对应的技术效果参照第一方面所提供的一种用户语音留言的智能处理方法的相关描述。
1.一种用户语音留言的智能处理方法,其特征在于,包括步骤:
2.根据权利要求1所述的一种用户语音留言的智能处理方法,其特征在于,所述政务留言标签为用户所选择的政务处理事项以及事件发生位置和事件发生时间,所述事件发生时间相关联的高频词汇为当前时间在预设时间范围内的所有时间。
3.根据权利要求1所述的一种用户语音留言的智能处理方法,其特征在于,所述提取所述政务留言标签相关联的高频词汇包括步骤:
4.根据权利要求3所述的一种用户语音留言的智能处理方法,其特征在于,所述提取所述政务留言标签相关联的高频词汇还包括步骤:
5.根据权利要求1所述的一种用户语音留言的智能处理方法,其特征在于,所述第一语音转录模型和所述第二语音转录模型均是基于深度全序列卷积神经网络。
6.根据权利要求5所述的一种用户语音留言的智能处理方法,其特征在于,所述提高所述高频词汇的权重数值为:
7.根据权利要求1所述的一种用户语音留言的智能处理方法,其特征在于,所述得到第一文字信息之后包括步骤:
8.根据权利要求1所述的一种用户语音留言的智能处理方法,其特征在于,还包括步骤:
9.根据权利要求8所述的一种用户语音留言的智能处理方法,其特征在于,还包括步骤:
10.一种用户语音留言的智能处理系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9任一所述的一种用户语音留言的智能处理方法。