基于大模型的检验报告解读方法、系统、设备及介质与流程

文档序号:37558481发布日期:2024-04-09 17:51阅读:80来源:国知局
基于大模型的检验报告解读方法、系统、设备及介质与流程

本发明属于人工智能,涉及检验报告的智能解读,尤其涉及一种基于大模型的检验报告解读方法、系统、设备及介质。


背景技术:

1、随着生活水平的提高,人们对健康状况的关注也是越来越高。无论是人们日常的健康体检,还是在就医诊断过程中,都会涉及各种各样的检测,同时也会产生各种检测报告、检验报告(以下统称为检验报告)。尤其是在临床中,患者对自身的健康状况有了足够了解,对检验报告中的各项数据也有了清晰的认识、了解,那患者配合诊断、治疗的可能性就会大大提高,对患者后续的健康管理也非常重要。然而,由于报告的解读过于专业,普通人对报告中的专业术语不理解。所以,现有技术中,被测者在领取到检测报告后,通常是将报告给到医生,然后由医生进行指导、解读、解释并给出相应健康建议。由于现在医疗资源较为欠缺,医生基本不可能做到面面俱到,对每位患者详细解读、解释其检验报告,为此,就亟需一种检验报告的智能解读方法、解读系统,以便普通人员能够根据解读的结果了解自身的健康状况、知晓如何配合医生的诊疗、甚至是后续的自我健康管理。

2、现有的报告智能解读方法,大多是从对接的医疗信息系统中获取检查报告,然后大模型根据患者针对报告提出的问题进行分析,得到关键词,患者问答系统根据关键词匹配相应的回答以及诊断建议,然后大模型再根据问答以及诊断建议进行分析后,生成解答并提供给患者。

3、如,申请号为202310472245.3的发明专利申请就公开了一种体检报告解读方法、装置、存储介质以及电子设备,其方法包括:获取待解读的体检报告;针对所述体检报告的类型采用与所述体检报告的类型相对应的数据提取方法,获取与所述体检报告对应的若干结构化体检数据;采用预设算法模型对各所述结构化体检数据进行数据处理,得到与所述体检报告对应的各医疗分析数据;至少基于目标医疗分析数据以及与所述目标医疗分析数据对应的预置数据等级划分方式,生成反映健康趋势的体检报告解读图示。本解读方法可以更精确的直观的展示用户的体检结果,反映用户的健康状况。

4、再如,申请号为202310956340.0的发明专利申请就公开了一种基于大语言模型和流程挖掘数据生成智能分析报告的方法和系统,其包括流程挖掘数据引擎、流程挖掘图表组件、任务编排引擎、大语言模型和自然语言接口;流程挖掘数据引擎:流程挖掘数据引擎是该系统的核心组件,用于接收和处理流程挖掘的原始数据;流程挖掘数据引擎从各种数据源中提取数据,并进行预处理和清洗,以准备后续的分析工作;数据源包括日志文件、数据库、传感器,该引擎支持数据抽取、转换和加载、数据清洗和特征提取,以确保数据的质量和准确性;流程挖掘图表组件:流程挖掘图表组件用于将经过专题数据计算后的结果可视化呈现。流程挖掘图表组件生成各种类型的图表,以展示不同维度的流程挖掘数据,图表为柱状图、折线图、饼图;这些图表能够直观地揭示数据之间的关联和趋势,帮助用户更好地理解和分析数据;任务编排引擎:任务编排引擎是协调系统中各个组件的关键部分;任务编排引擎根据用户需求和输入提示,与大语言模型进行交互,并协调生成最终的智能分析报告;任务编排引擎负责将用户的问题和需求转化为适合大语言模型处理的输入格式,并管理模型的调用和结果的解析;大语言模型:大语言模型是系统中的智能分析核心,它基于强大的自然语言处理和文本生成能力,可以根据输入提示推理生成结论和报告;通过与任务编排引擎的协作,大语言模型能够利用流程挖掘数据、专题数据计算结果以及可视化图表等信息,生成描述、分析和解读流程挖掘模型的智能报告;自然语言接口:系统提供自然语言接口,使系统具备以自然语言方式进行交互的能力,用户可以通过简单的自然语言指令与系统进行交互;用户可以提出问题、输入指令或请求特定类型的报告,系统将根据用户的输入进行解析和生成对应的分析报告,使得用户与系统之间的交互更加直观和便捷。

5、如上述的基于大语言模型和流程挖掘数据生成智能分析报告的方法和系统,现有的智能分析报告大多仅是采用大语言模型对报告进行解读,或者根据患者的提问结合报告进行解答。但是,基于大语言模型分析得来的文本数据,尚不能直接使用,或者使用后对报告的解读准确性较低、可靠性也更低,有必要提供一种解读准确性与可靠性更高的检验报告解读方法;此外,现有的解读方法仅是解读报告中的内容,并不能根据报告给出相应的健康建议。


技术实现思路

1、本发明的目的在于:为了提高检验报告解读的准确性和可靠性,提供一种基于大模型的检验报告解读方法、系统、设备及介质,通过在构建和微调大语言模型后,使模型能够掌握专业知识,形成专家智库,模型可根据被测者的检验数据进行解读、生成对应的健康建议,让被测者能够读懂自己的检验报告,知晓后续的健康建议。

2、本发明为了实现上述目的具体采用以下技术方案:

3、一种基于大模型的检验报告解读方法,包括以下步骤:

4、步骤s1,构建专家知识库;

5、通过爬虫程序从网络上收集医学知识数据,并利用收集的医学知识数据对报告解析大语言模型进行自监督学习;

6、步骤s2,使用前微调;

7、对报告解析大语言模型进行健康建议微调,使报告解析大语言模型具备检验报告解读的能力、以及根据报告解读结论输出健康建议的能力;

8、步骤s3,报告解析;

9、获取待解读的检验报告数据,并将检验报告数据输入报告解析大语言模型进行解析,并输出报告解读结论、健康建议。

10、进一步地,步骤s1中,报告解析大语言模型进行自监督学习时,具体步骤为:

11、步骤s1-1,输出特征向量;

12、使用报告解析大语言模型作为分析器,对检验报告样本数据进行分词处理,输出特征向量;

13、步骤s1-2,预测特征向量;

14、对于每条样本数据,将每条样本数据的特征向量逐个输入到报告解析大语言模型中,报告解析大语言模型根据输入的特征向量去预测后面的特征向量,并且计算同一条样本数据的两个特征向量的向量误差;

15、步骤s1-3,更新参数;

16、根据向量误差,更新大语言模型的参数;

17、步骤s1-4,重复至模型收敛;

18、重复步骤s1-2到步骤s1-3,直至报告解析大语言模型收敛。

19、进一步地,步骤s2中,在进行健康建议微调时,具体步骤为:

20、步骤s2-1-1,设计多个表示不同任务的人工编写指令,根据每条人工编写指令编写对应的(输入)和/或(输出),并将这些数据(指令,输入,输出)、(指令、输出)作为种子池;

21、步骤s2-1-2,从种子池中随机抽取n条人工编写指令,并输入至报告解析大语言模型,报告解析大语言模型输出模型生成指令、该模型生成指令的指令类型以及该模型生成指令所对应的(输入,输出);

22、其中,指令类型包括分类指令、非分类指令;

23、步骤s2-1-3,选择m条人工编写指令、p条模型生成指令,并将选择出来的指令输入至报告解析大语言模型,报告解析大语言模型输出模型生成指令、指令类型以及指令所对应的(输入,输出);

24、步骤s2-1-4,判断步骤s2-1-3输出的模型生成指令的rouge-l指标;若模型生成指令的rouge-l指标小于种子池中的指令的rouge-l指标的0.7倍,则将该指令对应的数据(指令,输入,输出)、(指令、输出)添加进种子池,并更新种子池;

25、步骤s2-1-5,重复步骤s2-1-3、步骤s2-1-4,直至种子池中所有指令数量达到10000条;

26、步骤s2-1-6,根据报告解析大语言模型输出的报告解读结论,报告解析大语言模型匹配种子池中数据(指令,输入,输出)中的(输入),并输出与该(输入)对应的(输出),该(输出)即为健康建议。

27、进一步地,步骤s2,在对报告解析大语言模型进行健康建议微调之后,再对报告解析大语言模型进行专家反馈微调。

28、更进一步地,在进行专家反馈微调时,具体步骤为:

29、步骤s2-2-1,获取样本数据;

30、获取检验报告样本数据及报告解读结论;

31、步骤s2-2-2,构建奖励模型;

32、奖励模型包括奖励大语言模型、输出层,奖励大语言模型通过复制报告解析大语言模型得到;

33、步骤s2-2-3,训练奖励模型;

34、采用步骤s2-2-1获取的检验报告样本数据及报告解读结论对步骤s2-2-2构建的奖励模型进行训练,得到成熟的奖励模型;

35、步骤s2-2-4,优化模型;

36、使用ppo算法并根据奖励值优化报告解析大语言模型中的参数,优化过程中固定输出层的参数,仅更新奖励大语言模型、报告解析大语言模型的参数。

37、更进一步地,步骤s2-2-3中,在训练奖励模型时,损失函数为:

38、,其中,表示输入的问题,表示回答的序号,表示选择结果的序号,表示奖励模型,表示数据集,表示第i个回答,表示回答的集合,表示选择结果的集合,表示第j个选择结果,表示选择该回答能够得到的奖励权重,表示回答的文本内容,表示第i个回答所能得到的奖励权重,表示第i个回答的文本内容,表示奖励模型。

39、进一步地,步骤s2-2-4中,在优化模型时,使用kl散度作为奖励值的惩罚项,设专家反馈微调前报告解析大语言模型输出为,奖励大语言模型的输出为,则奖励值表示为:,其中,表示惩罚权重,表示kl散度,表示奖励模型输出。

40、一种基于大模型的检验报告解读系统,包括以下步骤:

41、专家知识库构建???,用于通过爬虫程序从网络上收集医学知识数据,并利用收集的医学知识数据对报告解析大语言模型进行自监督学习;

42、使用前微调???,用于对报告解析大语言模型进行健康建议微调,使报告解析大语言模型具备根据报告解读结论输出健康建议的能力;

43、报告解析???,用于获取待解读的检验报告数据,并将检验报告数据输入报告解析大语言模型进行解析,并输出报告解读结论、健康建议。

44、一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述方法的步骤。

45、一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述方法的步骤。

46、本发明的有益效果如下:

47、1、本发明中,通过爬虫技术获取了相关的医学知识数据,形成了专家知识库,并且报告解析大语言模型可根据爬取的医学知识进行自监督学习,从而使报告解析大语言模型能够掌握相关的医学知识,并将其用于对待检验报告进行解析,从而可大大提高检验报告的解读准确性与可靠性;由于该报告解析大语言模型经过了使用前的微调,使得该报告解析大语言模型不仅可以输出解读结论,其还可以根据检验报告、解读结论生成健康建议,被检测人员可根据健康建议进行后续的健康调理,改善自身健康环境;此外,由于在爬取医学知识数据时,可以对爬取的数据进行归类,归类时,可以按照疾病类型进行分类,也可以按照医学报告类型进行分类,这样无论是做普通的体检检测,还是疑似某个疾病的检测,报告解析大语言模型能够给出更为准确、专业的解读结论、以及健康建议。

48、2、本发明中,引入基于专家反馈的模型微调(专家反馈微调),专家反馈中的专业知识信息质量普遍较高,差异性较??;专家的反馈参考价值极大,在微调时能够有效地提升专业知识的学习质量。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1
imtoken助记词怎么填-imtoken钱包没有收益-imtoken矿工费太贵了-im钱包官网:token.im