分箱方法和系统与流程

文档序号:37777617发布日期:2024-04-25 11:04阅读:12来源:国知局
分箱方法和系统与流程

本说明书涉及人工智能,尤其涉及一种分箱方法和系统。


背景技术:

1、在风险控制场景中,系统可以对各用户各自的信用评分进行分箱,即将一系列连续型的数值划分到离散个数的箱子中去。

2、在相关技术中,系统可以采用等距分箱或者等频分箱,以将各用户各自的信用评分划分至相应的箱子中,从而得到各用户各自的风险等级、各箱子各自的切分点。

3、然而,系统采用上述方法进行分箱,存在分箱可靠性和精度较低的问题。

4、值得说明的是,上述相关技术的内容仅仅是发明人个人所知晓的信息,并不代表上述信息在本公开申请日之前已经进入公共领域,也不代表其可以成为本公开的现有技术。


技术实现思路

1、本公开提供一种分箱方法和系统,用以避免上述技术问题中的至少一种。

2、第一方面,本公开提供一种分箱方法,所述方法包括:

3、对获得的预分箱样本数据进行预分箱,得到预分箱结果;

4、根据获得的分箱总样本数据、并且采用进化算法对所述预分箱结果进行多次迭代优化,得到精细分箱结果,所述预分箱样本数据为所述分箱总样本数据中的至少部分数据;

5、其中,所述多次迭代优化中当前次迭代优化包括:

6、根据获得的所述当前次迭代优化的各父代解确定所述当前次迭代优化的各子代解;

7、根据所述分箱总样本数据对所述各子代解进行单调性指标、用户分布指标、留存率指标约束的种群评估,得到所述各子代解各自的稳定性遗憾指标;

8、根据所述各子代解各自的稳定性遗憾指标、以及获得的所述各父代解各自的稳定性遗憾指标确定所述当前次迭代优化的分箱解。

9、在一些实施例中,所述分箱总样本数据包括多个时间段内的多个用户各自的信用评分;所述根据所述分箱总样本数据对所述各子代解进行单调性指标、用户分布指标、留存率指标约束的种群评估,得到所述各子代解各自的稳定性遗憾指标,包括:

10、针对所述各子代解中的每一子代解,根据所述多个时间段内的多个用户各自的信用评分分别计算当前子代解的单调性指标、用户分布指标、留存率指标;

11、将所述当前子代解的单调性指标、用户分布指标、留存率指标的和确定为所述当前子代解的稳定性遗憾指标。

12、在一些实施例中,根据所述多个时间段内的多个用户各自的信用评分计算所述当前子代解的单调性指标,包括:

13、针对所述多个时间段中的每一时间段,根据当前时间段的信用评分、获得的所述当前时间段的所述多个用户各自的违约信息、以及获得的预设映射表,确定在所述当前时间段的相邻风险等级的用户违约比例的增减趋势值,所述预设映射表用于表征信用评分与信用风险等级之间的映射关系;

14、根据各时间段的各相邻风险等级各自的增减趋势值、以及各风险等级各自的预设第一阈值确定所述当前子代解的单调性指标。

15、在一些实施例中,所述根据各时间段的各相邻风险等级各自的增减趋势值、以及各风险等级各自的预设第一阈值确定所述当前子代解的单调性指标,包括:

16、针对每一时间段的每一相邻风险等级,计算当前时间段的当前相邻风险等级中的较小风险等级的预设第一阈值、以及所述当前相邻风险等级增减趋势值之间的第一差值绝对值,并根据所述第一差值绝对值确定所述当前时间段的所述较小风险等级的单调性指标;

17、将各时间段的各风险等级的单调性指标之和确定为所述当前子代解的单调性指标。

18、在一些实施例中,所述根据所述第一差值绝对值确定所述当前时间段的所述较小风险等级的单调性指标,包括:

19、若所述第一差值绝对值大于0,则将所述第一差值绝对值确定为所述当前时间段的所述较小风险等级的单调性指标;

20、若所述第一差值绝对值等于0,则将所述当前时间段的所述较小风险等级的单调性指标确定为0。

21、在一些实施例中,根据所述多个时间段内的多个用户各自的信用评分计算所述当前子代解的用户分布指标,包括:

22、针对所述多个时间段中的每一时间段,根据当前时间段的信用评分、以及获得的预设映射表,确定所述当前时间段中的不同风险等级的用户人数分布信息,所述预设映射表用于表征信用评分与信用风险等级之间的映射关系;

23、计算所述当前时间段的用户人数分布信息与预设用户分布类型之间的第一相对熵;

24、将所述多个时间段各自的第一相对熵的和确定为所述当前子代解的用户分布指标。

25、在一些实施例中,根据所述多个时间段内的多个用户各自的信用评分计算所述当前子代解的留存率指标,包括:

26、根据所述多个时间段各自的信用评分、以及获得的预设映射表,确定在所述多个时间段的每一相邻的多个时间段中的相同风险等级的用户人数比例,所述预设映射表用于表征信用评分与信用风险等级之间的映射关系;

27、根据各相邻的多个时间段中的相同风险等级各自的用户人数比例、以及各相同风险等级各自的预设第二阈值确定所述当前子代解的留存率指标。

28、在一些实施例中,根据各相邻的多个时间段中的相同风险等级各自的用户人数比例、以及各相同风险等级各自的预设第二阈值确定所述当前子代解的留存率指标,包括:

29、针对每一相邻的多个时间段中的相同风险等级,计算当前相邻的多个时间段中的相同风险等级的预设第二阈值与用户人数比例之间的第二差值绝对值,并根据所述第二差值绝对值确定所述当前相邻的多个时间段中的相同风险等级的留存率指标;

30、将各相邻的多个时间段中的相同风险等级的单调性指标之和确定为所述当前子代解的留存率指标。

31、在一些实施例中,所述根据所述第二差值绝对值确定所述当前相邻的多个时间段中的相同风险等级的留存率指标,包括:

32、若所述第二差值绝对值大于0,则将所述第二差值绝对值确定为所述当前相邻的多个时间段中的相同风险等级的留存率指标;

33、若所述第二差值绝对值等于0,则将所述当前相邻的多个时间段中的相同风险等级的留存率指标确定为0。

34、在一些实施例中,所述根据获得分箱总样本数据、并且采用进化算法对所述预分箱结果进行多次迭代优化,得到精细分箱结果,包括:

35、根据所述分箱总样本数据对所述预分箱结果进行种群初始化,得到多个初始化解;

36、对所述多个初始化解进行所述多次迭代优化,得到所述精细分箱结果;

37、其中,所述多个初始化解为第一次迭代优化的各父代解。

38、在一些实施例中,所述预分箱结果包括预分箱用户人数分布;所述根据所述分箱总样本数据对所述预分箱结果进行种群初始化,得到多个初始化解,包括:

39、根据所述预分箱用户人数分布、以及获得的预设用户分布类型和精细分箱数量,从初始分箱向量为1开始,计算不同的初始分箱向量各自的用户理想累积概率分布;

40、针对每一初始分箱向量,基于轮盘赌的方式、所述分箱总样本数据、当前初始分箱向量的用户理想累积概率分布,确定所述当前初始分箱向量的用户实际累积概率分布;

41、根据各用户理想累积概率分布和各用户实际累积概率分布,确定所述多个初始化解。

42、在一些实施例中,所述根据各用户理想累积概率分布和各用户实际累积概率分布,确定所述多个初始化解,包括:

43、针对每一初始分箱向量,根据当前初始分箱向量的用户实际累积概率分布确定所述当前初始分箱向量的疑似分箱解;

44、针对每一疑似分箱解,将当前疑似分箱解的用户理想累积概率分布、用户实际累积概率分布之间的第二相对熵,作为所述当前疑似分箱解的解评分;

45、根据各疑似分箱解各自的解评分确定所述多个初始化解。

46、在一些实施例中,所述根据各疑似分箱解各自的第二相对熵确定所述多个初始化解,包括:

47、从各解评分中,获得前多个最小解评分;

48、将所述前多个最小解评分各自的疑似分箱解确定为所述多个初始化解。

49、在一些实施例中,所述根据所述预分箱用户人数分布、以及获得的预设用户分布类型和精细分箱数量,从初始分箱向量为1开始,计算不同的初始分箱向量各自的用户理想累积概率分布,包括:

50、根据所述预分箱用户人数分布、以及获得的预设用户分布类型和精细分箱数量,从初始分箱向量为1开始,计算不同的初始分箱向量各自的用户理想累积概率分布,直至初始分箱向量满足第一个箱子的用户人数、与所述分箱总样本数据对应的用户总人数之间的比值达到预设第三阈值的人数占比。

51、在一些实施例中,所述针对每一初始分箱向量,基于轮盘赌的方式、所述分箱总样本数据、当前初始分箱向量的用户理想累积概率分布,确定所述当前初始分箱向量的用户实际累积概率分布,包括:

52、针对所述当前初始分箱向量的每一其他分箱向量,根据所述分箱总样本数据确定与当前其他分箱向量的理想累积概率相邻的两个疑似实际累积概率;

53、基于轮盘赌的方式从所述两个疑似实际累积概率中确定与所述当前其他分箱向量的理想累积概率对应的实际累积概率;

54、根据所述当前初始分箱向量的理想累积概率、所述当前初始分箱向量的各其他分箱向量各自的实际累积概率,确定所述当前初始分箱向量的用户实际累积概率分布。

55、在一些实施例中,所述方法应用于分布式系统,所述分布式系统包括控制节点和多个工作节点;所述根据所述分箱总样本数据对所述各子代解进行单调性指标、用户分布指标、留存率指标约束的种群评估,得到所述各子代解各自的稳定性遗憾指标,包括:

56、针对所述各子代解中的每一子代解,所述控制节点将当前子代解的种群评估子任务分配给所述多个工作节点中的至少两个工作节点,种群评估子任务与工作节点为一一对应关系;

57、所述控制节点接收所述至少两个工作节点基于各自的种群评估子任务反馈的稳定性遗憾指标;

58、所述控制节点融合所述至少两个工作节点各自反馈的稳定性遗憾指标,确定与所述当前子代解对应的稳定性遗憾指标。

59、第二方面,本公开提供一种分箱系统,包括:

60、至少一个存储器,所述存储器包括至少一组指令来推送信息;

61、至少一个处理器,同所述至少一个存储器进行通讯;

62、其中,当所述至少一个处理器执行所述至少一组指令时,实施如第一方面中任一项所述的方法。

63、第三方面,本公开提供一种处理器可读存储介质,所述处理器可读存储介质存储有计算机程序,所述计算机程序用于使所述处理器执行第一方面任一项所述的方法。

64、第四方面,本公开提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;

65、所述存储器存储计算机执行指令;

66、所述处理器执行所述存储器存储的计算机执行指令,以实现如第一方面任一项所述的方法。

67、第五方面,本公开提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面任一项所述的方法。

68、由以上技术方案可知,本公开提供的分箱方法和系统,包括对获得的预分箱样本数据进行预分箱,得到预分箱结果,根据获得的分箱总样本数据、并且采用进化算法对预分箱结果进行多次迭代优化,得到精细分箱结果,预分箱样本数据为分箱总样本数据中的至少部分数据,其中,多次迭代优化中当前次迭代优化包括:根据获得的当前次迭代优化的各父代解确定当前次迭代优化的各子代解,根据分箱总样本数据对各子代解进行单调性指标、用户分布指标、留存率指标约束的种群评估,得到各子代解各自的稳定性遗憾指标,根据各子代解各自的稳定性遗憾指标、以及获得的各父代解各自的稳定性遗憾指标确定当前次迭代优化的分箱解,在本公开中,分箱系统将进化算法引入至了精细分箱,且在分箱系统具体采用进化算法中的种群评估进行精细分箱时,引入了对精细分箱结果进行稳定性评价的稳定性遗憾指标,且具体从单调性指标、用户分布指标、留存率指标3个维度对种群评估进行约束,得到稳定性遗憾指标,以提高种群评估的准确性,进而提高精细分箱的稳定系、可靠性、以及精度。

69、本说明书提供的分箱方法的其他功能将在以下说明中部分列出。根据描述,以下数字和示例介绍的内容将对那些本领域的普通技术人员显而易见。本说明书提供的分箱方法的创造性方面可以通过实践或使用下面详细示例中所述的方法、装置和组合得到充分解释。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1
imtoken助记词怎么填-imtoken钱包没有收益-imtoken矿工费太贵了-im钱包官网:token.im