分箱的方法主要有:
1.最小熵法:在信息论中,熵是对不确定性的一种度量。信息量越大,不确定性就越小,熵也就越小;信息量越小,不确定性越大,熵也越大。
2.自定义区间法:自定义一个数值区间,用分类讨论的办法研究问题。
3.统一区间法:与自定义区间法相对,多个问题研究共用一个区间。
4.统一权重法:权重越大则该指标的重要性越高,对整体的影响就越高,反之亦然。
数据平滑的方法主要有:
1.平均值法:求取平均值研究问题。
2.中间值法:去数集或解集的中间值研究问题。
3.边界值法:取数集或解集两段数或解研究问题。
转载请注明出处育才学习网 » 请教在数据挖掘中数据平滑的分箱方法