分类方法在多个样本中的应用

来源:百度知道 编辑:UC知道 时间:2024/05/15 18:09:44
想请教各位高手:一种分类方法在某个样本中应用时我们可以得到该方法的分类效能,但该方法如果应用于另一个样本时,它的分类效能会变化很大时怎么办?目前有没有文献讨论过这个问题?例如从一个样本测到的某分类方法的灵敏度是0.75,而代入另一个样本时灵敏度为0.50,怎么解释?怎么处理?

这叫 过拟合。或者叫 训练过度。

在某个样本上【一般叫训练样本集】得到的分类模型,如果在训练样本集上的性能太好了。

应用于另一个样本【一般叫测试样本】时,性能会变化。

说明,你在训练样本集上得到的模型的【推广能力不高】

要查文献,关键词--过拟合,推广能力,分类方法。

处理方法,
不要选择非常复杂的模型,模型越简单,推广能力就越强。
不要试图使模型的分类性能在训练样本集上过分高【不过,0.75好像不是很高~~】。