接着还是局部线性拟合研究一个样本的权重对预测的影响
以上 Iup,loss(z,ztest)Iup,loss(z,ztest) 还可以用于衡量两个样本的距离。
这个修正数据标注,看起来非常利害,但是仔细看发现其实没啥用,查20%20%的数据才能找出80%80%的错误,这个和直接反复验证对于预测权重影响较高的数据是一样的(因为本来数据由于重复程度,所以对于总体数据中重要的20%20%基本已经可以决定预测结果了,但是检查2020的数据也非常费时费力)。
https://zhuanlan.zhihu.com/p/28520049