Overfitting – stały problem w chemometrii

W najnowszym artykule w Journal of Chemometrics [1] możemy znaleźć kolejną próbę rozwiązania problemu ryzyka overfittingu w regresji PLS. Autor stara się przeanalizować źródła tego zjawiska oraz proponuje niewielką modyfikację – zerowanie elementów przekątnej macierzy XX’ podczas pracy algorytmu. Warto zerknąć na inne prace pokrewne, dotyczące np. szacowania istotności w PLS [2], testów randomizacyjnych [3], czy też ogólną pracę o walidacji zdolności predykcyjnych modeli [4]. Prawdziwą kopalnią wiedzy jest literatura zebrana w tej ostatniej publikacji.

Share on Google+Share on LinkedInTweet about this on TwitterShare on Facebook

References

  1. O. Cloarec, "Can we beat over-fitting?", Journal of Chemometrics, vol. 28, pp. 610-614, 2014. http://dx.doi.org/10.1002/cem.2602
  2. I.N. Wakeling, and J.J. Morris, "A test of significance for partial least squares regression", Journal of Chemometrics, vol. 7, pp. 291-304, 1993. http://dx.doi.org/10.1002/cem.1180070407
  3. H. van der Voet, "Comparing the predictive accuracy of models using a simple randomization test", Chemometrics and Intelligent Laboratory Systems, vol. 25, pp. 313-323, 1994. http://dx.doi.org/10.1016/0169-7439(94)85050-X
  4. K.H. Esbensen, and P. Geladi, "Principles of Proper Validation: use and abuse of re-sampling for validation", Journal of Chemometrics, vol. 24, pp. 168-187, 2010. http://dx.doi.org/10.1002/cem.1310

Comments

comments

Comments are closed