Co zrobić z brakującymi danymi?

To pytanie częste w chemometrii, a temat powraca w [1]. Autorzy porównują na przykładowych danych pięć metod imputacji (uzupełniania) brakujących danych przed analizą chemometryczną. Razem z inną pracą sprzed roku [2] jest to doskonała lektura dla osób chcących właściwie uzupełniać macierz danych przed dalszą obróbką. Można też cofnąć się do nieco starszego i dwuczęściowego artykułu przeglądowego [3] [4]. Problem zawężony do metody PCA omawiają też dwie inne wartościowe prace [5] [6].

Share on Google+Share on LinkedInTweet about this on TwitterShare on Facebook

References

  1. M. Gómez-Carracedo, J. Andrade, P. López-Mahía, S. Muniategui, and D. Prada, "A practical comparison of single and multiple imputation methods to handle complex missing data in air quality datasets", Chemometrics and Intelligent Laboratory Systems, vol. 134, pp. 23-33, 2014. http://dx.doi.org/10.1016/j.chemolab.2014.02.007
  2. Y. Liu, and S.D. Brown, "Comparison of five iterative imputation methods for multivariate classification", Chemometrics and Intelligent Laboratory Systems, vol. 120, pp. 106-115, 2013. http://dx.doi.org/10.1016/j.chemolab.2012.11.010
  3. B. Walczak, and D. Massart, "Dealing with missing data", Chemometrics and Intelligent Laboratory Systems, vol. 58, pp. 15-27, 2001. http://dx.doi.org/10.1016/S0169-7439(01)00131-9
  4. B. Walczak, and D. Massart, "Dealing with missing data: Part II", Chemometrics and Intelligent Laboratory Systems, vol. 58, pp. 29-42, 2001. http://dx.doi.org/10.1016/S0169-7439(01)00132-0
  5. I. STANIMIROVA, M. DASZYKOWSKI, and B. WALCZAK, "Dealing with missing values and outliers in principal component analysis", Talanta, vol. 72, pp. 172-178, 2007. http://dx.doi.org/10.1016/j.talanta.2006.10.011
  6. S. Serneels, and T. Verdonck, "Principal component analysis for data containing outliers and missing elements", Computational Statistics & Data Analysis, vol. 52, pp. 1712-1727, 2008. http://dx.doi.org/10.1016/j.csda.2007.05.024

Comments

comments

Comments are closed