You are here

Çoklu Atama Yönteminde Değişimlenen Atama Sayısının Açımlayıcı Faktör Analizindeki Etkilerinin İncelenmesi

Analyzing the Impacts of Alternated Number of Iterations in Multiple Imputation Method on Explanatory Factor Analysis

Journal Name:

Publication Year:

Abstract (2. Language): 
The study aims to identify the effects of iteration numbers used in multiple iteration method, one of the methods used to cope with missing values, on the results of factor analysis. With this aim, artificial datasets of different sample sizes were created. Missing values at random and missing values at complete random were created in various ratios by deleting data. For the data in random missing values, a second variable was iterated at ordinal scale level and datasets with different ratios of missing values were obtained based on the levels of this variable. The data were generated using “psych” program in R software, while “dplyr” program was used to create codes that would delete values according to predetermined conditions of missing value mechanism. Different datasets were generated by applying different iteration numbers. Explanatory factor analysis was conducted on the datasets completed and the factors and total explained variances are presented. These values were first evaluated based on the number of factors and total variance explained of the complete datasets. The results indicate that multiple iteration method yields a better performance in cases of missing values at random compared to datasets with missing values at complete random. Also, it was found that increasing the number of iterations in both missing value datasets decreases the difference in the results obtained from complete datasets.
Abstract (Original Language): 
Bu araştırmada kayıp veri baş etme yöntemlerinden çoklu atama yöntemindeki atama sayısının, açımlayıcı faktör analizi sonuçları üzerindeki etkilerinin belirlenmesi amaçlanmıştır. Bu amaçla öncelikle farklı örneklem büyüklüklerinde yapay veri setleri üretilmiştir. Üretilen veri setlerinde farklı kayıp veri oranlarında tamamen rastgele kayıp ve rastgele kayıp örüntüsü oluşturulacak şekilde veriler silinerek, kayıp verili setler oluşturulmuştur. Tamamen rastgele kayıp mekanizmasında herhangi bir değişkene bağlı olmadan belirlenen oranlarda veri silinmiştir. Rastgele kayıp mekanizmasında ise, veri setine sıralama ölçeği düzeyinde ikinci bir değişken atanmış ve bu değişkenin düzeylerine bağlı olarak farklı oranlarda verinin silinmesi yoluyla rastgele kayıp mekanizmasında kayıp veri içeren veri setleri elde edilmiştir. Verilerin üretilmesinde R yazılımındaki {psych} paketinden yararlanılmıştır. Verilerin silinmesinde ise yine R programına, belirlenen kayıp veri mekanizması koşullarını sağlayacak şekilde veri silme işlemini gerçekleştirecek “dplyr” paketi kullanılarak kod yazılmıştır. Çoklu atamada atama sayısı değişimlenerek, atama sayısı farklı olan, farklı tamamlanmış veri setleri elde edilmiştir. Tamamlanan veri setlerine açımlayıcı faktör analizi uygulanarak faktör sayısı ve açıklanan toplam varyans oranları elde edilmiştir. Bu değerler başlangıçta eksiksiz olarak üretilen veriden elde edilen faktör sayısı ve açıklanan varyans oranları referans alınarak değerlendirilmiştir. Araştırma sonucunda çoklu atama yönteminin rastgele kayıp koşulunda tüm tekrar sayılarında tamamen rastgele kayıp mekanizmasına göre daha iyi performans gösterdiği ve kayıp veri oranı arttıkça her iki kayıp veri mekanizmasında da atama sayısı artırılarak eksiksiz veri setinden uzaklaşmanın azaltılabileceği sonucuna ulaşılmıştır.
113
131

REFERENCES

References: 

Acock, A. C. (2005). Working with missing values. Journal of Marriage & Family, 67(4), 1012-1028.
Agresti, A., & Finlay, B. (1997). Statistical methods for the social sciences (4th ed.). USA: Pearson Prentice Hall.
Allison, P. D. (2000). Multiple imputation for missing data: A cautionary tale. Sociological Methods and Research, 28(3), 301-309.
Allison, P. D. (2002). Missing Data. Sage Publications.
Allison, P. D. (2003). Missing data techniques for structural equation modeling. Journal of Abnormal Psychology, 112(4), 545-557.
Allison, P. D. (2009). Missing data. In R. E. Millsap & A. Maydeu-Olivares (Eds.), The SAGE Handbook of Quantitative Methods in Psychology (pp. 72-89). Thousand Oaks, CA: Sage Publications.
Arnold, A. M., & Kronmal, R. A. (2002). Multiple imputation of baseline data in the cardiovascular health study. American Journal of Epidemiology, 157(1), 74-84. DOI: 10.1093/aje/kwf156.
Baraldi, A. N., & Enders, C. K. (2010). An introduction to modern missing data analysis. Journal of School Psychology, 48(1), 5-37.
KOÇAK & ÇOKLUK-BÖKEOĞLU
Analyzing the Impacts of Alternated Number of Iterations in Multiple Imputation Method on Explanatory Factor Analysis
110
Barzi, F., & Woodward, M. (2004). Imputations of missing values in practice: results from imputations of serum cholesterol in 28 cohort studies. American Journal of Epidemiology, 160(1), 34-45. DOI: 10.1093/aje/kwh175.
Baykul, Y. (2000). Eğitimde ve psikolojide ölçme. Ankara: ÖSYM Yayınları.
Baykul, Y., & Güzeller, C. O. (2013). Sosyal bilimler için istatistik: SPSS uygulamalı. Ankara: Pegem Akademi.
Cattell, R. B. (1978). The scientific use of factor analysis. New York: Plenum Press.
Cheema, J. (2012). Handling missing data in educational research using SPSS (Unpublished Doctoral dissertation). George Mason University, Fairfax, VA.
Chen, S. F., Wang, S., & Chen, Y. C. (2012). A simulation study using EFA and CFA programs based the impact of missing data on test dimensionality. Expert Systems with Applications, 39(4), 4026-4031.
Collins, L. M., & Lanza, S. T. (2010). Latent class and latent transition analysis with applications in the social, behavioral, and health sciences. Hoboken, New Jersey: John Wiley & Sons.
Comrey, A. L., & Lee, H. B. (1992). A first course in factor analysis. Hillsdale, NJ: Lawrence Erlbaum.
Çokluk, Ö., Şekercioğlu, G., & Büyüköztürk, Ş. (2012). Sosyal bilimler için çok değişkenli istatistik: SPSS ve Lisrel uygulamaları. Ankara: Pegem Akademi Yayıncılık.
Demir, E. (2013). Kayıp verilerin varlığında iki kategorili puanlanan maddelerden oluşan testlerin psikometrik özelliklerinin incelenmesi (Unpublished Doctoral dissertation). Ankara University, Ankara.
Donders, A. R. T., van der Heijden, G. J. M. G., Stijnen, T., & Moons, K. G. M. (2006). Review: A gentle introduction to imputation of missing values. Journal of Clinical Epidemiology, 59(10), 1087-1091. DOI: 10.1016/j.jclinepi.2006.01.014.
Durrant, G. B. (2005). Imputation methods for handling item-nonresponse in the social sciences: A methodological review. ESRC National Centre for Research Methods and Southampton Statistical Sciences Research Institute, NCRM Methods Review Papers NCRM/002. Southampton, UK: University of Southampton.
Enders, C. K. (2010). Applied missing data analysis (1st ed.). New York: Guilford Press.
Enders, C. K. (2013). Using the expectation maximization algorithm to estimate coefficient alpha for scales with item-level missing data. Psychological Methods, 8(3), 322-337.
Enders, C. K., & Bandalos, D. L. (2001). The relative performance of full information maximum likelihood estimation for missing data in structural equation models. Structural Equation Modeling: A Multidisciplinary Journal, 8(3), 430-457.
Ginkel, J. R. V., van der Ark, L. A., Sijtma, K., & Vermunt, J. K. (2007). Two-way imputation: A bayesian method for estimating missing scores in tests and questionnaires and an accurate approximation. Computational Statistics & Data Analysis, 51, 4013-4027. DOI:10.1016/j.csda.2006.12.022.
Gorsuch, R. L. (1983). Factor analysis. Philadelphia: Saunders.
Graham, J. W. (2009). Missing data: Analysis and design. New York: Springer.
Graham, J. W., Hofer, S. M., & Piccinin, A. M. (1994). Analysis with missing data in drug prevention research. In L. M. Collins & L. A. Seitz (Eds.), Advances in data analysis for prevention intervention research (pp. 13-64). Rockville, MD: National Institutes of Health.
Granberg-Rademacker, J. S. (2007). A comparison of three approaches to handling incomplete state level data. State Politics and Policy Quarterly, 7(3), 325-338.
Eğitim Bilimleri Araştırmaları Dergisi – Journal of Educational Sciences Research
111
Hohensinn, C., & Kubinger, K. D. (2011). On the impact of missing values on the item fit and the model validness of the Rasch model. Psychological Test and Assessment Modeling, 53(3), 380-393.
Kang, H. (2013). The prevention and handling of missing data. Korean J Anesthesiology, 64(5), 402-406.
Koçak, D. (2016). Kayıp veriyle baş etme yöntemlerinin madde tepki kuramı bir parametreli lojistik modelinde model veri uyumuna ve standart hataya etkisi (Unpublished Doctoral dissertation). Ankara University, Ankara.
Little, R. J. A., & Rubin, D. B. (1987). Statistical analysis with missing data. New York: Wiley.
McKnight, P. E., McKnight, K. M., Sidani, S., & Figueredo, A. J. (2007). Missing data: A gentle introduction. New York: Guilford Press.
Newman, D. A. (2003). Longitudinal modeling with randomly and systematically missing data: A simulation of ad hoc, maximum likelihood and multiple imputation techniques. Organizational Research Methods, 6(3), 328-362. DOI: 10.1177/1094428103254673.
Pigott, T. D. (2001). A review of methods for missing data. Educational Research and Evaluation: An International Journal of Theory and Practice, 7(4), 353-383.
Rubin, D. B. (1976). Inference and missing data. Biometrika, 63(3), 581-592
Rubin, D. B. (1987). Multiple imputation for nonresponse in surveys. New York: John Wiley & Sons.
Satıcı, E. (2009). Kayıp gözlem olması durumunda kitle ortalaması tahmini (Unpublished Doctoral dissertation). Hacettepe University, Ankara.
Schafer, J. L. (1997). Analysis of incomplete multivariate data. USA: Chapman & Hall.
Streiner, D. V. (2002). The case of the missing data: methods of dealing with dropouts and other research vagaries. Research methods in Psychiatry, 47(1), 68-75.
Şencan, H. (2005). Sosyal ve davranışsal ölçümlerde güvenilirlik ve geçerlilik. Ankara: Seçkin Yayıncılık.
Tavşancıl, E. (2005). Tutumların ölçülmesi ve SPSS ile veri analizi (2nd ed.). Ankara: Nobel Yayınları.
Wayman, J. C. (2003, April). Multiple imputation for missing data: What is it and how can I use it? Paper presented at the Annual Meeting of the American Educational Research Association. Chicago, IL.
Young, W., Weckmen, G., & Holland, W. (2011). A survey of methodologies for the treatment of missing values within datasets: Limitations and benefits. Theoretical Issues in Ergonomics Science, 12(1), 15-43.
'

Thank you for copying data from http://www.arastirmax.com