Analyzing the Impacts of Alternated Number of Iterations in Multiple Imputation Method on Explanatory Factor Analysis
Journal Name:
- Eğitim Bilimleri Araştırmaları Dergisi (EBAD)
Key Words:
Keywords (Original Language):
Author Name | University of Author | Faculty of Author |
---|---|---|
Abstract (2. Language):
The study aims to identify the effects of iteration numbers used in multiple iteration method, one of the methods used to cope with missing values, on the results of factor analysis. With this aim, artificial datasets of different sample sizes were created. Missing values at random and missing values at complete random were created in various ratios by deleting data. For the data in random missing values, a second variable was iterated at ordinal scale level and datasets with different ratios of missing values were obtained based on the levels of this variable. The data were generated using “psych” program in R software, while “dplyr” program was used to create codes that would delete values according to predetermined conditions of missing value mechanism. Different datasets were generated by applying different iteration numbers. Explanatory factor analysis was conducted on the datasets completed and the factors and total explained variances are presented. These values were first evaluated based on the number of factors and total variance explained of the complete datasets. The results indicate that multiple iteration method yields a better performance in cases of missing values at random compared to datasets with missing values at complete random. Also, it was found that increasing the number of iterations in both missing value datasets decreases the difference in the results obtained from complete datasets.
Bookmark/Search this post with
Abstract (Original Language):
Bu araştırmada kayıp veri baş etme yöntemlerinden çoklu atama yöntemindeki atama sayısının, açımlayıcı faktör analizi sonuçları üzerindeki etkilerinin belirlenmesi amaçlanmıştır. Bu amaçla öncelikle farklı örneklem büyüklüklerinde yapay veri setleri üretilmiştir. Üretilen veri setlerinde farklı kayıp veri oranlarında tamamen rastgele kayıp ve rastgele kayıp örüntüsü oluşturulacak şekilde veriler silinerek, kayıp verili setler oluşturulmuştur. Tamamen rastgele kayıp mekanizmasında herhangi bir değişkene bağlı olmadan belirlenen oranlarda veri silinmiştir. Rastgele kayıp mekanizmasında ise, veri setine sıralama ölçeği düzeyinde ikinci bir değişken atanmış ve bu değişkenin düzeylerine bağlı olarak farklı oranlarda verinin silinmesi yoluyla rastgele kayıp mekanizmasında kayıp veri içeren veri setleri elde edilmiştir. Verilerin üretilmesinde R yazılımındaki {psych} paketinden yararlanılmıştır. Verilerin silinmesinde ise yine R programına, belirlenen kayıp veri mekanizması koşullarını sağlayacak şekilde veri silme işlemini gerçekleştirecek “dplyr” paketi kullanılarak kod yazılmıştır. Çoklu atamada atama sayısı değişimlenerek, atama sayısı farklı olan, farklı tamamlanmış veri setleri elde edilmiştir. Tamamlanan veri setlerine açımlayıcı faktör analizi uygulanarak faktör sayısı ve açıklanan toplam varyans oranları elde edilmiştir. Bu değerler başlangıçta eksiksiz olarak üretilen veriden elde edilen faktör sayısı ve açıklanan varyans oranları referans alınarak değerlendirilmiştir. Araştırma sonucunda çoklu atama yönteminin rastgele kayıp koşulunda tüm tekrar sayılarında tamamen rastgele kayıp mekanizmasına göre daha iyi performans gösterdiği ve kayıp veri oranı arttıkça her iki kayıp veri mekanizmasında da atama sayısı artırılarak eksiksiz veri setinden uzaklaşmanın azaltılabileceği sonucuna ulaşılmıştır.
FULL TEXT (PDF):
- 2