Farklı büyüklükteki veri setlerınde yapısal eşitlik modeli uyumu testlerine göre karşılaştırılması: simülasyon çalışması
Özet
Yapısal eşitlik modeli (YEM) gözlemlenebilen ve gözlemlenemeyen değişkenler arası
ilişkileri bir mantık dahilinde modelleyerek çözümü kolaylaştırmaya yarayan ve direk ve
indirekt etkileri ortaya koyan istatistiksel teknikler toplamıdır. Modeli belirleme, tahmin etme
ve test ederek nedensel ve teorik ilişkileri ortaya koyan yöntemler bütünüdür. Bu tez
çalışmasında YEM varsayımları sağlayan iki adet model R istatistiksel programda simülasyon
çalışması yapılarak oluşturulmuştur. Yapısal eşitlik modellemesinde dışsal gizil değişken
sayısına göre oluşturulan iki farklı model, üç dışsal gizil değişkenli Model 1 ve dört dışsal gizil
değişkenli Model 2 baz alınarak çok değişkenli normallik varsayımının sağlandığı simülasyon
çalışmasında “tahmin tekniği” ve “örneklem hacmi” etmenlerinin etkilerini araştırmak ve bu
etmenlerin uyum indeksleri üzerindeki etkileri doğrultusunda model uyum indekslerini
karşılaştırmaktır. Bu amaç çerçevesinde, çok değişkenli normallik varsayımının sağlandığı
durumlarda ML ve GLS parametre tahmin yöntemleri kullanarak 300, 600, 1200 birimlik
örneklem büyüklüklerinde oluşturulan yapısal eşitlik modellemesine ilişkin model uyum
indeksleri karşılaştırmalı olarak değerlendirilmiştir.
Yapılan simülasyon çalışmasında iterasyon sayısı ise 1000 olarak belirlenmiştir.
Simülasyon çalışması sonucunda, örneklem büyüklüğü ve standart sapma, korelasyon matrisi
ve buna bağlı oluşturulan korelasyon matrisi değişimine bağlı optimizasyon, negatif varyans
tahmini problemleri ve tanımlama hataları ile karşılaşılmıştır. Bu problemlerin örneklem
büyüklüğünün artmasıyla ortadan kalktığı gözlenmiştir. Değişkenler arası korelasyonun
artmasıyla da bu sorunların ortadan kalktığı gözlenmiştir.
Çalışmada kurulan modeller (Model 1, Model 2) için en çok gözlem sayısından ve
parametre tahmininden etkilenen uyum indeksi NFI olduğu gözlemlenmiştir. IFI, TLI, CFI
uyum indeksleri NFI uyum indeksine göre daha az etkilendiği gözlemlenmiştir. RMSEA, GFI,
NNFI ve AGFI uyum indeksleri neredeyse etkilenmemektedir. Model 1 ve Model 2 için
RMSEA ve NNFI uyum indeksleri tercih edilmelidir. RMSEA ve NNFI uyum iyiliği
indekslerinin tercih edilmesi; NFI uyum iyiliği indeksinin ise gözlem sayısından en çok
etkilenen olduğu için tercih edilmemesi önerilir. Ayrıca gözlem sayısı arttıkça tüm uyum iyiliği
indeksleri daha iyi sonuç verdiği önerilen gözlem sayısının 500 ve üstü gözlem sayısı olduğu
düşünülmektedir. Structural equation model is the sum of all statistical methods used for logical modeling
the relationships between observable and unobservable variables, facilitating its results and
exhibiting direct and indirect effects. It is a set of methods that establish causal and theoretical
relations through determining, predicting and testing the model. The present thesis study created
two models ensuring SEM assumptions through simulation study in R statistical software. In
structural equation modelling, two different models are created according to the number of
exogenous latent variables as Model 1 with three exogeneous latent variables and Model 2 with
four exogenous latent variables. The simulation study, which is based on these two models and
ensures multivariate normality assumption, aims to analyze the effects of “estimation
technique” and “sample size” and compare model fit indices according to their effects on fit
indices. Within this scope, when multivariate normality assumption is ensured, the present
thesis study comparatively evaluates model fit indices regarding structural equation modelling
created in 300, 600 and 1200 units of sample size using ML and GLS parameter estimation
methods.
Iteration number is determined as 1000 in simulation study. Simulation study results in
negative variance estimation problems, identification errors and optimization problems due to
sample size and standard deviation, correlation matrix and correspondingly formed correlation
matrix. These problems are observed to be removed upon increasing sample size. In addition,
increasing intervariable correlation is also observed to remove these problems.
Among models established in the study (Model 1, Model 2), NFI is observed to be the
fit index mostly affected by the number of observations and parameter estimation. IFI, TLI,
CFI fit indices are found to be affected less than NFI fit index. RMSEA, GFI, NNFI and AGFI
fit indices are almost not affected. While RMSEA and NNFI fit indices can be advised for
Model 1 and Model 2. RMSEA and NNFI goodness of fit indices should be preferred; however,
NFI goodness of fit index should not be preferred due to its being mostly affected by the number
of observations. In addition, as the number of observations increases, the number of
observations suggested for giving better results for all goodness of fit indices is thought to be
“500 and above”.
Koleksiyonlar
- Tez Koleksiyonu [574]