Eğitimde, bilişsel, duygusal ve psikomotor alanlardaki bireylerin özelliklerini belirlemek için farklı ölçümler yapılmaktadır. Bu ölçümleri gerçekleştirmek için kontrol listeleri, puanlama ölçekleri, rubrikler, testler, gözlem formları vb. gibi birçok ölçme aracı kullanılmaktadır. Ancak, sosyal bilimlerde ve bir alt alanı olan eğitimde yapılan ölçümler ve doğa bilimlerinde de ölçümler kesin olarak doğru değildir. Ölçüm sonuçlarını etkileyen birçok faktör, ölçüm hatalarına neden olur. Farklı kaynaklardan gelen bu hatalar, ölçüm sonuçlarıyla ilgili gerçek ölçüm değerine eşit değildir. Gerçek ölçüm değeri çoğu zaman doğrudan ölçülemez ve X-E gerçek ölçüm değeri olarak adlandırılır, burada X ölçüm sonucudur (veya gözlenen puan) ve E, farklı kaynaklardan sonuçla müdahale eden ölçüm hatalarıdır (veya hata puanı) (Gulliksen, 1950; Lord & Novick, 2008). Ölçüm çalışmalarında beklenti, ölçülen özelliğin gerçek ölçüm değerine yakın bir ölçüm sonucu elde edilmesidir (Baykul, 2000). Bu, ölçüm sonuçlarıyla müdahale eden hataların düşük olması koşuluyla mümkündür. Bu nedenle, ölçüm çalışmalarının temel amacı, mümkün olduğunca ölçülen özelliğin gerçek ölçüm değerine ulaşabilen ölçme araçları üretmek ve ölçümden elde edilecek puanları mümkün olduğunca hatasız kullanmaktır. Ölçüm sonuçlarının ölçüm hatalarından ne kadar uzak olduğu, güvenilirlik olarak tanımlanır (American Educational Research Association, American Psychological Association & National Council on Measurement in Education, 2014).Klasik Test Kuramı kapsamında güvenilirliği tahmin etmek için tarihsel olarak çeşitli prosedürler geliştirilmiştir. Bu güvenilirlik tahmin prosedürleri, ölçüm hatalarının kaynaklarına bağlı olarak farklı isimler ve anlamlar taşır. Test-tekrar test güvenilirliği, farklı zamanlarda gerçekleştirilen aynı testin iki performansından elde edilen puanlar arasındaki korelasyona dayanır ve test puanlarının zaman içindeki istikrarını gösterir. Test-tekrar test güvenilirliği tahmininde hata kaynağı, testin iki uygulaması arasındaki zaman aralığıdır (durum). Paralel testlerin güvenilirliği, bir testin paralel formundan elde edilen puanlar arasındaki korelasyonla belirlenir ve farklı madde setlerini içeren paralel formların tutarlılığını tahmin eder. Burada, güvenilirlik tahmininde hata kaynağı test formlarıdır. İç tutarlılık için kullanılan formüller, test maddelerini birbirleriyle tutarlılık veya uyum gösteren hata kaynağı olarak ele alır. Aralıklı gözlemciler arası güvenilirlik... (devamı 200 kelimeyi geçti)(AI)
Atıf Sayısı :