1 İpucu

Kolmogórov-Smirnov testi: nedir ve nasıl kullanılır?

18 Mart 2023 - 8:29

Parametrik ve parametrik olmayan testler, çıkarımsal istatistik alanında yaygın olarak kullanılmaktadır.. Parametrik olmayanlar arasında, belirli bir örneğin verilerinin bir olasılık dağılımına uyup uymadığına karar vermemize yardımcı olacak bir gösterge döndüren Kolmogórov-Smirnov testini ve bu gerçeğin veri analizi için sahip olduğu sonuçları buluyoruz.

Bu kanıt, Nikolaevich Kolmogorov ve Vladimir Ivanovich Smirnov’un katkılarından kaynaklanmaktadır. Kolmogorov’un katkısı, tek bir örneklemle ilgili soruna karşılık gelirken, Smirnov’unki, sorunu iki örnekle ilgili olarak yanıtlamaktan, birinin köken popülasyonları arasındaki eşitlik hipotezini diğerininkine göre test etmeye çalışmaktan sorumludur. .

Kolmogorov-Smirnov testi nedir?

Kolmogorov-Smirnov testi, araştırmacıya iki dağılımın farklı olup olmadığı hakkında bir fikir veren bir gösterge elde etmek için kullanılan parametrik olmayan bir uyum iyiliği testi veya temeldeki bir olasılık dağılımı varsayımsal bir dağılımdan farklıysa (Dodge, 2008).





Prensip olarak, bir araştırmada, farklı iki popülasyondan iki örneğimiz olduğunda kullanılır.. Bu tür testlerin parametrik olmayan bazı özellikleri şunlardır (Gómez-Gómez ve diğerleri, 2003):

  • Eşleştirilmiş veriler dışında rastgele gözlemlerden bağımsızdırlar.
  • Nüfusun dağılımına ilişkin çok az varsayımları vardır.
  • Bağımlı değişken kategorik bir ölçekte ölçülür.
  • Birincil nokta, sıralama veya sıklık sıralamasıdır.
  • Hipotezler, verilerin aralıkları, medyanı veya frekansları hakkında yapılır.
  • Gerekli örnek boyutu daha küçüktür (20 veya <).





İstatistik yapan erkek







Bu ne için?

Bu test bize şu konularda yardımcı olur:

  • Örneğimizden elde ettiğimiz puanların normal bir dağılım gösterip göstermediğini kontrol ediniz.
  • Bir veri kümesinin dağılımı ile belirli bir teorik dağılım arasındaki uyum derecesini ölçmek.
  • Hangi dağılımın verilere en uygun olduğunu değerlendirin.
  • Gözlemlerimizin belirli bir dağılımdan gelip gelmediğini kontrol edin.
  • Dağılımların yer ve şekillerindeki farklılıkları ayırt edin.
  • Tahmin senaryoları oluşturmak istediğimizde iki dağılımın birbirinden yeterince farklı olup olmadığını test edin.

Kolmogorov-Smirnov aracılığıyla şunları yapabiliriz: teorik frekansların kümülatif dağılımını, gözlemlenen frekansların kümülatif dağılımıyla karşılaştırın. Bunu yapmak için fikir, maksimum sapma noktasını bulmak ve bu büyüklükteki bir farkın rastgele meydana gelme olasılığını belirlemektir.

Nasıl hesaplanır?

Hesaplamak için şundan başlıyoruz: bir örneğin (gözlenen) kümülatif dağılımı ile teorik dağılım arasındaki en büyük fark (mutlak değer olarak). Numunenin uyum iyiliği, gözlemlerin belirli dağılıma karşılık gelebileceğini makul bir şekilde varsaymasına izin verir (Gómez-Gómez ve diğerleri, 2003).

İstediğimiz şey, gözlemlenen verilerin ampirik dağılım fonksiyonunu sıfır hipotezi ile ilişkili kümülatif dağılım fonksiyonu ile karşılaştırmak ise, adımlar aşağıdaki gibidir (Kawwa, 2020):

  • Gözlemleri artan düzende sıralayın.
  • Gözlemlerin ampirik dağılımının fonksiyonunu hesaplayın.
  • Her gözlem için xi, F exp (xi) = P (Z ≤ xi) hesaplayın.
  • Mutlak farkları hesaplayın.
  • Maksimum farkı kaydedin.
  • Kritik değeri bulun.
  • Boş hipotezleri reddedin veya kabul edin.

Aynı dağılımdan iki örnek alınıp alınmadığını test etmek istiyorsak aşağıdaki adımları izlemeliyiz (Kawwa, 2020):

  • Her örneği sıralayın.
  • Bunları sıralı bir dizide birleştirin.
  • İki örneğin gözlenen kümülatif dağılım fonksiyonlarını hesaplayın.
  • Maksimum mutlak farkını hesaplayın.
  • Sonuçları karşılaştırın.

Bu testi uygularken, her zaman test dağılımının parametrelerinin belirtildiğini varsayın peşin. Bu prosedür, numuneden parametreleri tahmin eder. Öte yandan, örneklem ortalamasının ve standart sapmanın normal dağılımın parametreleri olduğunu da varsaymalıyız.

Hesaplama yapan insanlar

Testin sınırlamaları

Kolmogorov-Smirnov testinin sınırlamalarından biri şudur: Çalışması için konum, ölçek ve şekil parametreleri belirtilmelidir.. Bu parametreler verilerden tahmin edilirse, test geçersiz sayılır. Bu nedenle, bu parametrelerin ne olduğunu bilmiyorsak, çok resmi olmayan bir test uygulamak daha iyidir.

Diğer bir sınırlama ise, genellikle ayrık dağılımlar için kullanılamaz, özellikle yazılım kullanıyorsanız, çoğu yazılım paketi Kolmogorov-Smirnov testi için gerekli uzantılara sahip olmadığından ve manuel hesaplamalar karmaşık olduğundan.

Giriş Kolmogórov-Smirnov testi: nedir ve nasıl kullanılır? ilk olarak 1 İpucun’da yayınlandı.

Sitemizde yayınlanan haberlerin telif hakları gazete ve haber kaynaklarına aittir. Kopyalanması yasaktır.