"Kelimelerin gücüyle dünyaları değiştirin."

YKS, LGS ve DGS Tercih Süreçlerinde İstatistiksel Yöntemlerin Metodolojik Sınırları ve Fark Tabanlı Trend Analizi

Bu metin, Türkiye'deki merkezi sınav sistemlerindeki tercih süreçlerinde kullanılan istatistiksel yöntemlerin metodolojik sorunlarını ele alıyor. YKS, LGS ve DGS gibi milyonlarca öğrenciyi etkileyen sınavlarda, geleneksel parametrik istatistik yöntemlerinin uygulanabilirliği sorgulanıyor. Rastgelelik ve bağımsız dağılım gibi temel varsayımların bu sistemlerde geçerli olup olmadığı tartışılarak, daha doğru tercih yöntemleri geliştirme ihtiyacı vurgulanıyor.

yazı resim

Türkiye'deki merkezi sınav sistemleri (YKS, LGS, DGS), her yıl milyonlarca öğrencinin eğitim hayatını şekillendiren kritik geçiş noktalarıdır. Bu süreçlerde öğrencilerin ve ailelerinin en büyük kaygılarından biri, tercih aşamasında doğru ve güvenilir yöntemlerle karar vermektir. Ancak bu noktada önemli bir metodolojik sorun ortaya çıkmaktadır: Geleneksel istatistiksel yöntemler ve veri analizi teknikleri, bu sınav sistemlerinin doğasına uygun değildir.
Parametrik İstatistik Yöntemlerinin Temel Varsayımları
Parametrik istatistik yöntemleri, belirli matematiksel ve istatistiksel ön koşullar üzerine kuruludur. Bu yöntemlerin geçerli sonuçlar üretebilmesi için:

  1. Rastgelelik Varsayımı
    Parametrik modeller, gözlemlerin rastgele bir süreçten geldiğini varsayar. Örneklem, evren hakkında genelleme yapmaya imkan tanıyan rastgele seçim süreçleriyle oluşturulmalıdır.
  2. Bağımsız ve Özdeş Dağılım (i.i.d.)
    Gözlemlerin birbirinden bağımsız olması ve aynı olasılık dağılımından gelmiş olması beklenir. Bu, her bir gözlemin diğerlerinden etkilenmediği ve tüm gözlemlerin aynı yapısal özellikleri taşıdığı anlamına gelir.
  3. Normal Dağılım
    Birçok parametrik test ve model, verilerin normal dağılım gösterdiği varsayımına dayanır. Bu varsayım, ortalama, standart sapma gibi parametrelerin anlamlı olması için gereklidir.
  4. Durağanlık
    Zaman serisi analizlerinde, sürecin zaman içinde sabit istatistiksel özelliklere sahip olması (ortalama, varyans, otokorelasyon) beklenir.
    YKS, LGS ve DGS Sistemlerinin Yapısal Özellikleri
    Rastgelelik Varsayımının Yokluğu
    Merkezi sınav sistemleri, rastgeleliğe değil, tamamen deterministik bir yapıya sahiptir:
    - Tercih davranışı bireyseldir: Her öğrenci kendi akademik başarısı, sosyo-ekonomik durumu, coğrafi konumu ve kişisel tercihleri doğrultusunda tercih yapar.
    - Stratejik etkileşim vardır: Öğrencilerin tercihleri, diğer öğrencilerin tahmin edilen tercihlerinden etkilenir (oyun teorisi dinamiği).
    - Kontenjanlara bağımlılık: Tercih sonuçları, bölümlerin kontenjanlarına doğrudan bağlıdır ve bu kontenjanlar yıllar arasında değişkenlik gösterir.
    - Bilgi asimetrisi: Öğrenciler eksik ve asimetrik bilgi ile tercih yaparlar, bu da rastgele olmayan sistematik hataları beraberinde getirir.
    Bu özellikler nedeniyle, tercih sistemi klasik olasılık teorisinin öngördüğü rastgele bir süreç değil, karmaşık bir karar ağıdır.
    Bağımsızlık ve Özdeşlik Varsayımının İhlali
    YKS, LGS ve DGS verilerinde:
    - Yıllar arası korelasyon: Bir yılın taban sıralamaları ve puanları, bir sonraki yılın tercih davranışlarını etkiler (otokorelasyon).
    - Yapısal değişiklikler: Sınav formatı değişiklikleri, müfredat güncellemeleri, soru dağılımı farklılıkları her yıl farklı bir veri yapısı oluşturur.
    - Bölümler arası etkileşim: Bir bölümün popülerliği artarsa, benzer bölümlerin taban sıralamaları düşebilir (substitution effect).
    - Makroekonomik faktörler: İşsizlik oranları, sektörel gelişmeler, pandemi gibi dışsal şoklar tüm sistemi etkiler.
    Bu nedenle, farklı yıllara ait veriler bağımsız ve özdeş dağılımlı değildir.
    Normal Dağılım Varsayımının Karşılanmaması
    Puan ve sıralama dağılımları:
    - Çarpık dağılımlar gösterir: Özellikle popüler bölümlerde yüksek puanlarda yoğunlaşma (right-skewed), düşük tercih edilen bölümlerde düşük puanlarda yığılma (left-skewed) görülür.
    - Çok modlu yapılar içerir: Farklı puan türleri, farklı üniversite grupları ayrı modlar oluşturur.
    - Kuyruklarda kalınlaşma (fat tails): Ekstrem değerler normal dağılımın öngördüğünden daha sık gözlemlenir.
    - Kesikli yapı: Puanlar kesikli değerler alır ve sürekli bir dağılım göstermez.
    Durağanlık Problemleri
    Zaman boyutunda:
    - Trend değişimleri: Demografik değişimler (doğum oranları, göç), eğitim politikaları, üniversite sayısı artışı trend kırılmalarına yol açar.
    - Yapısal kırılmalar: 2018'de YKS sistemine geçiş, 2024'te bazı bölümlerin kapatılması gibi yapısal değişiklikler durağanlığı bozar.
    - Varyans değişkenliği: Farklı yıllarda taban sıralamalarının değişkenliği tutarlı değildir.
    Yeni Açılan Bölümler: Veri Yokluğu Sorunu
    Parametrik modellerin en temel gereksinimi, geçmiş veri serileridir. Ancak yeni açılan bölümler için:
    Zaman Serisi Yokluğu
    - Yeni açılan bir bölümün 2025 veya 2026'da ilk kez öğrenci alması durumunda, geçmiş yıllara ait hiçbir taban puanı, sıralama verisi veya tercih trendi mevcut değildir.
    - Bu durum, regresyon analizi, zaman serisi modelleri, ARIMA, hareketli ortalamalar gibi tüm tarihsel veri gerektiren yöntemleri anlamsız kılar.
    Benzerlik Varsayımlarının Sınırlılığı
    - "Benzer bölümlerin verilerini kullanalım" yaklaşımı da sorunludur çünkü:
    - Her bölüm kendine özgü dinamiklere sahiptir
    - Üniversite ve şehir faktörü büyük farklılı oluşturur.
    - Yeni açılan bölümler genellikle belirsizlik nedeniyle beklenmedik sonuçlar verir
    Parametrik Tahminlerin İmkansızlığı
    Yeni bölümler için:
    - Ortalama hesaplanamaz (veri yok)
    - Varyans hesaplanamaz (veri yok)
    - Regresyon katsayıları tahmin edilemez (bağımlı değişken yok)
    - Olasılık dağılımları modellenemez (gözlem yok)
    Geleneksel Veri Analizi Yöntemlerinin Metodolojik Geçersizliği
    Ortalama ve Standart Sapma
    - Problem: Yapısal kırılmalar ve trend değişimleri nedeniyle geçmiş yılların ortalaması geleceği temsil etmez.
    - Yanılgı: "Son 5 yılın ortalamasını alalım" yaklaşımı, sistematik trend varsa tamamen yanıltıcıdır.
    Regresyon Analizi
    - Problem: Bağımsız değişkenler (soru sayısı, kontenjan, üniversite sayısı vb.) ile taban puanları arasındaki ilişki yıllar arası değişir.
    - Yanılgı: Geçmiş ilişkilerin gelecekte de geçerli olacağı varsayımı.
    Olasılık Dağılımları
    - Problem: Dağılım parametreleri stabil değildir, her yıl farklı bir dağılım sözkonusudur.
    - Yanılgı: "Belirli bir sıralamaya yerleşme olasılığı %X'tir" şeklindeki ifadeler istatistiksel temelden yoksundur.
    Makine Öğrenmesi Modelleri
    Modern makine öğrenmesi teknikleri bile:
    - Overfitting riski: Az sayıda gözlem (yıllar) ve çok sayıda değişken nedeniyle aşırı öğrenme kaçınılmazdır.
    - Feature instability: Özelliklerin (features) yıllar arası tutarlılığı yoktur.
    - Validation problemi: Geçerleme için yeterli bağımsız test seti oluşturulamaz.
    Fark Tabanlı Trend Analizi: Non-Parametrik Alternatif
    Metodolojik Temeller
    Fark tabanlı trend analizi, parametrik varsayımlara dayanmayan bir non-parametrik yöntemdir:
    Temel prensib: Mutlak değerler yerine, yıllar arası değişimlere (farklara) odaklanılır.
    Matematiksel gösterim:
    Δt = Xt - Xt-1
    Burada Xt, t yılındaki değer (taban puanı veya sıralama), Δt ise değişimdir.
    Mutlak değerce minimum ∆t ve maksimum ∆t son yılla işleme konularak aralık belirlenir.
    Neden Non-Parametrik?
  5. Dağılım varsayımı yok: Verilerin hangi dağılımdan geldiği önemli değildir.
  6. Normallik gereksiz: Farkların normal dağılması şart değildir.
  7. Sıralı veri yeterli: Kardinal ölçüm yerine ordinal ölçüm bile yeterlidir.
  8. Robust (dayanıklı): Aykırı değerlere karşı dirençlidir.
    Minimum-Maksimum Temelli Yaklaşım
    Fark tabanlı analizde kullanılan temel metrikler:
    Minimum değişim (Δmin):
    - Taban sıralamanın düşebileceği en muhafazakar tahmin
    - Geçmiş yıllardaki en küçük düşüş veya en küçük artış
    - Risk minimizasyonu sağlar
    Maksimum değişim (Δmax):
    - Taban sıralamanın yükselebileceği en uç senaryo
    - Geçmiş yıllardaki en büyük artış veya en büyük düşüş
    - Olası şok durumlarını kapsar
    Ortalama fark (Δmedian):
    - Medyan farkı (mean değil): Aykırı değerlerden etkilenmez
    - Tipik değişim büyüklüğünü gösterir
    Uygulama Adımları
  9. Veri toplama: Mevcut yıllar için taban sıralama verilerini derleyin.
  10. Fark hesaplama: Her yıl için bir önceki yıla göre farkı hesaplayın.
  11. Sınır belirleme: Δmin ve Δmax değerlerini tespit edin.
  12. Trend tanımlama: Farkların yönünü (pozitif/negatif) ve büyüklüğünü analiz et
  13. Aralık tahmini: Gelecek yıl için [Mevcut değer - Δmin, Mevcut değer - Δmax] aralığını oluşturun.
    Avantajları
  14. Veri eksikliği toleransı: Sadece 2-3 yıllık veri ile bile anlamlı sonuç verir
  15. Yapısal kırılma esnekliği: Son yıllara daha fazla ağırlık verilebilir
  16. Belirsizlik yönetimi: Aralık tahmini, kesin sayı yerine olası senaryolar sunar
  17. Yeni bölümler için adaptasyon: Benzer bölümlerin fark dinamikleri kullanılabilir
  18. Şeffaflık: Hesaplama mantığı basit ve anlaşılırdır
    Sınırlılıklar ve Dikkat Edilmesi Gerekenler
  19. Geçmiş gelecektir varsayımı: Fark analizi de geçmiş dinamiklerin tekrar edeceğini varsayar, ancak parametrik yöntemlerden daha az katıdır.
  20. Ekstrem senaryolar: Pandemi, büyük yapısal reformlar gibi eşi benzeri görülmemiş durumları yakalamakta zorlanır.
  21. Yön bilgisi sınırlı: Değişimin büyüklüğü hakkında fikir verir ama kesin yönü garanti etmez.
    Gerçeklik, Belirsizlik ve Epistemolojik Sınırlar
    Geleceğin Bilinemezliği
    İstatistiksel ve analitik yöntemler ne kadar gelişmiş olursa olsun, temel bir epistemolojik gerçekle karşı karşıyayız: Gelecek, tanım gereği belirsizdir.
    Belirsizliğin kaynakları:
    - İnsan davranışının karmaşıklığı
    - Beklenmedik toplumsal ve ekonomik değişimler
    - Politika değişiklikleri
    - Teknolojik gelişmeler
    - Rastlantısal faktörler
    Hiçbir analiz yöntemi, hiçbir teknoloji bu belirsizliği tamamen ortadan kaldıramaz. Bu, bilimin ve rasyonel düşüncenin bir sınırı değil, gerçekliğin doğasından kaynaklanan bir durumdur.
    Tahmin ve Öngörü Arasındaki Fark
    Tahmin (prediction): Geçmiş verilerden yola çıkarak geleceğe dair sayısal değerler üretmek.
    Öngörü (foresight): Olası senaryoları ve bunların olasılıklarını değerlendirmek.
    Tercih süreçlerinde, kesin tahminler yerine akılcı öngörüler ve risk aralıkları sunmak daha dürüst ve etik bir yaklaşımdır.
    Yanılgılardan Kaçınmak
    Aşırı güven yanılgısı: İstatistiksel modeller, özellikle karmaşık olanlar, yanıltıcı bir kesinlik hissi oluşturabilir. "%95 güven aralığı" gibi ifadeler, kullanıcıda yanlış bir güvence oluşturabilir.
    Veri fetişizmi: "Veri analizi" ve "büyük veri" kavramlarının popülerliği, her soruna veri odaklı çözüm aranmasına yol açmaktadır. Ancak bazı problemler, yapısal özellikleri nedeniyle veri analizine uygun değildir.
    Teknoloji-çözümcülük: En gelişmiş yapay zeka bile, sistematik belirsizlik içeren bir sistemde kesin sonuçlar üretemez.
    Etik Boyut
    Tercih danışmanlığı yapan kişi ve kurumların etik sorumluluğu:
  22. Şeffaflık: Kullanılan yöntemin sınırlarını açıkça belirtmek
  23. Dürüstlük: "Garanti" veya "kesin sonuç" iddialarından kaçınmak
  24. Bilgilendirme: Öğrenci ve aileleri, karar sürecinin doğal belirsizliği hakkında bilinçlendirmek
  25. Sorumluluk: Yanlış yönlendirmelerin ciddi hayati sonuçları olabileceğini kabul etmek
    Pratik Öneriler
    Tercih Yapacak Öğrenciler İçin
  26. Çoklu senaryo düşünün: Tek bir "hedef sıralama" yerine bir aralık belirleyin
  27. Güvenli-dengeli-riskli dağılım: Tercih listenizi bu üç kategoriye göre oluşturun.
  28. En az 3-4 yılın yıl verilerine odaklanıp fark tabanlı trend analizi yapın: Sadece geçen yıla bakmak boşta kalmaya yol açar.
  29. Tercih listelerini kumar usulü yazı tura atar gibi gibi yazanlara güvenmeyin. Tercih dönemlerinde sıklıkla şu tür kumar usulü tavsiyelere rastlanmaktadır:
    “Sıralamanızın %75'i kadar yukarıdan hayal bölümler yazın. Sıralamanızı 0.9 ve 1.1 ile çarpıp orta tercih aralığını belirleyin. Son tercihlerde sıralamanızın 1.5 ila 2 katı aralığındaki bölümleri yazın.”
    Bu yaklaşımlar, istatistiksel olarak hiçbir bilimsel temele dayanmamaktadır. Gerçekte bunlar, yazı tura atmak veya fal açmak kadar rastlantısaldır. Bu tür kumar usulü tavsiyeler verenlere hiçbir şekilde güvenmeyin.ppq Üstelik bu kumar 1 yıllık verilere uygulanır. Tercihler için en az 3-4 yıllık verilere bakmak gerekir.
  30. Yapısal değişiklikleri takip edin: Yeni açılan/kapatılan bölümler, kontenjan değişimleri
  31. "Kesin yerleşir" iddialarına inanmayın: Hiçbir yöntem kesinlik sağlayamaz
    Danışmanlar ve Eğitimciler İçin
  32. Metodolojik dürüstlük: Kullandığınız yöntemin sınırlarını açıklayın
  33. Fark tabanlı trend analizini tercih edin: Parametrik yöntemler yerine non-parametrik yaklaşımları kullanın
  34. Aralık tahminleri yapın: Tek sayı yerine minimum-maksimum aralıkları verin
  35. Riskleri açıklayın: Her tercihin taşıdığı belirsizliği belirtin
  36. Sürekli güncelleyin: Son dakika kontenjan değişikliklerini takip edin
    Politika Yapıcılar İçin
  37. Veri şeffaflığı: Geçmiş yıllara ait tüm taban puanı ve sıralama verilerini açık erişimli yapın
  38. Yapısal istikrar: Sık sık sistem değişikliği, tüm tahminleri anlamsızlaştırır
  39. Erken bilgilendirme: Kontenjan ve program değişikliklerini mümkün olduğunca erken açıklayın
  40. Yanıltıcı uygulamaların denetimi: Garanti veren ticari danışmanlık hizmetlerini düzenleyin
    YKS, LGS ve DGS gibi merkezi sınav sistemlerinin tercih süreçleri, klasik istatistiksel yöntemlerin varsayımlarını karşılamayan karmaşık, deterministik ve yapısal belirsizlik içeren sistemlerdir. Bu sistemlerde:
  41. Rastgelelik varsayımı geçersizdir: Tercihler stratejik bireysel kararların sonucudur
  42. Parametrik modeller uygulanamaz: Normal dağılım, i.i.d., durağanlık varsayımları ihlal edilir
  43. Yeni bölümler için veri yoktur: Geçmiş veri gerektiren tüm yöntemler anlamsızdır
  44. Belirsizlik yapısaldır: Hiçbir teknoloji gelecekteki tercihlerin kesin sonucunu bilemez
    Bu koşullar altında, fark tabanlı trend analizi, minimum-maksimum değişim aralıklarına dayanan non-parametrik bir yöntem olarak, metodolojik olarak en tutarlı ve etik yaklaşımdır. Bu yöntem:
    - Parametrik varsayımlar gerektirmez
    - Az veri ile çalışabilir
    - Aralık tahmini yaparak belirsizliği yansıtır
    - Şeffaf ve anlaşılabilir bir mantığa sahiptir
    Ancak unutulmamalıdır ki, fark taban trend analizi de dahil hiçbir yöntem gelecek hakkında kesin bilgi veremez. Tercih sürecinde en önemli şey, rasyonel değerlendirme, risk yönetimi ve gerçekçi beklentilerdir. Öğrenciler, aileler ve danışmanlar, metodolojik sınırları kabul ederek, en iyi kararı vermek için ellerindeki araçları bilinçli ve sorumlu bir şekilde kullanmalıdır. Eğitim hayatının bu kritik geçiş noktalarında, bilimsel dürüstlük, epistemolojik alçakgönüllülük ve etik sorumluluk, herhangi bir analitik yöntemden daha değerlidir.

KİTAP İZLERİ

İNCİR KUŞLARI

Sinan Akyüz

Zambaklar Ülkesinde Açan Kan Gülleri: "İncir Kuşları" Sinan Akyüz’ün gerçek bir yaşam öyküsünden yola çıkarak kaleme aldığı "İncir Kuşları", okuru 1990'ların başında Avrupa'nın kalbinde patlak
İncelemeyi Oku

Yorumlar

Başa Dön