Türkiye'deki merkezi sınav sistemleri (YKS, LGS, DGS), her yıl milyonlarca öğrencinin eğitim hayatını şekillendiren kritik geçiş noktalarıdır. Bu süreçlerde öğrencilerin ve ailelerinin en büyük kaygılarından biri, tercih aşamasında doğru ve güvenilir yöntemlerle karar vermektir. Ancak bu noktada önemli bir metodolojik sorun ortaya çıkmaktadır: Geleneksel istatistiksel yöntemler ve veri analizi teknikleri, bu sınav sistemlerinin doğasına uygun değildir.
Parametrik İstatistik Yöntemlerinin Temel Varsayımları
Parametrik istatistik yöntemleri, belirli matematiksel ve istatistiksel ön koşullar üzerine kuruludur. Bu yöntemlerin geçerli sonuçlar üretebilmesi için:
- Rastgelelik Varsayımı
Parametrik modeller, gözlemlerin rastgele bir süreçten geldiğini varsayar. Örneklem, evren hakkında genelleme yapmaya imkan tanıyan rastgele seçim süreçleriyle oluşturulmalıdır. - Bağımsız ve Özdeş Dağılım (i.i.d.)
Gözlemlerin birbirinden bağımsız olması ve aynı olasılık dağılımından gelmiş olması beklenir. Bu, her bir gözlemin diğerlerinden etkilenmediği ve tüm gözlemlerin aynı yapısal özellikleri taşıdığı anlamına gelir. - Normal Dağılım
Birçok parametrik test ve model, verilerin normal dağılım gösterdiği varsayımına dayanır. Bu varsayım, ortalama, standart sapma gibi parametrelerin anlamlı olması için gereklidir. - Durağanlık
Zaman serisi analizlerinde, sürecin zaman içinde sabit istatistiksel özelliklere sahip olması (ortalama, varyans, otokorelasyon) beklenir.
YKS, LGS ve DGS Sistemlerinin Yapısal Özellikleri
Rastgelelik Varsayımının Yokluğu
Merkezi sınav sistemleri, rastgeleliğe değil, tamamen deterministik bir yapıya sahiptir:
- Tercih davranışı bireyseldir: Her öğrenci kendi akademik başarısı, sosyo-ekonomik durumu, coğrafi konumu ve kişisel tercihleri doğrultusunda tercih yapar.
- Stratejik etkileşim vardır: Öğrencilerin tercihleri, diğer öğrencilerin tahmin edilen tercihlerinden etkilenir (oyun teorisi dinamiği).
- Kontenjanlara bağımlılık: Tercih sonuçları, bölümlerin kontenjanlarına doğrudan bağlıdır ve bu kontenjanlar yıllar arasında değişkenlik gösterir.
- Bilgi asimetrisi: Öğrenciler eksik ve asimetrik bilgi ile tercih yaparlar, bu da rastgele olmayan sistematik hataları beraberinde getirir.
Bu özellikler nedeniyle, tercih sistemi klasik olasılık teorisinin öngördüğü rastgele bir süreç değil, karmaşık bir karar ağıdır.
Bağımsızlık ve Özdeşlik Varsayımının İhlali
YKS, LGS ve DGS verilerinde:
- Yıllar arası korelasyon: Bir yılın taban sıralamaları ve puanları, bir sonraki yılın tercih davranışlarını etkiler (otokorelasyon).
- Yapısal değişiklikler: Sınav formatı değişiklikleri, müfredat güncellemeleri, soru dağılımı farklılıkları her yıl farklı bir veri yapısı oluşturur.
- Bölümler arası etkileşim: Bir bölümün popülerliği artarsa, benzer bölümlerin taban sıralamaları düşebilir (substitution effect).
- Makroekonomik faktörler: İşsizlik oranları, sektörel gelişmeler, pandemi gibi dışsal şoklar tüm sistemi etkiler.
Bu nedenle, farklı yıllara ait veriler bağımsız ve özdeş dağılımlı değildir.
Normal Dağılım Varsayımının Karşılanmaması
Puan ve sıralama dağılımları:
- Çarpık dağılımlar gösterir: Özellikle popüler bölümlerde yüksek puanlarda yoğunlaşma (right-skewed), düşük tercih edilen bölümlerde düşük puanlarda yığılma (left-skewed) görülür.
- Çok modlu yapılar içerir: Farklı puan türleri, farklı üniversite grupları ayrı modlar oluşturur.
- Kuyruklarda kalınlaşma (fat tails): Ekstrem değerler normal dağılımın öngördüğünden daha sık gözlemlenir.
- Kesikli yapı: Puanlar kesikli değerler alır ve sürekli bir dağılım göstermez.
Durağanlık Problemleri
Zaman boyutunda:
- Trend değişimleri: Demografik değişimler (doğum oranları, göç), eğitim politikaları, üniversite sayısı artışı trend kırılmalarına yol açar.
- Yapısal kırılmalar: 2018'de YKS sistemine geçiş, 2024'te bazı bölümlerin kapatılması gibi yapısal değişiklikler durağanlığı bozar.
- Varyans değişkenliği: Farklı yıllarda taban sıralamalarının değişkenliği tutarlı değildir.
Yeni Açılan Bölümler: Veri Yokluğu Sorunu
Parametrik modellerin en temel gereksinimi, geçmiş veri serileridir. Ancak yeni açılan bölümler için:
Zaman Serisi Yokluğu
- Yeni açılan bir bölümün 2025 veya 2026'da ilk kez öğrenci alması durumunda, geçmiş yıllara ait hiçbir taban puanı, sıralama verisi veya tercih trendi mevcut değildir.
- Bu durum, regresyon analizi, zaman serisi modelleri, ARIMA, hareketli ortalamalar gibi tüm tarihsel veri gerektiren yöntemleri anlamsız kılar.
Benzerlik Varsayımlarının Sınırlılığı
- "Benzer bölümlerin verilerini kullanalım" yaklaşımı da sorunludur çünkü:
- Her bölüm kendine özgü dinamiklere sahiptir
- Üniversite ve şehir faktörü büyük farklılı oluşturur.
- Yeni açılan bölümler genellikle belirsizlik nedeniyle beklenmedik sonuçlar verir
Parametrik Tahminlerin İmkansızlığı
Yeni bölümler için:
- Ortalama hesaplanamaz (veri yok)
- Varyans hesaplanamaz (veri yok)
- Regresyon katsayıları tahmin edilemez (bağımlı değişken yok)
- Olasılık dağılımları modellenemez (gözlem yok)
Geleneksel Veri Analizi Yöntemlerinin Metodolojik Geçersizliği
Ortalama ve Standart Sapma
- Problem: Yapısal kırılmalar ve trend değişimleri nedeniyle geçmiş yılların ortalaması geleceği temsil etmez.
- Yanılgı: "Son 5 yılın ortalamasını alalım" yaklaşımı, sistematik trend varsa tamamen yanıltıcıdır.
Regresyon Analizi
- Problem: Bağımsız değişkenler (soru sayısı, kontenjan, üniversite sayısı vb.) ile taban puanları arasındaki ilişki yıllar arası değişir.
- Yanılgı: Geçmiş ilişkilerin gelecekte de geçerli olacağı varsayımı.
Olasılık Dağılımları
- Problem: Dağılım parametreleri stabil değildir, her yıl farklı bir dağılım sözkonusudur.
- Yanılgı: "Belirli bir sıralamaya yerleşme olasılığı %X'tir" şeklindeki ifadeler istatistiksel temelden yoksundur.
Makine Öğrenmesi Modelleri
Modern makine öğrenmesi teknikleri bile:
- Overfitting riski: Az sayıda gözlem (yıllar) ve çok sayıda değişken nedeniyle aşırı öğrenme kaçınılmazdır.
- Feature instability: Özelliklerin (features) yıllar arası tutarlılığı yoktur.
- Validation problemi: Geçerleme için yeterli bağımsız test seti oluşturulamaz.
Fark Tabanlı Trend Analizi: Non-Parametrik Alternatif
Metodolojik Temeller
Fark tabanlı trend analizi, parametrik varsayımlara dayanmayan bir non-parametrik yöntemdir:
Temel prensib: Mutlak değerler yerine, yıllar arası değişimlere (farklara) odaklanılır.
Matematiksel gösterim:
Δt = Xt - Xt-1
Burada Xt, t yılındaki değer (taban puanı veya sıralama), Δt ise değişimdir.
Mutlak değerce minimum ∆t ve maksimum ∆t son yılla işleme konularak aralık belirlenir.
Neden Non-Parametrik? - Dağılım varsayımı yok: Verilerin hangi dağılımdan geldiği önemli değildir.
- Normallik gereksiz: Farkların normal dağılması şart değildir.
- Sıralı veri yeterli: Kardinal ölçüm yerine ordinal ölçüm bile yeterlidir.
- Robust (dayanıklı): Aykırı değerlere karşı dirençlidir.
Minimum-Maksimum Temelli Yaklaşım
Fark tabanlı analizde kullanılan temel metrikler:
Minimum değişim (Δmin):
- Taban sıralamanın düşebileceği en muhafazakar tahmin
- Geçmiş yıllardaki en küçük düşüş veya en küçük artış
- Risk minimizasyonu sağlar
Maksimum değişim (Δmax):
- Taban sıralamanın yükselebileceği en uç senaryo
- Geçmiş yıllardaki en büyük artış veya en büyük düşüş
- Olası şok durumlarını kapsar
Ortalama fark (Δmedian):
- Medyan farkı (mean değil): Aykırı değerlerden etkilenmez
- Tipik değişim büyüklüğünü gösterir
Uygulama Adımları - Veri toplama: Mevcut yıllar için taban sıralama verilerini derleyin.
- Fark hesaplama: Her yıl için bir önceki yıla göre farkı hesaplayın.
- Sınır belirleme: Δmin ve Δmax değerlerini tespit edin.
- Trend tanımlama: Farkların yönünü (pozitif/negatif) ve büyüklüğünü analiz et
- Aralık tahmini: Gelecek yıl için [Mevcut değer - Δmin, Mevcut değer - Δmax] aralığını oluşturun.
Avantajları - Veri eksikliği toleransı: Sadece 2-3 yıllık veri ile bile anlamlı sonuç verir
- Yapısal kırılma esnekliği: Son yıllara daha fazla ağırlık verilebilir
- Belirsizlik yönetimi: Aralık tahmini, kesin sayı yerine olası senaryolar sunar
- Yeni bölümler için adaptasyon: Benzer bölümlerin fark dinamikleri kullanılabilir
- Şeffaflık: Hesaplama mantığı basit ve anlaşılırdır
Sınırlılıklar ve Dikkat Edilmesi Gerekenler - Geçmiş gelecektir varsayımı: Fark analizi de geçmiş dinamiklerin tekrar edeceğini varsayar, ancak parametrik yöntemlerden daha az katıdır.
- Ekstrem senaryolar: Pandemi, büyük yapısal reformlar gibi eşi benzeri görülmemiş durumları yakalamakta zorlanır.
- Yön bilgisi sınırlı: Değişimin büyüklüğü hakkında fikir verir ama kesin yönü garanti etmez.
Gerçeklik, Belirsizlik ve Epistemolojik Sınırlar
Geleceğin Bilinemezliği
İstatistiksel ve analitik yöntemler ne kadar gelişmiş olursa olsun, temel bir epistemolojik gerçekle karşı karşıyayız: Gelecek, tanım gereği belirsizdir.
Belirsizliğin kaynakları:
- İnsan davranışının karmaşıklığı
- Beklenmedik toplumsal ve ekonomik değişimler
- Politika değişiklikleri
- Teknolojik gelişmeler
- Rastlantısal faktörler
Hiçbir analiz yöntemi, hiçbir teknoloji bu belirsizliği tamamen ortadan kaldıramaz. Bu, bilimin ve rasyonel düşüncenin bir sınırı değil, gerçekliğin doğasından kaynaklanan bir durumdur.
Tahmin ve Öngörü Arasındaki Fark
Tahmin (prediction): Geçmiş verilerden yola çıkarak geleceğe dair sayısal değerler üretmek.
Öngörü (foresight): Olası senaryoları ve bunların olasılıklarını değerlendirmek.
Tercih süreçlerinde, kesin tahminler yerine akılcı öngörüler ve risk aralıkları sunmak daha dürüst ve etik bir yaklaşımdır.
Yanılgılardan Kaçınmak
Aşırı güven yanılgısı: İstatistiksel modeller, özellikle karmaşık olanlar, yanıltıcı bir kesinlik hissi oluşturabilir. "%95 güven aralığı" gibi ifadeler, kullanıcıda yanlış bir güvence oluşturabilir.
Veri fetişizmi: "Veri analizi" ve "büyük veri" kavramlarının popülerliği, her soruna veri odaklı çözüm aranmasına yol açmaktadır. Ancak bazı problemler, yapısal özellikleri nedeniyle veri analizine uygun değildir.
Teknoloji-çözümcülük: En gelişmiş yapay zeka bile, sistematik belirsizlik içeren bir sistemde kesin sonuçlar üretemez.
Etik Boyut
Tercih danışmanlığı yapan kişi ve kurumların etik sorumluluğu: - Şeffaflık: Kullanılan yöntemin sınırlarını açıkça belirtmek
- Dürüstlük: "Garanti" veya "kesin sonuç" iddialarından kaçınmak
- Bilgilendirme: Öğrenci ve aileleri, karar sürecinin doğal belirsizliği hakkında bilinçlendirmek
- Sorumluluk: Yanlış yönlendirmelerin ciddi hayati sonuçları olabileceğini kabul etmek
Pratik Öneriler
Tercih Yapacak Öğrenciler İçin - Çoklu senaryo düşünün: Tek bir "hedef sıralama" yerine bir aralık belirleyin
- Güvenli-dengeli-riskli dağılım: Tercih listenizi bu üç kategoriye göre oluşturun.
- En az 3-4 yılın yıl verilerine odaklanıp fark tabanlı trend analizi yapın: Sadece geçen yıla bakmak boşta kalmaya yol açar.
- Tercih listelerini kumar usulü yazı tura atar gibi gibi yazanlara güvenmeyin. Tercih dönemlerinde sıklıkla şu tür kumar usulü tavsiyelere rastlanmaktadır:
“Sıralamanızın %75'i kadar yukarıdan hayal bölümler yazın. Sıralamanızı 0.9 ve 1.1 ile çarpıp orta tercih aralığını belirleyin. Son tercihlerde sıralamanızın 1.5 ila 2 katı aralığındaki bölümleri yazın.”
Bu yaklaşımlar, istatistiksel olarak hiçbir bilimsel temele dayanmamaktadır. Gerçekte bunlar, yazı tura atmak veya fal açmak kadar rastlantısaldır. Bu tür kumar usulü tavsiyeler verenlere hiçbir şekilde güvenmeyin.ppq Üstelik bu kumar 1 yıllık verilere uygulanır. Tercihler için en az 3-4 yıllık verilere bakmak gerekir. - Yapısal değişiklikleri takip edin: Yeni açılan/kapatılan bölümler, kontenjan değişimleri
- "Kesin yerleşir" iddialarına inanmayın: Hiçbir yöntem kesinlik sağlayamaz
Danışmanlar ve Eğitimciler İçin - Metodolojik dürüstlük: Kullandığınız yöntemin sınırlarını açıklayın
- Fark tabanlı trend analizini tercih edin: Parametrik yöntemler yerine non-parametrik yaklaşımları kullanın
- Aralık tahminleri yapın: Tek sayı yerine minimum-maksimum aralıkları verin
- Riskleri açıklayın: Her tercihin taşıdığı belirsizliği belirtin
- Sürekli güncelleyin: Son dakika kontenjan değişikliklerini takip edin
Politika Yapıcılar İçin - Veri şeffaflığı: Geçmiş yıllara ait tüm taban puanı ve sıralama verilerini açık erişimli yapın
- Yapısal istikrar: Sık sık sistem değişikliği, tüm tahminleri anlamsızlaştırır
- Erken bilgilendirme: Kontenjan ve program değişikliklerini mümkün olduğunca erken açıklayın
- Yanıltıcı uygulamaların denetimi: Garanti veren ticari danışmanlık hizmetlerini düzenleyin
YKS, LGS ve DGS gibi merkezi sınav sistemlerinin tercih süreçleri, klasik istatistiksel yöntemlerin varsayımlarını karşılamayan karmaşık, deterministik ve yapısal belirsizlik içeren sistemlerdir. Bu sistemlerde: - Rastgelelik varsayımı geçersizdir: Tercihler stratejik bireysel kararların sonucudur
- Parametrik modeller uygulanamaz: Normal dağılım, i.i.d., durağanlık varsayımları ihlal edilir
- Yeni bölümler için veri yoktur: Geçmiş veri gerektiren tüm yöntemler anlamsızdır
- Belirsizlik yapısaldır: Hiçbir teknoloji gelecekteki tercihlerin kesin sonucunu bilemez
Bu koşullar altında, fark tabanlı trend analizi, minimum-maksimum değişim aralıklarına dayanan non-parametrik bir yöntem olarak, metodolojik olarak en tutarlı ve etik yaklaşımdır. Bu yöntem:
- Parametrik varsayımlar gerektirmez
- Az veri ile çalışabilir
- Aralık tahmini yaparak belirsizliği yansıtır
- Şeffaf ve anlaşılabilir bir mantığa sahiptir
Ancak unutulmamalıdır ki, fark taban trend analizi de dahil hiçbir yöntem gelecek hakkında kesin bilgi veremez. Tercih sürecinde en önemli şey, rasyonel değerlendirme, risk yönetimi ve gerçekçi beklentilerdir. Öğrenciler, aileler ve danışmanlar, metodolojik sınırları kabul ederek, en iyi kararı vermek için ellerindeki araçları bilinçli ve sorumlu bir şekilde kullanmalıdır. Eğitim hayatının bu kritik geçiş noktalarında, bilimsel dürüstlük, epistemolojik alçakgönüllülük ve etik sorumluluk, herhangi bir analitik yöntemden daha değerlidir.