Radikal: Partizan istatistik – İlker Birbil

Üç vakte kalmaz önemli bilimsel gelişmelere sahne olacak nanoteknolojide, Türkiye’nin dünyaya verdiği mesaj çok açık: Açılın, biz geliyoruz!

Malum önümüzde bir yerel, bir de genel seçim var. Vaatler uçuşacak. Tabii bu vaatler ortalamalarla, yüzdelerle, anket sonuçları ile süslenecek. İşin garibi, aynı sayıları her parti farklı yorumlayacak. “Bu işte bir bityeniği var” diye düşünüyor insan. Öyle. Sorumlusu kim mi? İsta-tistik parti-zani!

Ortalama. Hani bana?
Örneğin şuna yakın bir vaat garanti: “2023 yılına kadar kişi başına düşen milli gelir iki katına çıkacak; 21 bin dolar olacak.” Bu verilen sayı, toplam gelirin nüfusa bölünmesi ile hesaplanıyor. Adı da aritmetik ortalama.

İki ülke düşünün. İkisinde de beşer kişi yaşıyor diyelim. Birinci ülkede vatandaşların milli gelirden aldıkları paylar sırasıyla 35 bin, 25 bin ve kalan üç kişiye de 15’er bin dolar olsun. Bu ülkede kişi başına 21 bin dolar düşüyor. Geçelim ikinci ülkeye. Burada büyük balık 90 bin dolar alıyor, çevresindeki iki kişiye sekiz bin ve altı bin dolar veriyor. Aşağıda kalan iki kişiye de beş yüzer dolar koklatıyor. Bu ülkede de aritmetik ortalama 21 bin dolar oluyor. Gel gör ki bir kişi hariç kimse o rakamı rüyasında bile göremiyor.

Aritmetik ortalama bizi yanılttı. Başka iki değere daha bakalım. Medyan, sayıları büyükten küçüğe dizdiğimizde tam ortadaki değere karşılık geliyor. Yani sayıların yarısı medyandan az, diğer yarısı da çok. Mod ise sayıların arasında en fazla tekrar edileni gösteriyor. Yukardaki birinci ülkede medyan ve mod değerlerinin ikisi de 15 bin. Şanslı ülke. İkinci ülkede ise medyan altı bin iken, mod sadece beş yüz. Medyan ile 21 bin gibi uçuk bir sayıdan biraz daha gerçekçi değerlere ulaştık. Mod sayesinde de ülkenin önemli bir kısmının çok az paraya talim ettiğini anladık. Bizim memleket bu iki farazi ülkenin arasında bir yerlerde. Hangisine daha yakın olduğunu siz takdir edersiniz. Benim diyeceğim adaletli paylaşımın olmadığı ülkelerde hükümet aritmetik ortalamaya, muhalefet ise medyan ya da mod değerlerine sarılır.

Anketler
Seçimler yaklaştıkça türlü türlü anket sonuçları da göreceğiz. Kim ne kadar oy alacak? Hangi bölge kime oy verecek? Araştırma şirketleri ve tabii partiler bu sayıların peşine düşecekler. Şimdiden başladılar bile. Ben bugüne kadar iki araştırma şirketinin sonuçlarının tuttuğunu görmedim. Zira bu mümkün değil. Çünkü bir araştırma şirketinin ülkedeki herkesle anket yapması imkânsız. Onun için farklı kesimlerden insanları seçerek örneklem denilen bir grup oluşturuyorlar. Anketi de bu gruba yapıyorlar. Örneklem ne kadar iyiyse sonuçlar da o kadar güvenilir oluyor. Evet, örneklemdeki insan sayısının çok olması önemli. Ancak asıl can alıcı nokta, örneklemin ülke genelini ne kadar temsil ettiği.

Bu temsil sorununu şöyle anlatayım. Diyelim ki örneklem, akşam vapur çıkışındaki insanlardan seçilmiş olsun. İlk bakışta vapurları herkesin kullandığı ve böyle bir grupta temsil sorunu olmayacağı düşünülebilir. Maalesef doğru değil. Çünkü akşamları vapur kullananlar işlerinden dönen insanlar. Evde kalanlar, işsizler ne olacak? Hele ki Türkiye’de. Malum onlar nüfusun önemli bir kısmını oluşturuyorlar.

Kötü niyetli değilse ya da birilerine yaranmaya çalışmıyorsa, bir firmanın böyle basit hatalar yapacağını sanmam. Öte yandan anket sonuçlarının insanların algısını etkilediği, karşı tarafın moralini bozduğu da bir gerçek. Onun için erken anket sonuçlarına, hele güvenilir firmalardan gelmiyorsa, şüpheyle yaklaşmakta fayda var.

Başka istatistik numaralarını merak ediyorsanız Darrell Huff’ın ‘İstatistik ile nasıl yalan söylenir?’ isimli eğlenceli kitabını tavsiye ederim. Ben konuya ucundan azıcık değindim; Huff ise hakkını veriyor. Eğer kitabı seçimlere kadar okuyamazsanız, en azından şu söz aklınızda olsun: “Üç tür yalan vardır: Yalanlar, kuyruklu yalanlar ve istatistik.”

İlker Birbil
31 Ağustos 2013
Kaynak; radikal.com.tr