Biyolojik Deneylerde Veri Tiplerinin Belirlenmesi ve Hata Oranının Azaltılması
İstatistik bilimi, elde edilen verilerin incelenmesine, karşılaştırılmasına, ve açıklanmasına olanak sağlayan bir bilim dalıdır. Biyolojik bilimlerde istatistik biliminin kullanımı oldukça önemli ve bir o kadar da zordur. Bunun sebebi incelenen bireyler veya popülasyonların birbirlerine asla benzememesidir. Bu noktada, biyolojik bilimlerde deney tasarımı ve deney sonrası elde edilen verilerin doğru istatistiksel yöntem kullanılarak incelenmesi büyük önem taşımaktadır. Bugünkü yazımda sizlere veri tiplerinden, verilerin özelliklerinden ve biyolojik bilimlerde deney tasarlanırken üzerinde durulması gereken önemli konulardan bahsetmeye çalışacağım.
Kullanacağımız verilerin kategorisini belirlemek, verileri karşılaştırırken ve deney tasarlarken büyük önem taşımaktadır. Bu sebepten deney tasarımında üzerinde durulması gereken noktalara geçmeden önce veri tiplerine değinmekte fayda olacağını düşünüyorum. İstatiksel veri tiplerini genel olarak ikiye ayırmak mümkündür. Bunlar:
Kategorik Veriler: Verilen datanın özelliğini belirlemek, nitelemek için kullanılan datalara verilen isimdir. Herhangi bir numerik değer içermez. Kategorik verileri kendi içinde iki gruba ayırmak mümkündür;
- Nominal Veriler: Herhangi bir sıraya ihtiyaç duymadan gruplanan data türüdür. Örnek olarak cinsiyet kromozomlarının belirtilmesi, ülkelerde baskın olarak kullanılan dillerin belirtilmesi gibi durumlar verilebilir.
- Ordinal Veriler: Dataların belirli bir sıraya göre dizilip gruplanmasına verilen isimdir. Her grupta verilen datalar belirli bir sıraya göre dizilmiş olmalıdır. Örneğin, kurbağanın yaşam evreleri, eğitim düzeyi, ülkelerin sosyoekonomik ölçek skorları ordinal verilerdir.
Nümerik Veriler: Ölçülebilir nitelikte olan verilerin sayısal olarak gösterilmesi durumudur. Nümerik verileri de kategorik verilerde olduğu gibi kendi içinde iki gruba ayırabiliriz;
- Sürekli Nümerik Veriler: Verilen iki değer arasında herhangi bir real sayı değeri alabilen datalardır. Örnek olarak vücut sıcaklığı, bir ormanın yüzölçümü verilebilir.
- Aralıklı Nümerik Veriler: Sınırlı bir zaman aralığında sayılabilen, sonlu sayısal verilerdir. Örnek olarak bir proteinin içerdiği amino asit sayısı verilebilir.
Verilen dataların hangi tipte olduğunu belirledikten sonra, data gruplarının özelliklerinin belirlenmesi de çok önemlidir. Bunun için data grubunun aritmetik ortalamasını, standart sapmasını, medyanını, modunu ve çeyrekler açıklığını belirlemek gerekmektedir;
Aritmetik Ortalama: Elde edilen nümerik veri elemanlarının toplamının eleman sayısına bölümü ile elde edilmektedir.
Standart Sapma: Elde edilen dataların, aritmetik ortalamaya yakınlığını ya da aritmetik ortalamadan sapmasının hesaplanmasıdır.
Medyan: Elde edilen verileri küçükten büyüğe doğru sıraladığımızda tam ortada kalan değere verilen isimdir.
Mod: Elde edilen veri grubunda en çok tekrar eden veridir.
Çeyrekler Açıklığı: Elde edilen verileri küçükten büyüğe doğru sıraladığımızda medyan ile ikiye bölünen ilk grubu ve aynı şekilde ikinci grubu tekrar tam ortadan bölen değerdir.
Biyolojik bilimlerde kullanılan araştırma yaklaşımlarını temel olarak iki sınıfa ayırabilmek mümkündür. Bunlardan ilki gözlemsel yaklaşımdır. Gözlemsel yaklaşımda araştırmacı tarafından incelenen veya incelenmek istenen özellikler araştırmacının kontrlü altında gerçekleşmemektedir. Gerçek hayata oldukça yakın sonuçlar elde edilebilmesine rağmen, neden-sonuç ilişkisi kurmak da bir o kadar zordur. Bir diğer araştırma yaklaşımı ise deneysel yaklaşımdır. Deneysel yaklaşımda incelenen özellikler araştırmacının kontrolü altında tutulabilir, ancak deney koşulları gerçek hayattaki ile tam olarak aynı olmamaktadır. Bunların yanı sıra deney sırasında kullandığımız farklı kategorilerde değişkenler vardır. Bunları genel olarak bağımlı, bağımsız ve kontrollü değişkenler olarak sınıflandırabiliriz. Bağımsız değişken, araştırmacı tarafından değiştirilen faktörlere verilen isimdir. Bağımlı değişken ise bağımsız değişkenlerin değişmesinden etkilenen faktörlerdir. Kontrollü değişkenler ise deneyin sonucunun başka bir faktörden etkilenmemesi için sabit tutulan değişkenlerdir. Bunların yanı sıra karıştırıcı değişken olarak adlandırdığımız bir değişken grubu daha vardır. Karıştırıcı değişkenler, bağımsız değişken olarak belirlenmemesine rağmen deney sonucuna yani bağımlı değişkenlerin üzerinde etkisi olan değişkenlerdir. Deney tasarımı sırasında karıştırıcı değişkenlerin minimum düzeye indirilmesi deneyin güvenilir sonuç vermesi için çok önemlidir.
Deney Tasarlarken Örneklem Hatası ve Sapmayı Azaltmanın Yolları
Deney tasarımı sırasında örneklem hatasını azaltmak için üç yola başvurmak mümkündür. Bunlar:
- Replikasyon: Deney sırasında örneklerin sayısını arttırarak, deneyin güvenilirliğinin arttırılma yöntemidir.Replikasyonun göz ardı edildiği deneylerde bulunan sonucun şansa bağlı olup olmadığını anlamak oldukça güçtür.
- Dengeleme: Deney sırasında farklı deney gruplarının örneklem sayısı eşit olmalıdır. Aksi takdirde örneklem hatası gözlemlemek mümkündür.
- Bloklama: Birbirine benzer özelliklere sahip örneklerin gruplar haline alınara incelenmesine dayanan bir yöntemdir. Gözlemlenmek istenmeyen özelliklerin elenmesine yardımcı olmaktadır.
Deney sırasında sapmayı azaltmak için de üç farklı yol kullanmak mümkündür. Bunlar:
- Randomizasyon: Uygulanacak işlemin veya tedavinin örneklere rastgele dağıtılması veya uygulancak işlem için seçilmesi gereken örneklemlerin rastgele seçilmesine dayanmaktadır.
- Kör Deney: Yapılan klinik araştırmalarda deney grubunda yer alanların aldığı tedaviyi veya işlemi bilmemesine tek kör deney yöntemi adı verilmektedir. Araştırmaya katılan araştırmacıların da örneklemler gibi uyguladıkları tedaviyi bilmemeleri durumu ise çift kör deney yöntemidir. Her iki durumunda amacı yapılan araştırmanın kişi davranışlarına bağlı olmadan güvenilir sonuç vermesini sağlamaktır.
- Kontrol Grubunun Varlığı: Yapılan araştırmalarda incelenmek istenen faktörün, tedavini veya işlemin belli bir gruba uygulanmaması durumunda bu grup kontrol grubu olarak deneyde yer almaktadır. Kontrol gruplarının varlığı incelenmek istenen faktörün etkisini belirlemek açısından oldukça önemlidir.
Utku GURS
Referanslar;
- Whitlock, M., & Schluter, D. (2020). Analysis of biological data. New York, NY: Macmillan Learning.
- What Are Clinical Trials and Studies? (n.d.). Retrieved from https://www.nia.nih.gov/health/what-are-clinical-trials-and-studies