DNA Nedir?
Deoksiribo Nükleik asit (DNA), organizmaların ve virüslerin biyolojik bilgilerini taşıyan bir nükleik asittir. DNA’nın en önemli özelliği bilgiyi uzun süre koruyabilmesidir. DNA, protein ve RNA gibi hücrenin diğer bileşenlerinin üretilmesi için gereken bilgileri içeren bir reçeteye benzetilebilir. Genetik bilgileri içeren DNA parçaları gen olarak adlandırılır.
1 gram DNA’da yaklaşık olarak 450 exabayt veri bulunur (1 exabayt =1 milyon GB). İnsan DNA dizisi bilgisayar ortamına aktarıldığında, büyük bir veri kümesi halini alır. Bu veri kümesi insanlardaki biyolojik özellikleri barındırır. Göz rengi, saç rengi, boyunun uzunluğu ve kalıtsal hastalıkları bu bilgilerin içerisindedir.
DNA, kromozomlar içinde bulunur. Bir hücredeki kromozomlar kümesine o hücrenin genomu denir. Genomu oluşturan DNA insanlarda hücre çekirdeğinde, ayrıca az miktarda mitokondrilerde bulunur. Genom tarafından kodlanan bilgi genlerde yer alır, bu bilginin tamamına genotip denir. Gen kalıtsaldır ve canlının belli özelliklerini belirleyen DNA dizileri ile tanımlanır.
Çoğu biyolojik türde proteinleri genomdaki dizilerin küçük bölümü kodlar. İnsan genomunun ancak %1'i protein kodlar, insan DNA'sının %50'si protein kodlamayan ve tekrar eden dizilerden oluşur. Ökaryot genomlarında bu kadar çok protein kodlamayan DNA'nın bulunması ve türlerin genom büyüklüğündeki farklılıkların nedeni henüz anlaşılamamıştır. Protein kodlamayan (non-coding) DNA dizileri RNA molekülleri kodlamaktadır. Bu nedenle protein kodlamayan DNA dizileri gen ifadesinin düzenlenmesinde dolaylı olarak rol oynarlar.
DNA Dizilemesi
DNA dizilemesi, bir DNA molekülündeki nükleotit bazlarının (adenin, guanin, sitozin ve timin) sırasının belirlenmesidir.
DNA dizilerinin bilinmesi temel biyoloji, biyoteknoloji, adli bilim, tıbbi tanı koyma gibi pek çok sahada vazgeçilmez hâle gelmiştir. DNA dizilemesi biyolojik araştırma ve keşifleri çok hızlandırmıştır. Modern DNA dizileme teknolojilerin mümkün kıldığı hızlı DNA dizileme sayesinde İnsan Genom Projesi'nde insan genomunun dizilenebilmiştir. Benzer projelerle pek çok hayvan, bitki ve mikrop genomunun tam dizisi üretilebilmiştir.
İnsan genom projesi ile insanların DNA’ları dizilenerek ortak bir referans DNA bulunmuştur. Bu DNA insanlara DNA testi yapıldığında test yapılan insanın referans DNA’dan ne kadar farklılığı bulunduğuna bakılır. DNA farklılıkları ve ailesinin hastalık geçmişi karşılaştırılarak kalıtsal hastalığının olup olmadığı bulunur.
Hastalığa neden olan genler birçok denekten alınan DNA’larla ve deneklerin hastalık geçmişleriyle karşılaştırılarak bulunmuştur. Hastalığa neden olan mutasyon ile değişmiş olabilir veya kalıtsal olarak aileden gelen bir gen olabilir.
Bir DNA dizisindeki genler tarif gibidir. Dizideki bir gen tariften yani referans DNA’daki genden farklı ise bu gen mutasyon olarak kabul edilir. Ancak her farklılık hastalığa neden olmaz.
DNA dizileri matematiksel olarak işlenirken genelde lineer diskriminant analizi veya temel bileşen analizi kullanılır. Bu algoritmalar istatiksel yöntemler kullanır. Büyük veri kümeleri üzerinde istatiksel olarak boyut azaltma amacıyla geliştirilmiş algoritmalardır. Bu yöntem, tekrarlayan DNA dizilerini azaltarak farklılıkları ortaya çıkarır.
[rwp-review id=”0″]