Biyoinformatik ve dna dizi analizi
Biyoinformatik, biyolojik bilgilerin yaratılması ve saklanması için veritabanlarının oluşturulmasıdır.Bu konudaki çalışmaların çoğu biyolojik verilerin analizi ile ilgilidir. Artan sayıdaki projelerde biyolojik bilgilerin organizasyonu gerekmektedir. Bu alanda oluşturulan veritabanlarının büyük bir kısmını nükleik asitler oluşturmaktadır.
Milyonlarca nükleotidin depolanması ve organizasyonu için veritabanlarının oluşturulması, araştırıcıların bu bilgilere ulaşabilmeleri ve yeni veriler girebilmeleri için ilk aşamadır. Biyoinformatik’te nükleotid dizi bilgilerinin organizasyonu ve depolanması görevini üstlenmiş üç kuruluş vardır. Genbankası (GenBank), Avrupa Moleküler Biyoloji Laboratuvarı (EMBL) ve DNA Japonya veritabanıdır (DDBJ). Bu üç kuruluş, araştırıcıların yararlanmasına açık, nükleotid dizi bilgilerinin toplanması ve yayılmasında işbirliği içinde çalışmaktadır. Gen Bankası ABD’de Maryland, Bethesda’da, Avrupa Moleküler Biyoloji Laboratuvarı, İngiltere’deki Hinxton’da ve DNA Japonya veritabanı ise Japonya’da Mishima’da yeni dizi bilgilerinin alışverişinde,İnternet üzerinde günlük olarak e-mail, ortak kullanılan ftp ve www üzerinden hizmet sunmaktadırlar. Protein dizi verileri ile ilgili başlıca hizmet sağlayıcılar ise GenBank, EMBL, PIR International ve Swiss-Prot’tur. NIH’in National Center for Biotechnology Information merkezi, biyoinformatik gereci sunan başlıca web sayfalarından biridir. Ve günde 3 milyon araştırmacı tarafından ziyaret edilmektedir.
Veritabanlarındaki bazı sorunlar; vektöriyel dizilerle kirlilik, bir gene ait dizi parçaçıklarının veritabanına birden çok kez girilmesi ile ortaya çıkan kalabalık, aynı gene ait birden fazla EST (Ekspressed Sequence Tag) içeren EST veritabanlarının olması gibi durumlardır. Bu durumlar; genom projelerinin ileri aşamalarını oluşturan UNIGENE, VecScreen gibi projelerle ortadan kaldırılmaya çalışılmaktadır.
Biyoinformatiğin ikinci özelliği; saklanan biyolojik bilgilerin analizidir. Analiz kapsamına giren konular;
1-Çeşitli organizmalardaki DNA dizilerinin hangi genlere ait olduğunun belirlenmesi
2-Yeni keşfedilen proteinlerin ve RNA dizilerinin yapı işlev ilişkilerinin belirlenebilmesi için yöntem geliştirilmesi
3-Protein dizilerinin ilgili gen ailelerine kümelernmesi ve protein modellerinin geliştirilmesi
4-Benzer proteinlerin sıralanarak evrimsel ortaya çıkaracak filogenetik ailelerin oluşturulmasıdır.
dunya uzerınde bıyoınformatık bılgılerın saklandıgı uc merkez var
EMBL (Europe) Linklerin Görülmesine İzin Verilmiyor
Kayıt Olunuz Ya da Giriş Yapınız
DDBJ (Japonya) Linklerin Görülmesine İzin Verilmiyor
Kayıt Olunuz Ya da Giriş Yapınız
GENbank (ABD) Linklerin Görülmesine İzin Verilmiyor
Kayıt Olunuz Ya da Giriş Yapınız
DNA dizi analizi
Dizi analizinde homoloji (benzerlik) araştırması; yeni bulunan bir dizinin bilinen tüm diğer dizilerle karşılaştırılması ve bunun sonucunda benzerlerdeki veritabanında ya da literatürde tanımlanmış bazı biyolojik işlevlerin yeni bulunan diziye yakıştırılması olarak tanımlanabilir. Bu yöntemi, genomik DNA içinden hızla ekson bulma çabasında olan pozisyonel klonlama yapan araştırma grupları tercih ederler. Bu yöntemle, dizi; benzerlikler ve protein kodlama potansiyeli yönünden araştırılarak genler belirlenir. Ve gendeki mutasyonlar ortaya konulur.
İntrinsik dizi özelliklerinin araştırılması yaklaşımı ise en çok öncelikli hedefi genom dizilerini belirlemek ve üstüste çakışan dizileri (contig) birleştirmek olan dizi analizcileri tarafından kullanılır. Amaç çakışan dizilerin birleştirilmesiyle tüm gen yapısının modellenmesidir. Çoğu zaman her iki yaklaşım birlikte kullanılır.
Benzerlik analizinde veritabanı araştırmaları ve dizi sıralamaları yapılırken, intrinsik analizde istatiksel özelliklerden yararlanarak eksonların belirlenmesinden protein yapısının ortaya konmasının ilk aşamalarına kadar geniş yelpazede bulgular elde edilir.
Dizi bilgileri veritabanlarında iki formda bulunur
Bunlardan birincisi; yazarlar/diziyi veritabanına ilk işleyenler, kaynak gösterimleri, biyolojik atıflar ve dizinin kendisiyle; intronlar, eksonlar, başlangıç ve bitiş kodonları vb bilgiyi içeren bir tablodan oluşan tam bilgi
İkincisi ise; hızlı benzerlik araştırmaları için kullanılan ve sadece diziyi içeren FASTA formatıdır. Accession (ulaşma) numaraları, herbir diziyi belirleyen özgün kimliklerdir ve dizi veritabanına ilk kez girildiğinde verilir.
Dizi bilgileri, patent ofisleri gibi çeşitli kaynaklardan veritabanına ulaştığından, örneğin, NCBI; non redundant (yinelenmeyen) nr (nükleotid/protein) verikümeleri oluşturmaktadır.
BLAST program ailesi
Veritabanlarında araştırma yapabilmek için tasarlanmış pekçok bilgisayar programı vardır. Bunlardan birisi de BLAST (Basic Local Aligment Search Tool) programıdır. Veritabanında homoloji araştırması için öncelikle uygun BLAST programının seçilmesi gerekir.
BLASTN bir nükleotid dizisi ile komplementer diziyi ele alarak nükleotid dizisi veritabanlarıyla karşılaştırır. Hız amacıyla tasarlanmıştır. Yüksek duyarlılık aranan durumlar için uygun değildir. BLASTN ve BALSTX; EST verilerinin analizi, ekson yakalama yöntemi ve genomik dizi örneklemlerinin incelenmesinde kulanılır.
NCBI’nın sunduğu diğer bir servis ENTREZ servisidir. ENTREZ servisinin en önemli özelliği veritabanları arasında çapraz gezinme olanağı sunmasıdır.
Örneğin, bir dizi için BLAST araştırması yaptıktan sonra, ilgili gen ile ilgili literatür bilgileri MEDLINE’dan elde edilebilir. Daha sonra ilgili grafik programlarının yüklenmesi sonrasında protein yapısıyla ilgili veritabanları kullanılarak, proteinin iki veya üç boyutlu yapısı izlenebilir. Protein dizilerindeki işlevsel motifleri araştırmak amacıyla kullanılan bazı veritabanları ise PROSITE ve BLOCKS’tur.
NCBI’nin bir başka alt hizmeti olan OMIM, genler ve genetik hastalıklarla ilgili ayrıntılı biyoteknolojik ve tıbbi bilgilerin bulunduğu servistir. Bu servis altında pekçok gende bugüne kadar tanımlanmış mutasyonlar ve ilgili klinik ilişkiler özetlendiğinden çok yararlıdır.
Mikroarraylerle genomik yaklaşımlarda en kapsamlı proje ABD Ulusal İnsan Genom Araştırmaları Enstitüsünün Microarray projesidir (µAP). Microarray bulgularının yorumu da diğer yüksek çıktılı (highthroughput) genomik teknikler gibi biyoinformatik yöntemlerin kullanımına ihtiyaç yaratmıştır.
Biyoinformatik Türkiye’de de yeni bir daldır. TUBITAK bünyesinde, Marmara Araştırma Merkezi (MAM) Gen Mühendisliği ve Biyoteknoloji Araştırma Enstitüsü diğer kuruluşlar ve uluslararası kuruluşlar arasında köprü görevi görerek ülkemizde biyoteknoloji alanında bir sanayi oluşmasına ve genişlemesine yardımcı olmaktadır.
Milyonlarca nükleotidin depolanması ve organizasyonu için veritabanlarının oluşturulması, araştırıcıların bu bilgilere ulaşabilmeleri ve yeni veriler girebilmeleri için ilk aşamadır. Biyoinformatik’te nükleotid dizi bilgilerinin organizasyonu ve depolanması görevini üstlenmiş üç kuruluş vardır. Genbankası (GenBank), Avrupa Moleküler Biyoloji Laboratuvarı (EMBL) ve DNA Japonya veritabanıdır (DDBJ). Bu üç kuruluş, araştırıcıların yararlanmasına açık, nükleotid dizi bilgilerinin toplanması ve yayılmasında işbirliği içinde çalışmaktadır. Gen Bankası ABD’de Maryland, Bethesda’da, Avrupa Moleküler Biyoloji Laboratuvarı, İngiltere’deki Hinxton’da ve DNA Japonya veritabanı ise Japonya’da Mishima’da yeni dizi bilgilerinin alışverişinde,İnternet üzerinde günlük olarak e-mail, ortak kullanılan ftp ve www üzerinden hizmet sunmaktadırlar. Protein dizi verileri ile ilgili başlıca hizmet sağlayıcılar ise GenBank, EMBL, PIR International ve Swiss-Prot’tur. NIH’in National Center for Biotechnology Information merkezi, biyoinformatik gereci sunan başlıca web sayfalarından biridir. Ve günde 3 milyon araştırmacı tarafından ziyaret edilmektedir.
Veritabanlarındaki bazı sorunlar; vektöriyel dizilerle kirlilik, bir gene ait dizi parçaçıklarının veritabanına birden çok kez girilmesi ile ortaya çıkan kalabalık, aynı gene ait birden fazla EST (Ekspressed Sequence Tag) içeren EST veritabanlarının olması gibi durumlardır. Bu durumlar; genom projelerinin ileri aşamalarını oluşturan UNIGENE, VecScreen gibi projelerle ortadan kaldırılmaya çalışılmaktadır.
Biyoinformatiğin ikinci özelliği; saklanan biyolojik bilgilerin analizidir. Analiz kapsamına giren konular;
1-Çeşitli organizmalardaki DNA dizilerinin hangi genlere ait olduğunun belirlenmesi
2-Yeni keşfedilen proteinlerin ve RNA dizilerinin yapı işlev ilişkilerinin belirlenebilmesi için yöntem geliştirilmesi
3-Protein dizilerinin ilgili gen ailelerine kümelernmesi ve protein modellerinin geliştirilmesi
4-Benzer proteinlerin sıralanarak evrimsel ortaya çıkaracak filogenetik ailelerin oluşturulmasıdır.
dunya uzerınde bıyoınformatık bılgılerın saklandıgı uc merkez var
EMBL (Europe) Linklerin Görülmesine İzin Verilmiyor
Kayıt Olunuz Ya da Giriş Yapınız
DDBJ (Japonya) Linklerin Görülmesine İzin Verilmiyor
Kayıt Olunuz Ya da Giriş Yapınız
GENbank (ABD) Linklerin Görülmesine İzin Verilmiyor
Kayıt Olunuz Ya da Giriş Yapınız
DNA dizi analizi
Dizi analizinde homoloji (benzerlik) araştırması; yeni bulunan bir dizinin bilinen tüm diğer dizilerle karşılaştırılması ve bunun sonucunda benzerlerdeki veritabanında ya da literatürde tanımlanmış bazı biyolojik işlevlerin yeni bulunan diziye yakıştırılması olarak tanımlanabilir. Bu yöntemi, genomik DNA içinden hızla ekson bulma çabasında olan pozisyonel klonlama yapan araştırma grupları tercih ederler. Bu yöntemle, dizi; benzerlikler ve protein kodlama potansiyeli yönünden araştırılarak genler belirlenir. Ve gendeki mutasyonlar ortaya konulur.
İntrinsik dizi özelliklerinin araştırılması yaklaşımı ise en çok öncelikli hedefi genom dizilerini belirlemek ve üstüste çakışan dizileri (contig) birleştirmek olan dizi analizcileri tarafından kullanılır. Amaç çakışan dizilerin birleştirilmesiyle tüm gen yapısının modellenmesidir. Çoğu zaman her iki yaklaşım birlikte kullanılır.
Benzerlik analizinde veritabanı araştırmaları ve dizi sıralamaları yapılırken, intrinsik analizde istatiksel özelliklerden yararlanarak eksonların belirlenmesinden protein yapısının ortaya konmasının ilk aşamalarına kadar geniş yelpazede bulgular elde edilir.
Dizi bilgileri veritabanlarında iki formda bulunur
Bunlardan birincisi; yazarlar/diziyi veritabanına ilk işleyenler, kaynak gösterimleri, biyolojik atıflar ve dizinin kendisiyle; intronlar, eksonlar, başlangıç ve bitiş kodonları vb bilgiyi içeren bir tablodan oluşan tam bilgi
İkincisi ise; hızlı benzerlik araştırmaları için kullanılan ve sadece diziyi içeren FASTA formatıdır. Accession (ulaşma) numaraları, herbir diziyi belirleyen özgün kimliklerdir ve dizi veritabanına ilk kez girildiğinde verilir.
Dizi bilgileri, patent ofisleri gibi çeşitli kaynaklardan veritabanına ulaştığından, örneğin, NCBI; non redundant (yinelenmeyen) nr (nükleotid/protein) verikümeleri oluşturmaktadır.
BLAST program ailesi
Veritabanlarında araştırma yapabilmek için tasarlanmış pekçok bilgisayar programı vardır. Bunlardan birisi de BLAST (Basic Local Aligment Search Tool) programıdır. Veritabanında homoloji araştırması için öncelikle uygun BLAST programının seçilmesi gerekir.
BLASTN bir nükleotid dizisi ile komplementer diziyi ele alarak nükleotid dizisi veritabanlarıyla karşılaştırır. Hız amacıyla tasarlanmıştır. Yüksek duyarlılık aranan durumlar için uygun değildir. BLASTN ve BALSTX; EST verilerinin analizi, ekson yakalama yöntemi ve genomik dizi örneklemlerinin incelenmesinde kulanılır.
NCBI’nın sunduğu diğer bir servis ENTREZ servisidir. ENTREZ servisinin en önemli özelliği veritabanları arasında çapraz gezinme olanağı sunmasıdır.
Örneğin, bir dizi için BLAST araştırması yaptıktan sonra, ilgili gen ile ilgili literatür bilgileri MEDLINE’dan elde edilebilir. Daha sonra ilgili grafik programlarının yüklenmesi sonrasında protein yapısıyla ilgili veritabanları kullanılarak, proteinin iki veya üç boyutlu yapısı izlenebilir. Protein dizilerindeki işlevsel motifleri araştırmak amacıyla kullanılan bazı veritabanları ise PROSITE ve BLOCKS’tur.
NCBI’nin bir başka alt hizmeti olan OMIM, genler ve genetik hastalıklarla ilgili ayrıntılı biyoteknolojik ve tıbbi bilgilerin bulunduğu servistir. Bu servis altında pekçok gende bugüne kadar tanımlanmış mutasyonlar ve ilgili klinik ilişkiler özetlendiğinden çok yararlıdır.
Mikroarraylerle genomik yaklaşımlarda en kapsamlı proje ABD Ulusal İnsan Genom Araştırmaları Enstitüsünün Microarray projesidir (µAP). Microarray bulgularının yorumu da diğer yüksek çıktılı (highthroughput) genomik teknikler gibi biyoinformatik yöntemlerin kullanımına ihtiyaç yaratmıştır.
Biyoinformatik Türkiye’de de yeni bir daldır. TUBITAK bünyesinde, Marmara Araştırma Merkezi (MAM) Gen Mühendisliği ve Biyoteknoloji Araştırma Enstitüsü diğer kuruluşlar ve uluslararası kuruluşlar arasında köprü görevi görerek ülkemizde biyoteknoloji alanında bir sanayi oluşmasına ve genişlemesine yardımcı olmaktadır.
Genetik
-
İnsanlarda Kaç Kromozom Vardır?
-
Sık görülen mikrodelesyon sendromları nelerdir?
-
Bilim insanları kromozomları nasıl inceler?
-
Arkea'da Kromozomlar ve DNA Replikasyonu
-
DNA Onarım Mekanizmaları Nelerdir?
-
DNA hasarına neden olan etkenler nelerdir?
-
XYY Süper Erkek Sendromu - JACOB’S, Sendromu
-
Bitki doku kültürü çalışmaları ile haploid bitkiler elde edilebilir
-
Gram pozitif bakterilerden genomik DNA izolasyon protokolü
-
E. coli bakterisinden genomik DNA izolasyon protokolü
-
DNA’nın Keşfi
-
İnsan Genom Projesi Nedir ? Amaçları Nelerdir ?
-
Genomik mikrodizilimlerle ikilenme teşhisi yöntemi
-
Gen duplikasyonu ve amplifikasyonu nedir?
-
DNA ile RNA Arasndaki Farklar ve Benzerlikler Nelerdir