reklam
reklam
DOLAR 42,3199 % -0.01
EURO 49,2354 % -0.28
STERLIN 55,8293 % -0.29
FRANG 53,3131 % -0.13
ALTIN 5.551,47 % -1,86
BITCOIN 95.818,18 -0.968
reklam

DNA için “Google”: MetaGraph genetik verileri saniyeler içinde tarıyor

Yayınlanma Tarihi : Google News
DNA için “Google”: MetaGraph genetik verileri saniyeler içinde tarıyor
reklam

Nadir genetik hastalıkların tespiti ve tümörlere özgü mutasyonların belirlenmesi artık mümkün. Bu başarı, yıllar önce biyomedikal araştırmalarda devrim yaratan DNA dizileme teknolojileri sayesinde elde edildi. Özellikle son dönemde geliştirilen yeni nesil dizileme (NGS) yöntemleri, genetik araştırmalarda büyük bir veri patlamasına yol açtı.

Amerikan Sequence Read Archive (SRA) ve Avrupa’daki European Nucleotide Archive (ENA) gibi dev veri merkezlerinde toplamda yaklaşık 100 petabayt genetik bilgi mevcut. Bu miktar, internetteki tüm metin verilerine eşdeğer bir hacim. Ancak bu kadar büyük bir veriyi aramak bugüne kadar son derece maliyetli ve zaman alıcı oldu.

ETH Zurich araştırmacıları, bu zorluğu aşmak için yeni bir çözüm geliştirdi.

METAGRAPH: DNA İÇİN BİR ARAMA MOTORU

ETH Zurich araştırma ekibi, MetaGraph adlı yeni bir araçla bu süreci köklü bir şekilde değiştirdi. MetaGraph, araştırmacıların tüm veri setlerini indirmeden, doğrudan DNA veya RNA dizileri içinde tam metin araması yapmalarını sağlıyor.

ETH Zürih Bilgisayar Bilimi Bölümü’nden Prof. Gunnar Rätsch, bu sistemi “DNA için Google” olarak tanımlıyor: “Eskiden araştırmacılar sadece açıklayıcı meta verilerde arama yapabiliyordu, ham veriye ulaşmak için devasa dosyalar indirmek zorundaydı. MetaGraph bunu saniyeler içinde gerçekleştirebiliyor.”

Araştırmaya göre, sistem son derece maliyet verimli: Tüm kamuya açık biyolojik dizilerin temsil edilmesi yalnızca birkaç sabit diske sığabiliyor ve büyük sorguların maliyeti megabaz başına yaklaşık 0,74 dolar seviyesinde kalıyor.

Bu özellik, MetaGraph’i yeni patojenlerin tespiti, antibiyotik direnci genlerinin analizi veya yararlı virüslerin (bakteriyofajlar) belirlenmesi gibi alanlarda son derece değerli kılıyor.

300 KAT SIKIŞTIRMA ORANIYLA DEV BİR VERİ DEVRİMİ

8 Ekim’de yayımlanan çalışmada, ETH ekibi MetaGraph’in teknik altyapısını detaylandırdı. Araç, genetik verileri gelişmiş matematiksel grafik yapıları kullanarak düzenliyor ve sıkıştırıyor.

Prof. Rätsch sistemi şöyle özetliyor: “Matematiksel olarak, bu, milyonlarca sütun ve trilyonlarca satır içeren dev bir matristen ibaret.”

MetaGraph’in farkı, ham veriyi meta verilerle doğrudan ilişkilendirirken 300 katlık sıkıştırma oranı sağlaması. Bu sıkıştırma, bir kitabı özetlemek gibi işliyor: gereksiz tekrarları ortadan kaldırarak, ama anlamlı ilişkileri koruyarak tüm bilgiyi daha küçük bir formda tutuyor.

ETH Biyomedikal Enformatik Grubu’ndan Dr. André Kahles, “Veriyi olabildiğince kompakt hale getiriyoruz, ama bilgi kaybı olmadan,” diyor. Ayrıca, sistemin ölçeklenebilir yapısı ile veri büyüdükçe ek hesaplama gücü ihtiyacını azaltıyor.

METAGRAPH ARTIK KAMUYA AÇIK

İlk olarak 2020’de tanıtılan MetaGraph, aradan geçen süreçte önemli ölçüde geliştirildi. Araç artık kamuya açık bir şekilde kullanılabiliyor: https://metagraph.ethz.ch/search adresi üzerinden araştırmacılar doğrudan genetik arama yapabiliyor.

MetaGraph, şu anda milyonlarca DNA, RNA ve protein dizisini indeksliyor. Veritabanının yaklaşık yarısı şu anda erişilebilirken, kalan kısmın yıl sonuna kadar eklenmesi bekleniyor.

Dr. Kahles’e göre bu teknoloji, gelecekte yalnızca araştırmacılar için değil, aynı zamanda bireyler için de kullanılabilir hale gelebilir: “Google ilk çıktığında kimse bir arama motorunun tam olarak ne işe yarayacağını bilmiyordu. DNA dizilemedeki bu hızlı ilerleme devam ederse, bir gün insanlar balkon bitkilerini bile MetaGraph ile tanımlayabilir.”

reklam

YORUM YAP