DNA wordt onze nieuwe versie van de harde schijf in de toekomst

BlogTechnology

Er zit ontzettend veel data in een DNA-streng, zo weten we al een tijdje. Wetenschappers zijn al jarenlang bezig om de laatste geheimen van DNA te ontrafelen, maar inmiddels wordt er ook al veel vooruitgang geboekt in het schrijven van gegevens op DNA. Dat is lastig, want de methode om dat te doen (waarbij synthetische DNA wordt gemaakt) is nog heel duur en langzaam. Erger nog: de data kon niet goed teruggelezen worden, want er zaten heel veel leesfouten in. Dat probleem is nu door nieuw onderzoek opgelost, dus de technologie kan zich verder gaan ontwikkelen.

Zo veel data

Maar waarom zou je dat überhaupt willen doen? Simpel: we hebben de ruimte binnenkort hard nodig. We zijn met zijn allen namelijk nogal veel data aan het genereren. Tegen 2020 zal dat zo’n 44 biljoen (44.000.000.000) gigabyte zijn. Dat zijn heel veel SD-kaartjes of harde schijven vol, zullen we maar zeggen. Onderzoekers van de Universiteit van Columbia hebben in samenwerking met het New York Genome Center een nieuwe methode bedacht die voornamelijk het probleem van de gecorrumpeerde data aangepakt. De oplossing heet in technische termen fountain code, maar het kan simpeler uitgelegd. Eerst even de basis.

DNA

Hoe werkt DNA-opslag?

Je kent de plaatjes zoals de bovenstaande van de DNA-streng wel, toch? De ‘pijpjes’ die je ziet vormen samen een code en bestaan uit een viertal ‘letters’. In de basis wordt dat DNA-alfabet (A, C, G en T) omgezet in binaire code, wat heel efficiënt is omdat binaire code alleen bestaat uit 1 en 0. Hoef je niet te onthouden, maar zie het zo: een DNA-streng heeft een hele hoop ‘letters’, en dus heel veel plek om gegevens op te slaan in heel weinig fysieke ruimte. Één gram aan DNA kan met deze nieuwe methode 215 miljoen gigabyte aan gegevens opslaan.

Eerdere onderzoeken naar DNA-opslag konden maar een honderdste van de opslag bij elkaar schrapen met hetzelfde DNA. Dat kwam door de foutcorrectie. Als een streng DNA beschadigd raakt ben je gegevens kwijt en dat is foute boel. Dat loste men eerder op door alles dubbel erop te zetten. Voorbeeld: als je “Mies loopt naar huis om te gaan eten” wil opslaan zou je “Mies loopt” “loopt naar” “naar huis” “huis om” “om te” etc. opslaan. Stukje kwijt? Dan kan de rest het hopelijk opvangen:

“Mies loopt” ~~“loopt naar”~~ “naar huis” ~~“huis om”~~ ~~“om te”~~ “te gaan” “gaan eten”

Sudoku

De nieuwe methode zorgt er voor dat niet alles dubbel hoeft te worden gedaan. Het zorgt dat de gegevens op een slimmere manier worden opgeslagen, waarbij in alle stukjes data ‘hints’ zitten naar de andere stukjes, zodat je willekeurige stukken kunt missen en toch het hele plaatje krijgt. Ideaal. Betekent dit dat we binnenkort een DNA-schijf kunnen gaan kopen? Nee, helaas. Hoe veel beter het nu al werkt met dit nieuwe systeem, het is wel nog steeds heel duur.

Om een bestand van twee megabyte op te slaan en weer uit te lezen kost op dit moment nog een paar duizend dollar, maar die prijs zal rap omlaag gaan in de komende paar jaar. De technologie is nog niet per sé nu nodig, dus tegen de tijd dat het een beetje penibel wordt om al onze data nog op te kunnen slaan zal DNA-opslag een meer dan realistische optie zijn. De mogelijkheden zijn, als we zover komen, bijna oneindig. Dat belooft nog wat.

Patrick Smeets

Game-enthousiast, tech blogger en presentator. Was ooit rockster. Local celebrity in Limburg maar ziet graag veel van de wereld. Er zijn niet genoeg kattenGIFjes in de wereld.

DNA wordt onze nieuwe versie van de harde schijf in de toekomst

Zo veel data

Hoe werkt DNA-opslag?

Sudoku

Share this post