التقريب أقرب إلى نظام ملفات قائم على الحمض النووي

الاقتراب من نظام الملفات المستند إلى الحمض النووي EnlargeWyss معهد هارفارد

عندما يتعلق الأمر بتخزين البيانات ، فإن الجهود للحصول على وصول أسرع معظم الاهتمام. لكن الأرشفة طويلة الأجل للبيانات متساوية مهم ، ويتطلب عموما مجموعة مختلفة تماما من الخصائص. للتعرف على سبب أهمية تصحيح هذا الأمر ، مجرد اتخاذ القمر الصناعي ناسا أحيت مؤخرا باعتبارها مثال – يعتمد استخراج أي شيء من بيانات القمر الصناعي حقيقة أن مهمة ناسا منفصلة لديها محرك الشريط العتيقة التي يمكن أن تقرأ برنامج الاتصالات الفضائية.

قراءة متعمقة

ناسا تؤكد: القمر الصناعي أوندد يعمل

واحدة من أكثر التقنيات غير المتوقعة لتلقي بعض الاهتمام كوسيلة تخزين المحفوظات هو الحمض النووي. بينما هو بطيئة بشكل لا يصدق لتخزين واسترجاع البيانات من الحمض النووي ، ونحن نعرف ذلك يمكن سحب المعلومات من الحمض النووي وهذا هو عشرات الآلاف من سنة وكانت هناك بعض المظاهرات المثيرة للإعجاب من النهج ، مثل نظام التشغيل التي يتم تخزينها في الحمض النووي في أ كثافة 215 بيتابايت غرام.

لكن هذه الطريقة تعاملت مع الحمض النووي ككرة من البتات غير المنظمة – أنت كان لتسلسل كل ذلك من أجل الحصول على أي من البيانات. الآن، اكتشف فريق من الباحثين كيفية إضافة شيء مثل نظام ملفات لتخزين الحمض النووي ، مما يتيح الوصول العشوائي إلى بيانات محددة ضمن مجموعة كبيرة من الحمض النووي. أثناء القيام بذلك ، الفريق أيضا اختبار طريقة وضعت مؤخرا لتسلسل الحمض النووي التي يمكن أن تكون القيام به باستخدام جهاز USB مدمج.

العشوائية

يحتفظ DNA بالبيانات على أنها مزيج من أربع قواعد ، وبالتالي تخزين البيانات في ذلك يتطلب وسيلة لترجمة البتات إلى هذا النظام. مرة تتم ترجمة القليل من البيانات ، ويتم تقطيعها إلى أجزاء أصغر (عادة 100 إلى 150 قواعد طويلة) وإدراجها بين نهايات ذلك جعلها أسهل للنسخ والتسلسل. هذه الغايات تحتوي أيضا على بعض المعلومات التي توجد بها البيانات في التخزين الكلي المخطط – أي ، هذه هي البايتات 197 إلى 300.

لاستعادة البيانات ، كل الحمض النووي لابد من تسلسل ، و قراءة المعلومات المحلية ، وتشفير تسلسل الحمض النووي. في الحقيقة، الحمض النووي يحتاج إلى تسلسل عدة مرات ، لأن هناك الأخطاء ودرجة من العشوائية تشارك في عدد المرات أي سوف ينتهي جزء يجري تسلسل.

مضيفا الوصول العشوائي إلى البيانات سوف يقلل بشكل كبير على كمية التسلسل التي سوف تحتاج إلى القيام به. بدلا من تسلسل أرشيف كامل لمجرد الحصول على ملف واحد منه يمكن أن يكون التسلسل أكثر استهدافًا. وكما اتضح ، التعاون بين شركة مايكروسوفت للبحوث وجامعة وجدت واشنطن طريقة بسيطة نسبيا للقيام بذلك.

لاحظ أعلاه حيث يتم تعبئة البيانات بين الحامض النووي القصير تسلسل ، مما يجعل من الأسهل نسخ وتسلسل. هناك الكثير من التسلسلات المحتملة التي يمكن أن تناسب مشروع القانون من حيث جعل الحمض النووي أسهل للعمل مع. حدد الباحثون الآلاف منهم. كل من هذه يمكن استخدامها لوضع علامة على التدخل البيانات التي تنتمي إلى ملف معين ، مما يسمح لتضخيمه وتسلسلها بشكل منفصل ، حتى لو كان موجودا في خليط كبير الحمض النووي من ملفات مختلفة. إذا كنت ترغب في تخزين المزيد من الملفات ، فقط عليك أن تبقي تجمعات مختلفة من الحمض النووي ، يحتوي كل منها على عدة آلاف الملفات (أو تيرابايت متعددة). حفظ هذه حمامات يتطلب فصل ماديًا حوالي ملليمتر مربع من الفراغ.

(من الممكن أن يكون لديك الكثير من علامات تسلسل الحمض النووي هذه ، لكن المؤلفين اختاروا فقط تلك التي ينبغي أن تنتج جدا نتائج تضخيم متسقة.)

كما توصل الفريق إلى حل ذكي لأحد مشاكل تخزين الحمض النووي. سيكون الكثير من الملفات الرقمية طويلة تمتد من نفس البتات (فكر في سماء زرقاء أو بضع ثوانٍ من الصمت في مقطوعة موسيقية). لسوء الحظ ، تسلسل الحمض النووي يميل إلى خنق عند مواجهة المدى الطويل من قواعد متطابقة ، إما إنتاج الأخطاء أو التوقف ببساطة. لتجنب هذا ، والباحثين إنشاء تسلسل عشوائي واستخدامه للقيام التقليب قليلا العملية (XOR) مع تسلسل يجري ترميز. هذا من شأنه كسر على المدى الطويل من قواعد متطابقة ويشكل الحد الأدنى من خطر خلق جديدة.

يقرأ طويلة

الشيء الآخر من الأخبار في هذا المنشور هو استخدام أ تكنولوجيا تسلسل الحمض النووي الجديدة نسبيا التي تنطوي على حشو فروع الحمض النووي من خلال مسام صغير وقراءة كل قاعدة لأنها يمر عبر. التكنولوجيا لهذا المدمجة ما يكفي لذلك متوفر في جهاز USB بحجم كف اليد. كانت التكنولوجيا جميلة عرضة للخطأ ، لكنها تحسنت بما فيه الكفاية أنه كان في الآونة الأخيرة تستخدم لتسلسل الجينوم البشري بأكمله.

قراءة متعمقة

قارئ DNA بحجم الجيب يستخدم لمسح تسلسل الجينوم البشري بأكمله

في حين أن تقنية nanopore لديها مشاكل مع الأخطاء ، لديها الاستفادة من العمل مع فترات أطول بكثير من الحمض النووي. لذلك قام المؤلفون بإعادة ترتيب بياناتهم المخزنة بحيث يتم وضعها على عدد أقل وأطول جزيئات الحمض النووي وأعطت الأجهزة الاختبار.

كان لديها نسبة خطأ عالية بشكل مدهش – حوالي 12 في المئة من قبل قياسهم. هذا يشير إلى أن النظام يحتاج إلى تكييف مع العمل مع عينات الحمض النووي التي أعدها المؤلفون. لا يزال الأخطاء كانت في معظمها عشوائية ، وكان الفريق قادرا على تحديد و قم بتصحيحها بتسلسل جزيئات كافية بحيث ، في المتوسط ​​، تمت قراءة كل تسلسل DNA 36 مرة.

لذلك ، مع وجود شيء يشبه نظام الملفات وقارئ مضغوط ، هل نتحرك بالقرب من نقطة تخزين الحمض النووي؟ عملي؟ ليس تماما. الكتاب نشير إلى قضية سعة. نمت قدرتنا على توليف الحمض النووي بشكل مذهل وتيرة ، لكنها بدأت من شيء تقريبا قبل بضعة عقود ، لذلك لا تزال صغيرة نسبيا. على افتراض أن محرك الأقراص الذي يعتمد على الحمض النووي سيكون قادرًا على قراءة كيلوبايت قليلة في الثانية الواحدة ، ثم يحسب الباحثون ذلك سوف يستغرق سوى حوالي أسبوعين لقراءة كل جزء من الحمض النووي الذي نحن يمكن توليفها سنويا. وضعت بشكل مختلف ، قدرتنا على توليف الحمض النووي لديه طريق طويل قبل أن نتمكن من تخزين عمليا الكثير من البيانات.

Nature Biotechnology، 2018. DOI: 10.1038 / nbt.4079 (About دويس).

Like this post? Please share to your friends:
Leave a Reply

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: