المؤلف: Stanford Blockchain Club المصدر: ترجمة W-SOURCE: Shan Oba, Golden Finance
مقدمة
منذ ولادتها، كانت سلاسل blockchain و تعمل العملات المشفرة على تغيير المشهد المالي من خلال توفير وصول أوسع وإزالة الوسطاء. بمرور الوقت، أدى تطوير web3 إلى توسيع سيناريوهات التطبيق الخاصة به، مما سلط الضوء على إمكانات تقنية blockchain لإنشاء إنترنت حيث يزدهر المبدعون ويتحكم المستخدمون في بياناتهم.
إن الجزء الرئيسي من البنية التحتية التي تعمل على تمكين المستخدمين النهائيين، مع ضمان اللامركزية، هو ضمان تخزين البيانات في قاعدة بيانات مرنة ومقاومة للرقابة. على الرغم من أن قواعد البيانات المركزية مريحة ومألوفة، إلا أنها تفشل في توفير الأمان اللازم وتتطلب إذنًا من مالك قاعدة البيانات، مما يحد من اعتمادها عالميًا.
تلبي أنظمة تخزين البيانات الموزعة الحاجة إلى تخزين عالي المرونة ومتسامح مع الأخطاء من خلال بناء شبكة من العقد التي تقوم بتخزين البيانات وإدارتها ومشاركتها. إن إزالة الحاجة إلى سلطة مركزية وتوزيع البيانات بطريقة P2P يعزز الأمان والشفافية. تميل أنظمة التخزين الموزعة، التي تعتمد غالبًا على تقنية blockchain أو تقنيات مماثلة، إلى تكرار البيانات من خلال التكرار والتوافر.
على الرغم من أن أنظمة التخزين الموزعة توفر الأمان ومرونة البيانات وفوائد التكلفة المحتملة من خلال الاعتماد على سعة التخزين غير المستخدمة، إلا أنها تواجه تحديات تنظيمية وتحديات التشغيل البيني.
بالنسبة لشبكة مفتوحة ويمكن الوصول إليها حقًا، يعد التخزين الموزع أمرًا ضروريًا. يتمثل أحد الجوانب الرئيسية لأي نظام تخزين في كيفية إثبات طريقة تخزين البيانات وصيانتها. السؤال الأكثر أهمية بالنسبة للمستخدمين هو،كيف يتم إثبات تخزين البيانات وصيانتها؟ يتم التعامل مع هذا من خلال إثبات البيانات.
بشكل عام، نميز بين نوعين من البراهين:
البراهين القطعية
قوية >: يسمح لأصحاب البيانات بإنشاء أدلة لبيانات محددة تثبت أنها تم إنشاؤها وتطابق تجزئة البيانات. يكشف هذا النوع من الإثبات فقط عن التجزئة التي تم إنشاؤها باستخدام البيانات كمدخلات. الدليل الاحتمالي: الاعتماد على الاحتمالية لإظهار أن البيانات الأساسية من المحتمل جدًا أن تكون متاحة. إنه مبرر يوضح بشكل عقلاني درجة اليقين في فرضية معينة، وينطبق على البيانات التي تم نشرها، ويمكن استرجاعها إذا لزم الأمر.
يناقش الجزء المتبقي من هذه المقالة اختيارات التصميم لإثبات تخزين البيانات وسلامتها في ثلاثة أنظمة مختلفة. الأول هو Tagion، الذي يركز على البيانات ذات السعة العالية والقابلة للتطوير، ثم يناقش كيف تضمن شبكة التخزين اللامركزية Filecoin تخزين البيانات على نطاق واسع. أخيرًا، ستستكشف هذه المقالة شركة Celestia، التي تركز على تخزين وتقديم بيانات blockchain.
Tagion
الهندسة المعمارية
Tagion عبارة عن شبكة لا مركزية مخصصة للمعاملات كبيرة الحجم بهدف بناء نظام عملة فريد يعتمد على التكنولوجيا والحكم الديمقراطي. ويعتمد المشروع على بنية قواعد البيانات المبتكرة وتكنولوجيا التشفير لتحقيق نطاق واسع. إنها ليست blockchain، ولكنها دفتر أستاذ موزع يستخدم قاعدة بيانات DART لتحسين التخزين. تعد آلية إثبات تاغيون مثالاً على الإثبات الحتمي.
الوظيفة الأساسية لقاعدة بيانات DART هي بمثابة جدول تجزئة موزع يقوم بتخزين البيانات وفقًا لمفاتيح التجزئة. مع زيادة تخزين المعلومات، يولد الهيكل بشكل طبيعي المزيد من الفروع، كل منها يدعم ما يصل إلى 256 أرشيفًا وفروعًا فرعية مشتركة.
باستثناء ما يشبه التوزيع جدول تجزئة الصيغة، يمكن أيضًا فهم البنية التحتية لـ Tagion على أنها شجرة Merkle متفرقة (SMT). SMT عبارة عن بنية بيانات معتمدة تعتمد على أزواج القيمة الرئيسية التي تدعم عمليات قاعدة البيانات القياسية مثل عمليات البحث والإدراج والتحديثات والحذف. يمثل كل زوج من المفاتيح والقيمة ورقة، ويتم اشتقاق تجزئة الفرع الأصلي عن طريق تجزئة العقد الفرعية بشكل متكرر إلى جذر Merkle.
يعمل SMT على تحسين الكفاءة بشكل كبير من خلال تمكين المُثبتين من التحقق من وجود العناصر دون الحاجة إلى الوصول إلى عناصر البيانات غير ذات الصلة أو تنزيل أجزاء محددة من البيانات. علاوة على ذلك، فإن استقلالية القيم في الشجرة تسمح بالتحديثات بأي ترتيب دون تغيير البنية النهائية للشجرة.
جذر استخدام نظام Tagion تجزئة تحتوي على جميع تجزئات الفروع الفرعية، والتحقق بسرعة من حالة البيانات بأقل قدر من العمليات الحسابية. لتعزيز قوة المعالجة بشكل أكبر، يمكن للنظام إنشاء DARTs فرعية لأنظمة بيئية محددة، على غرار سلاسل الكتل المقسمة. تقوم هذه العقد المخصصة بإدارة مجموعات فرعية من البيانات، مما يزيد من الإنتاجية ويتيح تخصيص الشبكة لتطبيقات مختلفة، على غرار سلاسل التطبيقات.
استخدم DART لإنشاء نظام عديم الحالة دون الحاجة إلى الاحتفاظ بسجل كامل لانتقالات النظام. وهذا يعني أنه يمكن حذف البيانات، مما يقلل متطلبات التخزين بشكل عام، وربما يزيد من لامركزية النظام من خلال تخفيف الوزن.
يستخدم Tagion HiBON (كائن تمثيل ثنائي ثابت للتجزئة) لتسهيل عملية التخزين بشكل أكبر، مما يضمن بقاء البيانات ثابتة عند ورودها، مما يبسط استرجاع البيانات استنادًا إلى التجزئة الترابطية. تعني ثبات التجزئة أن البيانات ستولد دائمًا نفس التجزئة بغض النظر عن الترتيب الذي تتم معالجته به. هذه تقنية مجربة لتسريع عملية استرجاع البيانات والكتابة في قواعد البيانات.
من خلال هذه الآليات، لا يقوم Tagion بتخزين البيانات بشكل آمن فحسب، بل يتحقق أيضًا بكفاءة من إدراجها وسلامتها في الشبكة.
سلامة البيانات
تقوم جميع الأنظمة الفرعية لـ Tagion بما يسمى بالجولات العشوائية للتحقق مما إذا كانت البيانات مخزنة ومقدمة حسب الحاجة. سيتم استبعاد العقد التي تفشل في تحدي التحقق من الاحتفاظ من الشبكة.
تتضمن جميع الأرشيفات طوابع زمنية وتتطلب الدفع مقابل التخزين الممتد. أثناء عملية التجوال، سيتحقق النظام مما إذا تم استلام الدفعة أم لا، سيتم حذف البيانات لتحرير المساحة.
Filecoin
Filecoin هي شبكة تخزين لا مركزية تحفز القائمين بالتعدين على توفير سعة تخزين من خلال رمزها الأصلي Filecoin. للحصول على هذه المكافآت، يجب على القائمين بالتعدين إنشاء أدلة تثبت قدرات التخزين الخاصة بهم.
تُسمى وحدة التخزين الأساسية لـ Filecoin بالقطاع، ولها حجم قياسي وعمر يمكن تمديده بواسطة المزود. يوازن التصميم بعناية بين الأمان وسهولة الاستخدام. يتم تشفير جميع بيانات المستخدم المخزنة على Filecoin ويتم توزيع نسخ متعددة عبر الشبكة، مما يضمن عدم تمكن القائمين بالتعدين من الوصول إلى محتويات الملف.
يتناسب تأثير القائمين بالتعدين في شبكة Filecoin بشكل مباشر مع حجم التخزين الذي يقدمونه، والذي يسمح لهم أيضًا بالمشاركة في آلية الإجماع الخاصة بالشبكة. الجهاز الافتراضي Filecoin هو المسؤول عن تنفيذ العقود الذكية وتسهيل عمليات السوق مثل إقران موفري التخزين مع المستخدمين.
إن بنية Filecoin معيارية، مما يسمح للعقد بتخصيص أجزاء محددة من نظام التشغيل حسب الحاجة. على سبيل المثال، يمكن للعقدة أن تعمل فقط كعقدة تخزين ولا تشارك في عمليات السوق.
لضمان سلامة البيانات وتوافرها، يعتمد Filecoin على خوارزميتين: إثبات التخزين وإثبات النسخ.
إثبات التخزين
يقوم القائمون بالتعدين في Filecoin بإنشاء أدلة للتحقق من أنهم يحتفظون بنسخة من البيانات في أي وقت محدد. يتم تحقيق هذا الإثبات من خلال التحدي: يطرح النظام على القائمين بالتعدين أسئلة لا يمكن الإجابة عليها بشكل صحيح إلا إذا كانت لديهم البيانات.
لضمان عدم قيام القائمين بالتعدين بنسخ البيانات فقط عند ظهور التحدي، تم تصميم التحديات لاستهداف أجزاء مختلفة من البيانات بشكل عشوائي على فترات زمنية غير متوقعة. إن الجمع بين العشوائية وعدم اليقين في الفترات الزمنية يجعل من المستحيل وغير الاقتصادي وغير العقلاني بالنسبة لعمال المناجم الحصول على البيانات فقط عندما يصدرون تحديًا.
إثبات المكان والزمان (PoSt)
تقدم Filecoin إثبات المكان والزمان (PoSt) لضمان التخزين المستمر وتوافر البيانات. يتحقق إثبات Spacetime من التخزين على فترات زمنية من خلال فرض تحدي تشفير على القائمين بالتعدين. لا يمكن لعمال المناجم اجتياز التحدي إلا إذا تم تخزين الملفات خلال الإطار الزمني المحدد.
تتضمن PoSt نوعين من التحديات:
الفوز بـ PoSt: يتحقق القائمون بالتعدين من أنهم تخزين نسخة من البيانات في وقت محدد، عادةً عندما تختار الخوارزمية عامل التعدين لتعدين الكتلة التالية. المواعيد النهائية القصيرة تضمن حصولهم على البيانات.
إثبات نافذة الزمكان (WindowPoSt): تحدٍ متكرر يقدم فيه القائمون بالتعدين دليلاً على أنهم احتفظوا بالبيانات كما هو مطلوب. سيكون ختم البيانات فقط عند تقديمها أكثر تكلفة بالنسبة لعمال المناجم.
يعد الختم جزءًا من خوارزمية إثبات التكرار وهو مكثف حسابيًا، مما يجعل عمال المناجم العقلانيين يرغبون في تقليل الحاجة إلى الختم قدر الإمكان.
إثبات النسخ
يعد الختم جزءًا من خوارزمية إثبات النسخ، وهي مكثفة حسابيًا وتشجع عمال المناجم على تقليل تكرار الختم. يضمن إثبات النسخ قيام المستخدمين والقائمين بالتعدين بإنشاء نسخ فريدة وتخزينها على أجهزتهم المادية. يتضمن هذا الدليل ما يلي:
مطالبة عمال المناجم بإنشاء نوعين من الأدلة لتزويد المستخدمين بالتخزين الآمن للملفات، ولا يمكن إلا لعمال المناجم الذين يوفرون التخزين الفعلي الحصول على المكافآت. نظرًا لأن الدليل كبير جدًا بحيث لا يمكن وضعه على السلسلة، يقوم القائمون بالتعدين بإنشاء وسيطات معرفة موجزة وغير تفاعلية (zkSNARK) وإرسالها إلى السلسلة، مما يجعل Filecoin أكبر مستخدم لـ zkSNARK، حيث ينتج 6 ملايين إلى 7 ملايين دليل يوميًا .
بشكل عام، تجمع Filecoin بين طرق الإثبات الحتمي (PoRep) والإثبات الاحتمالي (PoSt)، باستخدام نهج مختلط.
Celestia
المثال الثالث في هذه المقالة هو Celestia، وهو ما يسمى بـ blockchain لتوفر البيانات والذي يوفر التنفيذ وتخزين البيانات لسلاسل الكتل المعيارية، مما يسمح لهم بالاستعانة بمصادر خارجية للوظائف الأساسية .
مع ظهور Ethereum Rollup، أصبحت حلول توفر البيانات مثل Celestia شائعة لأنها توفر بديلاً أرخص لتخزين بيانات المعاملات المجمعة من عقد أرشيف Ethereum.
إثبات توفر البيانات
على عكس Filecoin، لا توفر Celestia حلول تخزين للمستخدمين النهائيين، ولكنها تركز على حل مشكلات توفر البيانات. يضمن توفر البيانات نشر بيانات blockchain بشكل صحيح. عادةً، يجب على عقد البلوكشين تنزيل كتل كاملة للتحقق من توفرها، وهي عملية كثيفة الاستخدام للموارد يمكن أن تعيق التحقق.
لتبسيط هذه العملية، تستخدم Celestia أخذ عينات توفر البيانات (DAS). تتضمن هذه الطريقة قيام العقد الخفيفة بتنزيل جزء صغير فقط من البيانات حتى يتم الوصول إلى مستوى ثقة محدد مسبقًا. تعتبر البيانات منشورة إذا كانت جميع البيانات الموجودة في العينة متاحة كدليل احتمالي على توفر البيانات.
ويعمل على النحو التالي:
يقوم المقترح بإنشاء كتلة بيانات.
قم بتقسيم بيانات الكتلة إلى كتل k×k لتكوين مصفوفة.
قم بتوسيع المصفوفة عن طريق إضافة بيانات التكافؤ، باستخدام تشفير Reed-Solomon لإنشاء مصفوفة 2k×2k. يسمح هذا النوع من الترميز باسترداد مجموعة البيانات بأكملها من مجموعة فرعية من البيانات.
احسب ودمج جذور Merkle المستقلة لكل صف وعمود في المصفوفة الموسعة.
أخيرًا، تتم إضافة جذر Merkle لكل هذه الجذور المدمجة إلى التزام بيانات الكتلة في رأس الكتلة، مما يؤكد توفر البيانات.
للتحقق من التوفر، تقوم العقد الخفيفة بشكل عشوائي باستخراج إحداثيات فريدة من مصفوفة التوسعة ثم الاستعلام عن العقد الكاملة لكتل البيانات المقابلة لإثباتات Merkle لهذه الإحداثيات. إذا كانت الإجابة صحيحة، فهذا يعني أن هناك احتمالًا كبيرًا بأن تكون كتلة البيانات بأكملها متاحة.
تقوم العقدة بعد ذلك ببث الكتلة المستلمة مع إثبات Merkle الصحيح إلى بقية الشبكة. وطالما أن أخذ العينات كافٍ، يمكن للعقد إعادة بناء الكتلة بأكملها، مما يسمح لـ Celestia بالاعتماد بشكل أكبر على العقد ذات الموارد المحدودة للتحقق، وبالتالي المساهمة في اللامركزية.
حتى كتابة هذه السطور، لا تزال سيليستيا جديدة جدًا. ومع ذلك،إن أخذ عينات توفر البيانات هو تقنية يمكن اعتمادها خارج Celestia، ويناقش مطورو Ethereum الأساسيون إضافتها إلى البروتوكول للمساعدة في التوسع.
الاستنتاج
باختصار، هناك طرق مختلفة لتخزين البيانات والتحقق من توفرها في الشبكات الموزعة تعمل وتستخدم بنشاط.
يستخدم Tagion قاعدة بيانات DART، باستخدام التقسيم لزيادة الإنتاجية ودعم تطوير أنظمة بيئية فرعية متخصصة محمية بأشجار Merkle المتناثرة.
تستخدم بنية Filecoin خوارزميتين مختلفتين، إثبات الزمكان وإثبات النسخ، لتمكين القائمين بالتعدين من التحقق وإثبات أنهم قاموا بتخزين البيانات بشكل موثوق. يتم بعد ذلك تسجيل هذه البراهين على السلسلة في شكل براهين المعرفة الصفرية.
تستخدم Celestia، باعتبارها طبقة توفر البيانات، ترميز Reed-Solomon لتوسيع كتل البيانات إلى مصفوفات. تسمح هذه البنية للعملاء الخفيفين بإجراء أخذ عينات عشوائية لتأكيد توفر البيانات، متجاوزة الحاجة إلى تنزيل مجموعة البيانات بأكملها.
مع استمرار تطور نظام التخزين الموزع، يقترح كل من Tagion وFilecoin وCelestia استراتيجيات فريدة لضمان سلامة البيانات وتوافرها وإمكانية الوصول إليها. تقدم هذه المنصات معًا مساهمات مهمة في بناء أنظمة مرنة لنشر البيانات وتخزينها تدعم الشبكات اللامركزية.