المؤلف: جوش أوسوليفان، CoinTelegraph؛ من إعداد: Whitewater، Golden Finance.
أيد المؤسس المشارك لـ Ethereum، فيتاليك بوتيرين، طريقة ضغط Token for Image Tokenizer (TiTok) لتطبيقات blockchain المحتملة.
يجب عدم الخلط بينه وبين منصة الوسائط الاجتماعية TikTok، حيث تعمل طريقة ضغط TiTok الجديدة على تقليل حجم الصورة بشكل كبير، مما يجعلها أكثر ملاءمة للتخزين على blockchain.
سلط بوتيرين الضوء على إمكانات blockchain الخاصة بـ TiTok على منصة التواصل الاجتماعي اللامركزية Farcaster، قائلًا "320 بت هي في الأساس تجزئة". قيمة صغيرة بما يكفي لكل مستخدم للتسلسل؛">قد يكون لهذا التطوير آثار كبيرة على تخزين الصور الرقمية في صور الملفات الشخصية (PFPs) والرموز غير القابلة للاستبدال (NFTs).
TiTok لضغط الصور
تم تطوير TiTok بشكل مشترك بواسطة ByteDance وباحثين من الجامعة التقنية في ميونيخ، يمكن ضغط الصور إلى 32 كتلة بيانات صغيرة (بت) دون فقدان الجودة.
يسمح ضغط الصور بالذكاء الاصطناعي المتقدم (AI) لـ TiTok بضغط صورة بحجم 256 × 256 بكسل إلى "32 علامة منفصلة"، وفقًا لورقة بحث TiTok.
TiTok هو إطار عمل لترميز الصور أحادي البعد (1D) "يكسر حدود طرق الترميز ثنائية الأبعاد الموجودة قيود الشبكة"، مما يؤدي إلى صورة أكثر مرونة وصغيرة الحجم.
"ونتيجة لذلك، يمكنه تسريع عملية أخذ العينات بشكل كبير (على سبيل المثال، 410 مرات أسرع من DiT-XL/2) مع تحقيق جودة جيل تنافسية."< / p>
تُظهر ورقة بحث TikTok مقارنة بين أحجام ضغط الصور. المصدر: TikTok
صورة التعلم الآلي
يستخدم TikTok التعلم الآلي والذكاء الاصطناعي المتقدم ذكي تحويل الصور إلى تمثيلات رمزية باستخدام النماذج القائمة على المحولات.
تستخدم هذه الطريقة تكرار المنطقة، مما يعني أنها تحدد وتستخدم المعلومات المتكررة في مناطق مختلفة من الصورة لتقليل حجم البيانات الإجمالي للمنتج النهائي.
"تسلط التطورات الحديثة في النماذج التوليدية الضوء على الدور المهم لتصنيف الصور في التوليف الفعال للصور عالية الدقة."
وفقًا لورقة البحث، يمكن "التمثيل الكامن المدمج" لـ TiTok توليد "تمثيل أكثر كفاءة وفعالية من التقنيات التقليدية".
توضيح لإعادة بناء الصورة (أ) وتوليدها (ب) باستخدام إطار عمل TiTok (ج). المصدر: TiTok
TikTok وليس TikTok
رغم تشابه الاسم فإن وسائل التواصل الاجتماعي منصة TikTok غير معتمدة من قبل Buterin.
يسلط المؤسس المشارك لـ Ethereum الضوء على إمكانات TiTok في blockchain لهذه الطريقة الجديدة التي تعتمد على الذكاء الاصطناعي. تضيف طريقة ضغط الصور المصداقية.
" على عكس نماذج VQ ثنائية الأبعاد الحالية التي تتعامل مع المساحة الكامنة للصورة كشبكة ثنائية الأبعاد، فإننا نقدم صيغة أكثر إحكاما لتصنيف الصور على أنها تسلسل كامن أحادي الأبعاد."
يمكن للطريقة الجديدة المقترحة "تمثيل الصور بعلامات أقل بـ 8 إلى 64 مرة من "العلامة ثنائية الأبعاد"، ويأمل الفريق أن يؤدي هذا البحث إلى "تمثيل أكثر كفاءة للصور". ص>