Data Availability Sampling
Próbkowanie dostępności danych, czyli metoda, w której węzły sprawdzają losowe fragmenty danych, aby ocenić, czy cały zestaw danych jest dostępny do pobrania i weryfikacji.
Czym jest próbkowanie dostępności danych
Data Availability Sampling, w skrócie DAS, oznacza próbkowanie dostępności danych. Węzeł pobiera losowe fragmenty dużego zestawu danych zamiast całej paczki.
Jeśli wiele niezależnych węzłów może pobrać losowe próbki, sieć zyskuje wysoką pewność, że pełne dane zostały rzeczywiście udostępnione.
To ważny kierunek skalowania. Większe bloki danych i większa przepustowość rollupów powinny pozostać możliwe do weryfikacji przez zwykłych uczestników sieci.
Co DAS próbuje rozwiązać
- Duże dane
- Rollupy i systemy skalujące potrzebują publikować coraz więcej danych transakcyjnych.
- Lekkie węzły
- Użytkownicy powinni móc weryfikować system bez pobierania całego zestawu danych.
- Losowe próbki
- Węzły pobierają małe fragmenty danych, zamiast pełnego blobu albo bloku.
- Wspólna pewność
- Wiele udanych próbek od wielu węzłów zwiększa pewność, że dane są dostępne.
- Wykrywanie ukrycia danych
- Ukrycie części danych powinno stać się kosztowne i łatwiejsze do wykrycia.
Dlaczego pobieranie wszystkiego źle się skaluje
Pełna weryfikacja przez pobranie wszystkich danych jest prosta do zrozumienia, ale słabo skaluje się przy dużych ilościach danych.
Jeśli każdy użytkownik musiałby pobierać całe dane rollupów, wymagania sprzętowe i sieciowe rosłyby razem z przepustowością. To ogranicza liczbę osób zdolnych do niezależnej kontroli.
Próbkowanie dostępności danych pozwala utrzymać niższy próg uczestnictwa. Węzeł wykonuje mniej pracy, a sieć jako całość nadal może wykrywać problemy z dostępnością.
Jak działa intuicyjnie
Wyobraź sobie duży zestaw danych podzielony na wiele fragmentów. Węzeł losuje kilka fragmentów i próbuje je pobrać.
Pojedynczy węzeł widzi tylko część danych. Wiele węzłów losuje różne fragmenty, więc ukrycie istotnej części danych zwiększa szansę trafienia na brakującą próbkę.
W praktyce konstrukcja wymaga kodowania danych i mechanizmów kryptograficznych, żeby z małych próbek można było uzyskać wiarygodny sygnał o dostępności całości.
Dlaczego to ma znaczenie dla Ethereum i rollupów
Ta technika jest ważna, bo koszty danych są jednym z głównych ograniczeń skalowania.
- Może obniżyć koszt publikowania danych dla rollupów.
- Może pozwolić lekkim węzłom uczestniczyć w kontroli dostępności danych.
- Może zwiększyć przepustowość bez wymuszania ciężkich wymagań sprzętowych na każdym użytkowniku.
- Pomaga odróżnić systemy z publicznie dostępnymi danymi od systemów opartych na zaufaniu do operatorów.
- Jest powiązane z dalszym rozwojem Ethereum w kierunku lepszej warstwy danych dla rollupów.
Przykład intuicyjny
- Rollup publikuje duży zestaw danych potrzebnych do odtworzenia stanu.
- Lekki węzeł losuje małe fragmenty tego zestawu.
- Inne węzły losują inne fragmenty.
- Jeśli wiele próbek jest dostępnych, sieć zyskuje wysoką pewność, że dane nie zostały ukryte.
- Jeśli część danych jest niedostępna, losowe próbkowanie zwiększa szansę wykrycia problemu.
Najczęstsze błędne założenia
- Próbkowanie jest mechanizmem kontroli dostępności, a nie ślepym zaufaniem do operatora danych.
- Pojedyncza próbka daje ograniczoną informację. Siła modelu wynika z wielu niezależnych próbek.
- DAS sprawdza dostępność danych. Poprawność transakcji wymaga osobnych reguł walidacji i dowodów.
- Niższy koszt danych nadal wymaga sprawdzenia, gdzie dane są publikowane i kto może je pobrać.
- System z próbkowaniem może mieć inne założenia niż prosty rollup publikujący pełne dane na Ethereum.
Próbkowanie pomaga skalować weryfikację
Próbkowanie dostępności danych ma pozwolić wielu uczestnikom sprawdzać dostępność dużych zestawów danych bez pobierania wszystkiego. To ważny element skalowania rollupów i lekkiej weryfikacji.
