Etschbacher, M. (2022). Reducing the operation cost of a file fixity storage service on the ethereum blockchain by utilizing pool testing strategies [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2022.98502
1920 wurde eine historische Aufzeichnung von Vladimir Lenin und Leo Trotzki verändert und dadurch, mit Farbe und Pinsel die Geschichte gefälscht. Langfristig aufbewahrte Daten in digitalen Archiven bieten böswilligen Akteuren die Möglichkeit, Daten zu manipulieren. Datenmanipulationen in digitalen Archiven werden in der Regel durch den Vergleich kryptographischer Hash-Werte in unterschiedlichen Zeitintervallen erkannt, sogenannten Fixitätsinformationen. Während das Generieren von Fixitätsinformationen (z. B. MD5, SHA256) relativ einfach ist, ist das Speichern schwieriger, wenn man bedenkt, dass jeder, der sie ändern kann, auch die zugrunde liegenden Daten ändern kann. Jüngste Arbeiten haben gezeigt, dass die Ethereum-Blockchain geeignet ist, Metadaten unveränderlich zu speichern, was einen guten Kandidaten für die Speicherung von Fixitätsinformationen darstellt. Aber die Kosten einer individuellen Teststrategie, bei welcher die Fixitätsinformationen für jedes Objekt einzeln persistiert werden, ist zu hoch. Eine Strategie, um den Kosten entgegenzuwirken, besteht darin, die Anzahl kostspieliger Transaktionen auf der Ethereum-Blockchain zu minimieren. Dies kann durch den Einsatz von Pool-Testing erfolgen, was erstmals 1943 präsentiert wurde und heutzutage zum Untersuchen von Populationen auf COVID-19 verwendet werden, indem einzelne Proben zu einem Pool kombiniert werden. Dieses Konzept kann auch mit Hash-Listen implementiert werden, bei denen die kryptografischen Hashes digitaler Objekte in einer Hash-Liste kombiniert werden und nur der Root-Hash auf der Blockchain persistiert werden muss. Dadurch wird die Anzahl kostspieliger Transaktionen auf der Blockchain minimiert, während die Effizienz erhalten bleibt. Durch die Verwendung von Pool-Testing können die Kosten zur Sicherstellung der Integrität des OpenPreserve format-corpus Datensatzes auf der Ethereum-Blockchain um den Faktor 3,0 reduziert und die Effizienz um den Faktor 1,28 gesteigert werden. Diese Arbeit endet mit der Erfassung des genauen Rechenaufwands und der Kosten für den Betrieb eines Fixitätsspeichers auf der Ethereum-Blockchain und einer Methode, um die Kosten dafür zu senken.
de
In 1920, a historical record of Vladimir Lenin and Leon Trotsky was altered, thus forging history by using paint and brushes. Long term preserved data in digital archives offers malicious actors the possibility to forge history, where in the digital age data manipulation is more efficient and more exact. Data manipulation in digital archives is usually detected by comparing cryptographic hash values at different time intervals, so called fixity-information. While generating fixity information (e.g., MD5, SHA256) is relatively easy, storing it is more difficult when you consider that anyone who can change it can also change the underlying data. Recent work has shown that the Ethereum blockchain is suited for persisting metadata in an unchangeable manner, making a good candidate for storing fixity information. But, the cost of an individual testing strategy, in which the fixity information for each object is persisted is too high. A strategy to counter the cost is to minimize the amount of costly transactions on the Ethereum blockchain. This can be done by utilizing pooled testing, which was first introduced in 1943 and is now used to screen a large population for COVID-19 by combining individual samples into a pool. This concept can also be implemented with hash-lists, where the cryptographic hashes of digital objects are combined in a hash-list and only the root hash are persisted on the blockchain. This minimizes the number of costly transaction on the blockchain while still maintaining efficiency. With the usage of pooled testing, the cost of ensuring the integrity of the OpenPreserve format-corpus dataset on the Ethereum blockchain can be reduced by a factor of 3.0 and the efficiency can be increased by a factor of 1.28. From a cost perspective, this work concludes in the gathering of the exact computational effort and cost of operating a file fixity storage on the Ethereum blockchain and a method to decrease the cost of doing so.
en
Additional information:
Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers