Blockchain Technologie

Home/Blockchain Technologie

Multi-“DNA”-Blockchain White Paper

Technologie für verteilte Umgebungen mit komplexen Informationsstrukturen

Unsere Technologie für eine Multi-„DNA“-Blockchain zur verteilten Datenverarbeitung in peer-to-peer-Netzen mit gleichberechtigten, autarken Nodes unter Verwendung von Blockchain- und Smart Contract-Techniken

Das System ist geeignet für Anwendungsfälle in Netzwerken, in denen …

  • die Teilnehmer sich nicht kennen (müssen), als anonym interagieren (können),
  • der Einsatz von zentralen, übergreifend steuernden Komponenten technisch, organisatorisch oder politisch nicht umsetzbar ist,
  • eine verteilte Datenhaltung unumgänglich ist,
  • derTeilnehmerkreis nicht kontrollierbar ist oder sein soll,
  • die Einhaltung übergreifend gültiger Richtlinien und Regeln deshalb nicht durchsetzbar ist,
  • die zu erfassenden Daten nicht planbar sind,
  • im Sinne von nicht möglicher Standardisierung „unstrukturierte“ Informationen verarbeitet werden müssen,
  • sich Informationsstrukturen im Laufe der Zeit verändern,
  • die Interaktion zwischen Teilnehmern schwer vorhersehbar ist und
    hinsichtlich der Interaktionsfähigkeit der Teilnehmer eine hohe Flexibilität erforderlich ist.

Projekthistorie

2007: aus unserem Projektgeschäft heraus Idee zur Schaffung eines über beliebig viele Knoten verteilbaren Datenbanksystems ohne zentrale Steuerung, in welchem die Teilnehmer des Netzwerkes untereinander beliebig strukturierte Daten erfassen, bearbeiten und untereinander austauschen können.

2010: zwei Prototypen auf Grundlage von relationalen Datenbanksystemen; Erfahrungen im Umgang mit Dezentralisierung, Autarkie, Benutzerverhalten, Kommunikation und dem Thema „world view“ gesammelt; testweise einige Anwendungsfälle, aufgrund der Marktnachfrage mit wesentlichem Bezug auf semantische Netze

2017: Ergänzung um Blockchain-Technologie zur Sicherstellung von „weltweiter“ Datenkonsistenz und Integrität sowie „node‘s world view“ ohne zentrales Metadaten-Repository.

Screenshots panlogo prototyp

Assets

Das System verarbeitet Daten beliebiger Art und mit beliebigen, zur Laufzeit entstehenden und veränderlichen hierarchischen und netzförmigen Datenstrukturen.

Die Gesamtheit einer zusammenhängenden hierarchischen Datenstruktur nennen wir Asset. Die „Blätter“ dieser „Datenbäume“ bilden atomare Attribute. Diesen Attributen können Werte zugewiesen werden. Sie bilden die eigentlichen „Daten“ des Assets. Die möglichen Attributtypen für Asset-Strukturen sind fest vorgegeben und entsprechen den gängigen Datentypen von Datenbanksystemen.

Jedem Attribut kann neben einem Wert auch eine Bezeichnung zugewiesen werden: So kann bspw. ein Attribut vom Typ „ganzzahlig“ die Bezeichnung „Gewicht in kg“ und den Wert „25“ aufweisen.

Assets (als komplexeres Informationsobjekt) können netzförmig miteinander verknüpft werden, wodurch semantische Netze entstehen. Durch Methoden der Graphentheorie können diese Netze inhaltlich und formal analysiert werden und stellen eine intuitive Form der Wissensverarbeitung dar.

Assets stellen aufgrund ihres streng hierarchischen Aufbaus sog. Ontologien (Inf.) dar, deren Merkmale durch die hierarchiebildenden Beziehungen „ist Bestandteil von“ bzw. „gehört zu“ oder „ist ein“ zusammengefügt werden (vom Detail zum Master). Sie kommen damit menschlichen Denkstrukturen sehr nahe und unterstützen kognitive Fähigkeiten. Fakten und Wissen (im weitesten Sinne) lassen sich damit beliebig präzise und realitätsnah abbilden.

Datenstrukturen eines Assets können im Sinne einer Erweiterung mit denen anderen Assets verbunden werden, auch zwischen verschiedenen Nodes und Blockchains. Hierüber können innerhalb eines Assets Datenbereiche gebildet werden, die von anderen Nodes verwaltet werden.

Assets sind durch einen „Geburts-Hash“ weltweit eindeutig identifizierbar. Es handelt sich damit um „individualisierte Daten“.

Nodes und Smart Contracts

Auf jedem am Netzwerk teilnehmenden Node muss das Netzwerkprotokoll implementiert werden, damit die Nodes dieselbe „Sprache sprechen“. Die Implementierung kann systemspezifisch erfolgen und ist grundsätzlich nicht an eine bestimmte Plattform gebunden. Die Interaktion zwischen den Nodes wird mittels Blockchains und an das Smart Contracts-Konzept angelehnte Transaktionen realisiert (private Blockchains). Die Menge der möglichen Transaktionsarten ist auf die jeweilige Protokollimplementierung beschränkt und der ausführbare Transaktionscode ist hier nicht transaktions-inherent (wie bspw. im Ethereum Yellow Paper spezifiziert).

Das Netzwerkprotokoll umfasst u. a. Funktionen zum Erstellen, Strukturieren, Entfernen, Befüllen, Kopieren, Clonen, Versenden und Verknüpfen von Daten.

Nodes können mit anderen Nodes Nachrichten austauschen und Assets gemeinsam bearbeiten.

Ein Node kann die Eigentümerschaft für ein Asset an einen anderen Node übertragen.

Jeder Node bildet über seine eigenen und die ihm bekannten Nodes, Assets und Blockchains eine eigene Weltsicht („world view“) ab. Die Summe aller world views repräsentiert das Gesamtsystem.

panlogo blcokchain figure 2

Blockchains

Das Verfahren nutzt die Grundeigenschaft von Blockchains dass jeder Knoten ein identisches Abbild des Datenspeichers vorhält und sich hierzu fortlaufend mit den anderen Knoten abgleicht.

Das Verfahren reduziert die entsprechenden Blockchain-Mechanismen auf ein Minimum und orientiert sich eher am „private blockchain“-Paradigma, allerdings ohne das übergreifende koordinierende Wirken einer externen Regelungsinstanz. Das Netzwerk der Teilnehmer kann sich ungesteuert selbständig entfalten. Dies wird durch die konsequente Umsetzung des Eigentümerprinzips (principle of ownership) möglich. Mining und Consensus entfallen durch das Eigentümerprinzip vollständig. Im Gegenzug gibt es nur dann anonyme Teilnehmer, wenn wenigstens ein anderer Teilnehmer diesen für sich als Kommunikationspartner akzeptiert hat.

panlogo blcokchain figure 1

Multi-“DNA”-Blockchain

Wir haben das Verfahren aus den folgenden Gründen Multi-„DNA“-Blockchain genannt:

  • Das Gesamtsystem verwaltet beliebig viele Blockchains parallel – deshalb „Multi“.
  • Eine Blockchain enthält die Daten und Datenstrukturen der Assets in sequentialisierter, kanonischer Form.

Da jede Blockchain Informationsobjekte in sequentialisierter Form repräsentiert, die aus standardisierten universellen Strukturelementen zusammengesetzt sind, ähnelt eine solche „panlogo-Blockchain“ aus unserer Sicht einem DNA-Strang.

Softwarearchitektur

In jedem Node muss dieselbe Funktionalität zur Bearbeitung der Blockchains und Assets als Netzwerkprotokoll implementiert sein. Es kann je nach Anwendungsgebiet fach- oder branchenspezifische Netzwerkprotokolle geben. Sie besteht aus drei Ebenen:

  • Benutzerschnittstelle (user interface),
  • Verarbeitungslogik für Assets und Blockchains
  • Kommunikationslogik zur Kommunikation mit anderen Nodes.

panlogo blcokchain figure 4

Ebenenübergreifend umspannen Sicherheitsmechanismen und ein Datenbankadapter die im Node implementierte Funktionalität.

Der sog. Security Controller ermöglicht die Zuweisung von Zugriffsrechten zu Softwarekomponenten und Datenobjekten auf jeder Ebene.

Der Database Adapter unterstützt – falls aus Performancegründen auf dem jeweiligen Node erforderlich – die Ablage von Daten in einem nachgelagerten RDBMS für jede Softwareebene.

Anwendungsfälle / Use Cases

Anwendungsfall: Patientenakte / Arztbriefe

Im Gesundheitswesen kann die Technologie zum Austausch von Informationen über Patienten zwischen Ärzten und Krankenhäusern eingesetzt werden: In der Akte können Informationen flexibel und selbsterklärend abgelegt werden, ähnlich dem Prinzip von Papierakten. Ein Arzt als Urheber einer Patientenakte kann diese außerdem im Auftrag des Patienten an andere Ärzte direkt weitergeben, wobei sie als Blockchain verteilt gespeichert wird. Andere Ärzte, bspw. Fachärzte oder Konsiliarärzte können die Akte um weitere Informationen beliebig ergänzen und gleichzeitig umfassend über festgestellte Symptome, Diagnosen und Therapien anderer Ärzte informiert werden.

Vorteile wie Vermeidung wiederholter Behandlungen, genauere Abstimmung von Therapien und Medikationen sowie bessere Informationsversorgung für das Erstellen von Diagnosen liegen auf der Hand.

Die Eigentümerschaft an der Patientenakte kann dabei bedarfsweise an einen anderen Arzt oder Krankenhaus abgegeben werden, bspw. wenn dieser die weitere Behandlung des Patienten übernimmt.

Einzelne fachspezifische Teile der Patientenakte können durch Fachärzte eigenverantwortlich bearbeitet werden, wobei die Akte in der Eigentümerschaft des behandelnden Hausarztes verbleibt. Alle Teilnehmer haben die Möglichkeit, ihre Informationen frei zu strukturieren: sie müssen sich nicht an vordefinierte Datenstrukturen halten, sondern ergänzen ihre Informationen in der jeweils vorliegenden und optimalen Form, wobei auch Dokumenten wie bspw. Röntgenbildern oder Laborberichten verarbeitet werden.

In der Akte werden sämtliche dort erfassten Informationen dauerhaft chronologisch gespeichert. Informationsinhalte können als „nicht löschbar“ gekennzeichnet werden. Zugriffe auf die Akte oder einzelne Teile davon können vom Patienten selbst oder vom Eigentümer der Akte festgelegt werden. Die Verwendung der Akte kann in der Akte selbst als Logbuch dokumentiert werden.

Sämtliche Anforderungen des Datenschutzgesetzes werden dabei vollständig umgesetzt.

Zur Umsetzung wird keine zentrale und flächendeckende Infrastruktur benötigt sondern bei jedem Teilnehmer lediglich ein handelsüblicher PC mit dem installierten Netzwerkprotokoll für panlogo-Blockchains.

Anwendungsfall: Projektmanagement

Erfahrungsgemäß liegt in komplexen Projekten der vordergründige Bedarf einer Informationsversorgung weniger in der automationsgestützten Ressourceneinsatzplanung sondern in einer gut strukturierten und allgemein verfügbaren Gesamtsicht auf alle Dokumente wie Planung, Projekthandbücher, Checklisten, Konzepten, Entwurfsplänen, Ausführungsplänen, Dokumentationen usw.

Heute werden in komplexen Projekten durch die einzelnen Beteiligten nahezu alle Informationen extrem redundant abgelegt und unabhängig voneinander und unkontrolliert individuell gepflegt und fortgeschrieben. Dies führt regelmäßig zu Missverständnissen, Planungs- und Steuerungsfehlern aufgrund eines inkonsistenten Informationsstandes. Hieraus wiederum resultieren unnötig hohe Projektkosten und zeitlicher Verzug.

Mit unserer Technologie wird die Projektakte in einer gemeinsamen „private Blockchain“ abgelegt und von allen Beteiligten bedarfsgerecht gelesen, bearbeitet und ergänzt. Dokumente werden mit erforderlichen Zugriffsrechten versehen und gezielt im Teilnehmernetz gesteuert, so dass alle Teilnehmer über einem einheitlichen und aktuellen gemeinsamen Informationsstand verfügen.

Die Projektakte wird vom Projektleiter als Eigentümer verantwortet und den jeweiligen Projektbeteiligten gezielt zur Verfügung gestellt. Die einzelnen Beteiligten pflegen die jeweils von ihnen verantworteten Projektinhalte eigenverantwortlich, wofür granulare Zugriffsrechte zugewiesen werden.

Aus den oben genannten Merkmalen einer Anwendung der panlogo-Blockchains leiten sich bei entsprechender Kreativität durchaus weitere Nutzenaspekte im Projektmanagement ab.

Anwendungsfall: Forschungsvorhaben

In Forschungsvorhaben fallen im Laufe der Durchführung des Vorhabens unter Umständen in großem Umfang Daten in strukturierter und in unstrukturierter Form an. Zudem liegen diese oft in nicht vorhersehbarer Struktur und Qualität vor, die einer geordneten, informationsspezifischen Ablage bedürfen. Hierfür ist die Verwendung von panlogo-Blockchains optimal.

Die Dokumentation eines Forschungsvorhabens kann aufsetzenden Studien über eine Blockchain als Speicher- und Transportmedium bereitgestellt und von diesen eigenverantwortlich fortgeschrieben werden. Sie kann somit „in verschiedene fachliche Richtungen“ fortgeschrieben werden, wofür der Cloning-Mechanismus vorteilhaft ist: Aus einer Basisdokumentation werden einfach neue „Ableger“ ausgekoppelt. Durch Verknüpfungsfunktionen und die „weltweit“ eindeutige Kennzeichnung von Strukturmerkmalen könnten solche Dokumentation später auch wieder in einer gemeinsamen Datenstruktur sinnvoll zusammengeführt und inhaltlich konsolidiert werden.

Anwendungsfall: Kriminalitätsbekämpfung

Bei der Kriminalitätsbekämpfung fallen fallweise oft erhebliche Informationsmengen in völlig unstrukturierter Form an, die mit herkömmlichen Datenbanksystemen nur schwer verarbeitet werden können. Zudem ist die Weitergabe solcher Akten von einer Institution zur anderen schwierig, da es naturgemäß keine übergeordneten Metadatenmodelle für den Informationsaustausch gibt, d. h. die IT-Systeme „verstehen sich nicht“. Oft werden hier mit hohem Aufwand Schnittstellen geschaffen, deren Pflege sich später als aufwendig bis nicht machbar erweist, da die Quell- und Zielsysteme unabhängig voneinander weiterentwickelt werden.

Hier sind panlogo-Blockchains eine einfache und praktikable Lösung: Einerseits beschreiben sich die Daten selbst, andererseits ist eine automatische Verarbeitung im Zielsystem wegen der weltweit eindeutigen Identifizierbarkeit von Strukturelementen leicht möglich. Sog. „Parser“ können mit wenig Aufwand einfach durch Ableitung aus vorhandenen Datenstrukturen erstellt und in das Netzwerkprotokoll integriert werden (bspw. ein proprietäres Protokoll für die Kriminalitätsbekämpfung). Im Idealfall bringt die jeweilige Akte die erforderlichen Auswertungsfunktionen gleich selbst mit, wie wir es in unseren Prototypen bereits in Form „verschachtelter hierarchischer Tabellen“ erfolgreich getestet haben (auch hierarchisch strukturierte Massendaten lassen sich tabellarisch zweidimensional darstellen). Das Netzwerkprotokoll kann auch um Exportfunktionen zu gängigen Office-Produkten erweitert werden (ebenfalls in den Prototypen bereits erfolgreich getestet).

Anwendungsfall: Täternetzwerk

Im Rahmen der Tests der entwickelten Prototypen wurde ein aus unserer Sicht besonders interessanter Anwendungsfall getestet: die Dokumentation und gezielte Auswertung von „Täternetzwerken“.

Hierbei handelte es sich um einen Polizeibereich mit verhältnismäßig hoher Kriminalitätsrate sowohl in den Bereichen der Kleinkriminalität als auch der organisierten Kriminalität. Den Beamten war bewusst, dass zwischen den einzelnen Tätern und verdächtigten Personen sowie zwischen Ereignissen und Gegebenheiten Abhängigkeiten bestehen. Diese sind aber wegen der Gesamtkomplexität nur sehr schwer zu erkennen, sofern sie nicht unmittelbar offensichtlich oder zufällig erkennbar sind.

In diesem Projekt wurden unterschiedlichste Sachverhalte und Fakten testweise in erheblichem Umfang (nötigenfalls anonymisiert) erfasst und jeweils – soweit bekannt – durch beliebige Relationen miteinander verknüpft. Im Ergebnis entstanden sog. semantische Netze, aus denen verwertbare Beziehungen zwischen den Fakten hervorgingen und Schlussfolgerungen abgeleitet werden konnten.

Über einfache graphentheoretische Funktionen konnten teils komplexe Suchanfragen an das Gesamtsystem gestellt werden, bspw. in der Weise, ob es zwischen Sachverhalt A und Sachverhalt B einen oder mehrere Pfade gibt oder welche Sachverhalte in irgendeiner Weise mit einem Sachverhalt X verknüpft sind. Hierüber konnten interessante, wertvolle Erkenntnisse über ansonsten nicht sofort erkennbare Zusammenhänge gefunden werden.

Eine besondere Herausforderung bestand hier in der Berücksichtigung zeitlicher Aspekte. Durch die chronologischen Eigenschaften einer Blockchain kann dem künftig optimal begegnet werden.

Denkbar wäre, solche Sachverhalte durch mehrere Dienststellen pflegen zu lassen (Assets) und sie dann miteinander zu verbinden und auszuwerten. Die Pflege würde durch die Dienststellen unabhängig voneinander erfolgen können, in Blockchains gespeichert und verteilt und miteinander verknüpft werden. Im Ergebnis würde sich ein detailliertes und realitätsgetreues Bild über den gesamten „Kriminalitätskontext“ ergeben. In Verbindung mit semantischen und syntaktischen Suchfunktionen könnten Identitäten festgestellt und zusammengeführt werden, bspw. wenn ein Täter oder Verdächtiger in mehreren Dienststellen parallel dokumentiert worden wäre.

Performancemessungen der Prototypen auf handelsüblichen Desktop-PCs haben bspw. für die Bearbeitung von Informationsobjekten mit Hierarchien mit mehr als 300.000 Einzelattributen Antwortzeiten unter zwei Sekunden beim Lesen von Daten ergeben. Umfangreiche Strukturerweiterungen von Attributhierarchien benötigen je nach Art und Weise der softwaretechnischen Abbildung der Hierarchien längere Antwortzeiten. Diese lagen jedoch ebenfalls in für den Benutzer akzeptablen Bereichen.