Apache Cassandra
Was ist eigentlich dieses ominöse Apache Cassandra?
Cassandra ist der Name eines Open Source NoSQL-Datenbankverwaltungssystems, das als freie Software mit Apache Lizenz vertrieben wird. Apache Cassandra startete 2008 als Gemeinschaftsprojekt eines Facebook- und eines Amazon-Dynamo-Entwicklers. Später nahm sich die Apache Software Foundation der weiteren Ausarbeitung an. Die NoSQL Datenbank Cassandra kommt unter anderem bei Apple, Instagram, Netflix, Comcast, Twitter und Reddit zum Einsatz.[1]
Und wie Funktioniert der Quatsch jetzt?
Apache Cassandra ist ein Datensystem, dass für großen Datenmengen ausgelegt ist. Die Übermittlung geschieht über sog. Commodity-Server, die komplett ohne einen Single Point of Failure auskommen. Das heißt, dass das Cassandra eine enorm hohe Fehlertoleranz aufweist. Dies ist unter einem P2P Protokoll gesichert.
Das P2P Protokoll(Gossip Protocol)
Das P2P Protokoll verwaltet den Informationsaustausch zwischen den Rechnern in einem Netzwerk. Außerdem stellt es sicher, dass falls ein Netzwerknoten ausfällt, ein anderer dessen Aufgaben übernimmt, bis der Ausgefallene wieder funktioniert. Bei der Kommunikation P2P werden zudem in den Nachrichten gespeicherte Versionen älterer Informationen fortlaufend mit aktuelleren Versionen überschrieben.
CQL Cassandra Query Language
Cassandra Query Language ist die Datenbanksprache, über die man Zugriff auf Apache Cassandra erhält. CQL betrachtet die Datenbank (Keyspace) als einen Tabellen-Container. Der Client kann jeden Netzwerkknoten für seine Schreib-Operation ansprechen. Dieser Node stellt dann die Kommunikationsschnittstelle zwischen dem Client und den Netzknoten dar, die die Daten beinhalten.