Utilisation de SparkSQL pour analyser vos données Cassandra en Java, Scala et Python

Cassandra ne permet ni jointure, ni agrégats et limite drastiquement vos capacités à requêter vos données pour permettre une scalabilité linéaire dans une architecture masterless. L'outil de choix pour effectuer des traitements analytiques sur vos tables Cassandra est Spark mais ce dernier complexifie des opérations pourtant simples en SQL. SparkSQL permet de retrouver une syntaxe SQL dans Spark et nous allons voir comment l'utiliser en Scala, Java et en Python pour travailler sur des tables Cassandra, et retrouver jointures et agrégats (entre autres). Authors: Alexander DEJANOVSKI Développeur chez Chronopost Je me suis pris d'une passion toute particulière pour Apache Cassandra, et compte bien ne pas retravailler sur une base relationnelle de sitôt. Je contribue au driver JDBC "legacy" de Cassandra et j'ai récemment terminé sa réécriture pour qu'il utilise le driver Java Datastax au lieu de Thrift. Maxence Lecointe Just passionate about Java. Every day is a day to improve coding skills. Great experience with Java tools/technologies/frameworks/standards (e.g. Eclipse, Hibernate, Spring, etc.) and software development methods and tools. Code review. Software architecture and design. Implementation of innovative technologies.
Length: 27:29
Views 131 Likes: 0
Recorded on 2015-04-08 at Devoxx France
Look for other videos at Devoxx France.
Tweet this video