Streaming databáza PipelineDB je open-source



PipelineDB som zaregistroval ako zaujímavý a nádejný startup, ktorý absolvoval Y Combinator Winter 2014. O SQL databázach asi počul každý, tak isto svoj boom mali aj NoSQL databázy či value-key úložiská. Teraz prichádza opäť niečo nové, čo minimálne stojí za povšimnutie.

PipelineDB sa ale zameriava na stream dát do databázy, nad nimi vie robiť rôzne operácie a tie následne ukladať do tabuliek. Príkladom môžu byť A/B testy, kedy môže byť tok dát naozaj obrovský a štandardne sa vyhodnocujú až neskôr. PipelineDB tak umožňuje realtime prístup k takýmto dátam. Ďalším príkladom môže byť napríklad spracovanie logov či rôzne trackovacie systémy, výmenná reklama a podobne. Dáta je možné sumarizovať, filtrovať a agregovať no a následne napríklad vizualizovať.

An open-source relational database that runs SQL queries continuously on streams, incrementally storing results in tables

Aplikácia je postavená na jadre PosgreSQL 9.4 a spolieha práve na rozšírenosť SQL syntaxe, ktorá má pomôcť k rýchlejšiemu porozumeniu fungovania, ale aj nasadeniu do produkcie. Ďalšou výhodou je, že netreba pre komunikáciu žiadneho špeciálneho klienta - stačí práve ten PosgreSQL ako doteraz. Dnes bol celý projekt (verzia 0.7.7) zverejnený ako open-source, do konca roka by mala byť k dispozícii aj komerčná podpora. Balíčky sú dostupné pre Ubuntu, CentOS, Amazon Linux (AMI) a Mac OS X. Prípadne je možné skompilovať PipelineDB zo zdrojových kódov.

Momentálne má PipelineDB štyroch zamestnancov a dôvodov prečo sa rozhodli otvoriť ich aplikáciu je niekoľko. Hlavne je to rýchlejší vstup na trh a giganti ako Facebook či Google generujú toľko open-source projektov, že s niečim proprietárnym by sa dalo len veľmi ťažko konkurovať.

Staň sa fanúšikom

TOPlist TOPlist