PerformancePoint 2010 és PowerPivot

Image001

Tud jó forrása lenni egy Vertipaq adatbázis a PerformancePoint szervernek? A válasz igen. Legalábbis ez derül ki a PerformancePoint 2010 and PowerPivot című tanulmányból, melyben megismerhetjük azt is, hogy hogyan kell összelőni a két eszközt illetve választ kaphatunk arra is, hogy  milyen különbségek tapasztalhatóak a PerformancePoint működésében ha az adatforrás egy oszlopalapú adatbázis (Veripaq) ahhoz képest, amikor az adatforrás egy többdimenziós adatbázis (Analysis Services). Bővebb infó a PerformancePoint 2010 and PowerPivot című cikkben.

Balanced Data Distributorn

Az SQLCat-os fejlesztők készítettek egy SSIS komponenst, amellyel párhuzamosíthatók a transzformációk és ezzel - bizonyos esetekben – gyorsíthatóak a betöltések.

Image001

Maga a Balanced Data Distributor komponens nem soronként, hanem az SSIS pipeline-ba betöltött bufferenként párhuzamosít és elsősorban akkor lehet rá szükség, ha a betöltési folyamat szűk keresztmetszete nem az adatkinyerés, hanem a transzformáció, vagy az beszúrás a céladatbázisba.

Még nem próbáltam, de felírom magamnak ide, hogy ha egy bonyolult transzformáció lesz a szűk keresztmetszet, akkor ezzel a párhuzamosító komponenssel talán lehet gyorsítani a betöltéseket. További infó itt: The “Balanced Data Distributor” for SSIS

Az üzleti intelligencia első lépcsője

Olvasom Konrád blogjában, hogy:

„…ahány cég, annyi lehetséges forgatókönyv van arra nézve, mikor hogy viselkednek a vevőik. De ha több évre visszamenőleg van lehetőség pl. a bevételi, forgalmi adatokat elemezni, akkor azokból nagyon érdekes következtetéseket lehet arra nézve is levonni, hogy mikor és mit érdemes reklámozni…”

Ezzel kapcsolatban eszembe jutott, hogy az üzleti intelligencia első lépcsője az idősor elemzés, amelyre technológiai szempontból az OLAP (többdimenziós adatbázis-kezelők) adják a legjobb megoldást.

Hogyan építhetünk a PowerPivotra alkalmazást?

Alapértelmezés szerint a PowerPivotban használt Vertipaq adatbázishoz nincs publikusan elérhető interfész (API). (Többek között ezért nem tudjuk a munkafüzetben tárolt adatokat ütemezetten vagy eseményvezérelten frissíteni a SharePoint használata nélkül). Ugyanakkor szemmel láthatóan készülnek olyan alkalmazások a PowerPivot fölé, mint például a Twitter forgalmunk elemzését lehetővé tevő Analytics for Twitter vagy a PowerPivot adatokat elemezni képes adatbányász megoldás

Hogyan lehetséges akkor mindez? Vagy felvállaljuk a kockázatot és használjuk a dokumentálatlan API-t (ahogy az adatbányász megoldást fejlesztő cég tette), vagy kihasználjuk azt, hogy a PowerPivottal készített alkalmazás is csak egy Excel fájl, amihez már van API: (Ezt tették a Twitter forgalom elemzést lehetővé tevő alkalmazás fejlesztői is)

Image001

Ebben az esetben sajnos  örököljük az Excel korlátait (mint pl.: az egymillió soros korlát) ugyanakkor megnyílik a lehetőség a Vertipaq adatbázis használatára.

Egyik sem szép megoldás, de amíg nincs publikus API, addig be kell érnünk vagy az egyik, vagy a másik kerülőúttal.