Analiza bookmakurilor cu PowerBI si C#

 

De citva timp (2012) tin un Friday Links cu linkuri-le care mi-au placut. M-am intrebat care ar fi site-urile pe care le vizitez cel mai des. Si , ca programatorul adevarat, m-am gindit cum sa fac:

1. Export linkurile ( usor, sunt in Chrome bookmark manager)

2. Le interpretez cu C# si imi iau anul, domeniul , url si textul (ok, nu am nevoie de ultimele doua) .

3. Incep sa le bag intr-o baza de date relationala pe care fac apoi Group By

La 3 mi s-a cam taiat pofta. Oi fi stiind SQL , insa … sa scriu de mina toate query …. neah….

Si atunci mi-a venit ideea : PowerBI – stie el singur sa le interpreteze.

Asa ca 3 s-a transformat in

3 real .Le bag in CSV si le interpretez cu PowerBI desktop.

Zis si facut. Am exportat datele bin Bookmark manager al lui Chrome intr-un ( fel ) de XML – nu prea corect, XmlDocument la load dadea erori. Asa ca am folosit HTMLAgilityPack . Am avut probleme si la DATE_ADD – se inmulteste cu 1000 si se considera de la 1970-01-01-  codul de C# este

long l = long.Parse(item.Attributes["ADD_DATE"].Value)*1000L;
CreateDate = new DateTime(1970, 1, 1).AddMilliseconds(l);        

 

Apoi am exportat data in CSV si am importat in PowerBI Desktop de au iesit citeva rapoarte frumusele ( pentru count(url)>20 – le veti vedea in curind)

Acum – cum sa fac sa le vada si altii – as putea sa pun pbix la download , insa asta implica doua chestii:

1. Ca altcineva poate sa imi vada datele in forma lor nuda ( si nu prea imi place)

2.Ca trebuie sa isi downloadeze PowerBI desktop – si asta iar nu prea imi place.

Si mi-am adus aminte ca PowerBI are si o versiune free

Am apasat pe publish si voila!

(Pentru cei cu desktop: Vedeti ca jos in dreapta raportului este un buton de “Full screen” ca sa il vedeti mai bine – pentru mobile linkul este https://app.powerbi.com/view?r=eyJrIjoiMjRlNGZmNmUtMDAwYS00ZjU1LTgwN2EtNmZmMzQ4Njg1ZGZkIiwidCI6ImFlZTg2ZjQzLWU4MzUtNGVkYi05ZGQ1LWQyNjA5Y2Q3NWQwNyIsImMiOjh9)

Acel “year selector” de pe pagina 1 face toti banii … asa am observat ca in 2013 ma uitam cu precadere pe youtube, nuaisacrezi si blog msdn
Noroc cu 2014 , unde github a inceput sa preia locul intii.
2015 e mai diversificat iar 2016 , dupa cum se vede pe pagina 2, are mai putine bookmarkuri decit 2015( am fost mai puturos sau in mai multe sedinte …)
Iar stock tickerul pare cool – desi e fenta de programator , nu sunt actiuni, ci numar de linkuri …

Raportul are doua pagini( vedeti in josul raportului) si il gasiti la https://app.powerbi.com/view?r=eyJrIjoiMjRlNGZmNmUtMDAwYS00ZjU1LTgwN2EtNmZmMzQ4Njg1ZGZkIiwidCI6ImFlZTg2ZjQzLWU4MzUtNGVkYi05ZGQ1LWQyNjA5Y2Q3NWQwNyIsImMiOjh9

Leave a Reply

Your email address will not be published. Required fields are marked *