Piekļuve Centrālās statistikas pārvaldes datu bāzei ar Excel vai Power BI

Centrālā statistikas pārvalde apkopo dažāda veida datus, kurus reizēm ir parocīgi iegūt Excel darba lapā. Turklāt pieslēdzoties vēlamajiem datiem kā ārējam datu avotam un taupot laiku saistībā ar datu atjaunošanas porcesu. Lūk, kā to izdarīt.




Ielūkojos pieejamajos datos https://data.csb.gov.lv/ un izvēlējos aplūkot mājokļa cenu indeksu, kur sanāca visnotaļ interesants gala rezultāts.

Vispirms atlasīju visus par to esošos datus.

Kad tabula izveidota, lapas apakšā jāatrod iespēja to iespējot lietojumprogrammā.

Tur redzama Tīmekļa adrese (URL) un JSON vaicājums.

Šie divi parametri ir tie, kas būs jāizmanto, lai tabulu ar atlasīto saturu pieprasītu no CSP lapas caur Excel vai Power BI. Turklāt šāda darbošanās būs laba ar to, ka jaunākos datus varēs iegūt tos atjaunojot caur attiecīgo programmu – tātad ietaupīs laiku.

Attiecīgā piemēra turpinājums notiek Excel 2016, izmantojot sadaļu Get&Transform, Power BI tas notiek līdzīgi, bet vecākām Excel versijām jāinstalē Power Query Add-in.

Dodoties uz Data -> New Query -> From Other Sources -> From Web atveras logs, kurā iekopē attiecīgo tīmekļa adresi.

Power Query Editor logā sadaļā View atver Advanced Editor, kur jāpielāgo tur redzamā funkcija Web.Contents, lai tā izmantotu arī JSON vaicājumu. To izdara izmantojot funkcijas parametru Content un attiecīgo JSON vaicājumu norādot binārā formā ar funkciju Text.ToBinary.

Tomēr vispirms jāpielāgo JSON vaicājumā esošo tekstu ar papildus pēdiņām un vaicājumā formātu norādot json. Ātri to būs iespējams izdarīt, piemēram, programmā Notepad ++ un aizvietojot ” ar “”.

Visbeidzot JSON vaicājumu var piešķirt mainīgajam un lūk, kā vajadzētu izskatīties rezultātam. Jāpievērš uzmanība visām pēdiņām un komatiem!

Pēc tam atliek izvēlēties attiecīgo komponenti tālākai aplūkošanai, šajā gadījumā klikšķis uz List iepretim Data. Turpmākie soļi var atšķirties atkarībā no izgūtās tabulas.Listi pārveido par tabulu.

Izvērš attiecīgo kolonnu.

Un pēc tam arī nākošās kolonnas. Der pievērst uzmanību situācijām, kad vienā kolonnā veidojas saturs, kuru pēc tam vajadzēs sadalīt pa vairākām. Tādā gadījumā pēc izvēles Extract Values… papildus jānorāda arī atdalītājs.

Izmantojot atdalītāju sadala datus pa kolonnām.

Pielāgo kolonnu nosaukumus, ielūkojoties un salīdzinot ar saturu CSB lapā, bet pārējais jau ir atkarīgs no vēlmēm. Izvēlējos aplūkot mājokļa cenu indeksus attiecībā pret 2010.gadu, kad bijis zemākais cenu līmenis attiecīgajā periodā.

Attiecīgās tabulas dati grafiski izskatās šādi. Zemāk pieejams kods ar visiem izdarītajiem pārveidojumiem.