PowerQuery a PowerBI
Power Query, mocný nástroj pro transformaci dat, je zásadním prvkem v ekosystému Microsoft Excel a Power BI. Umožňuje uživatelům snadno importovat, transformovat, čistit a integrovat data z různých zdrojů. Tento článek vás provede základy Power Query, ukáže, jak efektivně využít jeho funkce pro práci s daty a jaké transformace můžete provádět pro zlepšení kvality vašich datových sad.
Základy Power Query
Jak otevřít Power Query
V Excelu lze Power Query najít pod záložkou "Data", kde můžete vybrat "Získat a transformovat data". V Power BI se Power Query otevírá automaticky při výběru "Získat data" z domovské stránky nebo záložky "Domů" v hlavním rozhraní pod ikonou "Transformovat data".

Základní rozhraní Power Query
Power Query Editor nabízí intuitivní rozhraní s hlavními oblastmi pro náhled dat a řadou nástrojových lišt pro různé transformace. Uživatelé mohou snadno navigovat mezi různými zdroji dat, aplikovat transformace a přizpůsobit si zobrazení dat podle svých potřeb.

Import dat
Power Query umožňuje import dat z široké škály zdrojů, včetně souborů (Excel, CSV, XML), databází (SQL, Access), webových služeb a mnoha dalších. Import je snadný a umožňuje rychlé zpracování dat bez potřeby složitého kódování.
Transformace dat
Transformace dat v Power Query umožňuje uživatelům efektivně přetvářet a přizpůsobit své datové sady pro analýzu a reportování. Zde se podíváme blíže na základní transformace a jak je lze využít k maximalizaci hodnoty vašich dat.
Odstranění sloupců
Jednou z nejběžnějších potřeb při práci s datovými sadami je odstranění nepotřebných sloupců, které neobsahují užitečné informace pro danou analýzu. Power Query umožňuje uživatelům snadno vybrat sloupce, které chtějí odstranit, a buď je odstranit přímo, nebo naopak zachovat pouze vybrané sloupce. Tato funkce je obzvláště užitečná pro zjednodušení datové sady a zaměření se pouze na relevantní data.
Změna typu dat
Správné typování dat je základem pro jakoukoliv analýzu. Typy dat v Power Query zahrnují text, celá čísla, desetinná místa, datumy a časy, pravdivostní hodnoty a další. Přesné nastavení typu dat je klíčové pro správné fungování matematických operací, časových porovnání a agregací. Power Query umožňuje uživatelům snadno změnit typ dat sloupce, což zajistí, že operace a výpočty provedené na těchto datech budou správné.
Filtrování řádků
Filtrování je základním nástrojem pro zúžení datové sady na relevantní řádky. Power Query nabízí rozsáhlé možnosti pro filtrování dat, včetně filtrů na základě hodnot, textových řetězců, datumů, a dalších kritérií. Filtrování může být použito k odstranění chybných dat, výběru určitých časových období, nebo jednoduše k zúžení datové sady na řádky relevantní pro konkrétní analýzu.
Přidání nových sloupců
Kromě odstraňování sloupců mohou uživatelé pomocí Power Query také přidávat nové sloupce založené na existujících datech. Toto může zahrnovat výpočty, jako je vytváření součtů, průměrů, nebo i složitějších výrazů využívajících jazyk M. Přidání nových sloupců umožňuje uživatelům vytvářet derivované metriky nebo přizpůsobené kategorizace přímo v rámci procesu transformace dat.
Seskupení a agregace
Power Query umožňuje seskupovat data podle jednoho nebo více sloupců a následně na seskupená data aplikovat různé agregace, jako jsou sumy, průměry, minimální a maximální hodnoty, a další. Seskupení a agregace jsou zásadní pro sumarizaci velkých datových sad do přehledných a analyzovatelných informací.
Rozšířené textové funkce
Pro práci s textovými daty nabízí Power Query řadu funkcí pro jejich úpravu a analýzu. To zahrnuje transformace, jako je změna velikosti písmen, odstranění mezer, rozdělení textu podle určitého znaku nebo spojení několika textových sloupců do jednoho. Tyto operace jsou klíčové pro normalizaci a přípravu textových dat pro další analýzu.
Každá z těchto základních transformací poskytuje uživatelům Power Query mocné nástroje pro efektivní práci s daty, umožňuje jim čistit, upravovat a připravovat data pro analýzu a vizualizaci, což vede k hlubším vhledům a lepšímu pochopení jejich dat.

Čištění Dat
Čištění dat je nezbytným krokem v procesu analýzy dat, neboť čistá a konzistentní datová sada je základem pro spolehlivé výsledky. Power Query poskytuje řadu funkcí, které usnadňují tento proces a transformují surová data do formy připravené pro hlubší analýzu.
Odstranění duplicit
Duplicitní záznamy mohou zkreslit analýzu dat, což vede k nesprávným závěrům. Power Query umožňuje uživatelům snadno identifikovat a odstranit duplicitní řádky v datové sadě. Tento proces se obvykle provádí po načtení dat a před jejich další transformací. Odstraněním duplicit zajistíte, že každý záznam v datové sadě je jedinečný a reprezentativní.
Práce s chybějícími hodnotami
Chybějící hodnoty mohou způsobit problémy při výpočtech a analýzách. Power Query nabízí několik možností, jak se s chybějícími hodnotami vypořádat, včetně jejich odstranění nebo nahrazení předem definovanou hodnotou. Nahrazení chybějících hodnot průměrem, mediánem nebo nulou může pomoci zachovat strukturu datové sady při minimalizaci vlivu chybějících dat.
Normalizace dat
Konzistence a srovnatelnost dat jsou klíčové pro jejich správnou analýzu. Normalizace dat v Power Query zahrnuje úpravy, jako je standardizace formátů dat (např. datumů a časů), jednotná velikost písma, odstranění nadbytečných mezer a sjednocení kategorických hodnot. Tyto úpravy zajišťují, že data jsou konzistentní napříč celou datovou sadou, což umožňuje přesné porovnání a analýzu.
Sloučení a připojení dat
Integrace dat z různých zdrojů je běžnou součástí procesu čištění dat. Power Query poskytuje možnosti sloučení (merge) a připojení (join) tabulek, což umožňuje kombinovat datové sady na základě společných klíčů nebo atributů. Tímto způsobem lze rozšířit existující datové sady o další informace nebo sloučit více souvisejících datových sad do jedné komplexní sady pro analýzu.
Závěr
Power Query je neocenitelným nástrojem pro každého, kdo pracuje s daty v Excelu nebo Power BI. Jeho schopnost importovat, transformovat, čistit a kombinovat data z různých zdrojů činí z analýzy dat rychlý a snadný proces. S tímto průvodcem máte pevný základ pro využití Power Query k zefektivnění vašich datových projektů a získání hlubších vhledů z vašich dat.