PySpark – analýza velkých dat v Databricks

13 068 Kč 13 068 Kč
Skladem
SKU
ba_cz_ictpro_3847
Věrnostní bodyZískejte 50 bodů za napsání recenze k tomuto produktu
Pracujete s daty v Excelu, Power Query, SQL nebo Pandas a potřebujete zpracovat gigabajty až terabajty dat? PySpark je Python rozhraní pro Apache Spark – nástroj, který zpracovává Big Data, a zvládne i to, co se nevejde do paměti jednoho počítače.

Workshop probíhá kompletně v prostředí Databricks Community Edition – žádná instalace, vše v prohlížeči. Naučíte se pracovat s PySpark DataFrame API a Spark SQL. Využijete své znalosti z SQL, syntaxe Vám bude povědomá.

  • Začínáme s Databricks
  • DataFrame – základní operace
  • Spark SQL
  • Zdroje dat
  • Zpracování dat
  • Agregace dat
  • Řešení chyb
  • Výstupy a export dat
Více informací
Dodavatel ICT Pro s. r. o.
Napište svou recenzi
Recenze mohou psát pouze registrovaní zákazníci. Přihláste se nebo registrujte prosím