Procesamiento de datos en Pythno y Bash con Apache Zeppelin#

  • Última modificación: Mayo 18, 2022

Acceso a la interfaz#

Vaya a:

localhost:8080

Acceso a la nueva interfaz#

assets/fig-00001.png

Creación de un notebook#

assets/fig-00002.png

assets/fig-00003.png

Configuración del interprete de Python 3#

assets/fig-00004.png

assets/fig-00005.png

assets/fig-00006.png

assets/fig-00007.png

Comandos en el Shell#

%sh
mkdir -p /tmp/csvkit_tutorial
curl -L -O https://raw.githubusercontent.com/wireservice/csvkit/master/examples/realdata/ne_1033_data.xlsx
mv ne_1033_data.xlsx /tmp/csvkit_tutorial/ne_1033_data.xlsx
%sh
in2csv /tmp/csvkit_tutorial/ne_1033_data.xlsx > /tmp/data.csv
head /tmp/data.csv

assets/fig-00008.png

%sh
pip install pandas
%python
import pandas as pd

pd.read_csv('/tmp/data.csv').head()

assets/fig-00009.png