Caso práctico: Carga de un grupo de archivos#

  • Última modificación: 2 de noviembre de 2022

Generación de datos#

[1]:
import os.path
import pandas as pd
import numpy as np

data = pd.read_csv(
    "https://raw.githubusercontent.com/jdvelasq/datalabs/master/datasets/drivers/timesheet.csv"
)

dir_path = "../../data/folder/"

if not os.path.exists(dir_path):
    os.makedirs(dir_path)

n_batches = 5
batch_indices = np.array_split(np.array(range(len(data))), n_batches)

for igroup in range(n_batches):
    data.iloc[batch_indices[igroup], :].to_csv(
        dir_path + "timesheet_{}.csv".format(igroup), index=False
    )

pd.read_csv("https://raw.githubusercontent.com/jdvelasq/datalabs/master/datasets/drivers/drivers.csv").to_csv(
    "../../data/folder/drivers.csv", index=False
)

Procedimiento#

  • Seleccione Obtener Datos.

get_data_folder_01.png

  • En Origenes de datos comunes seleccione Mas …

get_data_folder_02.png

  • Seleccione Carpeta y luego haga click en el boton Conectar.

get_data_folder_03.png

  • Seleccione la carpeta con los datos y haga click en Aceptar.

get_data_folder_04.png

  • Note que en los archivos seleccionados automáticamente, el archivo drivers.csv no pertenece al grupo de archivos que se desean importar. Para corregirlo haga click en Transformar datos.

get_data_folder_05.png

  • Haga click en el botón derecho del nombre de la columna, quite la marca de selección del archivo y haga click en Aceptar.

get_data_folder_06.png

  • Para concaternar los archivos haga click en el boton con las dos flechas hacia abajo.

get_data_folder_07.png

  • Revise la información presentada en la caja de concatenación de archivos.

get_data_folder_08.png

  • Verifique que los archivos ya se encuentran concatenados.

get_data_folder_09.png