La exploratoria de datos es un proceso que se suele realizar en los proyectos de analisis de datos en donde se busca identificar el formato de los datos y posibles valores vacios o errores en los mismos. La exploratoria se puede definir como: "Proceso que implica el uso de gráficos y visualizaciones para explorar y analizar un conjunto de datos. El objetivo es explorar, investigar y aprender del dato". Se suele utilizar para entender una fuente de datos e identificar posibles errores con los tipos de datos, oportunidades de mejora o enriquecimiento, etc.
Devuelve todas las columnas que posee la tabla.
df.columns
list(df)
Muestra el inicio de los índices de datos y el final. Permitiendo de esta forma determinar cuantos elementos existen en la tabla.
df.index
describe()
retorna una descripción estadística en formato tabla de las columnas numéricas del dataframe.
df.describe()
df.describe(include='object')
df.info()
permite revisar la cantidad de columnas del DataFrame, así como la cantidad de filas y tipo de datos de cada columna.
df.info()