Updated: 20 feb 2026
Métodos comunes de Numpy¶
Aquí veremos funciones que se usarán constantemente antes de hacer Machine Learning.
Crear arreglos¶
import numpy as np
a = np.array([1,2,3,4,5])
print(a)Generar Secuencia de Valores¶
valores = np.linspace(0,10,5) # 5 números entre 0 y 10
secuencia = np.arange(0,10,2) # de 2 en 2
print(valores)
print(secuencia)Operaciones estadísticas básicas¶
datos = np.array([23,25,24,26,28])
print("Promedio", datos.mean()) # calcula el promedio aritmético (la media) de los elementos
print("Desviación Estandar", datos.std()) # calcular la desviación estándar de un conjunto de datos
print("Mínimo", datos.min()) # encuentra el valor mínimo en un array
print("Maximo", datos.max()) # encuentra el valor máximo en un arrayOperaciones matemáticas vectorizadas¶
x = np.linspace(0,5,5)
print(x**2)
print(np.sqrt(x))
print(np.log(x+1))Métodos comunes de Pandas¶
Con la libreria pandas podemos leer un documento en formato csv
import pandas as pd
df = pd.read_csv("datos.csv")como también podemos crear nuestra propia data usando el método DataFrame
import pandas as pd
df = pd.DataFrame({
"estrella":["Sol","Alfa Centauri A","Sirius"],
"masa":[1, 1.1, 2.02],
"distancia":[0.000016, 4.39, 8.6]
})Inspeccionar Datos¶
df.head() # muestra las primeras filas del DataFrame
df.info() # muestra resumen de la información sobre el DataFrame
df.describe() # muestra estadísticas descriptivas de las columnas del DataFrameTambién podemos obtener el máximo, mínimo, y promedio de ciertas columnas en específico.
df["masa"].mean()
df["distancia"].max()
df["masa"].min()Para crear nuevas columnas
df["radio"] = 3,958.8* (df["masa"] / 1)**0.8Métodos Comunes de Matplotlib¶
Matplotlib es la librería base para hacer gráficas en Python. Es poderosa y muy flexible (pero más manual que seaborn).
Crear figura¶
plt.figure(figsize=(6,4))Línea¶
plt.plot(x, y)Puntos (scatter)¶
plt.scatter(x, y)Histograma¶
plt.hist(datos, bins=20)Etiquetas¶
plt.xlabel("Edad")
plt.ylabel("Altura")
plt.title("Relación Edad vs Altura")Leyenda¶
plt.legend()Mostrar gráfica¶
plt.show()Ejemplo¶
import matplotlib.pyplot as plt
import numpy as np
x = np.linspace(0,10,50)
y = np.sin(x)
plt.plot(x,y)
plt.title("Onda seno")
plt.xlabel("x")
plt.ylabel("sin(x)")
plt.show()Métodos comunes de Seaborn¶
Seaborn es una librería basada en Matplotlib pero especializada en análisis de datos.
En ciencia de datos real, se usa seaborn el 90% del tiempo.
Histograma inteligente¶
sns.histplot(data=df, x="edad")Relación entre variables¶
sns.scatterplot(data=df, x="altura", y="peso")Boxplot¶
sns.boxplot(data=df, x="genero", y="salario")Conteo de categorías¶
sns.countplot(data=df, x="clase")Correlaciones¶
sns.heatmap(df.corr(), annot=True)Ejemplo¶
import seaborn as sns
import pandas as pd
df = sns.load_dataset("tips")
sns.scatterplot(data=df, x="total_bill", y="tip", hue="sex")