Skip to article frontmatterSkip to article content
Site not loading correctly?

This may be due to an incorrect BASE_URL configuration. See the MyST Documentation for reference.

Updated: 20 feb 2026

Métodos comunes de Numpy

Aquí veremos funciones que se usarán constantemente antes de hacer Machine Learning.

Crear arreglos

import numpy as np

a = np.array([1,2,3,4,5])
print(a)

Generar Secuencia de Valores

valores = np.linspace(0,10,5)   # 5 números entre 0 y 10
secuencia = np.arange(0,10,2)     # de 2 en 2

print(valores)
print(secuencia)

Operaciones estadísticas básicas

datos = np.array([23,25,24,26,28])

print("Promedio", datos.mean()) #  calcula el promedio aritmético (la media) de los elementos
print("Desviación Estandar", datos.std()) # calcular la desviación estándar de un conjunto de datos
print("Mínimo", datos.min()) # encuentra el valor mínimo en un array
print("Maximo", datos.max()) # encuentra el valor máximo en un array

Operaciones matemáticas vectorizadas

x = np.linspace(0,5,5)

print(x**2)
print(np.sqrt(x))
print(np.log(x+1))

Métodos comunes de Pandas

Con la libreria pandas podemos leer un documento en formato csv

import pandas as pd

df = pd.read_csv("datos.csv")

como también podemos crear nuestra propia data usando el método DataFrame

import pandas as pd

df = pd.DataFrame({
    "estrella":["Sol","Alfa Centauri A","Sirius"],
    "masa":[1, 1.1, 2.02],
    "distancia":[0.000016, 4.39, 8.6]
})

Inspeccionar Datos

df.head() # muestra las primeras filas del DataFrame
df.info() # muestra resumen de la información sobre el DataFrame
df.describe() # muestra estadísticas descriptivas de las columnas del DataFrame

También podemos obtener el máximo, mínimo, y promedio de ciertas columnas en específico.

df["masa"].mean()
df["distancia"].max()
df["masa"].min()

Para crear nuevas columnas

df["radio"] = 3,958.8* (df["masa"] / 1)**0.8

Métodos Comunes de Matplotlib

Matplotlib es la librería base para hacer gráficas en Python. Es poderosa y muy flexible (pero más manual que seaborn).

Crear figura

plt.figure(figsize=(6,4))

Línea

plt.plot(x, y)

Puntos (scatter)

plt.scatter(x, y)

Histograma

plt.hist(datos, bins=20)

Etiquetas

plt.xlabel("Edad")
plt.ylabel("Altura")
plt.title("Relación Edad vs Altura")

Leyenda

plt.legend()

Mostrar gráfica

plt.show()

Ejemplo

import matplotlib.pyplot as plt
import numpy as np

x = np.linspace(0,10,50)
y = np.sin(x)

plt.plot(x,y)
plt.title("Onda seno")
plt.xlabel("x")
plt.ylabel("sin(x)")
plt.show()



Métodos comunes de Seaborn

Seaborn es una librería basada en Matplotlib pero especializada en análisis de datos.

En ciencia de datos real, se usa seaborn el 90% del tiempo.


Histograma inteligente

sns.histplot(data=df, x="edad")

Relación entre variables

sns.scatterplot(data=df, x="altura", y="peso")

Boxplot

sns.boxplot(data=df, x="genero", y="salario")

Conteo de categorías

sns.countplot(data=df, x="clase")

Correlaciones

sns.heatmap(df.corr(), annot=True)

Ejemplo

import seaborn as sns
import pandas as pd

df = sns.load_dataset("tips")

sns.scatterplot(data=df, x="total_bill", y="tip", hue="sex")