Hasta ahora usamos Python como calculadora y para trabajar con listas.
Pero en la vida real nadie analiza datos así.
Los científicos, ingenieros y analistas usan librerías.
¿Qué es una librería?¶
Una librería es un conjunto de herramientas ya construidas por otras personas para resolver problemas específicos.
Es como:
| Área | Herramienta |
|---|---|
| Carpintería | martillo |
| Matemática | calculadora |
| Ciencia de datos | librerías |
En vez de programar todo desde cero… usamos conocimiento acumulado.

Figure 1:Diferentes librerias que se utilizan en análisis de datos y machine learning.
Importar una librería¶
import numpy as npEsto significa:
“Trae las herramientas matemáticas avanzadas para poder usarlas”
np es solo un apodo (alias) para escribir menos.
NumPy — matemáticas y vectores¶
NumPy permite trabajar con arreglos numéricos eficientes.
Es la base de casi toda la computación científica en Python.
Se usa cuando:
hay muchos números
necesitamos rapidez
trabajamos con mediciones
Ejemplo¶
import numpy as np
temperaturas = np.array([23, 25, 24, 26, 28])
print(temperaturas.mean())
print(temperaturas.max())Diferencia con listas¶
lista = [1,2,3,4]
array = np.array([1,2,3,4])
lista * 2
array * 2Pandas — tablas inteligentes¶
Pandas permite trabajar con tablas de datos reales.
Es lo más importante para análisis de datos.
Se usa cuando:
hay archivos CSV
encuestas
mediciones experimentales
Ejemplo¶
Con la libreria pandas podemos leer un documento en formato csv
import pandas as pd
df = pd.read_csv("datos.csv")pero también podemos crear nuestra propia data usando el método DataFrame
import pandas as pd
df = pd.DataFrame({
"estrella":["Sol","Alfa Centauri A","Sirius"],
"masa":[1, 1.1, 2.02],
"distancia":[0.000016, 4.39, 8.6]
})Matplotlib — graficar¶
Permite visualizar datos.
Es la herramienta básica de gráficos.
Ejemplo¶
import matplotlib.pyplot as plt
plt.plot([1,2,3],[4,5,6])
plt.show()Se usa cuando queremos:
ver tendencias
explicar resultados
enseñar a estudiantes
Seaborn — gráficos estadísticos¶
Es una mejora de matplotlib.
Hace gráficos más claros automáticamente.
Ejemplo¶
import seaborn as sns
sns.histplot(df["nota"])Se usa cuando queremos:
histogramas claros
comparar grupos
visualizar distribuciones
Librerías futuras (Machine Learning)¶
Estas no las usaremos todavía, pero existen:
| Librería | Uso |
|---|---|
| scikit-learn | Machine Learning clásico |
| tensorflow | redes neuronales |
| pytorch | deep learning investigación |
| xgboost | modelos predictivos potentes |
Resumen¶
| Librería | Para qué sirve |
|---|---|
| NumPy | cálculos numéricos |
| Pandas | tablas de datos |
| Matplotlib | gráficos básicos |
| Seaborn | gráficos estadísticos |
En ciencia de datos, la mayor parte del trabajo NO es Machine Learning. Es entender los datos.