Las listas de python y los arrays de numpy son **objetos mutables**. Esto tiene un efecto muy importante que hay que tener en cuenta a la hora de programar, pues nos puede sorprender.

En este cuaderno se ilustra con un ejemplo sencillo lo que sucede y se explica cómo resolverlo.

In [1]:
# Comencemos importando numpy y creando un vector cualquiera

import numpy as np
import numpy.linalg as la
import numpy.random as rnd
rnd.seed(2023)

n = 5
x = rnd.rand(n)

x

array([0.3219883 , 0.89042245, 0.58805226, 0.12659609, 0.14134122])

In [2]:
# Ahora creamos un segundo vector $y$, igual a $x$ excepto en una coordenada.
y = x
y[0] = 42
y

array([42.        ,  0.89042245,  0.58805226,  0.12659609,  0.14134122])

In [3]:
# Tal vez nos interesa calcular la distancia entre ambos vectores; esperamos que sea 42
la.norm(y - x)

0.0

In [4]:
# ¿Qué pasó?
print(f"{x = }")
print(f"{y = }")

x = array([42.        ,  0.89042245,  0.58805226,  0.12659609,  0.14134122])
y = array([42.        ,  0.89042245,  0.58805226,  0.12659609,  0.14134122])


In [5]:
# ¡Los dos vectores son iguales!!!
x == y

array([ True,  True,  True,  True,  True])

In [6]:
# De hecho, son el mismo vector
x is y

True

Lo que sucede es que las variables en python funcionan como si fueran *punteros*. En este caso hay un único array  (el creado por la función `rnd.rand(n)`) y ambas variables `x` e `y` apuntan a ese mismo array. Al ejecutar `y[0] = 42` se modifica, a través de la variable `y`, la coordenada 0 de dicho array.

Esto solo tiene efecto visible en objetos **mutables** como es el caso de los arrays de numpy. Para objetos **inmutables** (como números, cadenas, etc) el hecho que las variables sean punteros no hace ninguna diferencia porque los objetos subyacentes no se pueden modificar.


In [7]:
# solución: *copiar* el array antes de modificar la copia
z = y.copy()
z[0] = 0
z

array([0.        , 0.89042245, 0.58805226, 0.12659609, 0.14134122])

In [8]:
print(f"{x = }")
print(f"{y = }")
print(f"{z = }")

x = array([42.        ,  0.89042245,  0.58805226,  0.12659609,  0.14134122])
y = array([42.        ,  0.89042245,  0.58805226,  0.12659609,  0.14134122])
z = array([0.        , 0.89042245, 0.58805226, 0.12659609, 0.14134122])


En este caso x, y siguen siendo "punteros" al mismo array. En cambio z apunta a un nuevo array, inicialmente copia del primer array, pero que puede ser modificado de manera independiente.

In [9]:
#
print(x is y)
print(x is z)
print(y is z)

True
False
False


In [10]:
# la función `id` devuelve un identificador del objeto subyacente
# aquí se ve que `x` e `y` apuntan al mismo objeto, pero `z` no.
id(x), id(y), id(z)

(139766962473072, 139766962473072, 139766963050736)