#**Taller 3 parte I**

# Representación de las señales en tiempo y frecuencia

# Introducción

En este taller comenzaremos a dar los primeros pasos para acercarnos a los temas de comunicaciones inalámbricas y procesamiento de señales. Con esta excusa, empezaremos tratando de entender algunos conceptos importantes, en particular el de *frecuencia*.

A lo largo de todo el taller (tanto la parte I como la parte II), las preguntas que se plantean se deben entender como guía. Toda exploración por fuera del camino marcado es más que bienvenida. Se espera que cada grupo registre y documente los distintos experimentos realizados y respuestas a las preguntas planteadas.

En general a lo largo del taller vamos a ir acumulando, es decir los ejemplos o ejercicios de un taller servirán como base para el resto del curso. Por eso es importante que cada grupo vaya guardando y documentando prolijamente los experimentos realizados y el código generado.

Los ejercicios obligatorios del taller, al igual que en los anteriores, deben ser realizados y entregados individualmente por más que trabajen en grupo en el resto del notebook. La entrega es el miércoles 17 de abril a las 23:59hs.







#Audio en Python

Empecemos por ver cómo manejar el sonido y las señales de audio con las que trabajaremos inicialmente desde Python.

En primer lugar se verá cómo reproducir archivos de audio. Reproduciremos y trabajaremos en este taller con archivos en formato *wav*. Buscar en internet en qué consiste este formato.

Nota: Para la correcta ejecución de varios de los recuadros de código de este notebook podría ser necesario tener seleccionada la opción "Aceptar todas las cookies" en el navegador.

Para reproducir un archivo de audio debemos importar una biblioteca llamada Audio, de la siguiente forma:

In [None]:
from IPython.display import Audio

Luego tenemos que reproducir el archivo de audio que deseemos. Eso lo podremos hacer de dos formas. La primera implica subir el archivo de nuestra computadora a Colab, ejecutando las siguientes dos intrucciones. Se abrirá una ventana que permitirá elegir el archivo que deseamos subir.

In [None]:
from google.colab import files
uploaded = files.upload()

En mi caso, por ejemplo, he subido un archivo llamado Jaime_24.wav y podré reproducirlo como se muestra en el recuadro siguiente a este texto (en el eva hay dos ejemplos de archivos .wav).





In [None]:
a = Audio('Jaime_24.wav')
a

Una observación importante es que el espacio en disco del notebook de Google Colab no es persistente y se borra cuando se cierra la sesión. Por lo tanto, el archivo se debe subir cada vez que se quiera trabajar con él. Más adelante veremos otra posibilidad que es tener el archivo en la web y acceder a él desde Colab. Otra forma es usar Google Drive como forma de almacenamiento. Pueden ver un tutorial de como hacerlo en:

https://www.youtube.com/watch?v=Gvwuyx_F-28

La última forma de reproducir un archivo wav que veremos es invocarlo directamente desde una página web como por ejemplo:

In [None]:
Audio('https://iie.fing.edu.uy/ense/asign/tallerinte/repo/canciones/Jaime_24.wav')

# Tasa de muestreo

El concepto de la **tasa de muestreo** (o **frecuencia de muestreo**) de una señal es muy importante y debe comprenderse bien para poder seguir adelante. Pensemos como ejemplo en la grabación de la voz de una persona. Cuando alguien habla se genera una onda sonora que se corresponde a variaciones de presión del aire. Estas variaciones de presión llegan a un micrófono (el de la computadora, por ejemplo) y son convertidas en una variación de voltaje como el de la siguiente Figura.

![alt text](https://iie.fing.edu.uy/~belza/tallerinefiguras/sonido.png)


Ahora bien, las computadoras, al tener memoria finita, no trabajan con señales que puedan tomar cualquier valor y que sean continuas en el tiempo. Se trabaja tomando muestras (valores de la señal) cada cierto tiempo periódico. Por lo tanto, si trabajo a 44100 muestras por segundo quiere decir que cada un tiempo igual a 1/44100 segundos guardo el valor del voltaje correspondiente a ese momento.

Además, ese valor muestreado lo voy a guardar con una cantidad de bits fijos. Si trabajara con 1 byte (1 byte= 8 bits), por ejemplo, me daría la posibilidad de tener una escala con 256 valores (8 bits donde cada uno puede valer 0 o 1, entonces tengo 2**8=256 valores/niveles distintos). Entonces lo que se hace es dividir el rango máximo de nuestra señal entre esa cantidad de valores y aproximar el voltaje en un punto al valor de la escala más cercano. Por ejemplo si el micrófono sacara una señal cuyo rango fuera entre 0 y 8 Volts como se muestra en la siguiente Figura

![alt text](https://iie.fing.edu.uy/~belza/tallerinefiguras/analog_muestreada.png)


y tuviera un byte (8 bits) para representar el valor de cada muestra tendría que dividir 8V/256 y eso me daría los escalones posibles a los cuales aproximar el valor de la señal en cada muestra. Es decir por ejemplo 0 Volts corresponde al 0, 8V a 255, 4V al 128, etc. Este proceso se puede ver en la siguiente Figura


![alt text](https://iie.fing.edu.uy/~belza/tallerinefiguras/tasasMuestreo.png)

Una señal muestreada en Python será para nosotros un vector (típicamente un numpy array) o una lista de Python donde los valores serán las muestras de la señal. La frecuencia de muestreo será un dato externo que no estará en el vector.

Por ejemplo, imaginemos que se tiene una señal que es una recta que pasa por el origen y crece de a un volt cada segundo. Si la muestreo a una tasa de $5$ muestras por segundo durante el primer segundo obtengo (asumiendo que la primera muestra sea en cero) el vector $[0, 0.2, 0.4, 0.6, 0.8]$; o si la primera muestra no cae en 0 sino en 0.1 V será $[0.1,0.3,0.5,0.7,0.9]$. En cambio si esa misma señal la muestreo durante un segundo a una tasa de $10$ muestras por segundo se obtiene el vector: $[0.0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9]$.

A modo de comentario y dado que venimos trabajando con archivos wav, la tasa de muestreo de los archivos wav es habitualmente de 44100 muestras/s (esto se puede ver haciendo click derecho en el archivo del wav y entrando a Propiedades).

#Ejemplo

Se denomina señal "sinusoidal" a una señal de forma $f(t) = A. \sin(2 \pi f_0 t)$, donde "A" es la amplitud y $f_0$ la frecuencia (T = período = $1/f_0$).


Es importante notar que la función seno puede ser cambiada por un coseno, sin perder la denominación de señal sinusoidal. Podría considerarse un elemento más en la función (la "fase") que se suma dentro del seno (o coseno) y desplaza la función en el tiempo. Usualmente se toma fase nula.

Suponer que se muestrea una señal sinusoidal de amplitud 0.5V y de período 1/50 segundos durante los primeros 5 períodos y a una tasa de muestreo $f_s$, que inicialmente valdrá 200 muestras por segundo.
¿Cómo generaría en Python un vector con las muestras que se obtendrían?

Idea: Sea la señal a muestrear $F(t) = K \sin(2 \pi f_0 t)$ con $f_0$ la frecuencia de la sinusoide. En Python para generar las $N$ muestras de la señal es necesario sustituir el $t$ de las ecuaciones anteriores por un array con los valores de los tiempos de las muestras, es decir $0,1/f_s,2/f_s,...., (N-1)/f_s$ siendo $f_s$ la frecuencia de muestreo. Esto es lo que haremos, como se presenta en el siguiente código.



In [None]:
import numpy as np
import matplotlib.pyplot as plt

#Ejemplo

# Voy a muestrear a 200 muestras por segundo durante 0.1 segundos (5 períodos de una sinusoide de período
# 1/50 segundos). Necesito un vector con los tiempos de muestreo.
T= np.arange(0,0.1,1/200) # esta instrucción crea un vector de 0 a 0.1 con pasos de 1/200 = 0.05
# Por ejemplo, genero una sinusoide de frecuencia 50Hz (1Hz = 1 ciclo o período por segundo,
# es decir de período 1/50 segundos) muestreada en los tiempos correspondientes al vector T,
# y la asigno a un vector f1
f0 = 50
amplitud = 0.5
f1 = amplitud * np.sin(2*np.pi*f0*T)
# Grafico el vector f1 poniendo en cada muestra un "*"
# Observar que para graficar le pedimos a la función plot que los puntos de la gráfica los muestre con un '*'.
# Si no ponemos este parámetro, plot unirá los puntos con líneas y podremos no darnos cuenta dónde
# están las muestras. Pruebe hacerlo.
plt.figure(figsize=(14,6))
plt.plot(f1, "*")
plt.show()

#Ejercicio

1. Observar la figura anterior. Si bien se "adivina" que las muestras son de una sinusoide, no podría afirmarse a simple vista: podría tratarse de otra forma de onda. ¿Cómo podría hacer para que se pareciera más a una sinusoide? Modificar el código anterior para lograrlo y explicar qué es lo que estaría haciendo para ver cada vez mejor la sinusoide.

2. Generar un programa en Python que calcule el vector correspondiente a una señal lineal (que pasa por el origen y crece de a 5 Volts por segundo) muestreada a una tasa de 10 muestras por segundo durante un segundo. El primer punto de muestreo es un valor aleatorio entre 0.0 y 0.1 segundos.

 Sugerencia: La señal a muestrear ahora es F(t)=5t.

In [None]:
# Celda para resolver el ejercicio 2 anterior




# El concepto de frecuencia

En primer lugar nos enfocaremos en señales más sencillas que la voz humana o la música. En particular, vamos a enfocarnos en notas musicales. Por ejemplo, la nota "LA" estándar (cuarta octava) está en 440 Hz. ¿Qué significa eso?

Para empezar, "Hz" es la abreviación de "Hertz". El Hertz es una unidad que mide algo periódico (que sucede cada cierto tiempo fijo). En particular, 1Hz indica algo que sucede una vez por segundo. Quizá hayan escuchado hablar de las RPM (revoluciones por minuto), que suelen utilizarse para indicar cuántas vueltas da el eje de un motor en un minuto (muchos autos lo incluyen en su tablero). Pues esto es lo mismo, pero medido cada un segundo en vez de un minuto. En todos los casos se lo denomina frecuencia.

#Ejemplo

Escribiremos un programa que genere el vector correspondiente a una sinusoide muestreada a 44100 muestras por segundo de duración 2 segundos y que tenga una frecuencia de 440 Hz. La señal a generar tendrá una amplitud que varíe entre +/- 0.5. Luego escucharemos esta señal utilizando la función Audio ya vista para reproducir archivos wav. Leer, comprender en detalle el siguiente código y luego ejecutarlo y modificarlo como desee.



In [None]:
import numpy as np
from IPython.display import Audio
fs = 44100 # Tasa/frecuencia de muestreo.
T = 2.0 # Tiempo de muestreo de la señal.
t = np.arange(0, T, 1/fs) # Vector con los tiempos de muestreo.
f0 = 440 # Frecuencia de la sinusoide.
x = 0.5*np.sin(2*np.pi*f0*t) # Nota La de la cuarta octava, una sinusoide(tono) a 440 Hz.
# Para escuchar el audio en este caso no tenemos un archivo como antes, sino el array con las muestras.
# A la función Audio le podemos pasar el array con las muestras directamente y la tasa de muestreo
# en el parámetro rate.
Audio(x, rate=fs)
# Probar variar la frecuencia de la sinusoide, por ejemplo a 5000 Hz y a 100 Hz, y ver qué se escucha.

#**Ejercicio 1 obligatorio para entrega individual**
Mostrar en un gráfico utilizando la función plot de la biblioteca matplotlib cómo varían en el tiempo las primeras doscientas muestras de la señal del ejercicio anterior. Verificar que la amplitud y el período de la sinusoide son los correctos. La gráfica debe mostrar con un marcador el valor de cada muestra.

Posteriormente, haga lo mismo para las notas Do, Re, Mi, Fa, Sol, La, Si de la cuarta octava y de la quinta octava.

Buscar en Internet una fórmula para calcular la frecuencia de cualquier nota en cualquier octava e impleméntelo en Python. Hacer una función a la que le pase la nota, la octava y el tiempo de ejecución y retorne las muestras.

Componer una melodía utilizando la función anterior y escucharla con la función Audio.

Nota: puede ser útil la función *concatenate* de numpy.


In [None]:
import numpy as np
import matplotlib.pyplot as plt
from IPython.display import Audio


# Representación de la señal en frecuencia

En la parte anterior se vio cómo variaba la señal en el tiempo. Esta es una posible representación de la señal. También se puede pensar en representar las señales por sus componentes en frecuencia en lugar de por sus valores en el tiempo. Para eso hay funciones que nos permiten dada una señal identificar qué frecuencias tiene. Un algoritmo para calcular los componentes en frecuencia de una señal muy utilizado se denomina Fast Fourier Transform (FFT). La siguiente función permite dada una señal obtener un gráfico de las componentes en frecuencia que tiene la señal. Al diagrama con las componentes en frecuencia de la señal se le llama habitualmente espectro de la señal.








In [None]:
import numpy as np
import matplotlib.pyplot as plt
def plot_frec(x,fs,fmax,m): #esta función permite graficar las frecuencias de una señal x muestreada a tasa fs, el rango que grafica va hasta fmax, y m la cantidad de puntos que toma para calcular la FFT .
 puntos = int(fmax/fs*m)
 lx = len(x)
 nt = (lx + m - 1)//m
 xp = np.append(x,np.zeros(-lx+nt*m))
 xmw = np.reshape( xp, (m,nt), order='F')
 xmf = np.fft.fft(xmw,len(xmw),axis=0)/m
 xf = np.linspace(0, int(fs/2.0), int(m/2))
 plt.figure(figsize=(14,6))
 plt.plot(xf[0:puntos],np.abs(xmf[0:int(m/2),0:int(lx/m-1)]).mean(1)[0:puntos])
 plt.show()


# Ejemplo de como utilizar la función que muestra las componentes en frecuencia de una señal usando el tono con la nota La que generamos en el ejemplo anterior
fs = 44100 # tasa de muestreo
T = 2.0 # tiempo de muestreo de la señal
t = np.arange(0, T, 1/fs) # vector con los tiempos de muestreo
f0 = 440 # frecuencia de la sinusoide
x = 0.5*np.sin(2*np.pi*f0*t) # nota La de la cuarta octava, una sinusoide(tono) a 440 Hz
#llamo a la figura y le pido que muestre los primeros 1000 Hz
plot_frec(x,fs,1000,4096)

#Ejercicio
1. Interpretar el gráfico obtenido en el ejemplo anterior.
2. Generar ahora una sinusoide de 4400 Hz. Sumar las dos sinusoides (la de 440 Hz y la de 4400 Hz) y graficar cómo varía la señal suma en el tiempo (primeras doscientas muestras) y cómo son sus componentes en frecuencia (observe que deberá cambiar también fmax). Interpretar el resultado que se obtiene al graficar las componentes en frecuencia.

3. Generar sinusoides de frecuencias crecientes desde los 4.4 kHz hasta 20 kHz, por ejemplo de 8kHz, 10 kHz, 12 kHz, 14 kHz, 16 kHz, 18 KHz y 20kHz y escuchar estas señales. ¿Por qué parece que a medida que la frecuencia aumenta se escucha más débil? Probar hacer escuchar estas sinusoides de mayor frecuencia a una persona mayor a 30 años. ¿Cuál fue el resultado?
Graficar en el tiempo los primeros 200 puntos de la sinusoide de 18 kHz, por ejemplo. ¿Se parece a una sinusoide? ¿Cómo explicaría lo que se observa?
Sumar ahora las sinusoides de 440Hz, 4400 Hz y 8 kHz escuche el resultado final y ver su respuesta en frecuencia y en el tiempo.






In [None]:
# Celda para hacer el ejercicio anterior

#Ejercicio
Analizar la respuesta en frecuencia de algunos archivos wav y compare lo que escucha y la respuesta en frecuencia ¿Qué se observa? ¿Cómo puede explicar lo que observa?

In [None]:
import librosa
# Para hacer este último ejercio será necesario leer archivos wav que haya subido a Colab
# Para leer un archivo wav puede hacerlo de la siguiente forma:
data, fs = librosa.load('Jaime_24.wav')# le devuelve un numpy array con las muestras y la frecuencia de muestreo

# Por si lo necesita en algún momento la forma de escribir un vector de muestras al disco de Colab se hace de la siguiente forma
#librosa.output.write_wav('nombrearchivo.wav', data, fs)
#data1, fs = librosa.load('nombrearchivo.wav')

Audio(data1,rate=fs)

In [None]:
import librosa
data, fs = librosa.load('Jaime_24.wav')#
plot_frec(data,fs,12000,4096)

La respuesta en frecuencia de una sinusoide (o de un conjunto de sinusoides) muestra un espectro con componentes en frecuencia discretas. En el caso de la voz o de la música, que no son una señal periódica, se observa un espectro "continuo". Es como si fuera la suma de muchas sinuoides de diferentes amplitudes en "todas las frecuencias" (no literalmente en todas las frecuencias, pero se trata de un rango amplio, que se puede visualizar como continuo). Si la canción tiene más peso en los graves, veremos un espectro con mayor peso en las bajas frecuencias, si la canción tiene mayor peso en los agudos veremos un espectro con mayor peso en las frecuncias altas. Todo esto siempre dentro del rango de las frecuencias audibles por el ser humano (entre 20Hz y 19kHz, aproximadamente).

Como podemos ver en las sinusoides, las frecuencias bajas están asociadas con señales que varían lentamente en el tiempo y las frecuencias altas con variaciones rápidas o bruscas en el tiempo.

El concepto de frecuencia se aplica también a otras señales que no son sonidos. Las imágenes son un buen ejemplo de otro uso de la frecuencia. En primer lugar veremos como traer una imagen de una página web a nuestro notebbok y luego visualizarla:


In [None]:
from PIL import Image
import matplotlib.pyplot as plt
#Podemos visualizar una figura trayendola de una web con el comando wget que la salva al disco de Colab
#luego leerla de disco
!wget 'https://iie.fing.edu.uy/~belza/tallerinefiguras/sonido.png'
pil_im = Image.open('sonido.png')
#y mostrarla usando la funación de matplotlib imshow
imgplot = plt.imshow(pil_im)

In [None]:
#pero para seguir avanzando en el concepto de frecuencia construiremos nosotros una imagen.
#Una imagen es un array de dos dimensiones donde en cada lugar del array tiene el valor del pixel correspondiente
#Comenzaremos creando un array de NxN que tenga 1 en todas las posiciones del array.
N = 5000
data = np.ones((N,N))
#Ahora vamos a recorrer las filas del array
for i in range(0,N,1):
 # para las filas superiores (menores a 500) vamos a dibujar en escala de grises una sinusoide
 if i < 500:
 for j in range(1,N,1):
 data[i][j] = np.sin(2*np.pi*20*j/N)
 #para la parte inferior del array vamos a dibujar 125 columnas blancas y 125 negras
 else:
 for j in range(1,N,250):
 for k in range(125):
 data[i][j+k] = -1
# visualizamos la imagen y le decimos que la queremos ver en escala de grises que se indica diciendo que el color map cmap es binary
imgplot = plt.imshow(data,cmap='binary')


In [None]:

# a continuación visualizaremos en el "tiempo" en este caso en los pixels una fila de la imagen por ejemplo la 400
plt.plot(data[400])
plt.show()
# y luego calcularemos su espectro de frecuencia
plot_frec(data[400],N,80,256)
# ¿En qué frecuencia se encuentra el pico? Explicar por qué da en ese valor mirando la imagen.


In [None]:
#también podemos ver una fila de la imagen en la parte inferior, por ejemplo la 600
plt.plot(data[600])
plt.show()
# y luego calcularemos su espectro de frecuencia
plot_frec(data[600],N,200,256)
# ¿En qué frecuencia se encuentra el primer pico? Explicar por qué da en ese valor mirando la imagen
# ¿Porqué tiene más componentes de frecuencia que la fila 400 que vimos antes?



Para quien esté interesado en trabajar con imágenes en Python le recomendamos el siguiente tutorial:
https://matplotlib.org/3.1.1/tutorials/introductory/images.html
