Parte c) - Completado de Datos

Parte c) - Completado de Datos

de Agustin Iba -
Número de respuestas: 4

Estimados, ¿cómo están?

Tenía ciertas dudas al realizar el completado de las series de datos, en especial con los datos de bajas alturas solares, ya que el filtrado de calidad los exculye y lo apliqué tanto para los datos medidos como para los satelitales y las estimaciones realizadas. ¿Debería completar la serie con los datos de bajas alturas solares medidos o los satelitales? Si no los considero, los gráficos tienen un aspecto esperable, pero al incorporarlos aparecen cosas extrañas (sobre todo en fd vs kt).

Por otro lado, ¿cómo se debería manejar el faltante de datos a la hora de hacer el promedio diario anual y mensual? Porque al tomar días de menor cantidad de horas se estaría aumentando el peso de las horas nocturnas en la ponderación y dejaría de ser representativo. Yo pensaba tomar los días donde se tuvieran el 100% de los datos y realizar el promedio mensual con ellos, y luego ponderar los promedios mensuales para obtener el promedio anual. Pero el problema está en que si no incluyo las horas de baja altitud solar se tienen prácticamente todos los días con datos faltantes.

Bueno, muchas gracias desde ya.
Saludos,

Agustín

En respuesta a Agustin Iba

Re: Parte c) - Completado de Datos

de Fuad Jorge Haffar Nemnom -

Buen día, también me pasa que después del filtrado de calidad hay días que me quedan solo con 3 horas de medidas.

Por otra parte, en las series temporales tengo un fenómeno medio raro entre febrero y abril donde los valores de la componente difusa son altos y por ende la directa me da valores muy bajos y parece estar incompleta en la gráfica en esos meses.

Tenía entendido que para determinar los promedios diarios, debemos tomar en cuenta las primeras horas de la mañana ya que sino estaríamos subestimando la medida.

Cuando dicen que para los siguientes ejercicios (d, e, f...) se deben usar el set de datos completados, quieren decir completados y FILTRADOS? 

Muchas gracias,

Saludos.

En respuesta a Fuad Jorge Haffar Nemnom

Re: Parte c) - Completado de Datos

de Jhonnatan Uzuriaga Ospina -

Hola Fuad, ¿Qué tal?


El fenómeno raro entre febrero y abril, tal vez es algo que mencionó rodrigo con respecto a un posible desalineamiento del tracker, en ese periodo encontré que GHI=DHI, si superpones las series vas a ver lo que digo, entonces esos datos yo los filtré de mi serie DHI.


Saludos,


Johnnatan

En respuesta a Jhonnatan Uzuriaga Ospina

Re: Parte c) - Completado de Datos

de Rodrigo Alonso -

Estimados,

Creo que todos están dando en el calvo por aquí. Aprovecho para aclarar algunas cosas:

* En efecto, lo normal es que el filtrado de calidad elimine muestras de sol bajo, dado que allí hay más error porcentual en la medida. Por otro lado, si uno quiere realizar acumulados diarios, no puede sistemáticamente perder dos horas por día. Tampoco está garantizado que los datos satélitales tengan bajo error en esas horas, por lo que pueden no pasar algunos filtros.

* Lo que se puede hacer es no considerar para el filtrado de datos las horas de sol bajo o realizar un filtrado más laxo. Una opción para estas horas sería topear valores (por ejemplo, kt), en vez de filtrarlos. Esto se puede aplicar ya sea a la serie de datos original o a la serie de datos completados, pero la idea es que en la serie completada haya la mayor completitud posible de datos. A modo de referencia, yo llegué a un 100% de completitud del data set completado, jugando entre filtros, completado con satélite y topeos, y con gráficos de dispersión de buen aspecto. No pierdan horas de sol bajo por filtrados exhaustivos, que luego les van a afectar su cálculos mensuales y anuales.

* Si uno llega a un data set completado con un porcentaje de datos faltantes (por ejemplo, de 5% o 10%), lo mejor es calcular el total anual como indica Agustín, lo que es un poco más robusto ante los huecos. Calculan el promedio diario de cada mes, y luego construyen el total anual haciendo (31*ENE + 28* FEB + ... +31*DIC) / 365. Dependiendo de las decisiones de filtrado y completado que tomen, les puede pasar que les queden algunos huecos: esto es perfectamente posible. Acá no hay un "método o elección correcta", y nada más, si no más bien que hay procedimientos razonables y no razonables. Lo razonable o no se define por si afecta significativamente o no la cuenta o análisis que uno quiere hacer.

* Respecto a la pregunta de Fuad, para las siguientes partes lo que se pide es usar el set de datos más completo que hayan podido construir. Esto sería el set de datos completado, quizá, con algún topeo posterior para asegurar tener diagramas de dispersión razonables entre las variables.

* Lo que comenta Johnnatan en su último post es correcto.

Saludos, Rodrigo