Estimados,
Excelente la discusión. Varias cosas.
* Es posible llevar dos filtrados, uno para GHI y otro para DHI, y por varios motivos es deseable. Tienen filtros para GHI y filtros para DHI. Para los filtros que usan ambas, como por ejemplo los basados en fd, hay dos opciones: (i) filtrar ambas dado que este filtro no distingue qué medida es la errónea y (ii) filtrar solo la DHI, sobre la base de que la medida de global es más simple y se esperan menos errores en su medida. La opción (i) es más conservadora que la opción (ii), pero ambas son posibles. La opción (ii) preserva más datos medidos, lo cual es bueno. Antes de usar la opción (ii) yo fundamentaría, por inspección visual, que no se observan anomalías en la medida de GHI, por lo que se la toma como buena.
* En caso de tener filtrados distintos para GHI y DHI, deberán incluir dos Tablas de filtrado.
* Creo que están poniendo mucho acento en los filtros y poco en la inspección visual. Esto es normal, claro, pero recuerden que la inspección visual puede ser más detallada de lo que he visto en este hilo. Por ejemplo, los puntos que señala Jhonnatan son valores de fd ~ 1 para muchos valores de kt, incluso valores altos. Si hacen un diagrama fd vs kt previo al filtrado, van a encontrar muchos puntos en esta condición: esto es sospechoso de desalineamiento del tracker, dado que son muestras donde GHI y DHI son parecidos, incluso para kt alto, donde no debería ocurrir. Los desalineamiento típicamente ocurren durante algunos periodos de tiempo, no son, por ejemplo, un fenómeno que ocurra esporádicamente o intermitentemente. Por tanto, es sencillo detectar los periodos de desalineamiento del tracker (GHI = DHI y DNI = 0) desde una inspección visual de la serie temporal. Al detectar este problema, es un error evidente, y se puede eliminar manualmente seleccionando el periodo de tiempo erróneo. Este filtrado afectaría solo a la DHI, dado que la desalinación no afecta la medida de GHI.
* Los filtrados usualmente se realizan colocando Nan (u otro tag no numérico, o vaciando la celda) en el dato filtrado, no eliminando el registro (o la fila). Es recomendable que los vectores o columnas de GHI y DHI quedar siempre solidarios a la misma etiqueta temporal.
* Existen filtros de máxima y mínima para la DHI. Si los van a usar, sugiero que inspeccionen bien su funcionamiento y ajusten sus parámetros para que no sobre-filtren la serie, en especial para muestras muy nubladas o de sol bajo. Si los van a usar, pueden poner condiciones para aplicar estos filtros solo cuando no hay sol bajo o cuando no hay alta nubosidad.
Saludos, Rodrigo