library(bigmemory) library(bit) library(readr) # Usemos "resumen" para calcula el mínimo, media, maximo y largo de un vector resumen = function(x) c(min = min(x,na.rm=TRUE), media = mean(x,na.rm=TRUE), max = max(x,na.rm=TRUE),largo = length(x)) x = big.matrix(nrow = 1, ncol = 3, type = "double", init = 6, backingfile = "ejex_big_matrix.bin", # Representación bunaria a donde apunta descriptorfile = "ejex_big_matrix.desc") # Metadata ######### # Archivo de 875 Mb archivo1 = "~/Desktop/R ZORA Ejemplos/CLASE 1/minitrain.csv" # Archivo de 15 Gb archivo2 = "~/Desktop/R ZORA Ejemplos/CLASE 1/train_data.csv" bd = read.big.matrix(archivo1, header = TRUE,sep = ",", backingfile="ad2.bin", # representación binaria de la matriz en el disco descriptorfile="ad2.desc", # metadata ) dim(bd) head(bd) object.size(bd) td = read.big.matrix(archivo2, header = TRUE,sep = ",", backingfile="td2.bin", descriptorfile="td2.desc", ) dim(td) head(td) object.size(td) names(td) is(td) td4 = td[,4] resumen(td4)