Las variables aleatorias son independientes e idénticamente distribuidas (i.i.d.) si cada una de ellas tiene la misma distribución de probabilidad y todas son mutuamente independientes (la probabilidad de cada uno no depende de que el otro suceso ocurra o no, es decir, los dos sucesos no están relacionados).
Por ejemplo, si se tienen 10000 muestras dadas por una distribución uniforme y se calcula la media muchas veces con 100 diferentes muestras de ese conjunto, entonces la distribución de esas muestras tiende a una distribución gaussiana. El siguiente código de MATLAB ilustra la aplicación del teorema:
N = 1000000; x = rand(1,N); % Número de datos suficientemente grande% Medias muestrales a partir de la muestra inicial:n = 100; % Número de elementos en cada sumam = 10000; % Número de medias a calculary = zeros(1,m);for i=1:mind = randi([1 N],1,n); % Índices aleatorios para la selección de una submuestraS = 0;for k=1:nS = S + x(ind(k));endy(i) = S/n; % Cálculo de la mediaend% Error estándar = Desviación estándar de la mediamx = mean(x); estdx = std(x)/sqrt(n); % Error estándarmy = mean(y); stdy = std(y); % Desviación estándarsubplot(1,2,1), h1 = histogram(x); title({'Distribución uniforme';['Error estándar = ' num2str(estdx)]})xlabel('Valores'), ylabel('Número de casos'), line([mx mx],[0 max(h1.Values)],'Color','red','LineWidth',2)line([mx-estdx mx-estdx],[0 max(h1.Values)],'Color','black','LineWidth',1,'LineStyle','--')line([mx+estdx mx+estdx],[0 max(h1.Values)],'Color','black','LineWidth',1,'LineStyle','--')subplot(1,2,2), h2 = histogram(y); title({'Distribución de las medias';['Desviación estándar = ' num2str(stdy)]})xlabel('Valores'), ylabel('Número de casos'), line([my my],[0 max(h2.Values)],'Color','red','LineWidth',2)line([my-stdy my-stdy],[0 max(h2.Values)],'Color','black','LineWidth',1,'LineStyle','--')line([my+stdy my+stdy],[0 max(h2.Values)],'Color','black','LineWidth',1,'LineStyle','--')
El resultado se muestra en la figura de arriba.
No hay comentarios:
Publicar un comentario