Teste de Lilliefors

O atendimento à pressuposição de normalidade dos dados é condição necessária para a realização de testes de hipóteses (teste t, teste F, ...), análises de delineamentos experimentais, bem como importante na análise dos resíduos de equações ajustadas para os mais diversos fins na mensuração florestal.

Para isso, existem diferentes testes estatísticos, como, por exemplo, Kolmogorov-Smirnov, Shapiro-Wilk e Lilliefors, que podem ser utilizados para esta finalidade.

A seguir será mostrado um exemplo da aplicação do teste de Lilliefors, cuja estatística é dada por:

As hipóteses do teste são:

Ho:. Os dados seguem a distribuição normal;

Ha:. Os dados não seguem a distribuição normal.

Em termos de interpretação da estatística anterior, o teste verifica se a distância máxima entre a distribuição de probabilidades acumuladas observadas padronizadas [F(xi)] e a distribuição acumulada teórica (distribuição de Z) [Fn(xi)] é estatisticamente significativa ou não, a um dado nível de probabilidade.

Exemplo:

Sejam os somatórios dos volumes das árvores dentro de 10 parcelas experimentais. Deseja-se saber se os dados observados possuem distribuição normal, a 5% de significância, pelo teste Lilliefors.

Para aplicação do teste alguns passos devem ser seguidos:

1) Ordenar os dados do menor para o maior valor de x;

2) Calcular a média, a variância e o desvio padrão dos dados;

     Para o exemplo:

3) Calcular Fn(xi) -  probabilidade acumulada da distribuição empírica (teórica) de x:

     Se n=10 observações, então tem-se: 1/10; 2/10 ... 10/10; 

4) Padronizar os dados, pela utilização da seguinte expressão:

5) Obter os valores de F(xi) - probabilidade acumulada padronizada dos valores observados de x na tabela de distribuição normal padronizada.

     Ex: Para o primeiro valor x = 13,

O respectivo valor tabelado F(xi) para Zi = - 1,33, será: 0,0918 (ver tabela abaixo):

6) Calcular:

                    

que são as distâncias verticais entre as distribuições acumuladas empírica e observada. Isso se faz necessário porque F(xi) é contínua e Fn(xi) é descontínua, conforme pode-se observar na figura abaixo.

7) Observar o valor máximo obtido e comparar com o valor tabelado, a um dado nível de significância (1% ou 5%);

8) Concluir sobre a distribuição dos dados (Ho/Ha).

Assim sendo, ou seja, seguindo os passos apresentados anteriormente, tem-se o seguinte quadro resumo:

A maior diferença entre as distribuições acumuladas é 0,1910. O valor tabelado para a definição do ponto crítico, considerando um nível de significância de 5% e 10 graus de liberdade é 0,258 (ver tabela abaixo).

Como a distância máxima (0,1910) é menor do que o valor tabelado (0,258), aceita-se a hipótese Ho, pelo teste de Lilliefors, ou seja, os dados seguem a distribuição normal.

No caso de rejeição da hipótese Ho, ou seja, os dados não seguem distribuição normal, pode-se transformar os dados para o atendimento da pressuposição e realizar as análises considerando os dados transformados. Entre as transformações mais utilizadas, tem-se: Logarítmo (Log ou Ln); Logarítmo + k (constante); Raiz quadrada - no casos de contagens; Padronização da variável para a distribuição Z.

 

Voltar ao Topo