Regressão não linear

1. Exemplo

Modelos volumétricos são ferramentas importantes para a estimação do volume de árvores individuais e, consequentemente, do estoque volumétrico das florestas.

Sejam os seguintes dados de cubagem rigorosa, salvos em arquivo com nome de “exemplo”, onde foram obtidos os volumes (vol), os diâmetros a 1,30m do solo (dap) e as aturas totais das árvores (h) de 40 árvores:

Para entender o comportamento das variáveis, gráficos de distribuição dos volumes das árvores em relação ao seus diâmetros e alturas podem ser obtidos de acordo com os seguintes comandos:

Como resultado, tem-se uma figura com dois gráficos, onde observa-se a tendência não linear entre a variável volume (vol) e as variáveis dap e h:

As tendências apresentadas podem ser representadas pelo seguinte modelo alométrico:

Considerando que as árvores de mesmo diâmetro podem apresentar diferentes alturas, o modelo anterior pode ser modificado, definindo o modelo de Schumacher e Hall (1933), que é amplamente empregado para estimar o volume das árvores das florestas, cuja funcional é:

O modelo volumétrico anterior é um modelo não linear. Assim sendo, diferentemente dos modelos lineares, cujas estimativas dos parâmetros podem ser obtidas por meio de um sistema de equações normais (com solução única), que minimiza a soma de quadrados dos resíduos (MQO) ou maximiza a probabilidade de ocorrência (MVS), as estimativas dos parâmetros dos modelos não lineares são obtidas por meio de algoritmos numéricos.

De posse de estimativas iniciais dos parâmetros dos modelos, um procedimento iterativo (procedimento que gera uma sequência de soluções aproximadas que vão melhorando conforme iterações são executadas) vai encontrando as estimativas dos β`s que minimizem, por exemplo, a soma de quadrados dos resíduos.

Entre os métodos de solução (algoritmos) destacam-se: o de Marquardt, Gauss-Newton, Newton-Raphson, entre outros, disponíveis em softwares de estatística em rotinas ou bibliotecas, que permitem a estimação dos parâmetros de um modelo não linear, por diferentes métodos de estimação.

No software R, pode ser utilizado o pacote “nlme” e os seguintes comandos para o ajustar a equação referente ao modelo de Schumacher e Hall (1933):

Como todo procedimento de regressão não linear, há a necessidade de fornecer estimativas iniciais dos parâmetros para que o algoritmo encontre as estimativas dos parâmetros. Para o modelo de Schumacher e Hall (1933), se os valores iniciais forem b0=0,0001; b1=2; e b2=1, estas são estimativas bem realistas em função da origem do modelo e das variáveis envolvidas.

O resultado dos ajuste, após 11 iterações para a convergência dos parâmetros, foi:

O coeficiente de determinação não é uma estatística apresentada no ajuste de modelos não lineares, contudo é possível calculá-lo, por meio dos comandos a seguir, para possibilitar a comparação com as estatísticas de equações lineares. Neste caso, a literatura denomina esta medida de precisão como coeficiente de determinação empírico ou eficiência do modelo (CRESCENTE-CAMPO et al., 2010).

A estimativa do coeficiente de determinação empírico (R²), é:

É possível avaliar o ajuste da equação também por meio de gráficos utilizando os seguintes comandos:

Os gráficos resultantes, são:

2. Referência bibliográfica

CRESCENTE-CAMPO, F.; SORES, P.; TOMÉ, M.; DIÉGUEZ-ARANDA, U. Modelling annual individual-tree growth and mortality of Scots pine with data obtained at irregular measurement intervals and containing missing observations. Forest Ecology and Management, v.260, p.1965–1974. 2010