Este artigo descreve a sintaxe da fórmula e o uso da FUNÇÃO PROJ.LIN no Microsoft Excel. Encontre links para informações adicionais sobre como criar gráficos e realizar uma análise de regressão na seção Consulte também.

Descrição

A função PROJ.LIN calcula as estatísticas para uma linha usando o método "quadrados mínimos" para calcular uma linha reta que melhor se ajusta aos seus dados e retorna uma matriz que descreve essa linha. Você também pode combinar a função PROJ.LIN com outras funções para calcular as estatísticas de outros tipos de modelos que são lineares nos parâmetros desconhecidos, incluindo séries polinomiais, logarítmicas, exponenciais e de potência. Como essa função retorna uma matriz de valores, ela deve ser inserida como uma fórmula de matriz. Instruções acompanham os exemplos neste artigo.

A equação para a linha é:

y = mx + b

-ou-

y = m1x1 + m2x2 + ... + b

se existirem vários intervalos de valores x, em que os valores y dependentes são uma função dos valores x independentes. Os valores m são coeficientes que correspondem a cada valor x e b é um valor constante. Observe que y, x e m podem ser vetores. A matriz retornada pela função PROJ.LIN é {mn,mn-1,...,m1,b}. PROJ.LIN também pode retornar estatísticas de regressão adicionais.

Sintaxe

PROJ.LIN(val_conhecidos_y, [val_conhecidos_x], [constante], [estatísticas])

A sintaxe da função PROJ.LIN tem os seguintes ARGUMENTOS :

Sintaxe

Os dados estatísticos de regressão adicionais são:

Dados estatísticos Descrição
se1.se2.....sem Os valores de erro padrão para os coeficientes m1.m2.....mn.
seb O valor de erro padrão para a constante b (seb = #N/D quando constante é FALSO).
r2 O coeficiente de determinação. Compara os valores y estimados e reais e os intervalos no valor de 0 a 1. Se for 1, existe uma correlação perfeita no exemplo - não há diferença entre o valor y estimado e o valor y real. No outro extremo, se o coeficiente de determinação for 0, a equação de regressão não será útil na previsão de um valor y. Para obter informações sobre como r2 é calculado, consulte "Comentários", mais adiante neste tópico.
Sey O valor de erro para a estimativa de y.
S A estatística F, ou o valor de F observado. Use a estatística F para determinar se a relação observada entre as variáveis dependentes e independentes ocorre por acaso.
Df Os graus de liberdade. Use os graus de liberdade para ajudar a encontrar os valores F críticos em uma tabela estatística. Compare os valores encontrados na tabela com a estatística F retornada por PROJ.LIN de modo a determinar um nível de confiança para o modelo. Para obter informações sobre como df é calculado, consulte "Comentários", mais adiante neste tópico. O mostra o uso de F e df.
Ssreg A soma dos quadrados da regressão.
Ssresid A soma residual dos quadrados. Para obter informações sobre como ssreg e ssresid são calculados, consulte "Comentários" mais adiante neste tópico.

A ilustração a seguir mostra a ordem em que os dados estatísticos adicionais são fornecidos.

Planilha

Comentários

Inclinação (m):
Para calcular a inclinação de uma linha, frequentemente representada por m, use dois pontos da linha, (x1,y1) e (x2,y2); a inclinação será igual a (y2 - y1)/(x2 - x1).

Intercepto de y (b):
O intercepto de y de uma linha, frequentemente representado por b, é o valor de y no ponto em que a linha cruza o eixo y.

A equação de uma linha reta é y = mx + b. Uma vez fornecidos os valores de m e de b, você pode calcular qualquer ponto na linha inserindo o valor de y ou de x nessa equação. Você também pode usar a função TENDÊNCIA.

Inclinação:
ÍNDICE(PROJ.LIN(val_conhecidos_y;val_conhecidos_x);1)

Ponto de origem y:
ÍNDICE(PROJ.LIN(val_conhecidos_y;val_conhecidos_x);2)

Equação

Equação

onde x e y são exemplos de média, ou seja, x = MÉDIA(val_conhecidos_x) e y = MÉDIA(val_conhecidos_y).

Observação No Excel Web App, não é possível criar fórmulas de matriz.

=PROJ.LIN(valores y, valores x^COLUNA($A:$C))

funciona quando você tem uma única coluna de valores y e uma única coluna de valores x para calcular a aproximação cúbica (polinomial de ordem 3) do formato:

y = m1*x + m2*x^2 + m3*x^3 + b

Você pode ajustar essa fórmula para calcular outros tipos de regressão, mas em alguns casos é necessário o ajuste dos valores de saída e outras estatísticas.

Exemplos

Exemplo 1 - Inclinação e Intercepção de Y

Copie os dados de exemplo da tabela a seguir e cole-os na célula A1 de uma nova planilha do Excel. Para as fórmulas mostrarem resultados, selecione-as, pressione F2 e pressione Enter. Se precisar, você poderá ajustar as larguras das colunas para ver todos os dados.

y conhecido x conhecido
1 0
9 4
5 2
7 3
Resultado (declive) Resultado (interceptação y)
2 1
Fórmula (fórmula de matriz nas células A7:B7)
=PROJ.LIN(A2:A5;B2:B5;FALSO)

Exemplo 2 - Regressão Linear Simples

Copie os dados de exemplo da tabela a seguir e cole-os na célula A1 de uma nova planilha do Excel. Para as fórmulas mostrarem resultados, selecione-as, pressione F2 e pressione Enter. Se precisar, você poderá ajustar as larguras das colunas para ver todos os dados.

Mês Vendas
1 $3.100
2 $4.500
3 $4.400
4 $5.400
5 $7.500
6 $8.100
Fórmula Resultado
=SOMA(PROJ.LIN(B1:B6, A1:A6)*{9,1}) $11.000
Calcula a estimativa das vendas no nono mês, com base nas vendas dos meses de 2 a 6.

Exemplo 3 - Regressão Linear Múltipla

Copie os dados de exemplo da tabela a seguir e cole-os na célula A1 de uma nova planilha do Excel. Para as fórmulas mostrarem resultados, selecione-as, pressione F2 e pressione Enter. Se precisar, você poderá ajustar as larguras das colunas para ver todos os dados.

Área útil (x1) Salas (x2) Entradas (x3) Idade (x4) Valor estimado (y)
2310 2 2 20 $142.000
2333 2 2 12 $144.000
2356 3 1,5 33 $151.000
2379 3 2 43 $150.000
2402 2 3 53 $139.000
2425 4 2 23 $169.000
2448 2 1,5 99 $126.000
2471 2 2 34 $142.900
2494 3 3 23 $163.000
2517 4 4 55 $169.000
2540 2 3 22 $149.000
-234,2371645
13,26801148
0,996747993
459,7536742
1732393319
Fórmula (fórmula de matriz inserida em A14:A18)
=PROJ.LIN(E2:E12;A2:D12;VERDADEIRO;VERDADEIRO)

Exemplo 4 - Usando as Estatísticas de F e r2

No exemplo anterior, o coeficiente de determinação, ou r2, é 0,99675 (consulte a célula A17 no resultado para PROJ.LIN), o que indica uma forte relação entre as variáveis independentes e o preço de venda. Você pode usar a estatística F para determinar se esses resultados, com um valor de r2 tão alto, ocorreram por acaso.

Suponha, por agora, que na verdade não há relação entre as variáveis, mas que você selecionou uma amostra rara de 11 prédios que fará com que a análise estatística demonstre uma forte relação. O termo "Alfa" é usado para indicar a probabilidade de se concluir erroneamente que existe uma relação.

Os valores F e df no resultado da função PROJ.LIN podem ser usados para avaliar a probabilidade de ocorrer um valor mais alto de F por acaso. F pode ser comparado a valores críticos em tabelas de distribuição de F publicadas ou a função DISTF no Excel pode ser usada para calcular a probabilidade de ocorrer um valor de F maior por acaso. A distribuição apropriada de F possui graus v1 e v2 de liberdade. Se n for o número de pontos de dados e constante for VERDADEIRO ou estiver omitido, então v1 = n - df - 1 e v2 = df. (Se constante for FALSO, então v1 = n - df e v2 = df). A função DISTF - com a sintaxe DISTF(F,v1,v2) - retornará a probabilidade de um valor mais alto de F ocorrer por acaso. Nesse exemplo, df = 6 (célula B18) e F = 459,753674 (célula A18).

Supondo um valor de Alpha igual a 0.05, v1 = 11 - 6 - 1 = 4 e v2 = 6, o nível crítico de F e 4.53. Como F = 459.753674 é muito mais alto do que 4.53, é extremamente improvável que um valor de F tão alto tenha ocorrido por acaso (Com Alpha = 0.05, a hipótese de que não há relação entre val_conhecidos_y e val_conhecidos_x deve ser rejeitada quando F excede o nível crítico, 4.53). Você pode usar a função DISTF no Excel pode obter a probabilidade de que um valor F dessa magnitude tenha ocorrido por acaso. Por exemplo, DISTF(459,753674, 4, 6) = 1.37E-7, uma probabilidade extremamente baixa. Você pode concluir, seja encontrando o nível crítico de F em uma tabela ou usando a função DISTF, que a equação de regressão é útil na previsão do valor avaliado de prédios comerciais nesta área. Lembre-se que é crítica a utilização dos valores corretos de v1 e v2 calculados no parágrafo anterior.

Calculando as estatísticas de t

Outro teste hipotético pode determinar se um coeficiente de inclinação é útil para prever o valor estimado de um prédio no . Por exemplo, para testar o coeficiente de idade para significância estatística, divida -234,24 (coeficiente de idade da inclinação) por 13,268 (o valor de erro estimado para os coeficientes de idade na célula A15). A equação a seguir representa o valor de t observado:

t = m4 ÷ se4 = -234,24 ÷ 13,268 = -17,7

Se o valor absoluto de t for suficientemente alto, poderemos concluir que que o eficiente da curva é útil na estimativa do valor avaliado de um prédio comercial no . A tabela a seguir mostra os valores absolutos dos 4 valores observados de t.

Se você consultar uma tabela em um manual de estatística, você descobrirá que o valor t crítico e bicaudal com 6 graus de liberdade e Alfa = 0,05 é 2,447. Este valor crítico também pode ser obtido por meio da função INVT no Excel. INVT(0.05,6) = 2.447. Na medida em que o valor t absoluto (17,7) é maior que 2,447, a idade será uma variável importante para prever o valor estimado de um prédio. Cada uma das outras variáveis independentes pode ser testada para valor estatístico de maneira semelhante. Na tabela a seguir, encontram-se os valores t observados para cada variável independente:

Variável valor de t observado
Área útil 5,1
Número de salas 31,3
Número de entradas 4,8
Idade 17,7

Todos esses valores apresentam um valor absoluto maior que 2,447; dessa forma, todas as variáveis usadas na equação de regressão serão úteis para prever o valor estimado dos prédios dessa área.