somatório [RESOLVIDO]

1. somatório [RESOLVIDO]

Andre Carvalho
TimMaiaMagro

(usa Outra)

Enviado em 02/07/2023 - 15:00h

olá,
na imagem abaixo tem uma fórmula para calcular o valor de um coeficiente r, mas não sei como escrever a fórmula no python. como eu poderia escreve-la?


  


2. Re: somatório [RESOLVIDO]

Jeffersson Abreu
ctw6av

(usa Nenhuma)

Enviado em 02/07/2023 - 16:26h

Poderia ser um pouco mais específico? Qual parte está com dificuldade?


3. Re: somatório [RESOLVIDO]

Lisandro Guerra
Lisandro

(usa Arch Linux)

Enviado em 03/07/2023 - 05:49h

Não é necessário escrever esta fórmula em Python a bilblioteca Pandas já faz isso e muito mais.

Com uma rápida busca na internet vais conseguir muitos exemplos.


Como este que pega as listas de um CSV:

import pandas as pd
from scipy.stats import pearsonr
df = pd.read_csv("meus_dados.csv")
list1 = df['educacao']
list2 = df['renda']
corr, _ = pearsonr(list1, list2)
print('Pearsons correlation: %.3f' % corr)


Abraço


4. Re: somatório [RESOLVIDO]

Andre Carvalho
TimMaiaMagro

(usa Outra)

Enviado em 03/07/2023 - 14:49h


Lisandro escreveu:

Não é necessário escrever esta fórmula em Python a bilblioteca Pandas já faz isso e muito mais.

Com uma rápida busca na internet vais conseguir muitos exemplos.


Como este que pega as listas de um CSV:

import pandas as pd
from scipy.stats import pearsonr
df = pd.read_csv("meus_dados.csv")
list1 = df['educacao']
list2 = df['renda']
corr, _ = pearsonr(list1, list2)
print('Pearsons correlation: %.3f' % corr)


Abraço


obrigado pela ajuda, mas tenho que usar a fórmula dada pela questão


5. Re: somatório [RESOLVIDO]

Andre Carvalho
TimMaiaMagro

(usa Outra)

Enviado em 03/07/2023 - 21:20h


ctw6av escreveu:

Poderia ser um pouco mais específico? Qual parte está com dificuldade?

na imagem anexada tem a fórmula de um coeficiente r e não sei como escreve-la no python




6. Re: somatório

Buckminster
Buckminster

(usa Debian)

Enviado em 04/07/2023 - 11:07h

Você sabe o que significa na fórmula o símbolo de somatório (sigma, Σ), índice i, etc?

Mas enfim, caso não souber montar o algoritmo a partir da fórmula, leia isto:
http://www.de.ufpb.br/~luiz/AED/Aula9.pdf
http://www.clbo.ufba.br/BioStat2005_2/Aula_1.pdf <<< este é bem resumido, mas simples de entender
https://pt.khanacademy.org/math/ap-calculus-ab/ab-integration-new/ab-6-3/a/review-summation-notation
https://statplace.com.br/blog/coeficientes-de-correlacao/

Mas vai uma dica.

Na fórmula: somatório de xiyi = x1.y1 + x2.y2 + x3.y3 + ... + xn.yn <<< somatório dos produtos (veja pdf [aula 1] no link acima).
Tem 27 parcelas (estados do Brasil), no caso 27 é o n.
O índice i = 1 é o primeiro valor da variável "x" (Educação) e da variável "y" (Renda).
Perceba na primeira linha (Acre) da tabela que x1 = 0,692 e y1 = 0,655 e na última (Tocantins) x27 = 0,732 e y27 = 0,684.

xiyi = x1.y1 + x2.y2 + x3.y3 + ... + xn.yn
xiyi = 0,692.0,655(Acre) + 0,679.0,630(Alagoas) + 0,647.0,648(Amapá) + ... + 0,732.0,684(Tocantins)

No caso da primeira parte de cima da fórmula (antes do sinal de menos) é o somatório dos produtos; depois do sinal de menos (sinal de subtração) é o somatório simples de x multiplicado pelo somatório simples de y.
Embaixo no denominador temos na primeira parte a raiz quadrada do somatório dos quadrados de x (Acre x1= 0,692 ao quadrado) + (Alagoas x2= 0,679 ao quadrado) + (Amapá x3= 0,647 ao quadrado) + ... +(x27 ao quadrado) menos entre parênteses o somatório simples de x (0,692+0,679+0,647+...+0,732) tudo elevado ao quadrado no final do somatório; e isso multiplicado pela mesma coisa de y (a raiz quadrada do somatório dos quadrados de y menos entre parênteses o somatório simples de y todo ele elevado ao quadrado no final do somatório).

Fiz de cabeça agora aqui, pode ter alguma coisa faltando, mas pela dica você monta teu código em Python.
Não sei se ficou muito confusa a explicação.
Aqui não aceita (ou eu não sei fazer) xi com i menor. Tentei copiar e colar, mas não foi nem o sigma ali em cima.
Acredito que o código da biblioteca Pandas que o Lisandro enviou faça o mesmo cálculo, pois estamos falando do coeficiente de Pearson (o valor de "r" estará sempre no intervalo de -1 a 1), mas testa depois com o teu código só para confirmar se dá o mesmo resultado.

Veja nesse link
http://www.de.ufpb.br/~luiz/AED/Aula9.pdf
que a fórmula ali (Coeficiente de Correlação Linear de Pearson) é a mesma do teu problema, é o Coeficiente de Correlação Linear de Pearson.

Aqui tem em Python com explicações:
https://medium.com/omixdata/estat%C3%ADstica-an%C3%A1lise-de-correla%C3%A7%C3%A3o-usando-python-e-r-....

Aqui a mesma com Pandas:
https://acervolima.com/python-teste-de-correlacao-de-pearson-entre-duas-variaveis/


_________________________________________________________
Always listen the Buck!
Com raras exceções, não dou mais soluções prontas, somente dou dicas!


7. Re: somatório [RESOLVIDO]

Andre Carvalho
TimMaiaMagro

(usa Outra)

Enviado em 04/07/2023 - 18:53h


Buckminster escreveu:

Você sabe o que significa na fórmula o símbolo de somatório (sigma, &#931;), índice i, etc?

Mas enfim, caso não souber montar o algoritmo a partir da fórmula, leia isto:
http://www.de.ufpb.br/~luiz/AED/Aula9.pdf
http://www.clbo.ufba.br/BioStat2005_2/Aula_1.pdf <<< este é bem resumido, mas simples de entender
https://pt.khanacademy.org/math/ap-calculus-ab/ab-integration-new/ab-6-3/a/review-summation-notation
https://statplace.com.br/blog/coeficientes-de-correlacao/

Mas vai uma dica.

Na fórmula: somatório de xiyi = x1.y1 + x2.y2 + x3.y3 + ... + xn.yn <<< somatório dos produtos (veja pdf [aula 1] no link acima).
Tem 27 parcelas (estados do Brasil), no caso 27 é o n.
O índice i = 1 é o primeiro valor da variável "x" (Educação) e da variável "y" (Renda).
Perceba na primeira linha (Acre) da tabela que x1 = 0,692 e y1 = 0,655 e na última (Tocantins) x27 = 0,732 e y27 = 0,684.

xiyi = x1.y1 + x2.y2 + x3.y3 + ... + xn.yn
xiyi = 0,692.0,655(Acre) + 0,679.0,630(Alagoas) + 0,647.0,648(Amapá) + ... + 0,732.0,684(Tocantins)

No caso da primeira parte de cima da fórmula (antes do sinal de menos) é o somatório dos produtos; depois do sinal de menos (sinal de subtração) é o somatório simples de x multiplicado pelo somatório simples de y.
Embaixo no denominador temos na primeira parte a raiz quadrada do somatório dos quadrados de x (Acre x1= 0,692 ao quadrado) + (Alagoas x2= 0,679 ao quadrado) + (Amapá x3= 0,647 ao quadrado) + ... +(x27 ao quadrado) menos entre parênteses o somatório simples de x (0,692+0,679+0,647+...+0,732) tudo elevado ao quadrado no final do somatório; e isso multiplicado pela mesma coisa de y (a raiz quadrada do somatório dos quadrados de y menos entre parênteses o somatório simples de y todo ele elevado ao quadrado no final do somatório).

Fiz de cabeça agora aqui, pode ter alguma coisa faltando, mas pela dica você monta teu código em Python.
Não sei se ficou muito confusa a explicação.
Aqui não aceita (ou eu não sei fazer) xi com i menor. Tentei copiar e colar, mas não foi nem o sigma ali em cima.
Acredito que o código da biblioteca Pandas que o Lisandro enviou faça o mesmo cálculo, pois estamos falando do coeficiente de Pearson (o valor de "r" estará sempre no intervalo de -1 a 1), mas testa depois com o teu código só para confirmar se dá o mesmo resultado.

Veja nesse link
http://www.de.ufpb.br/~luiz/AED/Aula9.pdf
que a fórmula ali (Coeficiente de Correlação Linear de Pearson) é a mesma do teu problema, é o Coeficiente de Correlação Linear de Pearson.

Aqui tem em Python com explicações:
https://medium.com/omixdata/estat%C3%ADstica-an%C3%A1lise-de-correla%C3%A7%C3%A3o-usando-python-e-r-....

Aqui a mesma com Pandas:
https://acervolima.com/python-teste-de-correlacao-de-pearson-entre-duas-variaveis/


_________________________________________________________
Always listen the Buck!
Com raras exceções, não dou mais soluções prontas, somente dou dicas!


Obrigado






Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts