Anúncio

Collapse
No announcement yet.

Ajuda urgente com problema de estatística!

Collapse

Ads nos topicos Mobile

Collapse

Ads Nos topicos Desktop

Collapse
X
Collapse
Primeira Anterior Próxima Última
 
  • Filtrar
  • Tempo
  • Show
Clear All
new posts

    Ajuda urgente com problema de estatística!

    Preciso de uma ajuda com o SPSS e um problema estatístico.

    O ficheiro é http://dl.dropbox.com/u/6887363/SAT_TRF.sav

    Os "tipo" 0 são os casos e os 1 os controlos. As amostras são independentes.
    Quero fazer uma comparação de médias da variável SAT_TRF, mas acontece que esta nos casos não tem uma distribução normal, ou mesmo que assumindo que sim por n>30, não tem simetria, por skewness/std error >1,96, pelo que penso que não posso usar os testes paramétricos para comparação de médias (T de Student e ANOVA), certo? É que se pudesse ficava com o problema resolvido, pois dá-me uma diferença com significância estatística. Não há outra maneira de comparar médias?

    Usando um teste não paramétrico de comparação de medianas (k samples), assume a hipótese nula de igualdade entre os grupos, o que não me dá jeito nenhum...

    Alguém me arranja uma maneira de transformar a variável de modo a que fique com distribuição normal em ambos os grupos, para usar os testes paramétricos? Já andei a experimentar com logaritmos e outras fórmulas, mas se normaliza num grupo, estraga noutro...

    Ajudem-me os experts, que o meu crash-course de bioestatística e SPSS não me dá para mais...

    #2
    se puderes traduzir para português

    Comentário


      #3
      Originalmente Colocado por Avant Ver Post
      Preciso de uma ajuda com o SPSS e um problema estatístico.

      O ficheiro é http://dl.dropbox.com/u/6887363/SAT_TRF.sav

      Os "tipo" 0 são os casos e os 1 os controlos. As amostras são independentes.
      Quero fazer uma comparação de médias da variável SAT_TRF, mas acontece que esta nos casos não tem uma distribução normal, ou mesmo que assumindo que sim por n>30, não tem simetria, por skewness/std error >1,96, pelo que penso que não posso usar os testes paramétricos para comparação de médias (T de Student e ANOVA), certo? É que se pudesse ficava com o problema resolvido, pois dá-me uma diferença com significância estatística. Não há outra maneira de comparar médias?

      Usando um teste não paramétrico de comparação de medianas (k samples), assume a hipótese nula de igualdade entre os grupos, o que não me dá jeito nenhum...

      Alguém me arranja uma maneira de transformar a variável de modo a que fique com distribuição normal em ambos os grupos, para usar os testes paramétricos? Já andei a experimentar com logaritmos e outras fórmulas, mas se normaliza num grupo, estraga noutro...

      Ajudem-me os experts, que o meu crash-course de bioestatística e SPSS não me dá para mais...
      Agora não tenho tempo para te tentar ajudar com grande profundidade, mas muito rapidamente ocorre-me o seguinte:

      1. Idealmente, para fazeres testes paramétricos a distribuição tem de ser normal e tem de haver homogeneidade dos resíduos (acho que é qualquer coisa deste género).
      2. Os testes paramétricos têm alguma robustez contra partidas da normalidade, mas é necessário muito cuidado para justificar coisas dessas (eu normalmente não arrisco, para não levar no lombo mais tarde).
      3. Podes testar diferentes transformações dos dados: raíz quadrada, logarítmica, arcsin, etc (tens aqui várias opções: Handbook of Biological Statistics: Data transformations)
      4. Podes sempre fazer testes não-paramétricos, tipo Mann-Whitney ou outro (não vi os teus dados para tentar perceber qual o teste mais adequado). Este site (Statistical Guides and SPSS Tutorials by Laerd Statistics) tem instruções muito simples de como trabalhar com o SPSS, incluindo como escolher o teste mais adequado, consoante o tipo de dados e o que se pretende, basta "clicares" em SPSS Tutorials e escolher o que se pretende. Podes também ler o separador Statistical Guides e Statistical Test Selector. São conteúdos muito simples e em linguagem relativamente pouco técnica.

      Espero ter ajudado (também não sou nenhum especialista), boa sorte!

      Comentário


        #4
        Originalmente Colocado por Florestal Ver Post
        Agora não tenho tempo para te tentar ajudar com grande profundidade, mas muito rapidamente ocorre-me o seguinte:

        1. Idealmente, para fazeres testes paramétricos a distribuição tem de ser normal e tem de haver homogeneidade dos resíduos (acho que é qualquer coisa deste género).
        2. Os testes paramétricos têm alguma robustez contra partidas da normalidade, mas é necessário muito cuidado para justificar coisas dessas (eu normalmente não arrisco, para não levar no lombo mais tarde).
        3. Podes testar diferentes transformações dos dados: raíz quadrada, logarítmica, arcsin, etc (tens aqui várias opções: Handbook of Biological Statistics: Data transformations)
        4. Podes sempre fazer testes não-paramétricos, tipo Mann-Whitney ou outro (não vi os teus dados para tentar perceber qual o teste mais adequado). Este site (Statistical Guides and SPSS Tutorials by Laerd Statistics) tem instruções muito simples de como trabalhar com o SPSS, incluindo como escolher o teste mais adequado, consoante o tipo de dados e o que se pretende, basta "clicares" em SPSS Tutorials e escolher o que se pretende. Podes também ler o separador Statistical Guides e Statistical Test Selector. São conteúdos muito simples e em linguagem relativamente pouco técnica.

        Espero ter ajudado (também não sou nenhum especialista), boa sorte!
        Ajudaste, fui pesquisar na web o Mann-Whitney U test, e parece-me ser o que procuro. É um teste não paramétrico de comparação de médias, ou seja, afere se a diferença de média entre 2 grupos independentes tem significado ou não, certo? Pelo que eu tinha visto nos testes não paramétricos do SPSS não tinha chegado a essa conclusão...
        Recordava-me vagamente que era um teste para variáveis nominais, mas afinal parece que pode ser aplicado a variáveis continuas com um intervalo.

        Mann-Whitney U Test in SPSS - Setup and Procedure

        Tentei fazer várias transformações, mas se facilmente conseguia uma distribuição normal nos casos, perdia a que tinha nos controlos... mas parece-me que o Mann-whitney serve perfeitamente para o que eu quero, e até me dá significância estatística para a diferença entre as médias, coisa que não conseguia com as k samples das medianas...

        Mas aceitam-se mais sugestões e opiniões...

        Comentário


          #5
          Originalmente Colocado por nathaniel Ver Post
          se puderes traduzir para português
          Eu traduzo:

          A estatística é a arte de torturar os números até eles nos dizerem o que nós queremos ouvir...

          Comentário


            #6
            Originalmente Colocado por Avant Ver Post
            Eu traduzo:

            A estatística é a arte de torturar os números até eles nos dizerem o que nós queremos ouvir...
            cá para mim, os números é que vos torturam

            Comentário


              #7
              Não podes baixar o limite de confiança para os 90% em vez dos 95%?
              É que com uma assimetria para dados normalizados >1,96 não vejo outra alternativa.

              Os teus dados já estão normalizados, trasformar esses dados para os "normalizar ainda mais não é viável, e usar testes não paramétricos para os teus dados retiraria á partida significancia aos resultados pois não me parecem ser os testes mais indicados dado o enunciado.

              Tenta baixar o limite de confiança.

              Testes não parametricos só mesmo quando não há volta a dar á normalidade.

              Comentário


                #8
                Originalmente Colocado por nathaniel Ver Post
                cá para mim, os números é que vos torturam
                PhD oblige... Tem sempre que ter umas estatísticas catitas...

                Comentário


                  #9
                  Originalmente Colocado por Foliv Ver Post
                  Não podes baixar o limite de confiança para os 90% em vez dos 95%?
                  É que com uma assimetria para dados normalizados >1,96 não vejo outra alternativa.

                  Os teus dados já estão normalizados, trasformar esses dados para os "normalizar ainda mais não é viável, e usar testes não paramétricos para os teus dados retiraria á partida significancia aos resultados pois não me parecem ser os testes mais indicados dado o enunciado.

                  Tenta baixar o limite de confiança.

                  Testes não parametricos só mesmo quando não há volta a dar á normalidade.
                  Não, não é nada habitual apresentar os resultados com um IC de 90%...
                  Mas usando o Mann-Whitney dá-me um p bastante razoável para rejeitar a hipótese nula das médias serem iguais, a minha pergunta é, tecnicamente está mal usar um teste não paramétrico?

                  Comentário


                    #10
                    Originalmente Colocado por Avant Ver Post
                    Não, não é nada habitual apresentar os resultados com um IC de 90%...
                    Mas usando o Mann-Whitney dá-me um p bastante razoável para rejeitar a hipótese nula das médias serem iguais, a minha pergunta é, tecnicamente está mal usar um teste não paramétrico?
                    Pois, eu sei que apresentar resultados para 90% em vez de 95% é raro, mas lá vem a regra dos dados reais: Não adaptar os dados a um modelo estatistico, mas sim o modelo aos dados.
                    Por isso mesmo é que existem os intervalos de confiança inferiores.

                    De qualquer modo, a adopção de um modelo estatistico em detrimento de outro, mesmo com resultados semelhantes ou melhores, está sempre nos pressupostos de cada modelo.
                    Os dados tem que cumprir a totalidade dos pressupostos para poderem ser validamente aplicados, muitas vezes apesar de existirem alternativas estatisticas, na pratica acabamos por não ter escolha.

                    Os testes não parametricos são usados como alternativa aos parametricos somente quando os dados não dão outra escolha ( seja por serem n<30, dados não ordinais, por grandes desvios á normalidade etc...)
                    No entanto podem ser usados caso demonstrem ser mais adequados, e este é o truque, tens que justificar a tua escolha do modelo com argumentos cabais.

                    Posto isto (que já sabias), recomendo que recorras a um especialista para dar uma vista de olhos, e te dar os argumentos para substanciar a tua decisão.

                    Comentário


                      #11
                      Originalmente Colocado por Foliv Ver Post
                      Pois, eu sei que apresentar resultados para 90% em vez de 95% é raro, mas lá vem a regra dos dados reais: Não adaptar os dados a um modelo estatistico, mas sim o modelo aos dados.
                      Por isso mesmo é que existem os intervalos de confiança inferiores.

                      De qualquer modo, a adopção de um modelo estatistico em detrimento de outro, mesmo com resultados semelhantes ou melhores, está sempre nos pressupostos de cada modelo.
                      Os dados tem que cumprir a totalidade dos pressupostos para poderem ser validamente aplicados, muitas vezes apesar de existirem alternativas estatisticas, na pratica acabamos por não ter escolha.

                      Os testes não parametricos são usados como alternativa aos parametricos somente quando os dados não dão outra escolha ( seja por serem n<30, dados não ordinais, por grandes desvios á normalidade etc...)
                      No entanto podem ser usados caso demonstrem ser mais adequados, e este é o truque, tens que justificar a tua escolha do modelo com argumentos cabais.

                      Posto isto (que já sabias), recomendo que recorras a um especialista para dar uma vista de olhos, e te dar os argumentos para substanciar a tua decisão.
                      A justificação que vou dar é mesmo essa, a distribuição no grupo dos casos não é normal, justificada com um Shapiro-Wilk com uma significância de 0,001, e mesmo assumindo a normalidade para o T de student por n>30, a distribuição não é simétrica por skewness/std. error = 2,98, pelo que se optou por um teste não paramétrico (Mann-Whitney) - este rejeita a hipótese nula de as médias serem normais, com um p=0,028.

                      Por exemplo, o histograma da distribuição desta variável é qualquer coisa assim:


                      Acho que até dava um ataque a um estatístico se metesse isto um teste paramétrico...

                      Esta conversa vai ser a mesma para muitas outras variáveis (são só 109... ) pois os resultados laboratoriais num grupo de doentes raramente se apresentam com uma distribuição normal...

                      Bem, vou escrever assim e logo se vê, se estiver bem para o orientador, está bem para mim...
                      Editado pela última vez por Avant; 18 December 2011, 19:09.

                      Comentário

                      AD fim dos posts Desktop

                      Collapse

                      Ad Fim dos Posts Mobile

                      Collapse
                      Working...
                      X