Como outros implicam, a questão pode ser respondida fazendo uma distribuição normal com a mesma média e SD. Mas as respostas seriam (1) não exatamente reprodutíveis, exceto com a mesma semente e o mesmo programa (2) amplamente considerado como indefensável estatisticamente minimamente, isso precisaria de explicações e justificativas muito cuidadosas. Este é um comentário estatístico, mas minha opinião é que não devemos incentivar o uso de software estatístico para fins mal escolhidos. Caso contrário, eu concordo com TWL: mostre a média - alguns múltiplos do SD como um gráfico de resumo bruto. Ndash Nick Cox 13 de março 14 às 20:40 Heres uma maneira de fazê-lo em R. Se você tem acesso aos pontos de dados individuais, você pode fazer algo como o seguinte: Se você tiver apenas as estatísticas de resumo, você pode alterar manualmente Valores para as estatísticas de box-and-whisker da seguinte forma: Os números acima estão em ordem: menor dovo, caixa inferior, linha média, caixa superior, bigode superior. Você pode alterar esses números para qualquer valor que você tiver, da seguinte maneira: Ou mude os valores individuais da seguinte maneira: Em seguida, redesenhe o gráfico: Isso é muito rápido e sujo, mas espero que você o comece. Alguns Comandos do Stata Comandos gerais de traçado Traçar um Histograma de uma variável: gráfico vn, bin (xx) Traçar um histograma de uma variável usando freqüências: gráfico vn, bin (xx) freq Traçar um histograma de uma variável com uma aproximação normal: gráfico vn, bin (xx) norma onde xx É o número de caixas. Traçar um boxplot de uma variável: graph vn, box Traçar parcelas de caixa lado a lado para uma variável (vone) por categorias de outra variável vtwo. (Vtwo deve ser categórico): classifique vtwo graph vone, box by (vtwo) Um gráfico de dispersão de duas variáveis: graph vone vtwo Uma matriz de gráficos de dispersão para três variáveis: gráfico vone vtwo vthr, matriz Um gráfico de dispersão de duas variáveis com Os valores de uma terceira variável usada no lugar dos pontos no gráfico (vthr pode conter valores numéricos ou indicar categorias, como masculino (m) e fêmea (f)): gráfico vone vtwo, símbolo (vthr) Planta de quantile normal: qnorm Vn Comandos gerais Para calcular meios e desvios padrão de todas as variáveis: resumir ou, usando uma abreviatura, summ Para calcular meios e desvios padrão de variáveis selecionadas: resuma vone vtwo vthr ou, usando uma abreviatura, summ vone vtwo vthr Para obter mais resumos numéricos Para uma variável: summ vone, detalhe Correlação entre duas variáveis: correlate vone vtwo Para ver todos os valores (todas as variáveis e todas as observações, não recomendadas para grandes conjuntos de dados): lista Para listar valores para duas variáveis: list vone vtwo Para listar o primeiro Valor 10 S para duas variáveis: list vone vtwo em 110 Para listar os últimos 10 valores para duas variáveis: list vone vtwo in -10l (O fim deste comando é menos 10letter l.) Tabelas Tabular variável vn: tabular vn ou, usando uma abreviatura , Tabulação vn Tabulação cruzada de duas variáveis: tab vone vtwo Tabuleiro cruzado duas variáveis, inclua uma ou mais opções para produzir porcentagens de coluna, linha ou célula e para suprimir a impressão de freqüências: guia vone vtwo, célula de linha de coluna Gerando novas variáveis gerais. Gerar índice de casos 1,2, ldots, n) (isso pode ser útil se você classificar os dados, então deseja restaurar os dados para o formulário original sem recarregar os dados): gerar caso n ou, usando uma abreviatura, gen casen Multiplique valores em vx por b e adicione um. Armazenar resultados em vy: gen vy a b vx Gerar uma variável com todos os valores 0: gen vone0 Gerar uma variável com valores 0 a menos que vtwo seja maior que c. Em seguida, faça o valor 1: gen vone0 substitua vone1 se vtwogtc números aleatórios. Defina números de observações para n. Definir semente de número aleatório para XXXX, o padrão é 1000: definir semente XXXX Gerar n variáveis aleatórias uniformes (chance igual de todos os resultados entre 0 e 1: gen vnuniform () Gerar n variáveis aleatórias uniformes (chance igual de todos os resultados entre uma E b. Gen vna (ba) uniforme () Gerar n variáveis aleatórias uniformes discretas (chance igual de todos os resultados entre 1 e 6) (Estes comandos simulam rodar um dado de seis lados): gen vn1int (6uniform ()) Dados normais com média 0 e desvio padrão 1: gen vn invnorm (uniforme ()) Dados normais com média mu e desvio padrão sigma. Gen vn mu sigma invnorm (uniforme ()) Regressão Calcula a linha de regressão simples (vy é resposta, vx é preditor): regredir Vy vx Calcule as previsões, crie uma nova variável yhat: preveja yhat Produza o gráfico de dispersão com a linha de regressão adicionada: gráfico vy yhat vx, conecte o símbolo (.s) (oi) Calcule os resíduos, crie nova variável tt residuals: preveja resíduos, resida Produza um residual Gráfico com linha horizontal a 0: resíduos do gráfico, y Linha (0) Identifique os pontos com os maiores e menores resíduos: classifique a lista de resíduos na lista 15 em -5l (O último comando é menos 5 letra l). Calcule a equação de regressão múltipla (vy é resposta, vone, vtwo e vthr são preditores): Regredir vy vone vtwo vthr Notas importantes sobre o comando do caule Existe uma falha com o comando Statas stem para parcelas de haste e folha. A função do caule parece reordenar permanentemente os dados para que eles sejam classificados de acordo com a variável que o gráfico de haste e folha foi plotado. A melhor maneira de evitar esse problema é evitar fazer parcelas de haste e folha (fazer histogramas em vez disso). No entanto, se você realmente quer fazer um gráfico de haste e folha, você sempre deve criar uma variável contendo os números de observação originais (chamado índice, por exemplo). Um comando para o fazer é: gerar índice n Se você fizer isso, você pode ordenar novamente os dados após o gráfico de haste e folha de acordo com a variável de índice (comando Stata: classificar índice) para que os dados voltem A ordem original. Comandos. Aqui estão alguns outros comandos que você pode achar úteis (esta não é, de modo algum, uma lista exaustiva de todos os comandos do Stata): operação geral de ANOVA, ANCOVA ou repetição de regressão para categorias de intervalos de confiança variáveis para significa limitações do conjunto de dados anterior correlação de memória insuficiente Entre variáveis descreve brevemente os dados (de obs, nomes de variáveis, etc.) distribuição de parcelas de diagnóstico elimina variáveis de memória melhor alternativa para entrada para Macs cria novas variáveis (por exemplo, gerar anos de início próximo) comando gráfico geral (este comando possui muitas opções) Permite selecionar um subconjunto de observações (p. Ex., Lista se o raio gt 3000) ler o conjunto de dados do formato não-Stata (arquivo ASCII ou texto) digitar a lista de dados brutos o conjunto inteiro de dados na memória (você também pode listar apenas certas variáveis) salvar ou imprimir Stata ouput (exceto gráficos) pesquisa por palavra-chave de comandos, muitas vezes precursor para ajudar oneway análise de variância coeficientes de correlação parcial text-mode (crude) scatterplots calculado predito val Ues (y-hat), resíduos (ordinário, padronizado e studentized), alavancas, distância de Cooks, erro padrão do indivíduo predito y. Erro padrão do significado previsto y. Erro padrão de residual da regressão
No comments:
Post a Comment