Gen Command In Stata Forex


AVISO: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisas Digitais e Educação Ajude o Grupo de Consultoria Estatal, dando um presente Notas da Classe Stata Contagem de n para N Introdução A Stata possui duas variáveis ​​incorporadas chamadas n e N. N é a notação Stata para o número de observação atual. N é 1 na primeira observação, 2 no segundo, 3 no terceiro e assim por diante. N é a notação de Stata para o número total de observações. Vamos ver como n e N funcionam. Como você pode ver, o ID da variável contém o número de observação que corre de 1 a 7 e nt é o número total de observações, que é 7. Contar com o uso de n e N em conjunto com o comando pode produzir alguns resultados muito úteis. É claro que, para usar o comando por nós, primeiro devemos classificar nossos dados na variável por variável. Agora n1 é o número de observação dentro de cada grupo e n2 é o número total de observações para cada grupo. Para listar a pontuação mais baixa para cada grupo, use o seguinte: Para listar a pontuação mais alta para cada grupo, use o seguinte: Outro uso de n Permite usar n para descobrir se existem números de identificação duplicados nos seguintes dados: As observações 6 e 7 têm os mesmos números de identificação e valores de pontuação diferentes. Encontrando Duplicados Agora, use N para encontrar observações duplicadas. Neste exemplo, classificamos as observações por todas as variáveis. Em seguida, usamos toda a variável na instrução by e definimos set n igual ao número total de observações que são idênticas. Finalmente, listamos as observações para as quais N é maior que 1, identificando as observações duplicadas. Se você tem muitas variáveis ​​no conjunto de dados, pode demorar muito tempo para digitá-las duas vezes. Podemos fazer uso do curinga para indicar que desejamos usar todas as variáveis. Além disso, nas versões mais recentes do Stata, podemos combinar classificar e em uma única declaração. Abaixo está uma versão simplificada do código que renderá exatamente os mesmos resultados acima. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software da Universidade da Califórnia. NOTICE: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar Manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisa e Educação Digital Ajudar o Grupo de Consultoria Estatal, dando um presente Módulo de Aprendizado Stata Criando e recodificando variáveis ​​Este módulo mostra como criar e recodificar variáveis. Na Stata você pode criar novas variáveis ​​com gerar e você pode modificar os valores de uma variável existente com substituição e com recodificação. Computação de novas variáveis ​​usando gerar e substituir Vamos usar os dados automaticamente para nossos exemplos. Nesta seção, veremos como calcular variáveis ​​com gerar e substituir. O comprimento variável contém o comprimento do carro em polegadas. Abaixo, veremos estatísticas resumidas para o comprimento. Permite usar o comando generate para criar uma nova variável que tenha o comprimento em pés em vez de polegadas, chamado lenft. Devemos enfatizar que gerar é criar uma nova variável. Para uma variável existente, você precisa usar o comando substituir (não gerar). Conforme mostrado abaixo, usamos substituição para repetir a atribuição para lenft. A sintaxe de gerar e substituir é idêntica, exceto: - gerar trabalhos quando a variável ainda não existe e dará um erro se a variável já existir. - substituir obras quando a variável já existe e dará um erro se a variável ainda não existir. Suponhamos que queríamos fazer uma variável chamada length2 que tenha um comprimento quadrado. Ou talvez possamos fazer loglen, que é o log natural do comprimento. Permite obter o desvio padrão e médio do comprimento e podemos fazer escores Z de comprimento. A média é 187,93 e o desvio padrão é 22,27, portanto, o zlength pode ser calculado como mostrado abaixo. Com gerar e substituir você pode usar - para adição e subtração que você pode usar para multiplicação e divisão que você pode usar para expoentes (por exemplo, comprimento2), você pode usar () para controlar a ordem das operações. Recodificação de novas variáveis ​​usando gerar e substituir Suponha que queríamos quebrar o mpg em três categorias. Vamos ver uma tabela de mpg para ver onde podemos desenhar as linhas para essas categorias. Permite converter mpg em três categorias para ajudar a tornar isso mais legível. Aqui convertem o mpg em três categorias usando gerar e substituir. Vamos usar tabulações para verificar se isso funcionou corretamente. Na verdade, você pode ver que um valor de 1 para mpg3 vai de 12-18, um valor de 2 vai de 19-23 e um valor de 3 vai de 24-41. Agora, poderíamos usar mpg3 para mostrar uma tabela de crosstag de mpg3 por estrangeiros para contrastar a quilometragem dos carros estrangeiros e domésticos. A tabela de referência acima mostra que 21 dos carros domésticos se enquadram na categoria de alta quilometragem, enquanto 55 dos carros estrangeiros se enquadram nesta categoria. Recodificação de variáveis ​​usando recode Existe uma maneira mais fácil de recodificar mpg para três categorias usando gerar e recodificar. Primeiro, fazemos uma cópia do mpg. Chamando mpg3a. Então, usamos recode para converter o mpg3a em três categorias: min-18 em 1, 19-23 em 2 e 24-max em 3. Permite verificar novamente se isso funcionou corretamente. Vemos que funcionou perfeitamente. Recodes com se permite criar uma variável chamada mpgfd que avalia a quilometragem dos carros em relação à sua origem. Deixe esta ser uma variável de 01 chamada mpgfd, que é: 0 se abaixo da mediana mpg para o seu grupo (domínios estrangeiros) 1 se atabove o mpg médio para o seu grupo (domínios estrangeiros). Nós vemos que a mediana é de 19 para os carros domésticos (estrangeiros) e 24,5 para os carros estrangeiros (estrangeiros1). Os comandos de geração e recodificação abaixo recodam o mpg para o mpgfd com base na mediana do carro doméstico para os carros domésticos e com base na mediana do carro estrangeiro para os carros estrangeiros. Podemos verificar usando isso abaixo, e o valor recodificado mpgfd parece correto. Crie uma nova variável que seja comprimento dividido por 12. Mude os valores de uma variável existente chamada lenft. Recode mpg em mpg3. Tendo três categorias usando gerar e substituir se. Recode mpg em mpg3a. Tendo três categorias, 1 2 3, usando gerar e recodificar. Recode mpg em mpgfd. Tendo duas categorias, mas usando diferentes pontos de corte para carros estrangeiros e domésticos. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia. Para perguntas rápidas, envie um email para dataprinceton. edu. Não há appts. Necessário durante as horas de caminhada. Nota: o laboratório DSS está aberto enquanto o Firestone estiver aberto, sem compromissos necessários para usar os computadores do laboratório para sua própria análise. Criando e Modificando Variáveis ​​Antes de ler isso, certifique-se de que você entende aproximadamente quais são as variáveis ​​Stata e como elas funcionam. Nossa página em Dados, Datasets e Variáveis ​​é um bom lugar para começar. Comandos de criação de variáveis ​​Os comandos básicos para criar novas variáveis ​​e modificar velhas em Stata são gerados (gen abreviado), egen e substituir. O comando gen variablename algo cria uma nova variável chamada variablename e a diferencia de algo. Algo pode ser um número simples, uma string, uma expressão matemática ou uma função de outras variáveis. Para obter informações sobre as funções do gen, procure funções na ajuda online do Statas. Para obter informações sobre as funções egen, procure por egen. O comando substituir é usado para fazer alterações nas variáveis ​​existentes: Substituir funciona com todas as funções gen, mas não com funções egen. No entanto, você pode usar substituir para modificar variáveis ​​criadas por egen, bem como as criadas por gen. Você normalmente quer usar o substituto para etapas secundárias e posteriores em criações de variáveis ​​de várias etapas, assim como a usamos aqui. É uma má prática escrever sobre as variáveis ​​existentes, porque se você cometeu um erro, não há como recuperar os dados originais. Por exemplo, mesmo se você decidiu que só se preocupava com a relação de engrenagem arredondada para o número inteiro mais próximo, substitua a rodada dentada (gearratio, 1) não é recomendado. É sempre melhor criar uma nova variável. O qualificador if O qualificador if é usado para isolar um conjunto de observações com variáveis ​​que atendem a alguns critérios específicos. Os valores nas variáveis ​​em um conjunto de dados são comparados com valores em outras variáveis ​​ou em números ou strings usando operadores de comparação lógica. Isso é muito usado para criar variáveis ​​dummy, indicadores de 0-1 usados ​​para indicar se algo é verdadeiro ou falso. NOTICE: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos . Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisas Digitais e Educação Ajude o Grupo de Consultoria Estatal, dando um presente Notas da Classe Stata Contagem de n para N Introdução A Stata possui duas variáveis ​​incorporadas chamadas n e N. N é a notação Stata para o número de observação atual. N é 1 na primeira observação, 2 no segundo, 3 no terceiro e assim por diante. N é a notação de Stata para o número total de observações. Vejamos como n e N funcionam. Como você pode ver, o ID da variável contém o número de observação que corre de 1 a 7 e nt é o número total de observações, que é 7. Contar com o uso de n e N em conjunto com o comando pode produzir alguns resultados muito úteis. É claro que, para usar o comando por nós, primeiro devemos classificar nossos dados na variável por variável. Agora n1 é o número de observação dentro de cada grupo e n2 é o número total de observações para cada grupo. Para listar a pontuação mais baixa para cada grupo, use o seguinte: Para listar a pontuação mais alta para cada grupo, use o seguinte: Outro uso de n Permite usar n para descobrir se existem números de identificação duplicados nos seguintes dados: As observações 6 e 7 têm os mesmos números de identificação e valores de pontuação diferentes. Encontrando Duplicados Agora, use N para encontrar observações duplicadas. Neste exemplo, classificamos as observações por todas as variáveis. Em seguida, usamos toda a variável na instrução by e definimos set n igual ao número total de observações que são idênticas. Finalmente, listamos as observações para as quais N é maior que 1, identificando as observações duplicadas. Se você tem muitas variáveis ​​no conjunto de dados, pode demorar muito tempo para digitá-las duas vezes. Podemos fazer uso do curinga para indicar que desejamos usar todas as variáveis. Além disso, nas versões mais recentes do Stata, podemos combinar classificar e em uma única declaração. Abaixo está uma versão simplificada do código que renderá exatamente os mesmos resultados acima. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.

Comments