Estatística matemática para especialistas em vários campos. Estatística matemática Estatística matemática

Estatística Matemática é um ramo moderno da ciência matemática que lida com a descrição estatística dos resultados de experimentos e observações, bem como construção modelos matemáticos contendo conceitos probabilidades. A base teórica da estatística matemática é teoria da probabilidade.

Na estrutura da estatística matemática, duas seções principais são tradicionalmente distinguidas: estatísticas descritivas e conclusões estatísticas (Fig. 1.1).

Figura: 1.1. As principais seções da estatística matemática

Estatísticas descritivas é usado para:

o generalização de indicadores de uma variável (estatísticas de uma amostra aleatória);

o identificação de relações entre duas ou mais variáveis \u200b\u200b(correlação e análise de regressão).

A estatística descritiva permite obter novas informações, compreendê-las rapidamente e avaliá-las de forma abrangente, ou seja, desempenha a função científica de descrever os objetos de pesquisa, o que justifica seu nome. Os métodos de estatística descritiva são projetados para transformar a totalidade dos dados empíricos individuais em um sistema de formas e números que são visuais para a percepção: distribuição de frequência; indicadores de tendências, variabilidade, comunicação. Esses métodos calculam as estatísticas de uma amostra aleatória, que servem de base para a implementação das conclusões estatísticas.

Resultados estatísticos dê a oportunidade:

o avaliar a precisão, confiabilidade e eficiência das estatísticas de amostra, encontrar erros que surgem no processo de pesquisa estatística (avaliação estatística)

o generalizar os parâmetros da população em geral obtidos com base em estatísticas amostrais (testando hipóteses estatísticas).

o objetivo principal pesquisa científica - é a aquisição de novos conhecimentos sobre uma grande classe de fenômenos, pessoas ou eventos, que geralmente são chamados de população em geral.

População geral é um conjunto completo de objetos de pesquisa, amostra - a sua parte, que se forma de uma determinada forma cientificamente fundamentada 2.

O termo "população em geral" é usado quando se trata de um grande, mas finito conjunto de objetos em estudo. Por exemplo, sobre a totalidade de candidatos na Ucrânia em 2009 ou a totalidade de crianças idade pré-escolar da cidade de Rivne. Populações gerais podem atingir volumes significativos, ser finitas e infinitas. Na prática, via de regra, trata-se de agregados finitos. E se a razão entre o tamanho da população e o tamanho da amostra for maior que 100, então, de acordo com Glass e Stanley, os métodos de estimativa para populações finitas e infinitas fornecem essencialmente os mesmos resultados. A população geral também pode ser chamada de conjunto completo de valores de algum atributo. O pertencimento da amostra à população em geral é a principal base para avaliar as características da população em geral pelas características da amostra.

a Principal idéia A estatística matemática é baseada na crença de que um estudo completo de todos os objetos da população em geral na maioria dos problemas científicos é praticamente impossível ou economicamente impraticável, uma vez que requer muito tempo e custos materiais significativos. Portanto, em estatística matemática, abordagem seletiva, cujo princípio é mostrado no diagrama da Fig. 1.2.

Por exemplo, de acordo com a tecnologia de formação, eles distinguem entre amostras aleatórias (simples e sistemáticas), estratificadas e agrupadas (ver Seção 4).

Figura: 1.2. Esquema de aplicação de métodos de estatística matemática de acordo com abordagem seletiva o uso de métodos matemáticos e estatísticos pode ser realizado na seguinte sequência (ver Fig. 1.2):

o com a população em geral, cujas propriedades estão sujeitas a pesquisa, determinado métodos de amostragem - um número típico, mas limitado de objetos aos quais métodos de pesquisa são aplicados;

o Como resultado de métodos de observação, ações experimentais e medições sobre objetos de amostra, dados empíricos são obtidos;

o processamento de dados empíricos usando métodos de estatística descritiva fornece indicadores de amostra, que são chamados de estatísticos - como o nome da disciplina, a propósito;

o aplicação de métodos de inferência estatística para estatístico, obter parâmetros que caracterizam as propriedades população geral.

Exemplo 1.1. Para avaliar a estabilidade do nível de conhecimento (variável X) teste de uma amostra aleatória de 3 alunos n. Os testes continham m tarefas, cada uma das quais foi avaliada de acordo com o sistema de pontos: "concluído" "- 1," não cumprido "- 0. O aproveitamento médio atual dos alunos permaneceu X

3 amostra aleatória (do inglês. Random - random) é uma amostra representativa, que é formada de acordo com a estratégia de testes aleatórios.

no nível dos anos anteriores / h? Sequência de solução:

o descobrir uma hipótese significativa como: "se os resultados do teste atual não diferem do passado, então o nível de conhecimento dos alunos pode ser considerado inalterado e o processo educacional é estável";

o formular uma hipótese estatística adequada, por exemplo, uma hipótese nula H 0 que "a pontuação média atual X não difere estatisticamente do indicador médio dos anos anteriores / h", isto é H 0: X \u003d / r, contra o correspondente hipótese alternativa X Ф ^;

o construir distribuições empíricas da variável X estudada;

o definir (se necessário) correlações, por exemplo, entre a variável X e outros indicadores, construir linhas de regressão;

o verificar a correspondência da distribuição empírica com a lei normal;

o avaliar o valor dos indicadores pontuais e o intervalo de confiança dos parâmetros, por exemplo, a média;

o definir um critério para verificação estatística hipóteses;

o realizar testes de hipóteses estatísticas com base nos critérios selecionados;

o formular uma decisão sobre a hipótese estatística nula em um determinado nível de significância;

o passar da decisão de aceitar ou rejeitar a hipótese nula estatística para interpretar as conclusões sobre a hipótese significativa;

o formular conclusões significativas.

Portanto, para resumir os procedimentos acima, o uso de métodos estatísticos consiste em três blocos principais:

A transição de um objeto de realidade para um esquema matemático e estatístico abstrato, ou seja, a construção de um modelo probabilístico de um fenômeno, processo, propriedade;

Realização de ações computacionais pelos próprios meios matemáticos no âmbito de um modelo probabilístico baseado nos resultados de medições, observações, experimentos e formulação de conclusões estatísticas;

Interpretação de conclusões estatísticas sobre a situação real e tomada de decisão adequada.

Os métodos estatísticos de processamento e interpretação de dados são baseados na teoria da probabilidade. A teoria da probabilidade é a base dos métodos da estatística matemática. Sem o uso de conceitos e leis fundamentais da teoria da probabilidade, é impossível generalizar as conclusões da estatística matemática e, portanto, usá-las de maneira razoável para fins científicos e práticos.

Portanto, a tarefa da estatística descritiva é transformar um conjunto de dados de amostra em um sistema de indicadores - estatísticas - distribuições de frequência, medidas de tendência central e variabilidade, coeficientes de correlação e semelhantes. No entanto, as estatísticas são características, de fato, de uma amostra particular. Claro, você pode calcular distribuições de amostra, médias de amostra, variâncias, etc., mas essa "análise de dados" tem valor científico e cognitivo limitado. A transferência "mecânica" de quaisquer conclusões feitas com base em tais indicadores para outros agregados não é correta.

Para poder transferir indicadores selecionados ou outros, ou para populações mais comuns, é necessário ter justificativa matemática provisões sobre a correspondência e capacidade das características da amostra às características dessas populações comuns ditas gerais. Tais disposições baseiam-se em abordagens teóricas e esquemas associados a modelos probabilísticos da realidade, por exemplo, na abordagem axiomática, na lei dos grandes números, etc. Só com a ajuda deles é possível transferir as propriedades que se estabelecem a partir dos resultados da análise de informações empíricas limitadas, ou para outros conjuntos comuns. Assim, a construção, as leis de funcionamento, o uso de modelos probabilísticos, é objeto de um campo matemático denominado “teoria da probabilidade”, torna-se a essência dos métodos estatísticos.

Assim, em estatística matemática, são utilizadas duas linhas paralelas de indicadores: a primeira linha, que é relevante para a prática (são indicadores de amostra) e a segunda, baseada na teoria (são indicadores de um modelo probabilístico). Por exemplo, as frequências empíricas, que são determinadas na amostra, correspondem ao conceito de probabilidade teórica; a média da amostra (prática) corresponde à expectativa matemática (teoria), etc. Além disso, em estudos, as características da amostra são geralmente primárias. São calculados a partir de observações, medidas, experimentos, após os quais passam por uma avaliação estatística de habilidade e eficiência, testam hipóteses estatísticas de acordo com os objetivos da pesquisa e, no final, são tomados com certa probabilidade como indicadores das propriedades das populações estudadas.

Questão. Tarefa.

1. Descreva as principais seções da estatística matemática.

2. Qual é a ideia principal da estatística matemática?

3. Descreva a proporção dos quadros geral e de amostra.

4. Explique o esquema de aplicação dos métodos de estatística matemática.

5. Indique uma lista das principais tarefas da estatística matemática.

6. Quais são os principais blocos de construção da aplicação de métodos estatísticos? Descreva-os.

7. Expanda a conexão da estatística matemática com a teoria da probabilidade.

A teoria da probabilidade e a estatística matemática são a base dos métodos probabilísticos e estatísticos de processamento de dados. E processamos e analisamos os dados principalmente para tomar decisões. Para usar o aparato matemático moderno, é necessário expressar os problemas em consideração em termos de modelos probabilísticos e estatísticos.

A aplicação de um método estatístico probabilístico específico consiste em três etapas:

A transição da realidade econômica, gerencial e tecnológica para um esquema matemático e estatístico abstrato, ou seja, construir um modelo probabilístico de um sistema de controle, processo tecnológico, procedimento de tomada de decisão, em particular, com base nos resultados de controle estatístico, etc.

Efectuar cálculos e obter conclusões por meios puramente matemáticos no quadro de um modelo probabilístico;

Interpretação de conclusões matemáticas e estatísticas em relação a uma situação real e tomada de decisão apropriada (por exemplo, sobre a conformidade ou não conformidade da qualidade do produto com os requisitos estabelecidos, a necessidade de ajustar o processo tecnológico, etc.), em particular, conclusões (sobre a proporção de unidades de produto defeituosas em um lote, sobre forma específica de leis de distribuição de parâmetros controlados do processo tecnológico, etc.).

A estatística matemática usa conceitos, métodos e resultados da teoria das probabilidades. A seguir, consideramos as principais questões da construção de modelos probabilísticos em situações econômicas, gerenciais, tecnológicas e outras. Ressaltamos que para o uso ativo e correto de documentos normativo-técnico e instrutivo-metodológicos sobre métodos estatísticos probabilísticos, é necessário um conhecimento prévio. Portanto, você precisa saber em que condições um determinado documento deve ser aplicado, quais informações iniciais devem estar disponíveis para sua seleção e aplicação, quais decisões devem ser tomadas com base nos resultados do processamento de dados, etc.

Exemplos de aplicação teoria da probabilidade e estatística matemática.Consideremos vários exemplos em que os modelos estatísticos probabilísticos são uma boa ferramenta para resolver problemas gerenciais, produtivos, econômicos e econômicos nacionais. Assim, por exemplo, no romance de A.N. Tolstoi "Caminhando pela agonia" (vol. 1) é dito: "a oficina dá vinte e três por cento do casamento, e você se atém a esse número", disse Strukov a Ivan Ilyich.

Como entender essas palavras na conversa dos gerentes de fábrica? Uma unidade de produto não pode estar 23% defeituosa. Pode ser bom ou com defeito. Provavelmente, Strukov quis dizer que um grande lote contém aproximadamente 23% dos itens com defeito. Então surge a pergunta: o que significa "aproximadamente"? Deixe que 30 entre 100 unidades de produção testadas sejam defeituosas, ou entre 1.000 - 300, ou entre 100.000 - 30.000, etc., Strukov deveria ser acusado de mentir?

Ou outro exemplo. A moeda a ser utilizada como lote deve ser "simétrica". Ao arremessá-lo, em média, na metade dos casos, o brasão (cabeças) deve cair, e na metade dos casos - a treliça (cauda, \u200b\u200bnúmero). Mas o que significa “média”? Se você realizar várias séries de 10 lançamentos em cada série, então haverá muitas séries em que a moeda cai 4 vezes com o emblema. Para uma moeda simétrica, isso ocorrerá em 20,5% da série. E se houver 40.000 brasões por 100.000 lançamentos, a moeda pode ser considerada simétrica? O procedimento de tomada de decisão é baseado na teoria da probabilidade e na estatística matemática.

O exemplo pode não parecer sério o suficiente. No entanto, não é. O sorteio é amplamente utilizado na organização de experimentos técnicos e econômicos industriais. Por exemplo, ao processar os resultados da medição do indicador de qualidade (momento de fricção) de rolamentos dependendo de vários fatores tecnológicos (a influência de um meio de conservação, métodos de preparação de rolamentos antes da medição, o efeito da carga do rolamento durante a medição, etc.). Digamos que seja necessário comparar a qualidade dos rolamentos em função dos resultados de seu armazenamento em diferentes óleos de preservação, ou seja, na composição de óleos E e AT... Ao planejar tal experimento, surge a questão de quais rolamentos devem ser colocados no óleo da composição E, e qual - na composição do óleo AT, mas de forma a evitar a subjetividade e garantir a objetividade da decisão. A resposta a esta questão pode ser obtida por sorteio.

Um exemplo semelhante pode ser dado com o controle de qualidade de qualquer produto. Para decidir se um lote controlado de produtos atende ou não aos requisitos estabelecidos, é retirada uma amostra do mesmo. Com base nos resultados da amostragem, é feita uma conclusão sobre todo o lote. Nesse caso, é muito importante evitar a subjetividade na seleção da amostra, ou seja, é necessário que cada item do lote controlado tenha a mesma probabilidade de ser selecionado na amostra. Em condições de produção, a seleção das unidades de produção na amostra geralmente é realizada não por lote, mas por tabelas especiais de números aleatórios ou com a ajuda de sensores de computador de números aleatórios.

Problemas semelhantes para garantir a objetividade da comparação surgem quando se comparam vários esquemas de organização da produção, remuneração, durante a realização de licitações e concursos, seleção de candidatos para cargos vagos, etc. Desenhos ou procedimentos semelhantes são necessários em todos os lugares.

Que seja necessário identificar o time mais forte e o segundo time mais forte ao organizar um torneio de acordo com o sistema olímpico (o perdedor é eliminado). Digamos que o time mais forte sempre vence o mais fraco. É claro que a equipe mais forte definitivamente se tornará a campeã. A segunda equipe mais forte chegará à final se e somente se não tiver jogos com o futuro campeão antes da final. Se tal jogo for planejado, o segundo time mais forte não chegará à final. Quem estiver planejando um torneio pode “nocautear” o segundo time mais forte do torneio antes do previsto, reunindo-o no primeiro encontro com o líder, ou dar a ele um segundo lugar, garantindo encontros com os times mais fracos até a final. Para evitar a subjetividade, muito se desenha. Para um torneio de 8 equipes, a probabilidade de que as duas equipes mais fortes se encontrem na final é de 4/7. Assim, com uma probabilidade de 3/7, o segundo time mais forte sairá do torneio antes do previsto.

Qualquer medida de unidades de produção (com um paquímetro, micrômetro, amperímetro, etc.) tem erros. Para saber se existem erros sistemáticos, é necessário fazer várias medições de uma unidade de produção cujas características são conhecidas (por exemplo, uma amostra padrão). Deve ser lembrado que além do erro sistemático, também existe um erro aleatório.

Portanto, surge a questão de como descobrir, a partir dos resultados da medição, se há um erro sistemático. Se observarmos apenas se o erro obtido na próxima medição é positivo ou negativo, então esse problema pode ser reduzido ao que já foi considerado. Na verdade, vamos comparar a medição com o lançamento de uma moeda, o erro positivo - com a queda do brasão, negativo - a rede (erro zero com um número suficiente de divisões de escala quase nunca ocorre). Então, verificar a ausência de um erro sistemático é equivalente a verificar a simetria da moeda.

Assim, o problema de verificar a ausência de um erro sistemático reduz-se ao problema de verificar a simetria de uma moeda. O raciocínio acima leva ao chamado "critério de sinal" em estatística matemática.

Com a regulação estatística dos processos tecnológicos com base nos métodos da estatística matemática, desenvolvem-se regras e planos de controlo estatístico dos processos, visando a detecção atempada de perturbações nos processos tecnológicos e a tomada de medidas para os ajustar e evitar a libertação de produtos que não cumpram os requisitos estabelecidos. Essas medidas visam reduzir os custos de produção e as perdas com o fornecimento de produtos abaixo do padrão. Com o controle estatístico de aceitação, baseado em métodos de estatística matemática, os planos de controle de qualidade são desenvolvidos por meio da análise de amostras de lotes de produtos. A dificuldade está em conseguir construir corretamente modelos probabilísticos e estatísticos de tomada de decisão. Em estatística matemática, modelos probabilísticos e métodos para testar hipóteses foram desenvolvidos para isso, em particular, hipóteses de que a proporção de unidades de produto defeituosas é igual a um certo número. r 0 , por exemplo, r 0 \u003d 0,23 (lembre-se das palavras de Strukov do romance de A.N. Tolstoi).

Tarefas de avaliação. Em várias situações gerenciais, produtivas, econômicas e econômicas nacionais, surgem problemas de um tipo diferente - o problema de avaliar as características e os parâmetros das distribuições de probabilidade.

Vejamos um exemplo. Deixe o lote de N lâmpadas. Deste lote, uma amostra com um volume de n lâmpadas. Uma série de questões naturais surgem. Como, com base nos resultados dos testes dos elementos da amostra, determinar a vida útil média das lâmpadas elétricas, com que precisão essa característica pode ser estimada? Como a precisão muda se você pegar uma amostra maior? Em quantas horas T pode ser garantido que pelo menos 90% das lâmpadas durarão T e mais horas?

Suponha que ao testar uma amostra de tamanho n lâmpadas estavam com defeito X lâmpadas. Quais limites podem ser especificados para o número D lâmpadas com defeito em um lote, para o nível de defeito D/ N etc?

Ou, na análise estatística da precisão e estabilidade dos processos tecnológicos, é necessário avaliar indicadores de qualidade como o valor médio do parâmetro controlado e o grau de sua dispersão no processo em questão. De acordo com a teoria da probabilidade, é aconselhável usar sua expectativa matemática como o valor médio de uma variável aleatória e variância, desvio padrão ou coeficiente de variação como uma característica estatística do spread. Surgem as perguntas: como avaliar essas características estatísticas a partir de dados de amostra, com que precisão isso pode ser feito?

Existem muitos exemplos semelhantes. Foi importante aqui mostrar como a teoria da probabilidade e a estatística matemática podem ser usadas em problemas de engenharia e gerenciamento.

Compreensão moderna de estatística matemática. Estatística matemática é entendida como “uma secção da matemática dedicada aos métodos matemáticos de recolha, sistematização, processamento e interpretação de dados estatísticos, bem como a sua utilização para conclusões científicas ou práticas. As regras e procedimentos da estatística matemática baseiam-se na teoria da probabilidade, o que permite avaliar a exatidão e confiabilidade das conclusões obtidas em cada problema com base no material estatístico disponível. ” Nesse caso, os dados estatísticos são chamados de informações sobre o número de objetos em algum conjunto mais ou menos extenso que possuem certas características.

De acordo com o tipo de problema a ser resolvido, a estatística matemática normalmente é dividida em três seções: descrição dos dados, estimativa e teste de hipóteses.

Pelo tipo de dados estatísticos processados, a estatística matemática é dividida em quatro direções:

Estatísticas unidimensionais (estatísticas variáveis \u200b\u200baleatórias), em que o resultado da observação é descrito por um número real;

Análise estatística multivariada, onde o resultado da observação de um objeto é descrito por vários números (vetor);

Estatísticas de processos aleatórios e séries temporais, onde o resultado da observação é uma função;

Estatísticas de objetos de natureza não numérica, em que o resultado da observação é de natureza não numérica, por exemplo, é um conjunto (figura geométrica), uma ordenação, ou é obtido como resultado de medição por um atributo qualitativo.

Historicamente, as primeiras a aparecer foram algumas áreas de estatísticas de objetos de natureza não numérica (em particular, problemas de estimar a proporção de casamento e testar hipóteses sobre ele) e estatísticas unidimensionais. O aparato matemático é mais simples para eles, portanto, por seu exemplo, as idéias básicas da estatística matemática são geralmente demonstradas.

Apenas aqueles métodos de processamento de dados, ou seja, as estatísticas matemáticas são evidenciais, baseadas em modelos probabilísticos dos fenômenos e processos reais correspondentes. Estamos falando de modelos de comportamento do consumidor, da ocorrência de riscos, do funcionamento de equipamentos tecnológicos, da obtenção dos resultados de um experimento, do curso da doença, etc. Um modelo probabilístico de um fenômeno real deve ser considerado construído se as quantidades em consideração e as relações entre elas forem expressas em termos de teoria da probabilidade. Conformidade com o modelo probabilístico da realidade, ou seja, sua adequação é comprovada, em particular, com o auxílio de métodos estatísticos de teste de hipóteses.

Os métodos de processamento de dados improváveis \u200b\u200bsão exploratórios, podendo ser usados \u200b\u200bapenas para análises preliminares de dados, uma vez que não permitem avaliar a exatidão e a confiabilidade das conclusões obtidas com base em material estatístico limitado.

Métodos probabilísticos e estatísticos são aplicáveis \u200b\u200bsempre que for possível construir e substanciar um modelo probabilístico de um fenômeno ou processo. Seu uso é obrigatório quando as conclusões tiradas de uma amostra de dados são transferidas para toda a população (por exemplo, de uma amostra para um lote inteiro de produtos).

Em áreas específicas de aplicação, tanto os métodos probabilístico-estatísticos de ampla aplicação quanto os específicos são usados. Por exemplo, na seção de gerenciamento da produção dedicada aos métodos estatísticos de gerenciamento da qualidade do produto, estatísticas matemáticas aplicadas (incluindo experimentos de planejamento) são usados. Utilizando os seus métodos, é efectuada uma análise estatística da exactidão e estabilidade dos processos tecnológicos e uma avaliação estatística da qualidade. Os métodos específicos incluem métodos de controle estatístico de aceitação da qualidade do produto, regulamentação estatística de processos tecnológicos, avaliação e controle de confiabilidade, etc.

Essas disciplinas probabilísticas e estatísticas aplicadas, como teoria da confiabilidade e teoria das filas, são amplamente utilizadas. O conteúdo do primeiro fica claro pelo nome, o segundo estuda sistemas como uma central telefônica, que recebe ligações em horários aleatórios - requisitos dos assinantes que discam números em seus telefones. A duração do atendimento a essas reivindicações, ou seja, a duração das conversas também é modelada com variáveis \u200b\u200baleatórias. Uma grande contribuição para o desenvolvimento dessas disciplinas foi feita pelo membro correspondente da Academia de Ciências da URSS A.Ya. Khinchin (1894-1959), acadêmico da Academia de Ciências do SSR ucraniano B.V. Gnedenko (1912-1995) e outros cientistas domésticos.

Resumidamente sobre a história da estatística matemática. A estatística matemática como ciência começa com os trabalhos do famoso matemático alemão Karl Friedrich Gauss (1777-1855), que, com base na teoria da probabilidade, investigou e fundamentou o método dos mínimos quadrados, criado por ele em 1795 e usado para processar dados astronômicos (a fim de esclarecer a órbita do planeta menor Ceres). Seu nome é freqüentemente chamado de uma das distribuições de probabilidade mais populares - normal, e na teoria dos processos aleatórios, o principal objeto de estudo são os processos gaussianos.

No final do século XIX. - o início do século XX. uma grande contribuição para a estatística matemática foi feita por pesquisadores ingleses, principalmente K. Pearson (1857-1936) e R.A. Fisher (1890-1962). Em particular, Pearson desenvolveu o teste “qui-quadrado” para testar hipóteses estatísticas, e Fisher desenvolveu a análise de variância, a teoria do projeto experimental e a probabilidade máxima de estimativa de parâmetro.

Na década de 30 do século XX. Pole Jerzy Neumann (1894-1977) e o inglês E. Pearson desenvolveram uma teoria geral de teste de hipóteses estatísticas, e os matemáticos soviéticos Academician A.N. Kolmogorov (1903-1987) e membro correspondente da Academia de Ciências da URSS N.V. Smirnov (1900-1966) lançou as bases para a estatística não paramétrica. Na década de quarenta do século XX. O romeno A. Wald (1902-1950) construiu uma teoria de análise estatística sequencial.

A estatística matemática está se desenvolvendo rapidamente atualmente. Assim, nos últimos 40 anos, quatro áreas fundamentalmente novas de pesquisa podem ser distinguidas:

Desenvolvimento e implementação de métodos matemáticos para planejamento de experimentos;

Desenvolvimento de estatísticas de objetos de natureza não numérica como uma direção independente na estatística matemática aplicada;

Desenvolvimento de métodos estatísticos estáveis \u200b\u200bem relação a pequenos desvios do modelo probabilístico utilizado;

Ampla implantação de trabalhos na criação de pacotes de softwares de computador voltados para análise estatística de dados.

Métodos estatísticos probabilísticos e otimização. A ideia de otimização permeia a estatística matemática aplicada moderna e outros métodos estatísticos. Nomeadamente, métodos de planejamento de experimentos, controle de aceitação estatística, regulação estatística de processos tecnológicos, etc. Por outro lado, as formulações de otimização na teoria da tomada de decisão, por exemplo, a teoria aplicada de otimização da qualidade do produto e requisitos de padrões, proporcionam o uso generalizado de métodos probabilísticos e estatísticos, principalmente estatística matemática aplicada.

Na gestão da produção, em particular, ao otimizar a qualidade do produto e os requisitos das normas, é especialmente importante aplicar métodos estatísticos na fase inicial do ciclo de vida do produto, ou seja, na fase de pesquisa e desenvolvimento de desenvolvimentos de projeto experimental (desenvolvimento de requisitos promissores para produtos, projeto preliminar, especificações técnicas para o desenvolvimento de projeto experimental). Isso se deve às informações limitadas disponíveis no estágio inicial do ciclo de vida do produto e à necessidade de prever as capacidades técnicas e a situação econômica para o futuro. Os métodos estatísticos devem ser aplicados em todas as fases da resolução do problema de otimização - ao dimensionar variáveis, desenvolver modelos matemáticos para o funcionamento de produtos e sistemas, conduzir experimentos técnicos e econômicos, etc.

Todas as áreas de estatísticas são usadas em tarefas de otimização, incluindo otimização da qualidade do produto e requisitos de padrões. Nomeadamente, estatísticas de variáveis \u200b\u200baleatórias, análise estatística multivariada, estatísticas de processos aleatórios e séries temporais, estatísticas de objetos de natureza não numérica. Recomendações sobre a escolha de um método estatístico para analisar dados específicos foram desenvolvidas.

Inglês: A Wikipedia está tornando o site mais seguro. Tu es usando um navegador antigo que não será capaz de se conectar à Wikipedia no futuro. Atualize seu dispositivo ou entre em contato com o administrador de TI.

中文: 维基 百科 正在 使 网站 更加 安全。 您 正在 使用 旧 的 浏览 器, 这 在 将来 无法 连接 维基 百科。 请 更新 您 的 设备 或 联络 您 的 IT 管理员。 以下 提供 更长 , 更具 技术性 的 更新 仅. )。

Español: Wikipedia está haciendo o site más seguro. Usted está usando um navegador web viejo que não será capaz de conectarse a Wikipedia no futuro. Actualice su dispositivo o contate um administrador informático. Más abajo hay una atualização más larga y más técnica en portugués.

ﺎﻠﻋﺮﺒﻳﺓ: ويكيبيديا تسعى لتأمين الموقع أكثر من ذي قبل. أنت تستخدم متصفح وب قديم لن يتمكن من الاتصال بموقع ويكيبيديا في المستقبل. يرجى تحديث جهازك أو الاتصال بغداري تقنية المعلومات الخاص بك. يوجد تحديث فني أطول ومغرق في التقنية باللغة الإنجليزية تاليا.

Français: Wikipédia va bientôt augmenter la sécurité de son site. Vous utilisez atuellement un Browsur web ancien, qui ne pourra plus se connecter à Wikipedia lorsque ce sera fait. Merci de mettre à jour votre appareil ou de contacter votre administrateur informatique à cette fin. Des informations supplémentaires plus technical et en anglais sont disponibles ci-dessous.

日本語: ウ ィ キ ペ デ ィ ア で は サ イ ト の セ キ ュ リ テ ィ を 高 め て い ま す. ご 利用 の ブ ラ ウ ザ は バ ー ジ ョ ン が 古 く, 今後, ウ ィ キ ペ デ ィ ア に 接 続 で き な く な る 可能性 が あ り ま す. デ バ イ ス を 更新 す る か, IT 管理者 に ご 相 談 く だ さ い. 技術 面 の 詳 し い 更新 情報 は 以下 に 英語 で 提供 し て い ま す。

Deutsch: Wikipedia erhöht die Sicherheit der Webseite. Du benutzt einen alten Webbrowser, der em Zukunft nicht mehr auf Wikipedia zugreifen können wird. Bitte aktualisiere dein Gerät oder sprich deinen Administrador de TI an. Ausführlichere (und technisch detailliertere) Hinweise findest Du unten in englischer Sprache.

Italiano: Wikipedia sta rendendo il sito più sicuro. Esteja usando um navegador da web que não está em conformidade com a Wikipedia no futuro. Por favor, aggiorna il seu dispositivo ou contatta il tuo amministratore informatico. Più in basso está disponibile un aggiornamento più dettagliato and tecnico in English.

Magyar: Biztonságosabb lesz a Wikipédia. A böngésző, amit használsz, nem lesz képes kapcsolódni a jövőben. Használj modernebb szoftvert vagy jelezd a problems a rendszergazdádnak. Alább olvashatod a részletesebb magyarázatot (angolul).

Svenska: Wikipedia gör sidan mer säker. Du använder en äldre webbläsare som inte kommer att kunna läsa Wikipedia i framtiden. Uppdatera din enhet eller kontakta din IT-administratör. Det finns en längre e mer teknisk förklaring på engelska längre ned.

हिन्दी: विकिपीडिया साइट को और अधिक सुरक्षित बना रहा है। आप एक पुराने वेब ब्राउज़र का उपयोग कर रहे हैं जो भविष्य में विकिपीडिया से कनेक्ट नहीं हो पाएगा। कृपया अपना डिवाइस अपडेट करें या अपने आईटी व्यवस्थापक से संपर्क करें। नीचे अंग्रेजी में एक लंबा और अधिक तकनीकी अद्यतन है।

Estamos removendo o suporte para versões inseguras do protocolo TLS, especificamente TLSv1.0 e TLSv1.1, que o software do seu navegador usa para se conectar aos nossos sites. Isso geralmente é causado por navegadores desatualizados ou smartphones Android mais antigos. Ou pode ser interferência de software corporativo ou pessoal de "Web Security", que na verdade reduz a segurança da conexão.

Você deve atualizar seu navegador da web ou corrigir este problema para acessar nossos sites. Esta mensagem permanecerá até 1º de janeiro de 2020. Após essa data, seu navegador não será capaz de estabelecer uma conexão com nossos servidores.


Conteúdo.

1. Introdução:
- Como a teoria da probabilidade e a estatística matemática são usadas? - p. 2
- O que é "estatística matemática"? - p. 3
2) Exemplos de aplicação da teoria da probabilidade e estatística matemática:
- Amostra. - pág. 4
- Tarefas de avaliação. - p. 6
- Métodos estatísticos probabilísticos e otimização. - p. 7
3) Conclusão.

Introdução.

Como a teoria da probabilidade e a estatística matemática são usadas? Essas disciplinas são a base dos métodos probabilísticos e estatísticos de tomada de decisão. Para usar seu aparato matemático, é necessário expressar os problemas de tomada de decisão em termos de modelos estatísticos probabilísticos. A aplicação de um método específico de tomada de decisão probabilística-estatística consiste em três etapas:
- transição da realidade econômica, gerencial e tecnológica para um esquema matemático e estatístico abstrato, ou seja, construir um modelo probabilístico de um sistema de controle, processo tecnológico, procedimento de tomada de decisão, em particular, com base nos resultados de controle estatístico, etc.
- realizar cálculos e obter conclusões por meios puramente matemáticos no âmbito de um modelo probabilístico;
- interpretação de conclusões matemáticas e estatísticas em relação a uma situação real e tomada de decisão adequada (por exemplo, sobre a conformidade ou não conformidade da qualidade do produto com os requisitos estabelecidos, a necessidade de ajustar o processo tecnológico, etc.), em particular, conclusões (sobre a proporção de unidades de produto defeituosas em um lote, na forma específica das leis de distribuição dos parâmetros controlados do processo tecnológico, etc.).

A estatística matemática usa conceitos, métodos e resultados da teoria das probabilidades. Consideremos as principais questões da construção de modelos probabilísticos de tomada de decisão em situações econômicas, gerenciais, tecnológicas e outras. Para o uso ativo e correto de documentos normativo-técnico e instrucional-metodológicos sobre métodos estatísticos probabilísticos de tomada de decisão, é necessário conhecimento preliminar. Portanto, você precisa saber em que condições um determinado documento deve ser aplicado, quais informações iniciais são necessárias para sua seleção e aplicação, quais decisões devem ser tomadas com base nos resultados do processamento de dados, etc.

O que é "estatística matemática"? Estatística matemática é entendida como “uma secção da matemática dedicada aos métodos matemáticos de recolha, sistematização, processamento e interpretação de dados estatísticos, bem como a sua utilização para conclusões científicas ou práticas. As regras e procedimentos da estatística matemática baseiam-se na teoria da probabilidade, o que permite avaliar a exatidão e confiabilidade das conclusões obtidas em cada problema com base no material estatístico disponível. ” Ao mesmo tempo, os dados estatísticos referem-se a informações sobre o número de objetos em algum conjunto mais ou menos extenso que possuem certas características.

De acordo com o tipo de problema a ser resolvido, a estatística matemática normalmente é dividida em três seções: descrição dos dados, estimativa e teste de hipóteses.

Pelo tipo de dados estatísticos processados, a estatística matemática é dividida em quatro direções:

Estatísticas unidimensionais (estatísticas de variáveis \u200b\u200baleatórias), nas quais o resultado da observação é descrito por um número real;

Análise estatística multivariada, onde o resultado da observação de um objeto é descrito por vários números (vetor);

Estatísticas de processos aleatórios e séries temporais, onde o resultado da observação é uma função;

Estatísticas de objetos de natureza não numérica, em que o resultado da observação é de natureza não numérica, por exemplo, é um conjunto (figura geométrica), uma ordenação ou é obtido como resultado de medição por um atributo qualitativo.

Exemplos de aplicação da teoria da probabilidade e estatística matemática.
Consideremos vários exemplos em que os modelos probabilísticos e estatísticos são uma boa ferramenta para resolver problemas gerenciais, de produção, econômicos e econômicos nacionais. Assim, por exemplo, uma moeda que é usada como lote deve ser "simétrica", ou seja, quando é arremessado, em média, na metade dos casos, o brasão deve cair e, na metade dos casos - a treliça (cauda, \u200b\u200bnúmero). Mas o que significa “média”? Se você realizar várias séries de 10 lançamentos em cada série, então muitas vezes haverá séries em que a moeda cai 4 vezes com o emblema. Para uma moeda simétrica, isso ocorrerá em 20,5% da série. E se houver 40.000 brasões por 100.000 lançamentos, a moeda pode ser considerada simétrica? O procedimento de tomada de decisão é baseado na teoria da probabilidade e na estatística matemática.

Este exemplo pode não parecer sério o suficiente. No entanto, não é. O sorteio é amplamente utilizado na organização de experimentos técnicos e econômicos industriais, por exemplo, ao processar os resultados da medição do indicador de qualidade (momento de atrito) de rolamentos dependendo de vários fatores tecnológicos (a influência de um meio de preservação, métodos de preparação de rolamentos antes da medição, o efeito da carga do rolamento durante a medição, etc.). P.). Digamos que seja necessário comparar a qualidade dos rolamentos em função dos resultados de seu armazenamento em diferentes óleos de preservação, ou seja, em óleos de composição A e B. Ao planejar tal experimento, surge a questão de quais rolamentos devem ser colocados no óleo de composição A e quais devem ser colocados no óleo de composição B, mas de forma a evitar a subjetividade e garantir a objetividade da decisão.

Amostra
A resposta a esta questão pode ser obtida por sorteio. Um exemplo semelhante pode ser dado com o controle de qualidade de qualquer produto. Para decidir se um lote controlado de produtos atende ou não aos requisitos estabelecidos, é retirada uma amostra do mesmo. Com base nos resultados da amostragem, é feita uma conclusão sobre todo o lote. Nesse caso, é muito importante evitar a subjetividade na seleção da amostra, ou seja, é necessário que cada unidade de produção do lote controlado tenha a mesma probabilidade de ser selecionada na amostra. Em condições de produção, a seleção das unidades de produção na amostra geralmente é realizada não por lote, mas por tabelas especiais de números aleatórios ou com a ajuda de sensores de computador de números aleatórios.
Problemas semelhantes para garantir a objetividade da comparação surgem quando se comparam vários esquemas de organização da produção, remuneração, durante a realização de licitações e concursos, seleção de candidatos para vagas, etc. Desenhos ou procedimentos semelhantes são necessários em todos os lugares. Vamos explicar usando o exemplo de identificação do time mais forte e do segundo time mais forte na organização de um torneio de acordo com o sistema olímpico (o perdedor é eliminado). Deixe a equipe mais forte vencer sempre a mais fraca. É claro que a equipe mais forte com certeza se tornará a campeã. A segunda equipe mais forte chegará à final se e somente se não tiver jogos com o futuro campeão antes da final. Se tal jogo for planejado, o segundo time mais forte não chegará à final. Quem estiver planejando um torneio pode “nocautear” o segundo time mais forte do torneio antes do previsto, reunindo-o no primeiro encontro com o líder, ou dar a ele um segundo lugar, garantindo encontros com times mais fracos até a final. Para evitar a subjetividade, tire a sorte. Para um torneio de 8 equipes, a probabilidade de que as duas equipes mais fortes se encontrem na final é de 4/7. Assim, com uma probabilidade de 3/7, o segundo time mais forte sairá do torneio antes do previsto.
Qualquer medida de unidades de produção (com um paquímetro, micrômetro, amperímetro, etc.) tem erros. Para saber se existem erros sistemáticos, é necessário fazer várias medições de uma unidade de produção cujas características são conhecidas (por exemplo, uma amostra padrão). Deve ser lembrado que além do erro sistemático, também existe um erro aleatório.

Portanto, surge a questão de como descobrir, a partir dos resultados da medição, se há um erro sistemático. Se observarmos apenas se o erro obtido durante a próxima medição é positivo ou negativo, então este problema pode ser reduzido ao anterior. Na verdade, comparemos a medição com o lançamento de uma moeda, o erro positivo - com a queda do brasão, o negativo - com a rede (erro zero com um número suficiente de divisões de escala praticamente nunca ocorre). Então, verificar a ausência de um erro sistemático é equivalente a verificar a simetria da moeda.

O objetivo desse raciocínio é reduzir o problema de verificação da ausência de um erro sistemático ao problema de verificação da simetria de uma moeda. O raciocínio acima leva ao chamado "critério de sinal" em estatística matemática.
O teste de sinal é um teste estatístico que permite testar a hipótese nula de que a amostra obedece à distribuição binomial com o parâmetro p \u003d 1/2. O teste de sinal pode ser usado como um teste estatístico não paramétrico para testar a hipótese de que a mediana é igual a um determinado valor (em particular, zero), bem como a ausência de deslocamento (sem efeito de processamento) em duas amostras conectadas. Também permite testar a hipótese de simetria da distribuição, mas para isso existem critérios mais poderosos - o teste de Wilcoxon de uma amostra e suas modificações.

Com a regulação estatística dos processos tecnológicos com base nos métodos da estatística matemática, desenvolvem-se regras e planos de controlo estatístico dos processos, visando a detecção atempada de perturbações nos processos tecnológicos e a tomada de medidas para os ajustar e evitar a libertação de produtos que não cumpram os requisitos estabelecidos. Essas medidas visam reduzir os custos de produção e as perdas com o abastecimento de unidades abaixo do padrão. Com o controle estatístico de aceitação, baseado em métodos de estatística matemática, planos de controle de qualidade são desenvolvidos por meio da análise de amostras de lotes de produtos. A dificuldade está em conseguir construir corretamente modelos probabilísticos e estatísticos de tomada de decisão, a partir dos quais seja possível responder às questões acima. Para isso, na estatística matemática, foram desenvolvidos modelos probabilísticos e métodos de teste de hipóteses, em particular, hipóteses de que a proporção de unidades de produção defeituosas é igual a um determinado número p0, por exemplo, p0 \u003d 0,23.

Tarefas de avaliação.
Em uma série de situações gerenciais, produtivas, econômicas e econômicas nacionais, surgem problemas de um tipo diferente - o problema de avaliar as características e os parâmetros das distribuições de probabilidade.

Vejamos um exemplo. Suponha que um lote de N lâmpadas foi recebido para inspeção. Uma amostra de n lâmpadas foi selecionada aleatoriamente deste lote. Uma série de questões naturais surgem. Como determinar a vida útil média das lâmpadas elétricas com base nos resultados dos testes dos elementos da amostra e com que precisão essa característica pode ser estimada? Como a precisão muda se você pegar uma amostra maior? Em quantas horas T pode ser garantido que pelo menos 90% das lâmpadas durarão T e mais horas?

Suponha que, ao testar uma amostra com um volume de n lâmpadas, X lâmpadas apresentem defeito. Então surgem as seguintes questões. Que limites podem ser especificados para o número D de lâmpadas defeituosas em um lote, para o nível de defeitos D / N, etc.?

Ou, na análise estatística da precisão e estabilidade dos processos tecnológicos, é necessário avaliar indicadores de qualidade como o valor médio do parâmetro controlado e o grau de sua dispersão no processo em questão. De acordo com a teoria da probabilidade, é aconselhável usar sua expectativa matemática como o valor médio de uma variável aleatória e variância, desvio padrão ou coeficiente de variação como uma característica estatística do spread. Daí surge a pergunta: como avaliar essas características estatísticas a partir de dados de amostra e com que precisão isso pode ser feito? Existem muitos exemplos semelhantes. Aqui foi importante mostrar como a teoria da probabilidade e a estatística matemática podem ser usadas no gerenciamento da produção na tomada de decisões no campo do gerenciamento estatístico da qualidade do produto.

Métodos estatísticos probabilísticos e otimização. A ideia de otimização permeia a estatística matemática aplicada moderna e outros métodos estatísticos. Ou seja, métodos de planejamento de experimentos, controle de aceitação estatística, regulação estatística de processos tecnológicos, etc. Por outro lado, as formulações de otimização na teoria da tomada de decisão, por exemplo, a teoria aplicada de otimização da qualidade do produto e requisitos de padrões, fornecem o uso generalizado de métodos probabilísticos e estatísticos, principalmente estatística matemática aplicada.

Na gestão da produção, em particular, ao otimizar a qualidade do produto e os requisitos de padrões, é especialmente importante aplicar métodos estatísticos na fase inicial do ciclo de vida do produto, ou seja, na fase de pesquisa e desenvolvimento de desenvolvimentos de projeto experimental (desenvolvimento de requisitos promissores para produtos, projeto preliminar, especificações técnicas para o desenvolvimento de projeto experimental). Isso se deve às informações limitadas disponíveis no estágio inicial do ciclo de vida do produto e à necessidade de prever as capacidades técnicas e a situação econômica para o futuro. Os métodos estatísticos devem ser aplicados em todas as fases da resolução do problema de otimização - ao dimensionar variáveis, desenvolver modelos matemáticos para o funcionamento de produtos e sistemas, conduzir experimentos técnicos e econômicos, etc.

Todas as áreas de estatísticas são usadas em tarefas de otimização, incluindo otimização da qualidade do produto e requisitos de padrões. Nomeadamente, estatísticas de variáveis \u200b\u200baleatórias, análise estatística multivariada, estatísticas de processos aleatórios e séries temporais, estatísticas de objetos de natureza não numérica. A escolha de um método estatístico para a análise de dados específicos é aconselhável realizar de acordo com as recomendações.

Conclusão.
NO
etc .................

Introdução

2. Conceitos básicos de estatística matemática

2.1 Conceitos básicos de amostragem

2.2 Distribuição da amostra

2.3 Função de distribuição empírica, histograma

Conclusão

Lista de referências

Introdução

A estatística matemática é a ciência dos métodos matemáticos de sistematizar e usar dados estatísticos para conclusões científicas e práticas. Em muitas de suas seções, a estatística matemática é baseada na teoria da probabilidade, o que permite avaliar a confiabilidade e a precisão das conclusões tiradas de material estatístico limitado (por exemplo, para estimar o tamanho da amostra necessária para obter os resultados da precisão necessária em uma pesquisa por amostragem).

Na teoria da probabilidade, são consideradas variáveis \u200b\u200baleatórias com uma determinada distribuição ou experimentos aleatórios, cujas propriedades são totalmente conhecidas. O assunto da teoria da probabilidade são as propriedades e relações dessas quantidades (distribuições).

Mas muitas vezes um experimento é uma caixa preta que produz apenas alguns resultados, de acordo com os quais é necessário tirar uma conclusão sobre as propriedades do próprio experimento. O observador tem um conjunto de resultados numéricos (ou podem ser numéricos) obtidos pela repetição do mesmo experimento aleatório nas mesmas condições.

Isso levanta, por exemplo, as seguintes questões: Se observarmos uma variável aleatória, como podemos tirar a conclusão mais precisa sobre sua distribuição a partir de um conjunto de seus valores em vários experimentos?

Um exemplo dessa série de experimentos é um levantamento sociológico, um conjunto de indicadores econômicos ou, finalmente, uma seqüência de brasões e caudas com mil lançamentos de moeda.

Todos os fatores acima determinam relevância e a importância do tema de trabalho no estágio atual, visando um estudo profundo e abrangente dos conceitos básicos da estatística matemática.

Nesse sentido, o objetivo deste trabalho é sistematizar, acumular e consolidar conhecimentos sobre os conceitos de estatística matemática.

1. Assunto e métodos de estatística matemática

A estatística matemática é a ciência dos métodos matemáticos para analisar dados obtidos durante observações de massa (medições, experimentos). Dependendo da natureza matemática dos resultados de observação específicos, as estatísticas matemáticas são divididas em estatísticas de números, análises estatísticas multivariadas, análises de funções (processos) e séries temporais, estatísticas de objetos de natureza não numérica. Uma parte essencial da estatística matemática é baseada em modelos probabilísticos. Aloque as tarefas gerais de descrição de dados, estimativa e teste de hipóteses. Eles também consideram tarefas mais específicas relacionadas à realização de pesquisas de amostra, restauração de dependências, construção e uso de classificações (tipologias), etc.

Para descrever os dados, são construídas tabelas, diagramas e outras representações visuais, por exemplo, campos de correlação. Modelos probabilísticos geralmente não são usados. Vários métodos para descrever dados são baseados na teoria avançada e nos recursos dos computadores modernos. Isso inclui, em particular, a análise de cluster, que visa identificar grupos de objetos que são semelhantes entre si, e escalonamento multidimensional, que permite representar visualmente os objetos em um plano, distorcendo ao menos as distâncias entre eles.

Os métodos de estimativa e teste de hipóteses dependem de modelos de geração de dados probabilísticos. Esses modelos são divididos em paramétricos e não paramétricos. Em modelos paramétricos, assume-se que os objetos em estudo são descritos por funções de distribuição que dependem de um pequeno número (1-4) de parâmetros numéricos. Em modelos não paramétricos, as funções de distribuição são consideradas contínuas arbitrárias. Em estatística matemática, os parâmetros e características da distribuição (expectativa matemática, mediana, variância, quantis, etc.), funções de densidade e distribuição, dependências entre variáveis \u200b\u200b(com base em coeficientes de correlação linear e não paramétrica, bem como estimativas paramétricas ou não paramétricas de funções que expressam dependências) são estimados e outros. Use estimativas de ponto e intervalo (dando limites para valores reais).

Na estatística matemática, há teoria geral teste de hipóteses e um grande número de métodos dedicados a testar hipóteses específicas. Considere hipóteses sobre os valores dos parâmetros e características, sobre a verificação da homogeneidade (ou seja, sobre a coincidência de características ou funções de distribuição em duas amostras), sobre a concordância da função de distribuição empírica com dada função distribuição ou com uma família paramétrica de tais funções, sobre a simetria da distribuição, etc.

De grande importância é a seção de estatística matemática relacionada à realização de pesquisas por amostragem, com as propriedades dos diversos esquemas de amostragem e a construção de métodos adequados para avaliação e teste de hipóteses.

Problemas de recuperação de dependência têm sido estudados ativamente por mais de 200 anos, desde o desenvolvimento do método dos mínimos quadrados por K. Gauss em 1794. Atualmente, os métodos mais relevantes para encontrar um subconjunto informativo de variáveis \u200b\u200be métodos não paramétricos.

O desenvolvimento de métodos para aproximação de dados e redução da dimensão da descrição começou há mais de 100 anos, quando K. Pearson criou o método do componente principal. Mais tarde, a análise fatorial e numerosas generalizações não lineares foram desenvolvidas.

Vários métodos de construção (análise de agrupamento), análise e uso (análise discriminante) de classificações (tipologias) também são referidos como métodos de reconhecimento de padrões (com e sem professor), classificação automática, etc.

Os métodos matemáticos em estatística baseiam-se tanto na utilização de somas (com base no Teorema do Limite Central da teoria da probabilidade) ou em indicadores de diferenças (distâncias, métricas), como nas estatísticas de objetos de natureza não numérica. Apenas os resultados assintóticos são geralmente comprovados com rigor. Hoje em dia, os computadores desempenham um grande papel na estatística matemática. Eles são usados \u200b\u200btanto para cálculos quanto para modelagem de simulação (em particular, em métodos de multiplicação de amostras e no estudo da adequação de resultados assintóticos).

Conceitos básicos de estatística matemática

2.1 Conceitos básicos de amostragem

Let Ser uma variável aleatória observada em um experimento aleatório. Supõe-se que o espaço de probabilidade é dado (e não nos interessa).

Vamos supor que, tendo realizado este experimento uma vez nas mesmas condições, recebemos números ,,, - os valores desta variável aleatória no primeiro, segundo, etc. experimentos. A variável aleatória tem alguma distribuição, que é parcial ou completamente desconhecida para nós.

Vamos dar uma olhada mais de perto em um conjunto chamado amostra.

Em uma série de experimentos já realizados, uma amostra é uma coleção de números. Mas se esta série de experimentos for repetida novamente, então, em vez desse conjunto, obteremos um novo conjunto de números. Em vez de um número, outro número aparece - um dos valores de uma variável aleatória. Ou seja, (e, e, etc.) é uma variável que pode assumir os mesmos valores que uma variável aleatória e com a mesma frequência (com as mesmas probabilidades). Portanto, antes do experimento - uma variável aleatória igualmente distribuída com, e depois do experimento - o número que observamos neste primeiro experimento, ou seja, um dos valores possíveis da variável aleatória.

Uma amostra de volume é um conjunto de variáveis \u200b\u200baleatórias independentes e igualmente distribuídas ("cópias") que têm, como, uma distribuição.

O que significa “tirar uma conclusão sobre a distribuição da amostra”? A distribuição é caracterizada por uma função de distribuição, densidade ou tabela, um conjunto de características numéricas - ,, etc. Com base na amostra, você precisa ser capaz de construir aproximações para todas essas características.

.2 Distribuição seletiva

Considere a implementação de uma amostra em um resultado elementar - um conjunto de números , , ... Em um espaço de probabilidade adequado, introduzimos uma variável aleatória tomando valores ,, com probabilidades em (se alguns dos valores coincidirem, adicionamos as probabilidades o número correspondente de vezes). A tabela de distribuição de probabilidade e a função de distribuição de uma variável aleatória têm a seguinte aparência:

A distribuição de uma quantidade é chamada de distribuição empírica ou amostral. Vamos calcular a expectativa matemática e a variância da quantidade e introduzir a notação para essas quantidades:

Da mesma forma, calculamos o momento do pedido

No caso geral, denotamos pela quantidade

Se, ao construirmos todas as características por nós introduzidas, considerarmos a amostra ,, como um conjunto de variáveis \u200b\u200baleatórias, então essas próprias características - ,,,, - se tornarão quantidades aleatórias. Essas características da distribuição da amostra são usadas para estimar (aproximar) as características desconhecidas correspondentes da distribuição verdadeira.

A razão para usar características de distribuição para avaliar as características da distribuição verdadeira (ou) está na proximidade dessas distribuições em geral.

Considere, por exemplo, lançar o dado correto. Deixe ser - o número de pontos perdidos durante o º lançamento. Suponha que um na amostra ocorra uma vez, dois - uma vez, etc. Então a variável aleatória assumirá os valores 1 , , 6 com probabilidades, respectivamente. Mas essas proporções com crescimento se aproximam de acordo com a lei dos grandes números. Ou seja, a distribuição do valor é, em certo sentido, semelhante à distribuição verdadeira do número de pontos perdidos quando o dado correto é lançado.

Não especificaremos o que significa proximidade da amostra e verdadeiras distribuições. Nos parágrafos a seguir, examinaremos mais de perto cada uma das características apresentadas acima e exploraremos suas propriedades, incluindo seu comportamento com o aumento do tamanho da amostra.

.3 Função de distribuição empírica, histograma

Visto que a distribuição desconhecida pode ser descrita, por exemplo, por sua função de distribuição, construiremos uma “estimativa” para esta função a partir da amostra.

Definição 1.

Uma função de distribuição empírica construída a partir de uma amostra de volume é uma função aleatória, para cada

Lembrete: Função aleatória

chamado de indicador de evento. Para cada um, é uma variável aleatória com uma distribuição Bernoulli com um parâmetro. porque?

Em outras palavras, para qualquer valor igual à probabilidade real de uma variável aleatória ser menor, ele é estimado pela proporção dos elementos da amostra que são menores.

Se os elementos da amostra ,,, forem classificados em ordem crescente (em cada resultado elementar), um novo conjunto de variáveis \u200b\u200baleatórias será obtido, chamado de série de variação:

O elemento ,, é denominado o ésimo membro da série de variação ou a estatística ordinal.

Exemplo 1.

Amostra:

Faixa de variação:

Figura: 1 Exemplo 1

A função de distribuição empírica tem saltos nos pontos de amostragem, a magnitude do salto no ponto é, onde é o número de elementos de amostragem que coincidem com.

Uma função de distribuição variacional empírica pode ser traçada:

Outra característica de uma distribuição é a tabela (para distribuições discretas) ou densidade (para absolutamente contínuas). O análogo empírico ou seletivo de uma tabela ou densidade é o assim chamado histograma.

O histograma é traçado usando dados agrupados. O intervalo assumido de valores da variável aleatória (ou a área dos dados amostrados) é dividido independentemente da amostra em vários intervalos (não necessariamente iguais). Sejam intervalos em uma linha reta chamados intervalos de agrupamento. Vamos denotar pelo número de elementos de amostra que se enquadram no intervalo:

(1)

Em cada um dos intervalos, é construído um retângulo, cuja área é proporcional. A área total de todos os retângulos deve ser igual a um. Let ser a duração do intervalo. A altura do retângulo acima é

A figura resultante é chamada de histograma.

Exemplo 2.

Há sim faixa de variação (veja o exemplo 1):

Aqui está o logaritmo decimal, portanto, ou seja, quando a amostra é duplicada, o número de intervalos de agrupamento aumenta em 1. Observe que quanto mais intervalos de agrupamento, melhor. Mas, se tomarmos o número de intervalos, digamos, da ordem de magnitude, com o aumento do histograma não se aproximará da densidade.

A afirmação a seguir é verdadeira:

Se a densidade de distribuição dos elementos da amostra é uma função contínua, então para isso, há uma convergência pontual na probabilidade do histograma para a densidade.

Portanto, a escolha do logaritmo é razoável, mas não a única possível.

Conclusão

A estatística matemática (ou teórica) é baseada nos métodos e conceitos da teoria da probabilidade, mas de certa forma ela resolve problemas inversos.

Se observarmos simultaneamente a manifestação de dois (ou mais) sinais, ou seja, temos um conjunto de valores de várias variáveis \u200b\u200baleatórias - o que podemos dizer sobre sua dependência? Ela está aí ou não? E se sim, qual é essa dependência?

Freqüentemente, é possível fazer algumas suposições sobre a distribuição oculta na "caixa preta" ou sobre suas propriedades. Nesse caso, de acordo com os dados experimentais, é necessário confirmar ou refutar essas suposições ("hipóteses"). Deve-se lembrar que a resposta "sim" ou "não" pode ser dada apenas com certo grau de confiabilidade e, quanto mais continuarmos o experimento, mais precisas serão as conclusões. A situação mais favorável para a pesquisa acaba sendo aquela em que se pode afirmar com segurança sobre algumas propriedades do experimento observado - por exemplo, a presença de uma relação funcional entre as quantidades observadas, a distribuição normal, sua simetria, a presença de uma distribuição de densidade ou sua natureza discreta, etc. ...

Portanto, faz sentido lembrar sobre as estatísticas (matemáticas) se

Há um experimento aleatório, cujas propriedades são parcial ou completamente desconhecidas,

· Podemos reproduzir este experimento nas mesmas condições um certo (ou melhor - qualquer) número de vezes.

Lista de referências

1. Baumol W. Teoria econômica e pesquisa operacional. - M.; Science, 1999.

2. Bolshev L.N., Smirnov N.V. Tabelas de estatísticas matemáticas. Moscou: Nauka, 1995.

3. Borovkov A.A. Estatística matemática. Moscou: Nauka, 1994.

4. Korn G., Korn T. Manual de matemática para cientistas e engenheiros. - SPB: Editora "Lan", 2003.

5. Korshunov D.A., Chernova N.I. Coleção de problemas e exercícios de estatística matemática. Novosibirsk: Editora do Instituto de Matemática. S.L. Sobolev SB RAS, 2001.

6. Pekheletsky I. D. Matemática: um livro didático para alunos. - M: Academy, 2003.

7. Sukhodolsky V.G. Aulas de matemática superior para as humanidades. - Editora de São Petersburgo da Universidade Estadual de São Petersburgo. 2003

8. Feller V. Introdução à teoria da probabilidade e suas aplicações. - M.: Mir, T.2, 1984.

9. Harman G., Modern factor analysis. - M .: Estatísticas, 1972.


Harman G., Modern factor analysis. - M .: Estatísticas, 1972.