Portal de construção - Casa. Aquecedores de água. Chaminés. Instalação de aquecimento. Aquecedores. Equipamento

Livro didático: Estatística matemática. Curso Teoria da Probabilidade em Estatística Matemática Sobre os métodos em que a ciência se baseia a estatística matemática

Estatísticas matemáticasé um ramo moderno da ciência matemática que trata da descrição estatística dos resultados de experimentos e observações, bem como prédio modelos matemáticos contendo conceitos probabilidades. A base teórica da estatística matemática é teoria da probabilidade.

Na estrutura da estatística matemática, duas seções principais são tradicionalmente distinguidas: estatísticas descritivas e inferência estatística (Figura 1.1).

Arroz. 1.1. Principais seções de estatística matemática

Estatísticas descritivasé usado para:

o generalização de indicadores de uma variável (estatísticas de amostra aleatória);

o identificar relações entre duas ou mais variáveis ​​(análise de correlação-regressão).

As estatísticas descritivas permitem obter nova informação, compreende-o rapidamente e avalia-o de forma abrangente, ou seja, desempenha a função científica de descrever os objetos de estudo, o que justifica o seu nome. Os métodos de estatística descritiva são projetados para transformar um conjunto de dados empíricos individuais em um sistema de formas e números visuais para percepção: distribuições de frequência; indicadores de tendências, variabilidade, comunicação. Esses métodos calculam as estatísticas de uma amostra aleatória, que servem de base para a implementação de inferências estatísticas.

Inferência estatística dê a oportunidade:

o avaliar a precisão, confiabilidade e eficácia das estatísticas da amostra, encontrar erros que ocorrem no processo de pesquisa estatística (avaliação estatística)

o generalizar os parâmetros da população geral obtidos com base em estatísticas amostrais (testando hipóteses estatísticas).

o objetivo principal pesquisa científica- é a aquisição de novos conhecimentos sobre uma grande classe de fenômenos, pessoas ou eventos, comumente chamados de população em geral.

Populaçãoé a totalidade dos objetos de estudo, amostra- a sua parte, que se forma de certa forma cientificamente fundamentada 2.

O termo “população geral” é usado quando se trata de um conjunto grande, mas finito, de objetos em estudo. Por exemplo, sobre a totalidade dos candidatos na Ucrânia em 2009 ou a totalidade das crianças idade pré-escolar a cidade de Rivne. As populações gerais podem atingir volumes significativos, ser finitas e infinitas. Na prática, via de regra, trata-se de conjuntos finitos. E se a razão entre o tamanho da população geral e o tamanho da amostra for superior a 100, então, de acordo com Glass e Stanley, os métodos de estimativa para populações finitas e infinitas fornecem, em essência, mesmos resultados. O conjunto geral também pode ser chamado de conjunto completo de valores de algum atributo. O facto de a amostra pertencer à população em geral é a principal base para avaliar as características da população em geral de acordo com as características da amostra.

Principal ideia a estatística matemática baseia-se na crença de que um estudo completo de todos os objetos da população em geral na maioria dos problemas científicos é praticamente impossível ou economicamente impraticável, pois requer muito tempo e custos materiais significativos. Portanto, em estatística matemática, é usado abordagem seletiva, cujo princípio é mostrado no diagrama da Fig. 1.2.

Por exemplo, de acordo com a tecnologia de formação, as amostras são aleatórias (simples e sistemáticas), estratificadas, agrupadas (ver Seção 4).

Arroz. 1.2. Esquema de aplicação de métodos de estatística matemática de acordo com abordagem seletiva o uso de métodos matemáticos e estatísticos pode ser realizado na seguinte sequência (ver Fig. 1.2):

ó com população geral, propriedades das quais estão sujeitas a pesquisa, certas métodos formam uma amostra- um número típico, mas limitado, de objetos aos quais são aplicados métodos de pesquisa;

o como resultado de métodos observacionais, ações experimentais e medições em objetos amostrais, são obtidos dados empíricos;

o o processamento de dados empíricos por meio de métodos de estatística descritiva fornece indicadores amostrais, que são chamados de estatísticos - como o nome da disciplina, aliás;

o aplicar métodos de inferência estatística para estatístico, receber parâmetros que caracterizam as propriedades a população em geral.

Exemplo 1.1. Para avaliar a estabilidade do nível de conhecimento (variável x) teste de uma amostra aleatória de 3 alunos com um volume de n. Os testes continham m tarefas, cada uma das quais foi avaliada de acordo com o sistema de pontuação: "concluído" "- 1," não cumprido "- 0. O desempenho médio atual dos alunos permaneceu X

3 amostra aleatória(do inglês. Random - random) é uma amostra representativa, que é formada segundo a estratégia de testes aleatórios.

ao nível dos anos anteriores/h? Sequência de solução:

o descobrir uma hipótese significativa como: “se os resultados dos testes atuais não diferem dos anteriores, então podemos considerar o nível de conhecimento dos alunos inalterado e o processo educacional - estável”;

o formular uma hipótese estatística adequada, como a hipótese nula H 0 que “a pontuação média atual de X não é estatisticamente diferente da média dos anos/h anteriores”, ou seja, H 0: X = ⁄ r, contra a hipótese alternativa correspondente XФ ^ ;

ó construir distribuições empíricas da variável investigada X;

o definir(se necessário) correlações, por exemplo, entre uma variável X e outros indicadores, construir linhas de regressão;

o verificar a correspondência da distribuição empírica com a lei normal;

o avaliar o valor dos indicadores pontuais e o intervalo de confiança dos parâmetros, por exemplo, a média;

o definir critérios para testar estatísticas hipóteses;

o testar hipóteses estatísticas com base nos critérios selecionados;

o formular uma decisão sobre a hipótese nula estatística sobre um determinado nível de significância;

o passar da decisão de aceitar ou rejeitar a hipótese nula estatística da interpretação das conclusões relativas à hipótese significativa;

o formular conclusões significativas.

Assim, se resumirmos os procedimentos acima, a aplicação dos métodos estatísticos consiste em três blocos principais:

A transição de um objeto da realidade para um esquema matemático e estatístico abstrato, ou seja, a construção de um modelo probabilístico de um fenômeno, processo, propriedade;

Realização de ações computacionais por meios matemáticos próprios no âmbito de um modelo probabilístico baseado nos resultados de medições, observações, experiências e na formulação de conclusões estatísticas;

Interpretação dos resultados estatísticos sobre situação real e tomar uma decisão apropriada.

Os métodos estatísticos para processamento e interpretação de dados são baseados na teoria das probabilidades. A teoria da probabilidade é a base dos métodos da estatística matemática. Sem o uso de conceitos e leis fundamentais da teoria das probabilidades, é impossível generalizar as conclusões da estatística matemática e, portanto, a sua utilização razoável para fins científicos e práticos.

Assim, a tarefa da estatística descritiva é transformar um conjunto de dados amostrais em um sistema de indicadores - estatísticas - distribuições de frequência, medidas de tendência central e variabilidade, coeficientes de acoplamento e assim por diante. Contudo, as estatísticas são características, na verdade, de uma determinada amostra. É claro que é possível calcular distribuições amostrais, médias amostrais, variâncias, etc., mas tal “análise de dados” tem valor científico e educacional limitado. A transferência “mecânica” de quaisquer conclusões tiradas com base em tais indicadores para outras populações não é correta.

Para poder transferir indicadores amostrais ou outros, ou para populações mais comuns, é necessário ter valores matematicamente justificados disposições na conformidade e capacidade das características da amostra com as características desses chamados populações. Tais disposições baseiam-se em abordagens teóricas e esquemas associados a modelos probabilísticos da realidade, por exemplo, na abordagem axiomática, na lei dos grandes números, etc. Somente com a ajuda deles é possível transferir as propriedades que são estabelecidas pelos resultados da análise de informações empíricas limitadas, seja para outros conjuntos ou para conjuntos generalizados. Assim, a construção, as leis de funcionamento, a utilização de modelos probabilísticos, é objeto de um campo matemático denominado “teoria das probabilidades”, torna-se a essência dos métodos estatísticos.

Assim, na estatística matemática, são utilizadas duas linhas paralelas de indicadores: a primeira linha, que é relevante para a prática (são indicadores amostrais) e a segunda, baseada na teoria (são indicadores de um modelo probabilístico). Por exemplo, as frequências empíricas determinadas na amostra correspondem aos conceitos de probabilidade teórica; a média amostral (prática) corresponde à expectativa matemática (teoria), etc. Além disso, nos estudos, as características seletivas, via de regra, são primárias. São calculados com base em observações, medições, experimentos, após os quais passam por uma avaliação estatística de capacidade e eficácia, testando hipóteses estatísticas de acordo com os objetivos da pesquisa, e ao final são aceitos com certa probabilidade como indicadores das propriedades das populações estudadas.

Pergunta. Tarefa.

1. Descreva as principais seções da estatística matemática.

2. Qual é a ideia principal da estatística matemática?

3. Descreva a proporção entre a população geral e a amostra.

4. Explique o esquema de aplicação dos métodos da estatística matemática.

5. Especifique a lista das principais tarefas da estatística matemática.

6. Quais são os principais blocos de aplicação dos métodos estatísticos? Descreva-os.

7. Expandir a conexão entre estatística matemática e teoria das probabilidades.

Introdução

2. Conceitos básicos de estatística matemática

2.1 Conceitos básicos de amostragem

2.2 Amostragem

2.3 Função de distribuição empírica, histograma

Conclusão

Bibliografia

Introdução

A estatística matemática é a ciência dos métodos matemáticos de sistematização e utilização de dados estatísticos para conclusões científicas e práticas. Em muitos de seus ramos, a estatística matemática é baseada na teoria da probabilidade, o que permite avaliar a confiabilidade e a precisão das conclusões tiradas de material estatístico limitado (por exemplo, para estimar o tamanho da amostra necessário para obter resultados com a precisão necessária em uma pesquisa por amostragem).

Na teoria das probabilidades, são consideradas variáveis ​​​​aleatórias com uma determinada distribuição ou experimentos aleatórios cujas propriedades são totalmente conhecidas. O assunto da teoria das probabilidades são as propriedades e relações dessas quantidades (distribuições).

Mas muitas vezes o experimento é uma caixa preta, fornecendo apenas alguns resultados, segundo os quais é necessário tirar uma conclusão sobre as propriedades do próprio experimento. O observador tem um conjunto de resultados numéricos (ou podem ser numéricos) obtidos pela repetição do mesmo experimento aleatório nas mesmas condições.

Neste caso, por exemplo, surgem as seguintes questões: Se observarmos uma variável aleatória, como podemos tirar a conclusão mais precisa sobre sua distribuição a partir de um conjunto de seus valores em vários experimentos?

Um exemplo dessa série de experimentos é uma pesquisa sociológica, um conjunto de indicadores econômicos ou, finalmente, uma sequência de brasões e coroas durante um lançamento de moeda mil vezes maior.

Todos os fatores acima levam a relevância e a importância do tema do trabalho em estágio atual visando um estudo profundo e abrangente dos conceitos básicos da estatística matemática.

Nesse sentido, o objetivo deste trabalho é sistematizar, acumular e consolidar conhecimentos sobre os conceitos da estatística matemática.

1. Assunto e métodos de estatística matemática

A estatística matemática é a ciência dos métodos matemáticos para analisar dados obtidos durante observações em massa (medições, experimentos). Dependendo da natureza matemática dos resultados específicos das observações, a estatística matemática é dividida em estatística de números, análise estatística multivariada, análise de funções (processos) e séries temporais e estatística de objetos não numéricos. Uma parte significativa da estatística matemática baseia-se em modelos probabilísticos. distribuir tarefas gerais descrições de dados, avaliação e teste de hipóteses. Consideram também tarefas mais específicas relacionadas com a realização de inquéritos amostrais, restauração de dependências, construção e utilização de classificações (tipologias), etc.

Para descrever os dados, são construídas tabelas, gráficos e outras representações visuais, por exemplo, campos de correlação. Modelos probabilísticos geralmente não são usados. Alguns métodos de descrição de dados baseiam-se em teoria avançada e nas capacidades dos computadores modernos. Estas incluem, nomeadamente, a análise de cluster, que visa identificar grupos de objetos semelhantes entre si, e o escalonamento multidimensional, que permite visualizar objetos num plano, distorcendo ao mínimo as distâncias entre eles.

Os métodos de estimativa e teste de hipóteses baseiam-se em modelos probabilísticos de geração de dados. Esses modelos são divididos em paramétricos e não paramétricos. Nos modelos paramétricos, assume-se que os objetos em estudo são descritos por funções de distribuição que dependem de um pequeno número (1-4) de parâmetros numéricos. Em modelos não paramétricos, as funções de distribuição são consideradas contínuas arbitrárias. Na estatística matemática, os parâmetros e características de distribuição (expectativa matemática, mediana, variância, quantis, etc.), densidades e funções de distribuição, dependências entre variáveis ​​(baseadas em coeficientes de correlação lineares e não paramétricos, bem como paramétricos ou não- estimativas paramétricas de funções que expressam dependências) são avaliadas, etc. Use estimativas de ponto e intervalo (fornecendo limites para valores verdadeiros).

Na estatística matemática existe uma teoria geral de teste de hipóteses e grande número métodos dedicados a testar hipóteses específicas. São consideradas hipóteses sobre os valores de parâmetros e características, sobre a verificação da homogeneidade (ou seja, sobre a coincidência de características ou funções de distribuição em duas amostras), sobre a concordância da função de distribuição empírica com uma determinada função de distribuição ou com um paramétrico família de tais funções, sobre a simetria da distribuição, etc.

De grande importância é a secção de estatística matemática associada à realização de inquéritos amostrais, às propriedades dos vários esquemas amostrais e à construção de métodos adequados para estimar e testar hipóteses.

Os problemas de recuperação de dependência têm sido estudados ativamente há mais de 200 anos, desde o desenvolvimento do método dos mínimos quadrados por K. Gauss em 1794. Atualmente, os métodos de busca de um subconjunto informativo de variáveis ​​e os métodos não paramétricos são os mais relevantes.

O desenvolvimento de métodos para aproximação de dados e redução de dimensão de descrição foi iniciado há mais de 100 anos, quando K. Pearson criou o método dos componentes principais. Mais tarde, a análise fatorial e numerosas generalizações não lineares foram desenvolvidas.

Vários métodos de construção (análise de cluster), análise e utilização (análise discriminante) de classificações (tipologias) também são chamados de métodos de reconhecimento de padrões (com e sem professor), classificação automática, etc.

Os métodos matemáticos em estatística baseiam-se no uso de somas (baseadas no Teorema do Limite Central da teoria das probabilidades) ou de indicadores de diferença (distâncias, métricas), como nas estatísticas de objetos não numéricos. Normalmente, apenas os resultados assintóticos são rigorosamente fundamentados. Hoje em dia os computadores desempenham um grande papel na estatística matemática. Eles são usados ​​tanto para cálculos quanto para modelagem de simulação (em particular, em métodos de amostragem e no estudo da adequação de resultados assintóticos).

Conceitos básicos de estatística matemática

2.1 Conceitos básicos do método de amostragem

Seja uma variável aleatória observada em um experimento aleatório. Supõe-se que o espaço de probabilidade é dado (e não nos interessará).

Assumiremos que, tendo realizado este experimento uma vez nas mesmas condições, obtivemos os números , , , - os valores desta variável aleatória no primeiro, segundo, etc. experimentos. Uma variável aleatória tem alguma distribuição que nos é parcial ou totalmente desconhecida.

Vamos dar uma olhada mais de perto em um conjunto chamado amostra.

Numa série de experimentos já realizados, uma amostra é um conjunto de números. Mas se esta série de experiências for repetida novamente, então, em vez deste conjunto, obteremos um novo conjunto de números. Em vez de um número, aparecerá outro número - um dos valores de uma variável aleatória. Ou seja, (e, e, etc.) é uma variável que pode assumir os mesmos valores que a variável aleatória, e com a mesma frequência (com as mesmas probabilidades). Portanto, antes do experimento - uma variável aleatória igualmente distribuída com , e depois do experimento - o número que observamos em isso primeiro experimentar, ou seja, um dos valores possíveis da variável aleatória.

Uma amostra de volume é um conjunto de variáveis ​​aleatórias independentes e igualmente distribuídas (“cópias”) que, como e , possuem uma distribuição.

O que significa “tirar uma conclusão sobre a distribuição a partir de uma amostra”? A distribuição é caracterizada por uma função de distribuição, densidade ou tabela, um conjunto de características numéricas - , , etc. Com base na amostra, deve-se ser capaz de construir aproximações para todas essas características.

.2 Amostragem

Considere a implementação de uma amostra em um resultado elementar - um conjunto de números , , . Em um espaço de probabilidade adequado, introduzimos uma variável aleatória assumindo os valores, , com probabilidades em (se alguns dos valores coincidirem, somamos as probabilidades o número correspondente de vezes). A tabela de distribuição de probabilidade e a função de distribuição de uma variável aleatória são assim:

A distribuição de uma quantidade é chamada de distribuição empírica ou amostral. Vamos calcular a expectativa matemática e a variância de uma quantidade e introduzir a notação para essas quantidades:

Da mesma forma, calculamos o momento do pedido

No caso geral, denotamos pela quantidade

Se, ao construir todas as características por nós introduzidas, considerarmos a amostra , , como um conjunto de variáveis ​​​​aleatórias, então essas próprias características - , , , , - se tornarão variáveis ​​​​aleatórias. Essas características de distribuição amostral são usadas para estimar (aproximar) as características desconhecidas correspondentes da distribuição verdadeira.

A razão para usar as características da distribuição para estimar as características da distribuição verdadeira (ou) está na proximidade dessas distribuições para grandes.

Considere, por exemplo, lançar um dado normal. Deixar - o número de pontos que caíram no -ésimo lançamento, . Suponha que um na amostra ocorra uma vez, dois ocorram uma vez e assim por diante. Então a variável aleatória assumirá os valores 1 , , 6 com probabilidades,, respectivamente. Mas essas proporções aproximam-se do crescimento de acordo com a lei dos grandes números. Ou seja, a distribuição de magnitude, em certo sentido, aproxima-se da verdadeira distribuição do número de pontos que caem quando o dado correto é lançado.

Não especificaremos o que significa proximidade da amostra e distribuições verdadeiras. Nos parágrafos seguintes, examinaremos mais de perto cada uma das características apresentadas acima e examinaremos suas propriedades, incluindo seu comportamento com o aumento do tamanho da amostra.

.3 Função de distribuição empírica, histograma

Como a distribuição desconhecida pode ser descrita, por exemplo, pela sua função de distribuição, construiremos uma “estimativa” para esta função a partir da amostra.

Definição 1.

Uma função de distribuição empírica construída sobre uma amostra de volume é chamada de função aleatória, para cada uma igual a

Lembrete: função aleatória

chamado de indicador de evento. Para cada um, esta é uma variável aleatória com distribuição de Bernoulli com parâmetro. Por que?

Em outras palavras, para qualquer valor de , igual à verdadeira probabilidade da variável aleatória ser menor que , estima-se a proporção de elementos da amostra menor que.

Se os elementos da amostra , , forem ordenados em ordem crescente (em cada resultado elementar), será obtido um novo conjunto de variáveis ​​aleatórias, denominado série de variação:

O elemento , , é chamado de décimo membro da série variacional ou estatística de quinta ordem.

Exemplo 1

Amostra:

Linha de variação:

Arroz. 1. Exemplo 1

A função de distribuição empírica tem saltos em pontos amostrais, o valor do salto no ponto é, onde é o número de elementos amostrais que correspondem a.

É possível construir uma função de distribuição empírica para as séries variacionais:

Outra característica de uma distribuição é a tabela (para distribuições discretas) ou a densidade (para distribuições absolutamente contínuas). Um análogo empírico ou seletivo de uma tabela ou densidade é o chamado histograma.

O histograma é baseado em dados agrupados. O intervalo estimado de valores de uma variável aleatória (ou intervalo de dados amostrais) é dividido, independentemente da amostra, em um certo número de intervalos (não necessariamente iguais). Sejam intervalos na linha, chamados intervalos de agrupamento. Vamos denotar pelo número de elementos da amostra que se enquadram no intervalo:

(1)

Em cada um dos intervalos é construído um retângulo cuja área é proporcional a. A área total de todos os retângulos deve ser igual a um. Seja a duração do intervalo. A altura do retângulo acima é

A figura resultante é chamada de histograma.

Exemplo 2

Existe uma série de variações (ver exemplo 1):

Aqui está o logaritmo decimal, portanto, ou seja, quando a amostra é duplicada, o número de intervalos de agrupamento aumenta em 1. Observe que quanto mais intervalos de agrupamento, melhor. Mas, se tomarmos o número de intervalos, digamos, da ordem de , então com o crescimento o histograma não se aproximará da densidade.

A afirmação a seguir é verdadeira:

Se a densidade de distribuição dos elementos da amostra for uma função contínua, então, para que haja uma convergência pontual na probabilidade do histograma para a densidade.

Portanto a escolha do logaritmo é razoável, mas não a única possível.

Conclusão

A estatística matemática (ou teórica) baseia-se nos métodos e conceitos da teoria das probabilidades, mas em certo sentido resolve problemas inversos.

Se observarmos a manifestação simultânea de dois (ou mais) signos, ou seja, temos um conjunto de valores de diversas variáveis ​​​​aleatórias - o que pode ser dito sobre sua dependência? Ela está lá ou não? E se sim, qual é essa dependência?

Muitas vezes é possível fazer algumas suposições sobre a distribuição escondida na “caixa preta” ou sobre suas propriedades. Neste caso, de acordo com dados experimentais, é necessário confirmar ou refutar estes pressupostos (“hipóteses”). Ao mesmo tempo, devemos lembrar que a resposta “sim” ou “não” só pode ser dada com um certo grau de certeza, e quanto mais tempo pudermos continuar o experimento, mais precisas serão as conclusões. A situação mais favorável para a pesquisa é quando se pode afirmar com segurança sobre algumas propriedades do experimento observado - por exemplo, sobre a presença de uma dependência funcional entre as quantidades observadas, sobre a normalidade da distribuição, sobre sua simetria, sobre a presença de densidade na distribuição ou sobre sua natureza discreta, etc.

Então, faz sentido lembrar sobre estatísticas (matemáticas) se

há um experimento aleatório, cujas propriedades são parcial ou completamente desconhecidas,

Somos capazes de reproduzir este experimento nas mesmas condições algumas (ou melhor, qualquer) número de vezes.

Bibliografia

1. Baumol U. Teoria econômica e pesquisa operacional. – M.; Ciência, 1999.

2. Bolshev L.N., Smirnov N.V. Tabelas de estatística matemática. Moscou: Nauka, 1995.

3. Borovkov A.A. Estatísticas matemáticas. Moscou: Nauka, 1994.

4. Korn G., Korn T. Manual de matemática para cientistas e engenheiros. - São Petersburgo: Lan Publishing House, 2003.

5. Korshunov D.A., Chernova N.I. Coleção de tarefas e exercícios de estatística matemática. Novosibirsk: Editora do Instituto de Matemática. SL Sobolev SB RAS, 2001.

6. Peheletsky I.D. Matemática: livro didático para alunos. - M.: Academia, 2003.

7. Sukhodolsky V.G. Palestras sobre matemática superior para as humanidades. - Editora de São Petersburgo de São Petersburgo Universidade Estadual. 2003

8. Feller V. Introdução à teoria da probabilidade e suas aplicações. - M.: Mir, T.2, 1984.

9. Harman G., análise fatorial moderna. - M.: Estatísticas, 1972.


Harman G., análise fatorial moderna. - M.: Estatísticas, 1972.

A teoria da probabilidade e a estatística matemática são a base dos métodos estatísticos probabilísticos de processamento de dados. E processamos e analisamos os dados principalmente para a tomada de decisões. Para utilizar o aparato matemático moderno, é necessário expressar os problemas considerados em termos de modelos estatísticos probabilísticos.

A aplicação de um método estatístico-probabilístico específico consiste em três etapas:

A transição da realidade econômica, gerencial e tecnológica para um esquema matemático e estatístico abstrato, ou seja, construir um modelo probabilístico de um sistema de controlo, de um processo tecnológico, de um procedimento de tomada de decisão, nomeadamente com base nos resultados do controlo estatístico, etc.

Efetuar cálculos e obter conclusões por meios puramente matemáticos no âmbito de um modelo probabilístico;

Interpretação de conclusões matemáticas e estatísticas em relação a uma situação real e tomada de decisão adequada (por exemplo, sobre a conformidade ou não conformidade da qualidade do produto com os requisitos estabelecidos, necessidade de ajuste do processo tecnológico, etc.), em particular, conclusões (sobre a proporção de unidades defeituosas de produtos em um lote, sobre uma forma específica de leis de distribuição de parâmetros controlados do processo tecnológico, etc.).

A estatística matemática utiliza os conceitos, métodos e resultados da teoria das probabilidades. A seguir, consideramos as principais questões da construção de modelos probabilísticos em situações econômicas, gerenciais, tecnológicas e outras. Ressaltamos que para a utilização ativa e correta de documentos normativo-técnicos e instrutivo-metódicos sobre métodos estatísticos probabilísticos são necessários conhecimentos preliminares. Assim, é necessário saber em que condições um ou outro documento deve ser aplicado, que informações iniciais são necessárias para a sua seleção e aplicação, que decisões devem ser tomadas com base nos resultados do processamento de dados, etc.

Exemplos de aplicação teoria das probabilidades e estatística matemática. Consideremos vários exemplos em que os modelos estatísticos probabilísticos são uma boa ferramenta para resolver problemas de gestão, industriais, económicos e económicos nacionais. Assim, por exemplo, no romance de AN Tolstoi "Caminhando pelos tormentos" (vol. 1) diz: "a oficina dá vinte e três por cento do casamento, você segura esse número", disse Strukov a Ivan Ilyich.

Como entender essas palavras na conversa dos gestores de fábrica? Uma unidade de produção não pode apresentar defeito de 23%. Pode ser bom ou defeituoso. Talvez Strukov quisesse dizer que um lote grande contém aproximadamente 23% de unidades defeituosas. Então surge a pergunta: o que significa “sobre”? Deixe 30 em cada 100 unidades de produtos testadas apresentarem defeito, ou em 1.000 - 300, ou em 100.000 - 30.000, etc., Strukov deveria ser acusado de mentir?

Ou outro exemplo. A moeda utilizada como lote deve ser “simétrica”. Quando é lançado, em média, em metade dos casos, o brasão (águia) deve cair, e em metade dos casos - a treliça (cauda, ​​número). Mas o que significa “média”? Se você realizar muitas séries de 10 lançamentos em cada série, muitas vezes haverá séries em que uma moeda com um brasão cai 4 vezes. Para uma moeda simétrica, isso acontecerá em 20,5% da série. E se houver 40.000 brasões para 100.000 lançamentos, a moeda pode ser considerada simétrica? O procedimento de tomada de decisão é baseado na teoria da probabilidade e na estatística matemática.

O exemplo pode não parecer suficientemente sério. No entanto, não é. O sorteio é amplamente utilizado na organização de experimentos de viabilidade industrial. Por exemplo, ao processar os resultados da medição do índice de qualidade (momento de atrito) dos rolamentos, dependendo de vários fatores tecnológicos (a influência de um ambiente de conservação, métodos de preparação dos rolamentos antes da medição, o efeito da carga do rolamento no processo de medição, etc. .). Suponha que seja necessário comparar a qualidade dos rolamentos em função dos resultados de seu armazenamento em diferentes óleos de conservação, ou seja, em óleos de composição A E EM. Ao planejar tal experimento, surge a questão de quais rolamentos devem ser colocados na composição do óleo A, e quais - na composição óleo EM, mas de forma a evitar a subjetividade e garantir a objetividade da decisão. A resposta a esta pergunta pode ser obtida por sorteio.

Um exemplo semelhante pode ser dado com o controle de qualidade de qualquer produto. Para decidir se um lote de produtos inspecionado atende ou não aos requisitos estabelecidos, dele é retirada uma amostra. Com base nos resultados do controle amostral, é feita uma conclusão sobre todo o lote. Neste caso, é muito importante evitar a subjetividade na formação da amostra, ou seja, é necessário que cada unidade de produto do lote controlado tenha a mesma probabilidade de ser selecionada na amostra. Nas condições de produção, a seleção das unidades de produção da amostra costuma ser feita não por lotes, mas sim de acordo com tabelas especiais. Números aleatórios ou usando geradores de números aleatórios de computador.

Problemas semelhantes para garantir a objetividade da comparação surgem na comparação de vários esquemas de organização da produção, remuneração, na realização de concursos e concursos, na seleção de candidatos para cargos vagos, etc. Em todos os lugares você precisa de uma loteria ou procedimentos semelhantes.

Que seja necessário identificar a equipe mais forte e a segunda mais forte na hora de organizar um torneio de acordo com o sistema olímpico (o perdedor é eliminado). Digamos que o time mais forte sempre derrota o mais fraco. É claro que o time mais forte com certeza será o campeão. A segunda equipe mais forte chegará à final se e somente se não tiver jogos com o futuro campeão antes da final. Se tal jogo for planejado, o segundo time mais forte não chegará à final. Quem planeja o torneio pode “nocautear” o segundo time mais forte do torneio antes do previsto, derrubando-o no primeiro encontro com o líder, ou garantir-lhe o segundo lugar, garantindo encontros com times mais fracos até a final. Para evitar subjetividade, faça um sorteio. Para um torneio de 8 equipas, a probabilidade de as duas equipas mais fortes se encontrarem na final é de 4/7. Assim, com probabilidade de 3/7, o segundo time mais forte deixará o torneio antes do previsto.

Em qualquer medição de unidades de produto (usando paquímetro, micrômetro, amperímetro, etc.), existem erros. Para saber se existem erros sistemáticos, é necessário fazer medições repetidas de uma unidade de produto cujas características são conhecidas (por exemplo, uma amostra padrão). Deve-se lembrar que além do erro sistemático, existe também o erro aleatório.

Portanto, surge a questão de como descobrir, a partir dos resultados das medições, se existe um erro sistemático. Se observarmos apenas se o erro obtido na próxima medição é positivo ou negativo, então este problema pode ser reduzido ao já considerado. Com efeito, comparemos a medição com o lançamento de uma moeda, o erro positivo - com a perda do brasão, o negativo - com a rede (erro zero com um número suficiente de divisões da escala quase nunca ocorre). Então verificar a ausência de erro sistemático equivale a verificar a simetria da moeda.

Assim, o problema de verificar a ausência de erro sistemático se reduz ao problema de verificar a simetria de uma moeda. O raciocínio acima leva ao chamado “critério dos sinais” na estatística matemática.

Na regulação estatística dos processos tecnológicos com base nos métodos da estatística matemática, são desenvolvidas regras e planos de controlo estatístico dos processos, visando a detecção atempada da desordem dos processos tecnológicos e a tomada de medidas para os ajustar e evitar o lançamento de produtos que não não atender aos requisitos estabelecidos. Estas medidas visam reduzir os custos de produção e as perdas decorrentes do fornecimento de produtos de baixa qualidade. Com o controle estatístico de aceitação, baseado nos métodos da estatística matemática, são desenvolvidos planos de controle de qualidade por meio da análise de amostras de lotes de produtos. A dificuldade está em conseguir construir corretamente modelos de tomada de decisão estatístico-probabilísticos. Na estatística matemática, modelos e métodos probabilísticos para testar hipóteses foram desenvolvidos para isso, em particular, hipóteses de que a proporção de unidades de produção defeituosas é igual a um certo número R 0 , Por exemplo, R 0 = 0,23 (lembre-se das palavras de Strukov do romance de A.N. Tolstoy).

Tarefas de avaliação. Em várias situações de gestão, industriais, económicas e económicas nacionais, surgem problemas de um tipo diferente - problemas de estimativa das características e parâmetros das distribuições de probabilidade.

Considere um exemplo. Deixe uma festa de N lâmpadas elétricas Deste lote, uma amostra de n lâmpadas elétricas Surgem uma série de questões naturais. Como determinar a vida útil média das lâmpadas elétricas com base nos resultados dos testes dos elementos da amostra, com que precisão essa característica pode ser estimada? Como a precisão muda se uma amostra maior for coletada? Em que horas Té possível garantir que pelo menos 90% das lâmpadas elétricas durarão T ou mais horas?

Suponhamos que ao testar uma amostra com um volume n lâmpadas estão com defeito X lâmpadas elétricas Quais limites podem ser especificados para um número D lâmpadas elétricas defeituosas em lote, para o nível de defeito D/ N e assim por diante.?

Ou, numa análise estatística da precisão e estabilidade dos processos tecnológicos, é necessário avaliar indicadores de qualidade como o valor médio do parâmetro controlado e o grau de sua distribuição no processo em questão. De acordo com a teoria da probabilidade, é aconselhável utilizar sua expectativa matemática como o valor médio de uma variável aleatória, e a variância, desvio padrão ou coeficiente de variação como característica estatística do spread. Surgem questões: como avaliar essas características estatísticas a partir de dados amostrais, com que precisão isso pode ser feito?

Existem muitos exemplos semelhantes. Aqui foi importante mostrar como a teoria das probabilidades e a estatística matemática podem ser usadas em problemas de engenharia e gerenciamento.

Conceito moderno de estatística matemática. A estatística matemática é entendida como “uma secção da matemática dedicada aos métodos matemáticos de recolha, sistematização, processamento e interpretação de dados estatísticos, bem como à sua utilização para conclusões científicas ou práticas. As regras e procedimentos da estatística matemática baseiam-se na teoria da probabilidade, o que permite avaliar a exatidão e a confiabilidade das conclusões obtidas em cada problema com base no material estatístico disponível. Ao mesmo tempo, dados estatísticos referem-se a informações sobre o número de objetos em qualquer coleção mais ou menos extensa que possuam determinadas características.

De acordo com o tipo de problema a ser resolvido, a estatística matemática é geralmente dividida em três seções: descrição dos dados, estimativa e teste de hipóteses.

De acordo com o tipo de dados estatísticos processados, a estatística matemática é dividida em quatro áreas:

Estatísticas unidimensionais (estatísticas de variáveis ​​aleatórias), em que o resultado de uma observação é descrito por um número real;

Análise estatística multivariada, onde o resultado da observação de um objeto é descrito por diversos números (vetor);

Estatísticas de processos aleatórios e séries temporais, onde o resultado da observação é uma função;

Estatísticas de objetos de natureza não numérica, em que o resultado da observação é de natureza não numérica, por exemplo, é um conjunto ( figura geométrica), ordenado ou obtido como resultado de medição qualitativa.

Historicamente, algumas áreas da estatística de objetos de natureza não numérica (em particular, problemas de estimativa da percentagem de produtos defeituosos e teste de hipóteses sobre o mesmo) e da estatística unidimensional foram as primeiras a aparecer. O aparato matemático é mais simples para eles, portanto, pelo seu exemplo, costumam demonstrar as ideias principais da estatística matemática.

Apenas esses métodos de processamento de dados, ou seja. as estatísticas matemáticas são baseadas em evidências, que se baseiam em modelos probabilísticos de fenômenos e processos reais relevantes. Estamos falando de modelos de comportamento do consumidor, de ocorrência de riscos, de funcionamento de equipamentos tecnológicos, de obtenção de resultados de um experimento, de evolução de uma doença, etc. Um modelo probabilístico de um fenômeno real deve ser considerado construído se as quantidades consideradas e as relações entre elas forem expressas em termos da teoria das probabilidades. Correspondência com o modelo probabilístico da realidade, ou seja, a sua adequação é comprovada, nomeadamente, com a ajuda de métodos estatísticos de teste de hipóteses.

Métodos incríveis de processamento de dados são exploratórios, só podem ser utilizados na análise preliminar dos dados, pois não permitem avaliar a exatidão e a confiabilidade das conclusões obtidas com base em material estatístico limitado.

Os métodos probabilísticos e estatísticos são aplicáveis ​​sempre que for possível construir e fundamentar um modelo probabilístico de um fenômeno ou processo. A sua utilização é obrigatória quando as conclusões retiradas dos dados da amostra são transferidas para toda a população (por exemplo, de uma amostra para um lote inteiro de produtos).

Em áreas específicas de aplicação, são utilizados métodos estatísticos probabilísticos de ampla aplicação e específicos. Por exemplo, na seção de gestão da produção dedicada aos métodos estatísticos de gestão da qualidade do produto, são utilizadas estatísticas matemáticas aplicadas (incluindo o desenho de experimentos). Com a ajuda dos seus métodos, é realizada uma análise estatística da precisão e estabilidade dos processos tecnológicos e uma avaliação estatística da qualidade. Os métodos específicos incluem métodos de controle estatístico de aceitação da qualidade do produto, regulação estatística de processos tecnológicos, avaliação e controle de confiabilidade, etc.

Disciplinas estatísticas probabilísticas aplicadas, como teoria da confiabilidade e teoria das filas, são amplamente utilizadas. O conteúdo do primeiro deles fica claro no título, o segundo trata do estudo de sistemas como uma central telefônica, que recebe chamadas em horários aleatórios - exigências dos assinantes que discam números em seus telefones. A duração do serviço desses requisitos, ou seja, a duração das conversas também é modelada por variáveis ​​aleatórias. Uma grande contribuição para o desenvolvimento dessas disciplinas foi feita pelo Membro Correspondente da Academia de Ciências da URSS A.Ya. Khinchin (1894-1959), acadêmico da Academia de Ciências da RSS da Ucrânia B.V. Gnedenko (1912-1995) e outros cientistas nacionais.

Resumidamente sobre a história da estatística matemática. A estatística matemática como ciência começa com os trabalhos do famoso matemático alemão Carl Friedrich Gauss (1777-1855), que, com base na teoria da probabilidade, investigou e fundamentou o método dos mínimos quadrados, que criou em 1795 e aplicou ao processamento de dados astronômicos (a fim de esclarecer a órbita de um pequeno planeta Ceres). Uma das distribuições de probabilidade mais populares, a normal, costuma receber seu nome e, na teoria dos processos aleatórios, o principal objeto de estudo são os processos gaussianos.

No final do século XIX. - início do século XX. uma importante contribuição para a estatística matemática foi feita por pesquisadores ingleses, principalmente K. Pearson (1857-1936) e R. A. Fisher (1890-1962). Em particular, Pearson desenvolveu o teste qui-quadrado para testar hipóteses estatísticas, e Fisher desenvolveu a análise de variância, a teoria do desenho experimental e o método de máxima verossimilhança para estimar parâmetros.

Na década de 30 do século XX. o polonês Jerzy Neumann (1894-1977) e o inglês E. Pearson desenvolveram teoria geral teste de hipóteses estatísticas e matemáticos soviéticos Acadêmico A.N. Kolmogorov (1903-1987) e o membro correspondente da Academia de Ciências da URSS N.V. Smirnov (1900-1966) lançaram as bases da estatística não paramétrica. Nos anos quarenta do século XX. O romeno A. Wald (1902-1950) construiu a teoria da análise estatística consistente.

A estatística matemática está se desenvolvendo rapidamente na atualidade. Assim, nos últimos 40 anos, quatro áreas de investigação fundamentalmente novas podem ser distinguidas:

Desenvolvimento e implementação de métodos matemáticos para planejamento de experimentos;

Desenvolvimento de estatísticas de objetos de natureza não numérica como direção independente na estatística matemática aplicada;

Desenvolvimento de métodos estatísticos resistentes a pequenos desvios do modelo probabilístico utilizado;

Amplo desenvolvimento de trabalhos de criação de pacotes de software destinados à análise estatística de dados.

Métodos estatístico-probabilísticos e otimização. A ideia de otimização permeia as modernas estatísticas matemáticas aplicadas e outros métodos estatísticos. Nomeadamente, métodos de planejamento de experimentos, controle estatístico de aceitação, controle estatístico de processos tecnológicos, etc. Por outro lado, formulações de otimização na teoria da decisão, por exemplo, teoria aplicada a otimização da qualidade do produto e os requisitos das normas, prevêem o uso generalizado de métodos estatísticos probabilísticos, principalmente estatística matemática aplicada.

Na gestão da produção, em particular, ao otimizar a qualidade do produto e os requisitos padrão, é especialmente importante aplicar métodos estatísticos na fase inicial do ciclo de vida do produto, ou seja, na fase de preparação de pesquisas para desenvolvimentos de projetos experimentais (desenvolvimento de requisitos promissores para produtos, projeto preliminar, termos de referência para o desenvolvimento de projetos experimentais). Isto deve-se à informação limitada disponível na fase inicial do ciclo de vida do produto e à necessidade de prever as possibilidades técnicas e a situação económica para o futuro. Os métodos estatísticos devem ser aplicados em todas as etapas da resolução de um problema de otimização - ao dimensionar variáveis, desenvolver modelos matemáticos para o funcionamento de produtos e sistemas, realizar experimentos técnicos e econômicos, etc.

Em problemas de otimização, incluindo otimização da qualidade do produto e requisitos padrão, todas as áreas da estatística são utilizadas. Nomeadamente, estatísticas de variáveis ​​aleatórias, análise estatística multivariada, estatísticas de processos aleatórios e séries temporais, estatísticas de objetos de natureza não numérica. Foram desenvolvidas recomendações sobre a escolha de um método estatístico para a análise de dados específicos.

Inglês: A Wikipedia está tornando o site mais seguro. Você está usando um navegador antigo que não poderá se conectar à Wikipedia no futuro. Atualize seu dispositivo ou entre em contato com seu administrador de TI.

中文: 维基百科正在使网站更加安全。您正在使用旧的浏览器,这在将来无法连接维基百科。请更新您的设备或联络您的IT管理员。以下提供更长,更具技术性的更新(仅英语)。

Espanhol: Wikipedia está fazendo o site mais seguro. Usted está usando um navegador web antigo que não será capaz de se conectar à Wikipedia no futuro. Atualize seu dispositivo ou entre em contato com seu administrador informático. Mais abaixo há uma atualização mais longa e mais técnica em inglês.

ﺎﻠﻋﺮﺒﻳﺓ: ويكيبيديا تسعى لتأمين الموقع أكثر من ذي قبل. أنت تستخدم متصفح وب قديم لن يتمكن من الاتصال بموقع ويكيبيديا في المستقبل. يرجى تحديث جهازك أو الاتصال بغداري تقنية المعلومات الخاص بك. يوجد تحديث فني أطول ومغرق في التقنية باللغة الإنجليزية تاليا.

Francês: A Wikipedia aumentará a segurança do seu site. Você usará um navegador da web atual que não poderá mais se conectar à Wikipédia quando isso acontecer. Por favor, forneça seu dispositivo hoje ou entre em contato com seu administrador de informações neste final. As informações complementares, mais técnicas e em inglês estão disponíveis aqui.

日本語: ."しています。

Alemão: A Wikipedia contém a segurança do site. Você usa um outro navegador da Web que não pode ser encontrado mais na Wikipedia. Atualize seu dispositivo ou forneça seu administrador de TI. Ausführlichere (e detalhes técnicos) Hinweise encontra Du unten em inglês Sprache.

Italiano: A Wikipedia está tornando o site mais seguro. Você está usando um navegador da web que não será capaz de se conectar à Wikipedia no futuro. Por favor, atualize seu dispositivo ou entre em contato com seu administrador de informática. Mais em baixo está disponível uma atualização mais detalhada e técnica em inglês.

Magiar: Biztonságosabb lesz na Wikipedia. A böngésző, amit használsz, nem lesz képes kapcssolódni a jövőben. Használj modernebb szoftvert vagy jelezd a problemát a rendszergazdádnak. Alább olvashatod a reszletesebb magyarázatot (angolul).

Suécia: A Wikipedia é mais segura. Você abre uma página da web que não vai permitir que você acesse a Wikipédia no site. Atualize seu dispositivo ou entre em contato com seu administrador de TI. É uma língua longa e mais técnica explicada em língua inglesa.

हिन्दी: विकिपीडिया साइट को और अधिक सुरक्षित बना रहा है। आप एक पुराने वेब ब्राउज़र का उपयोग कर रहे हैं जो भविष्य में विकिपीडिया से कनेक्ट नहीं हो पाएगा। कृपया अपना डिवाइस अपडेट करें या अपने आईटी व्यवस्थापक से संपर्क करें। नीचे अंग्रेजी में एक लंबा और अधिक तकनीकी अद्यतन है।

Estamos removendo o suporte para versões inseguras do protocolo TLS, especificamente TLSv1.0 e TLSv1.1, dos quais o software do seu navegador depende para se conectar aos nossos sites. Isso geralmente é causado por navegadores desatualizados ou smartphones Android mais antigos. Ou pode ser interferência de software "Web Security" corporativo ou pessoal, que na verdade reduz a segurança da conexão.

Você deve atualizar seu navegador ou corrigir esse problema para acessar nossos sites. Esta mensagem permanecerá até 1º de janeiro de 2020. Após essa data, seu navegador não conseguirá estabelecer conexão com nossos servidores.

Como a probabilidade e a estatística matemática são usadas? Essas disciplinas são a base dos métodos estatísticos probabilísticos tomando uma decisão. Para usar seu aparato matemático, você precisa de tarefas tomando uma decisão expresso em termos de modelos estatísticos probabilísticos. Aplicação de um método estatístico-probabilístico específico tomando uma decisão consiste em três etapas:

  • transição da realidade econômica, gerencial e tecnológica para um esquema matemático e estatístico abstrato, ou seja, construindo um modelo probabilístico de um sistema de controle, um processo tecnológico, procedimentos de tomada de decisão, nomeadamente de acordo com os resultados do controlo estatístico, etc.;
  • realizar cálculos e obter conclusões por meios puramente matemáticos no âmbito de um modelo probabilístico;
  • interpretação das conclusões matemáticas e estatísticas em relação a uma situação real e tomada de decisão adequada (por exemplo, sobre a conformidade ou não conformidade da qualidade do produto com os requisitos estabelecidos, a necessidade de ajustar o processo tecnológico, etc.), em particular, conclusões (sobre a proporção de unidades defeituosas de produtos em um lote, sobre a forma específica de leis de distribuição parâmetros controlados processo tecnológico, etc.).

A estatística matemática utiliza os conceitos, métodos e resultados da teoria das probabilidades. Considere as principais questões da construção de modelos probabilísticos tomando uma decisão em situações econômicas, gerenciais, tecnológicas e outras. Pela utilização ativa e correta de documentos normativo-técnicos e instrutivo-metódicos sobre métodos estatísticos probabilísticos tomando uma decisãoé necessário conhecimento prévio. Assim, é necessário saber em que condições um ou outro documento deve ser aplicado, que informações iniciais são necessárias para a sua seleção e aplicação, que decisões devem ser tomadas com base nos resultados do processamento de dados, etc.

Exemplos de aplicação da teoria das probabilidades e estatística matemática. Consideremos vários exemplos em que os modelos estatísticos probabilísticos são uma boa ferramenta para resolver problemas de gestão, industriais, económicos e económicos nacionais. Assim, por exemplo, no romance de A.N. "Caminhando pelos tormentos" de Tolstoi (vol. 1) diz: "a oficina dá vinte e três por cento do casamento, você segura esse número", disse Strukov a Ivan Ilitch.

Surge a questão de como entender essas palavras na conversa dos gestores de fábrica, já que uma unidade de produção não pode apresentar defeito de 23%. Pode ser bom ou defeituoso. Talvez Strukov quisesse dizer que um lote grande contém aproximadamente 23% de unidades defeituosas. Então surge a pergunta: o que significa “sobre”? Deixe 30 em cada 100 unidades de produtos testadas apresentarem defeito, ou em 1.000-300, ou em 100.000-30.000, etc., Strukov deveria ser acusado de mentir?

Ou outro exemplo. A moeda utilizada como lote deve ser "simétrica", ou seja, quando é lançado, em média, em metade dos casos, o brasão deve cair, e em metade dos casos - a treliça (cauda, ​​número). Mas o que significa “média”? Se você realizar muitas séries de 10 lançamentos em cada série, muitas vezes haverá séries em que uma moeda com um brasão cai 4 vezes. Para uma moeda simétrica, isso acontecerá em 20,5% da série. E se houver 40.000 brasões para 100.000 lançamentos, a moeda pode ser considerada simétrica? Procedimento tomando uma decisãoé baseado na teoria da probabilidade e na estatística matemática.

O exemplo em consideração pode não parecer suficientemente sério. No entanto, não é. O sorteio é amplamente utilizado na organização de experimentos de viabilidade industrial, por exemplo, ao processar os resultados da medição do índice de qualidade (momento de atrito) de rolamentos dependendo de vários fatores tecnológicos (a influência de um ambiente de conservação, métodos de preparação de rolamentos antes da medição, o efeito da carga do rolamento no processo de medição, etc.). P.). Suponha que seja necessário comparar a qualidade dos rolamentos em função dos resultados de seu armazenamento em diferentes óleos de conservação, ou seja, em óleos de composição e . Ao planejar tal experimento, surge a questão de quais rolamentos devem ser colocados na composição óleo e quais - na composição óleo, mas de forma a evitar a subjetividade e garantir a objetividade da decisão.

A resposta a esta pergunta pode ser obtida por sorteio. Um exemplo semelhante pode ser dado com o controle de qualidade de qualquer produto. A amostragem é feita para decidir se um lote inspecionado de produtos atende ou não aos requisitos especificados. Com base nos resultados do controle amostral, é feita uma conclusão sobre todo o lote. Neste caso, é muito importante evitar a subjetividade na formação da amostra, ou seja, é necessário que cada unidade de produto do lote controlado tenha a mesma probabilidade de ser selecionada na amostra. Nas condições de produção, a seleção das unidades de produção na amostra geralmente é realizada não por lote, mas por tabelas especiais de números aleatórios ou com a ajuda de geradores de números aleatórios de computador.

Problemas semelhantes para garantir a objectividade da comparação surgem quando se comparam regimes diferentes. organização de produção, remuneração, durante licitações e concursos, seleção de candidatos para vagas, etc. Em todos os lugares você precisa de uma loteria ou procedimentos semelhantes. Expliquemos pelo exemplo da identificação das equipes mais fortes e das segundas mais fortes na organização de um torneio de acordo com o sistema olímpico (o perdedor é eliminado). Deixe o time mais forte sempre vencer o mais fraco. É claro que o time mais forte com certeza será o campeão. A segunda equipe mais forte chegará à final se e somente se não tiver jogos com o futuro campeão antes da final. Se tal jogo for planejado, o segundo time mais forte não chegará à final. Quem planeja o torneio pode “nocautear” antecipadamente o segundo time mais forte do torneio, derrubando-o no primeiro encontro com o líder, ou proporcionar-lhe o segundo lugar, garantindo encontros com times mais fracos até a final. Para evitar subjetividade, faça um sorteio. Para um torneio de 8 equipas, a probabilidade de as duas equipas mais fortes se encontrarem na final é de 4/7. Assim, com probabilidade de 3/7, o segundo time mais forte deixará o torneio antes do previsto.

Em qualquer medição de unidades de produto (usando paquímetro, micrômetro, amperímetro, etc.), existem erros. Para saber se existem erros sistemáticos, é necessário fazer medições repetidas de uma unidade de produto cujas características são conhecidas (por exemplo, uma amostra padrão). Deve-se lembrar que além do erro sistemático, existe também o erro aleatório.

Portanto, surge a questão de como descobrir, a partir dos resultados da medição, se existe um erro sistemático. Se observarmos apenas se o erro obtido na próxima medição é positivo ou negativo, então este problema pode ser reduzido ao anterior. Com efeito, comparemos a medição com o lançamento de uma moeda, o erro positivo - com a perda do brasão, o negativo - com a rede (erro zero com um número suficiente de divisões da escala quase nunca ocorre). Então verificar a ausência de erro sistemático equivale a verificar a simetria da moeda.

O objetivo destas considerações é reduzir o problema de verificação da ausência de erro sistemático ao problema de verificação da simetria de uma moeda. O raciocínio acima leva ao chamado “critério dos sinais” na estatística matemática.

Na regulação estatística dos processos tecnológicos, com base nos métodos da estatística matemática, são desenvolvidas regras e planos de controlo estatístico dos processos, visando a detecção atempada da desordem dos processos tecnológicos, tomando medidas para os ajustar e evitar o lançamento de produtos que não não atender aos requisitos estabelecidos. Estas medidas visam reduzir os custos de produção e as perdas decorrentes do fornecimento de produtos de baixa qualidade. Com o controle estatístico de aceitação, baseado nos métodos da estatística matemática, são desenvolvidos planos de controle de qualidade por meio da análise de amostras de lotes de produtos. A dificuldade está em conseguir construir corretamente modelos estatísticos probabilísticos tomando uma decisão com base nos quais as questões acima podem ser respondidas. Na estatística matemática, modelos probabilísticos e métodos para testar hipóteses foram desenvolvidos para isso, em particular, hipóteses de que a proporção de unidades de produção defeituosas é igual a um certo número, por exemplo, (lembre-se das palavras de Strukov do romance de A.N. Tolstoi).

Tarefas de avaliação. Em várias situações de gestão, industriais, económicas e económicas nacionais, surgem problemas de um tipo diferente - problemas de estimativa das características e parâmetros das distribuições de probabilidade.

Considere um exemplo. Deixe um lote de N lâmpadas elétricas chegar ao controle. Uma amostra de n lâmpadas elétricas foi selecionada aleatoriamente deste lote. Surgem uma série de questões naturais. Como determinar a vida útil média das lâmpadas elétricas a partir dos resultados dos testes dos elementos da amostra e com que precisão essa característica pode ser estimada? Como a precisão mudará se uma amostra maior for coletada? Em que número de horas é possível garantir que pelo menos 90% das lâmpadas elétricas durarão mais de horas?

Suponha que, ao testar uma amostra com um volume de lâmpadas elétricas, as lâmpadas elétricas estivessem com defeito. Surgem então as seguintes questões. Que limites podem ser especificados para o número de lâmpadas eléctricas defeituosas num lote, para o nível de defeito, etc.?

Ou, numa análise estatística da precisão e estabilidade dos processos tecnológicos, é necessário avaliar tais indicadores de qualidade, como média parâmetro controlado e o grau de sua disseminação no processo em consideração. De acordo com a teoria da probabilidade, é aconselhável usar sua expectativa matemática como o valor médio de uma variável aleatória, e a variância, desvio padrão ou o coeficiente de variação. Isto levanta a questão: como estimar estas características estatísticas a partir de dados amostrais e com que precisão isso pode ser feito? Existem muitos exemplos semelhantes. Aqui foi importante mostrar como a teoria das probabilidades e a estatística matemática podem ser utilizadas na gestão da produção na tomada de decisões no campo da gestão estatística da qualidade do produto.

O que é "estatística matemática"? A estatística matemática é entendida como "um ramo da matemática que se dedica aos métodos matemáticos de recolha, sistematização, processamento e interpretação de dados estatísticos, bem como à sua utilização para conclusões científicas ou práticas. As regras e procedimentos da estatística matemática baseiam-se na teoria das probabilidades, o que permite avaliar a precisão e confiabilidade das conclusões obtidas em cada tarefa com base no material estatístico disponível" [ [ 2.2], p. 326]. Ao mesmo tempo, dados estatísticos referem-se a informações sobre o número de objetos em qualquer coleção mais ou menos extensa que possuam determinadas características.

De acordo com o tipo de problema a ser resolvido, a estatística matemática é geralmente dividida em três seções: descrição dos dados, estimativa e teste de hipóteses.

De acordo com o tipo de dados estatísticos processados, a estatística matemática é dividida em quatro áreas:

  • estatísticas unidimensionais (estatísticas de variáveis ​​aleatórias), nas quais o resultado de uma observação é descrito por um número real;
  • análise estatística multidimensional, onde o resultado da observação de um objeto é descrito por diversos números (vetor);
  • estatísticas de processos aleatórios e séries temporais, onde o resultado da observação é uma função;
  • estatísticas de objetos de natureza não numérica, em que o resultado de uma observação é de natureza não numérica, por exemplo, é um conjunto (uma figura geométrica), uma ordenação, ou obtido como resultado de uma medição por um atributo qualitativo.

Historicamente, algumas áreas da estatística de objetos não numéricos (em particular, problemas de estimativa da percentagem de casamento e teste de hipóteses sobre o mesmo) e da estatística unidimensional foram as primeiras a aparecer. O aparato matemático é mais simples para eles, portanto, pelo seu exemplo, costumam demonstrar as ideias principais da estatística matemática.

Apenas esses métodos de processamento de dados, ou seja. as estatísticas matemáticas são baseadas em evidências, que se baseiam em modelos probabilísticos de fenômenos e processos reais relevantes. Estamos falando de modelos de comportamento do consumidor, de ocorrência de riscos, de funcionamento de equipamentos tecnológicos, de obtenção de resultados de um experimento, de evolução de uma doença, etc. Um modelo probabilístico de um fenômeno real deve ser considerado construído se as quantidades consideradas e as relações entre elas forem expressas em termos da teoria das probabilidades. Correspondência com o modelo probabilístico da realidade, ou seja, a sua adequação é comprovada, nomeadamente, através de métodos estatísticos de teste de hipóteses.

Métodos incríveis de processamento de dados são exploratórios, só podem ser utilizados na análise preliminar dos dados, pois não permitem avaliar a exatidão e a confiabilidade das conclusões obtidas com base em material estatístico limitado.

Probabilístico e Métodos estatísticos são aplicáveis ​​sempre que for possível construir e fundamentar um modelo probabilístico de um fenômeno ou processo. A sua utilização é obrigatória quando as conclusões retiradas dos dados da amostra são transferidas para toda a população (por exemplo, de uma amostra para um lote inteiro de produtos).

Em aplicações específicas, eles são usados ​​como métodos probabilísticos. Métodos estatísticos ampla aplicação, bem como específicas. Por exemplo, na seção de gestão da produção dedicada aos métodos estatísticos de gestão da qualidade do produto, são utilizadas estatísticas matemáticas aplicadas (incluindo o desenho de experimentos). Com a ajuda de seus métodos, análise estatística precisão e estabilidade dos processos tecnológicos e avaliação estatística da qualidade. Os métodos específicos incluem métodos de controle estatístico de aceitação da qualidade do produto, regulação estatística de processos tecnológicos, avaliação e controle de confiabilidade, etc.

Disciplinas estatísticas probabilísticas aplicadas, como teoria da confiabilidade e teoria das filas, são amplamente utilizadas. O conteúdo do primeiro deles fica claro no título, o segundo trata do estudo de sistemas como uma central telefônica, que recebe chamadas em horários aleatórios - exigências dos assinantes que discam números em seus telefones. A duração do serviço desses requisitos, ou seja, a duração das conversas também é modelada por variáveis ​​aleatórias. Uma grande contribuição para o desenvolvimento dessas disciplinas foi feita pelo Membro Correspondente da Academia de Ciências da URSS A.Ya. Khinchin (1894-1959), Acadêmico da Academia de Ciências da RSS da Ucrânia B.V. Gnedenko (1912-1995) e outros cientistas nacionais.

Resumidamente sobre a história da estatística matemática. A estatística matemática como ciência começa com os trabalhos do famoso matemático alemão Carl Friedrich Gauss (1777-1855), que, com base na teoria da probabilidade, investigou e fundamentou método dos mínimos quadrados, criado por ele em 1795 e usado para processar dados astronômicos (a fim de refinar a órbita do planeta menor Ceres). Uma das distribuições de probabilidade mais populares, a normal, costuma receber seu nome e, na teoria dos processos aleatórios, o principal objeto de estudo são os processos gaussianos.

No final do século XIX. - início do século XX. uma grande contribuição para a estatística matemática foi feita por pesquisadores ingleses, principalmente K. Pearson (1857-1936) e R.A. Fischer (1890-1962). Em particular, Pearson desenvolveu o critério "qui-quadrado" para testar hipóteses estatísticas, e Fisher - análise de variação, a teoria do planejamento de experimentos, o método de máxima verossimilhança para estimativa de parâmetros.

Na década de 30 do século XX. O polonês Jerzy Neumann (1894-1977) e o inglês E. Pearson desenvolveram uma teoria geral para testar hipóteses estatísticas, e os matemáticos soviéticos Acadêmico A.N. Kolmogorov (1903-1987) e membro correspondente da Academia de Ciências da URSS N.V. Smirnov (1900-1966) lançou as bases da estatística não paramétrica. Nos anos quarenta do século XX. O romeno A. Wald (1902-1950) construiu a teoria da análise estatística consistente.

A estatística matemática está se desenvolvendo rapidamente na atualidade. Assim, nos últimos 40 anos, quatro áreas de pesquisa fundamentalmente novas podem ser distinguidas [ [ 2.16 ] ]:

  • desenvolvimento e implementação de métodos matemáticos para planejamento de experimentos;
  • desenvolvimento de estatísticas de objetos de natureza não numérica como uma direção independente na estatística matemática aplicada;
  • desenvolvimento de métodos estatísticos resistentes a pequenos desvios do modelo probabilístico utilizado;
  • ampla implantação de trabalhos de criação de pacotes de software destinados à análise estatística de dados.

Métodos estatísticos probabilísticos e otimização. A ideia de otimização permeia as modernas estatísticas matemáticas aplicadas e outras Métodos estatísticos. Nomeadamente, métodos de planeamento de experiências, controlo estatístico de aceitação, controlo estatístico de processos tecnológicos, etc. Por outro lado, formulações de otimização em teoria tomando uma decisão, por exemplo, a teoria aplicada de otimização da qualidade do produto e os requisitos dos padrões, prevêem o uso generalizado de métodos estatísticos probabilísticos, principalmente estatística matemática aplicada.

Na gestão da produção, em particular, ao otimizar a qualidade do produto e os requisitos padrão, é especialmente importante aplicar Métodos estatísticos na fase inicial do ciclo de vida do produto, ou seja, na fase de preparação de pesquisas para desenvolvimentos de projetos experimentais (desenvolvimento de requisitos promissores para produtos, projeto preliminar, termos de referência para o desenvolvimento de projetos experimentais). Isto deve-se à informação limitada disponível na fase inicial do ciclo de vida do produto e à necessidade de prever as possibilidades técnicas e a situação económica para o futuro. Métodos estatísticos deve ser aplicado em todas as etapas da resolução do problema de otimização - no dimensionamento de variáveis, no desenvolvimento de modelos matemáticos para o funcionamento de produtos e sistemas, na realização de experimentos técnicos e econômicos, etc.

Em problemas de otimização, incluindo otimização da qualidade do produto e requisitos padrão, todas as áreas da estatística são utilizadas. Ou seja - as estatísticas de variáveis ​​​​aleatórias, multivariadas análise estatística, estatísticas de processos aleatórios e séries temporais, estatísticas de objetos de natureza não numérica. A escolha de um método estatístico para análise de dados específicos deverá ser realizada de acordo com as recomendações [

Postagens semelhantes