quinta-feira, 2 de outubro de 2014

Aula 5 - Medidas de Posição

Média Aritmética

A média de um conjunto de dados numéricos obtém-se somando os valores de todos os dados e dividindo a soma pelo número de dados.

Chapolin se dirigiu até uma pizzaria e comeu três pizzas. Lipão e Rafinha, nenhuma.

  • Em média, quantas pizzas comeu cada um?
  • Saíram todos satisfeitos da pizzaria? 
Dividindo o número de pizzas, 3, pelo número de pessoas,3, obtemos a média de 1 pizza por pessoa. Se nos informarem que três pessoas saíram de uma pizzaria tendo comido, em média, uma pizza cada uma, não devemos nos iludir, achando que todas tenham saído bastante satisfeitas. Que o digam  Lipão e Rafinha, não é?




Moda

Moda é o valor mais frequente de um conjunto de dados. Abaixo veja a série de dados:

7, 8, 9, 10, 10, 10, 11, 12, 13, 14, 15
Ela possui a moda igual a 10.

A moda pode ser:

Amodal
Séries que não possui valor modal, ou seja, nenhum numero possui repetição.
Exemplo: 3, 4, 5, 6, 7, 8, 9
Bimodal
Em uma série pode haver dois valores de concentração.
Exemplo: 3, 4, 4, 4,5, 6, 7, 7, 7, 8, 9
Neste exemplo temos duas modas: 4 e 7.
Multimodal
Quando uma série possui mais de duas modas.
Exemplo: 2, 2, 3, 4, 4, 5, 6, 7, 8, 8, 9,9
Neste exemplo as modas são 2, 4, 8 e 9.

Mediana
Depois de ordenados (colocados em rol) os valores por ordem crescente ou decrescente, a mediana é:

o valor que ocupa a posição central, se a quantidade desses valores for ímpar;
a média dos dois valores centrais, se a quantidade desses valores for par.
Isso quer dizer que mediana é o valor intermediário que separa a metade superior da metade inferior do conjunto de dados. No entanto esse valor pode ser encontrado de formas diferentes caso o número de dados seja par ou ímpar.


terça-feira, 30 de setembro de 2014

Aula 4 - Frequências

Definição


A simples verificação visual de uma série de dados nem sempre permite compreender o significado dos números contido em uma amostra. 

É muito importante destacar o intervalo de variação dos dados e qual deles é o mais e qual é o que menos acontece.

Frequência de uma observação em uma série de dados é o número de repetições dessa observação.

A frequência relativa de uma observação da série de dados é o número de repetições dessa observação dividido pelo tamanho da amostra (N) e multiplicado por 100 (para se apresentar os dados em %).

Assim, para compreender como é constituída a amostra é necessário verificar qual é:
  • o valor máximo e
  •  o valor mínimo encontrados
  •  a amplitude de variação dos dados (diferença entre o maior e o menor valor)
  •  o valor que apresenta a maior frequência
  •  e o que apresenta a menor

Frequência absoluta, relativa e acumulada.


A frequência absoluta de um valor é o número de vezes que certa variável assume esse valor. Portanto, basta contar.

A frequência absoluta pode ser chamada simplesmente de frequência. 

Entretanto, para facilitar a comparação dos dados, é interessante recorrer à frequência relativa, que é o resultado obtido da divisão entre a frequência absoluta pelo total de indivíduos. Geralmente é apresentada na forma de porcentagem. 

Pode-se também usar a frequência acumulada que é o numero de vezes que uma variável assume um valor inferior ou igual a esse valor, ou seja, é a soma das frequências relativas anteriores com a frequência relativa desse valor. 

Supondo que tivéssemos os seguintes dados sobre 10 alunos de certa turma 


Nome
Sexo
Idade
Nome
Sexo
Idade
Sofia
F
14
Mara
F
13
Paulo
M
16
Guilherme
M
13
Alexandre
M
16
Sônia
F
13
João
M
15
Thomaz
M
13
Tiago
M
16
Ana
F
15

1. Se estudarmos a variável sexo, quais as frequências absolutas e relativas?
  • Sofia, Mara, Sônia, Ana = 4 F e Paulo, Alexandre, João, Tiago, Guilherme, Thomaz = 6 M


 Sexo Feminino:
Frequência absoluta: 4
Frequência relativa: 4 em 10 = 40%
Sexo Masculino:
Frequência absoluta: 6
Frequência relativa: 6 em 10 = 60%

Neste exemplo, a frequência acumulada não tem muita utilidade, pois o Sexo é uma variável nominal,
não havendo "categorias anteriores" para somar.


2. Se estudarmos a variável idade, quais as frequências absolutas e relativas?
  • 13 = 4, 14 = 1, 15 = 2, 16 = 3


13 anos:
Frequência absoluta: 4
Frequência relativa: 4 em 10 = 40%
14 anos:
Frequência absoluta: 1
Frequência relativa: 1 em 10 = 10%
15 anos:
Frequência absoluta: 2
Frequência relativa: 2 em 10 = 20%
16 anos:
Frequência absoluta: 3
Frequência relativa: 3 em 10 = 30%

    Lembrando que a frequência relativa de um acontecimento é o quociente da frequência absoluta da ocorrência desse evento pelo número total de elementos em estudo é importante notar que a frequência relativa fornece uma melhor visualização dos dados, pois os valores porcentuais traduzem melhor a situação comparativa de cada caso.


Frequência
Frequência acumulada
Idade
Absoluta
Relativa
Absoluta
Relativa
Valor puro
Em %
Valor puro
em %
13
4
0,40
40
4
0,40
40
14
2
0,20
20
6
0,60
60
15
1
0,10
10
7
0,70
70
16
3
0,30
30
10
1,00
100

Aqui se percebe a importância da frequência acumulada.


Veja o vídeo abaixo:


Aula 3 - Estatística Descritiva

Nessa aula tivemos um pouco sobre estatística descritiva.

A estatística descritiva é a etapa inicial da análise utilizada para descrever e resumir os dados. A
disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revigorou está área da estatística.

Etapas da Análise Estatística 


 O vídeo abaixo mostra um pouco mais sobre o que é Estatística Descritiva e como aplicar:


domingo, 28 de setembro de 2014

Aula 2 - Análise Combinatória

A analise Combinatória é a matemática nos permite contar o número de elementos dentro de um conjunto.
Para que um seja viável contagem, E necessário que o conjunto possua um número limitado de elementos e determinada característica Específica.



Abaixo temos um vídeo que mostra um pouco mais sobre analise combinatória:



AMOSTRAGEM

”Para se saber se o bolo de chocolate está bom, basta comer uma fatia.”

A teoria da amostragem estuda as relações existentes entre uma população
e as amostras extraídas dessa população. E útil para avaliação de grandezas 
desconhecidas da população, ou para determinar se as diferenças observadas
entre duas amostrações devidas ao acaso ou se são verdadeiramente significativas.

Alguns exemplos da utilização da amostragem são:
  •         Sondagens à opinião pública que servem para conhecer a opinião da população sobre variadas questões.  As mais populares são as sondagens políticas.

  •         Inspeção de mercado utilizada com o intuito de descobrir as preferências das pessoas em relação a certos produtos. Um dos exemplos mais conhecidos da aplicação desta amostragem é a lista de audiências dos programas de televisão.

  •         Para estimar a prevalência de uma doença rara, a amostra pode ser constituída por algumas instituições médicas, cada uma das quais tem registro dos pacientes.

Aula 1 - Pirâmide do Conhecimento e Curva de Gauss ou Curva em forma de Sino

Pirâmide do Conhecimento

Aprendemos em nossa primeira aula que a pirâmide do conhecimento deverá apresentar as seguintes informações:
  • Dado - são informações qualitativas, categóricas. 
  • Informação - dados dotados de relevância e propósito. Ele tem significado e é organizado por algum propósito. 
  • Conhecimento - Informações que podem ser utilizadas. "Já o conhecimento, refere-se à habilidade de criar um modelo mental que descreva o objeto e indique as ações a implementar, as decisões a tomar." (Solange Oliveira Rezende, Sistemas Inteligentes, (2003) Manole Barueri São Paulo) 
  • Sabedoria - habilidade de usar o conhecimento adquirido de forma simples e dinâmica. 
Podemos aplicar esta pirâmide em diversas situações. Na figura abaixo lhe proporcionará um melhor entendimento.

Sem sombra de dúvidas que mensurar resultados seja fundamental. Diversas metodologias de gestão foram desenvolvidas baseadas em medições e apurações baseado em indicadores visando assim tentar melhorar determinados processos.

Em muitos casos o levantamento de dados já é um enorme desafio por si só, seja por se tratar de dados oriundos de critérios subjetivos, seja por demandar ferramentas de alto custo e consequentemente sofisticadas para minerar dados, seja por estarem embutidos e ocultos em plataformas legadas que poucos ainda dominam.

Acontece que apesar da dificuldade em se obter dados, estes por si só são apenas números, textos e tabelas, usualmente em volumes humanamente impossíveis de serem analisados individualmente. E o maior desafio na verdade nunca foi capturar os dados, mas transformá-los em informação rica e útil.



Essa enxurrada de dados certamente causará pânico a qualquer time com pouca intimidade no processamento destas ricas informações, mas nas mãos de um profissional de business intelligence ou um Estatístico podem aplicar minerar com mais eficiência dados e auxiliar nas tomadas de decisões estratégias de maneira mais assertiva em seu negócio. Hoje no mundo virtual como por exemplo no e-commerce agindo no seu estoque, distribuição, satisfação, hábitos, intenção de compras, qualidade de vida e preferências de seus clientes. Uma destas ferramentas que acredito ser umas das mais completas para BI e estatísticas é o QlikView.



Curva de Gauss ou Curva Normal

Conhecida como a curva de Gauss, Curva Normal ou curva em forma de sino, é um gráfico visivelmente de distribuição normal que apresenta um determinado conjunto de dados mostrando em sua função que possui propriedades peculiares. Este nome se deve à suposição que o cientista Gauss tenha sido a primeira pessoa a fazer uso de suas propriedades.

Esta função aplicada em estatísticas é fundamental, ela define a probabilidade de ocorrência de certos eventos. Esta distribuição de probabilidades é definida pela função ou gráfico abaixo:



Antes de conhecer um Professor Valente....