1 @c Language: Brazilian Portuguese, Encoding: iso-8859-1
2 @c /stats.texi/1.5/Sat Jun 2 00:13:33 2007//
4 * Introduç@~{a}o a stats::
5 * Funç@~{o}es e Vari@'{a}veis Definidas para inference_result::
6 * Funç@~{o}es e Vari@'{a}veis Definidas para stats::
7 * Funç@~{o}es e Vari@'{a}veis Definidas para distribuiç@~{o}es especiais::
10 @node Introduç@~{a}o a stats, Funç@~{o}es e Vari@'{a}veis Definidas para inference_result, Top, Top
11 @section Introduç@~{a}o a stats
14 O pacote @code{stats} cont@'{e}m um conjunto de procedimentos de infer@^{e}ncia cl@'{a}ssica
15 estat@'{i}stica e procedimentos de teste.
17 Todas essas funç@~{o}es retornam um objeto do Maxima chamado @code{inference_result} que cont@'{e}m
18 os resultados necess@'{a}rios para infer@^{e}ncias de manipulaç@~{a}o e tomada de decis@~{o}es.
20 A vari@'{a}vel global @code{stats_numer} controla se resultados s@~{a}o mostrados em
21 ponto flutuante ou simb@'{o}lico e no formato racional; seu valor padr@~{a}o @'{e} @code{true}
22 e os resultados s@~{a}o retornados no formato de ponto flutuante.
24 O pacote @code{descriptive} cont@'{e}m alguns utilit@'{a}rios para manipular estruturas de dados
25 (listas e matrizes); por exemplo, para extrair subamostras. O pacote @code{descriptive} tamb@'{e}m cont@'{e}m alguns
26 exemplos sobre como usar o pacote @code{numericalio} para ler dados a partir de arquivo no formato texto
27 plano. Veja @code{descriptive} e @code{numericalio} para maiores detalhes.
29 O pacote @code{stats} precisa dos pacotes @code{descriptive}, @code{distrib} e
30 @code{inference_result}.
32 Para coment@'{a}rios, erros ou sugest@~{o}es, por favor contate o autor em
34 @var{'mario AT edu DOT xunta DOT es'}.
37 @node Funç@~{o}es e Vari@'{a}veis Definidas para inference_result, Funç@~{o}es e Vari@'{a}veis Definidas para stats, Introduç@~{a}o a stats, Top
38 @section Funç@~{o}es e Vari@'{a}veis Definidas para inference_result
40 @deffn {Funç@~{a}o} inference_result (@var{t@'{i}tulo}, @var{valores}, @var{n@'{u}meros})
42 Constr@'{o}i um objeto @code{inference_result} do tipo retornado pelas
43 funç@~{o}es stats. O argumento @var{t@'{i}tulo} @'{e} uma
44 seq@"{u}@^{e}ncia de caracteres do Maxima co o nome do procedimento; @var{valores} @'{e} uma lissta com
45 elementos da forma @code{s@'{i}mbolo = valor} e @var{n@'{u}meros} @'{e} uma lista
46 com n@'{u}meros inteiros positivos no intervalo de um para @code{length(@var{valores})},
47 indicando que valores ser@~{a}o mostrados por padr@~{a}o.
51 Este @'{e} um exemplo que mostras os resultados associados a um ret@'{a}ngulo. O
52 t@'{i}tulo deste objeto @'{e} a seq@"{u}@^{e}ncia de caraceteres @code{"Ret@^{a}ngulo"}, o qual armazena cinco resultados, a saber
53 @code{'base}, @code{'altura}, @code{'diagonal}, @code{'@'{a}rea},
54 e @code{'per@'{i}metro}, por@'{e}m s@'{o} mostra o primeiro, segundo, quinto e quarto
55 resultado. O resultado @code{'diagonal} tamb@'{e}m @'{e} armazenado neste objeto, no entanto n@~{a}o @'{e}
56 mostrado por padr@~{a}o; para se ter acesso a este valor, faz-se uso da funç@~{a}o @code{take_inference}.
59 @c load (inference_result)$
61 @c inference_result("Ret@^{a}ngulo",
64 @c 'diagonal=sqrt(b^2+h^2),
66 @c 'per@'{i}metro=2*(b+h)],
68 @c take_inference('diagonal,%);
71 (%i1) load(inference_result)$
73 (%i3) inference_result("Ret@^{a}ngulo",
76 'diagonal=sqrt(b^2+h^2),
78 'per@'{i}metro=2*(b+h)],
89 (%i4) take_inference('diagonal,%);
93 Veja tamb@'{e}m @code{take_inference}.
101 @deffn {Funç@~{a}o} inferencep (@var{obj})
103 Retorna @code{true} ou @code{false}, dependendo se @var{obj} @'{e}
104 um objeto @code{inference_result} ou n@~{a}o.
113 @deffn {Funç@~{a}o} items_inference (@var{obj})
115 Retorna uma lista com os nomes dos itens em @var{obj}, que devem
116 ser um objeto @code{inference_result}.
120 O objeto @code{inference_result} armazena dois valores, a saber @code{'pi} e @code{'e},
121 mas somente o segundo @'{e} mostrado. A funç@~{a}o @code{items_inference} retorna os nomes
122 de todos os itens, n@~{a}o importa se eles s@~{a}o ou n@~{a}o mostrados.
125 @c load (inference_result)$
126 @c inference_result("Hi", ['pi=%pi,'e=%e],[2]);
127 @c items_inference(%);
130 (%i1) load(inference_result)$
131 (%i2) inference_result("Hi", ['pi=%pi,'e=%e],[2]);
135 (%i3) items_inference(%);
146 @deffn {Funç@~{a}o} take_inference (@var{n}, @var{obj})
147 @deffnx {Funç@~{a}o} take_inference (@var{nome}, @var{obj})
148 @deffnx {Funç@~{a}o} take_inference (@var{lista}, @var{obj})
150 Retorna o @var{n}-@'{e}simo valor armazenado em @var{obj} se @var{n} for um inteiro positivo,
151 ou o item chamado @var{nome} se esse for o nome de um item. Se o primeiro
152 argumento for uma lista de n@'{u}meros e/ou s@'{i}mbolos, a funç@~{a}o @code{take_inference} retorna
153 uma lista com os resultados correspondentes.
157 Fornece um objeto @code{inference_result}, a funç@~{a}o @code{take_inference} @'{e}
158 chamada com o objetivo de extrair alguma informaç@~{a}o armazenada nesse objeto.
161 @c load (inference_result)$
163 @c sol:inference_result("Ret@^{a}ngulo",
166 @c 'diagonal=sqrt(b^2+h^2),
168 @c 'per@'{i}metro=2*(b+h)],
170 @c take_inference('base,sol);
171 @c take_inference(5,sol);
172 @c take_inference([1,'diagonal],sol);
173 @c take_inference(items_inference(sol),sol);
176 (%i1) load(inference_result)$
178 (%i3) sol: inference_result("Ret@^{a}ngulo",
181 'diagonal=sqrt(b^2+h^2),
183 'per@'{i}metro=2*(b+h)],
194 (%i4) take_inference('base,sol);
196 (%i5) take_inference(5,sol);
198 (%i6) take_inference([1,'diagonal],sol);
200 (%i7) take_inference(items_inference(sol),sol);
201 (%o7) [3, 2, sqrt(13), 6, 10]
204 Veja tamb@'{e}m @code{inference_result} e @code{take_inference}.
215 @node Funç@~{o}es e Vari@'{a}veis Definidas para stats, Funç@~{o}es e Vari@'{a}veis Definidas para distribuiç@~{o}es especiais, Funç@~{o}es e Vari@'{a}veis Definidas para inference_result, Top
216 @section Funç@~{o}es e Vari@'{a}veis Definidas para stats
219 @defvr {Vari@'{a}vel de opç@~{a}o} stats_numer
220 Valor padr@~{a}o: @code{true}
222 Se @code{stats_numer} for @code{true}, funç@~{o}es de infer@^{e}ncia estat@'{i}stica
223 retornam seus resultados em n@'{u}meros com ponto flutuante. Se @code{stats_numer} for @code{false},
224 resultados s@~{a}o fornecidos em formato simb@'{o}lico e racional.
230 @deffn {Funç@~{a}o} test_mean (@var{x})
231 @deffnx {Funç@~{a}o} test_mean (@var{x}, @var{opç@~{a}o_1}, @var{opç@~{a}o_2}, ...)
233 Esse @'{e} o teste-@var{t} de m@'{e}dia. O argumento @var{x} @'{e} uma lista ou uma matriz coluna
234 contendo uma amostra unidimensional. @code{test_mean} tamb;em executa um teste assint@'{o}tico
235 baseado no @i{Teorema do Limite Central} se a opç@~{a}o @code{'asymptotic} for
243 @code{'mean}, o valor padr@~{a}o @'{e} @code{0}, @'{e} o valor da m@'{e}dia a ser verificado.
246 @code{'alternative}, o valor padr@~{a}o @'{e} @code{'twosided}, @'{e} a hip@'{o}tese alternativa;
247 valores v@'{a}lidos s@~{a}o: @code{'twosided}, @code{'greater} e @code{'less}.
250 @code{'dev}, o valor padr@~{a}o @'{e} @code{'unknown}, corresponde ao valor do desvio padr@~{a}o quando esse valor de desvio padr@~{a}o for
251 conhecido; valores v@'{a}lidos s@~{a}o: @code{'unknown} ou uma express@~{a}o positiva.
254 @code{'conflevel}, o valor padr@~{a}o @'{e} @code{95/100}, n@'{i}vel de confid@^{e}ncia para o intervalo de confid@^{e}ncia; deve
255 ser uma express@~{a}o que toma um valor em (0,1).
258 @code{'asymptotic}, o valor padr@~{a}o @'{e} @code{false}, indica se @code{test_mean} exeecuta um teste-@var{t} exato ou
259 um teste assint@'{o}tico baseando-se no @i{Teorema do Limite Central};
260 valores v@'{a}lidos s@~{a}o @code{true} e @code{false}.
264 A sa@'{i}da da funç@~{a}o @code{test_mean} @'{e} um objeto @code{inference_result} do Maxima
265 mostrando os seguintes resultados:
270 @code{'mean_estimate}: a m@'{e}dia da amostra.
273 @code{'conf_level}: n@'{i}vel de confid@^{e}ncia selecionado pelo usu@'{a}rio.
276 @code{'conf_interval}: intervalo de confid@^{e}ncia para a m@'{e}dia da populaç@~{a}o.
279 @code{'method}: procedimento de infer@^{e}ncia.
282 @code{'hypotheses}: hip@'{o}tese do nulo e hip@'{o}tese alternativa a ser testada.
285 @code{'statistic}: valor da amostra estat@'{i}stica a ser usado para testar a hip@'{o}tese do nulo.
288 @code{'distribution}: distribuiç@~{a}o da amostra estat@'{i}stica, juntamente com seus par@^{a}metro(s).
291 @code{'p_value}: valores de @math{p} do teste.
297 Executa um teste-@var{t} exato com vari@^{a}ncia desconhecida. A hip@'{o}tese do nulo
298 @'{e} @math{H_0: mean=50} contra a alternativa unilatera @math{H_1: mean<50};
299 conforme os resultados, o valor de @math{p} @'{e} muito grande, n@~{a}o existem
300 evid@^{e}ncias paa rejeitar @math{H_0}.
304 @c data: [78,64,35,45,45,75,43,74,42,42]$
305 @c test_mean(data,'conflevel=0.9,'alternative='less,'mean=50);
309 (%i2) data: [78,64,35,45,45,75,43,74,42,42]$
310 (%i3) test_mean(data,'conflevel=0.9,'alternative='less,'mean=50);
313 | mean_estimate = 54.3
317 | conf_interval = [minf, 61.51314273502712]
319 (%o3) | method = Exact t-test. Unknown variance.
321 | hypotheses = H0: mean = 50 , H1: mean < 50
323 | statistic = .8244705235071678
325 | distribution = [student_t, 9]
327 | p_value = .7845100411786889
330 Nesta ocasi@~{a}o Maxima executa um testte assint@'{o}tico, baseado no @i{Teorema do Limite Central}.
331 A hip@'{o}tese do nulo @'{e} @math{H_0: equal(mean, 50)} contra a alternativa de duas vias @math{H_1: not equal(mean, 50)};
332 conforme os resultados, o valor de @math{p} @'{e} muito pequeno, @math{H_0} pode ser rejeitado em
333 favor da alternativa @math{H_1}. Note que, como indicado pela componente @code{Method},
334 esse procedimento pode ser aplicado a grandes amostras.
338 @c test_mean([36,118,52,87,35,256,56,178,57,57,89,34,25,98,35,
339 @c 98,41,45,198,54,79,63,35,45,44,75,42,75,45,45,
340 @c 45,51,123,54,151],
341 @c 'asymptotic=true,'mean=50);
345 (%i2) test_mean([36,118,52,87,35,256,56,178,57,57,89,34,25,98,35,
346 98,41,45,198,54,79,63,35,45,44,75,42,75,45,45,
348 'asymptotic=true,'mean=50);
351 | mean_estimate = 74.88571428571429
355 | conf_interval = [57.72848600856194, 92.04294256286663]
357 (%o2) | method = Large sample z-test. Unknown variance.
359 | hypotheses = H0: mean = 50 , H1: mean # 50
361 | statistic = 2.842831192874313
363 | distribution = [normal, 0, 1]
365 | p_value = .004471474652002261
376 @deffn {Funç@~{a}o} test_means_difference (@var{x1}, @var{x2})
377 @deffnx {Funç@~{a}o} test_means_difference (@var{x1}, @var{x2}, @var{opç@~{a}o_1}, @var{opç@~{a}o_2}, ...)
379 Esse @'{e} o teste-@var{t} de diferença de m@'{e}dias entre duas amostras.
380 Os argumentos @var{x1} e @var{x2} s@~{a}o listas ou matrizes colunas
381 contendo duas amostras independentes. No caso de diferentes vari@^{a}ncias desconhecidas
382 (veja opç@~{o}es @code{'dev1}, @code{'dev2} e @code{'varequal} abaixo),
383 os graus de liberdade s@~{a}o calculados por meio da aproximaç@~{a}o de Welch.
384 @code{test_means_difference} tamb@'{e}m executa um teste assint@'{o}tico
385 baseado no @i{Teorema do Limite Central} se a opç@~{a}o @code{'asymptotic} for
386 escolhida para @code{true}.
395 @code{'alternative}, o valor padr@~{a}o @'{e} @code{'twosided}, @'{e} a hip@'{o}tese alternativa;
396 valores v@'{a}lidos s@~{a}o: @code{'twosided}, @code{'greater} e @code{'less}.
399 @code{'dev1}, o valor padr@~{a}o @'{e} @code{'unknown}, @'{e} o valor do desvio padr@~{a}o
400 da amostra @var{x1} quando esse desvio for conhecido; valores v@'{a}lidos s@~{a}o: @code{'unknown} ou uma express@~{a}o positiva.
403 @code{'dev2}, o valor padr@~{a}o @'{e} @code{'unknown}, @'{e} o valor do desvio padr@~{a}o
404 da amostra @var{x2} quando esse desvio for conhecido; valores v@'{a}lidos s@~{a}o: @code{'unknown} ou uma express@~{a}o positiva.
407 @code{'varequal}, o valor padr@~{a}o @'{e} @code{false}, se vari@^{a}ncias podem serem consideradas como iguais ou n@~{a}o;
408 essa opç@~{a}o tem efeito somente quando @code{'dev1} e/ou @code{'dev2} forem @code{'unknown}.
411 @code{'conflevel}, o valor padr@~{a}o @'{e} @code{95/100}, n@'{i}vel de confid@^{e}ncia para o intervalo de confid@^{e}ncia; deve
412 ser uma express@~{a}o que toma valores em (0,1).
414 Nota de Traduç@~{a}o: (0,1) representa intervalo aberto.
417 @code{'asymptotic}, o valor padr@~{a}o @'{e} @code{false}, indica se @code{test_means_difference} executa um teste-@var{t} exato ou
418 um teste ass@'{i}nt@'{o}tico baseando-se no @i{Teorema do Limite Central};
419 valores v@'{a}lidos s@~{a}o @code{true} e @code{false}.
423 A sa@'{i}da da funç@~{a}o @code{test_means_difference} @'{e} um objeto @code{inference_result} do Maxima
424 mostrando os seguintes resultados:
429 @code{'diff_estimate}: a diferença de m@'{e}dias estimadas.
432 @code{'conf_level}: n@'{i}vel de confid@^{e}ncia selecionado pelo usu@'{a}rio.
435 @code{'conf_interval}: intervalo de confid@^{e}ncia para a diferença de m@'{e}dias.
438 @code{'method}: procedimento de infer@^{e}ncia.
441 @code{'hypotheses}: a hip@'{o}tese do nulo e a hip@'{o}tese alternativa a serem testadas.
444 @code{'statistic}: valor da amostra estat@'{i}stica usado para testar a hip@'{o}tese do nulo.
447 @code{'distribution}: distribuiç@~{a}o da amostra estat@'{i}stica, juntamente com seu(s) par@^{a}metro(s).
450 @code{'p_value}: valor de @math{p} do teste.
456 A igualdade de m@'{e}dias @'{e} testada com duas pequenas amostras @var{x} e @var{y},
457 contra a alternativa @math{H_1: m_1>m_2}, sendo @math{m_1} e @math{m_2}
458 as m@'{e}dias das populaç@~{o}es; vari@^{a}ncias s@~{a}o desconhecidas e supostamente admitidas para serem diferentes.
460 @c equivalent code for R:
461 @c x <- c(20.4,62.5,61.3,44.2,11.1,23.7)
462 @c y <- c(1.2,6.9,38.7,20.4,17.2)
463 @c t.test(x,y,alternative="greater")
467 @c x: [20.4,62.5,61.3,44.2,11.1,23.7]$
468 @c y: [1.2,6.9,38.7,20.4,17.2]$
469 @c test_means_difference(x,y,'alternative='greater);
473 (%i2) x: [20.4,62.5,61.3,44.2,11.1,23.7]$
474 (%i3) y: [1.2,6.9,38.7,20.4,17.2]$
475 (%i4) test_means_difference(x,y,'alternative='greater);
476 | DIFFERENCE OF MEANS TEST
478 | diff_estimate = 20.31999999999999
482 | conf_interval = [- .04597417812882298, inf]
484 (%o4) | method = Exact t-test. Welch approx.
486 | hypotheses = H0: mean1 = mean2 , H1: mean1 > mean2
488 | statistic = 1.838004300728477
490 | distribution = [student_t, 8.62758740184604]
492 | p_value = .05032746527991905
495 O mesmo teste que antes, mas agora as vari@^{a}ncias s@~{a}o admitidas serem supostamente
498 @c equivalent code for R:
499 @c x <- c(20.4,62.5,61.3,44.2,11.1,23.7)
500 @c y <- c(1.2,6.9,38.7,20.4,17.2)
501 @c t.test(x,y,var.equal=T,alternative="greater")
505 @c x: [20.4,62.5,61.3,44.2,11.1,23.7]$
506 @c y: [1.2,6.9,38.7,20.4,17.2]$
507 @c test_means_difference(x,y,'alternative='greater,'varequal=true);
511 (%i2) x: [20.4,62.5,61.3,44.2,11.1,23.7]$
512 (%i3) y: matrix([1.2],[6.9],[38.7],[20.4],[17.2])$
513 (%i4) test_means_difference(x,y,'alternative='greater,'varequal=true);
514 | DIFFERENCE OF MEANS TEST
516 | diff_estimate = 20.31999999999999
520 | conf_interval = [- .7722627696897568, inf]
522 (%o4) | method = Exact t-test. Unknown equal variances
524 | hypotheses = H0: mean1 = mean2 , H1: mean1 > mean2
526 | statistic = 1.765996124515009
528 | distribution = [student_t, 9]
530 | p_value = .05560320992529344
541 @deffn {Funç@~{a}o} test_variance (@var{x})
542 @deffnx {Funç@~{a}o} test_variance (@var{x}, @var{opç@~{a}o_1}, @var{opç@~{a}o_2}, ...)
544 Esse @'{e} o teste da vari@^{a}ncia @var{chi^2}. O argumento @var{x} @'{e} uma lista ou uma matriz coluna
545 contendo uma amostra unidimensional tomada entre a populaç@~{a}o normal.
552 @code{'mean}, o valor padr@~{a}o @'{e} @code{'unknown}, @'{e} a m@'{e}dia da populaç@~{a}o, quando for conhecida.
555 @code{'alternative}, o valor padr@~{a}o @'{e} @code{'twosided}, @'{e} a hip@'{o}tese alternativa;
556 valores v@'{a}lidos s@~{a}o: @code{'twosided}, @code{'greater} e @code{'less}.
559 @code{'variance}, o valor padr@~{a}o @'{e} @code{1}, isso @'{e} o valor (positivo) da vari@^{a}ncia a ser testado.
562 @code{'conflevel}, o valor padr@~{a}o @'{e} @code{95/100}, n@'{i}vel de confid@^{e}ncia para o intervalo de confid@^{e}ncia; deve
563 ser uma express@~{a}o que toma valores em (0,1).
567 A sa@'{i}da da funç@~{a}o @code{test_variance} est@'{a} no objeto @code{inference_result} do Maxima
568 mostrando os seguintes resultados:
573 @code{'var_estimate}: a vari@^{a}ncia da amostra.
576 @code{'conf_level}: n@'{i}vel de confid@^{e}ncia selecionado pelo usu@'{a}rio.
579 @code{'conf_interval}: intervalo de confid@^{e}ncia para a vari@^{a}ncia da populaç@~{a}o.
582 @code{'method}: procedimento de infer@^{e}ncia.
585 @code{'hypotheses}: a hip@'{o}tese do nulo e a hip@'{o}tese alternativa a serem testadas.
588 @code{'statistic}: valor da amostra estat@'{i}stica usado para testar a hip@'{o}tese do nulo.
591 @code{'distribution}: distribuiç@~{a}o da amostra estat@'{i}stica, juntamente com seu par@^{a}metro.
594 @code{'p_value}: o valor de @math{p} do teste.
600 Isso @'{e} testado se a vari@^{a}ncia de uma populaç@~{a}o com m@'{e}dia desconhhecida
601 for igual ou maior que 200.
605 @c x: [203,229,215,220,223,233,208,228,20]$
606 @c test_variance(x,'alternative='greater,'variance=200);
610 (%i2) x: [203,229,215,220,223,233,208,228,209]$
611 (%i3) test_variance(x,'alternative='greater,'variance=200);
614 | var_estimate = 110.75
618 | conf_interval = [57.13433376937479, inf]
620 (%o3) | method = Variance Chi-square test. Unknown mean.
622 | hypotheses = H0: var = 200 , H1: var > 200
626 | distribution = [chi2, 8]
628 | p_value = .8163948512777689
639 @deffn {Funç@~{a}o} test_variance_ratio (@var{x1}, @var{x2})
640 @deffnx {Funç@~{a}o} test_variance_ratio (@var{x1}, @var{x2}, @var{opç@~{a}o_1}, @var{opç@~{a}o_2}, ...)
642 Isso @'{e} o teste @var{F} da raz@~{a}o de vari@^{a}ncia para duas populaç@~{o}es normais.
643 Os argumentos @var{x1} e @var{x2} s@~{a}o listas ou matrizes colunas
644 contendo duas amostras independentes.
651 @code{'alternative}, o valor padr@~{a}o @'{e} @code{'twosided}, @'{e} a hip@'{o}tese alternativa;
652 valores v@'{a}lidos s@~{a}o: @code{'twosided}, @code{'greater} e @code{'less}.
655 @code{'mean1}, o valor padr@~{a}o @'{e} @code{'unknown}, quando for conhecida, isso @'{e} a m@'{e}dia da
656 populaç@~{a}o da qual @var{x1} foi tomada.
659 @code{'mean2}, o valor padr@~{a}o @'{e} @code{'unknown}, quando for conhecida, isso @'{e} a m@'{e}dia da
660 populaç@~{a}o da qual @var{x2} foi tomada.
663 @code{'conflevel}, o valor padr@~{a}o @'{e} @code{95/100}, n@'{i}vel de confid@^{e}ncia para o intervalo de confid@^{e}ncia da
664 raz@~{a}o; deve ser uma express@~{a}o que tome valores em (0,1).
668 A sa@'{i}da da funç@~{a}o @code{test_variance_ratio} @'{e} um objeto @code{inference_result} do Maxima
669 mostrando os seguintes resultados:
674 @code{'ratio_estimate}: a raz@~{a}o de vari@^{a}ncia da amostra.
677 @code{'conf_level}: n@'{i}vel de confid@^{e}ncia selecionado pelo usu@'{a}rio.
680 @code{'conf_interval}: intervalo de confid@^{e}ncia para a raz@~{a}o de vari@^{a}ncia.
683 @code{'method}: procedimento de infer@^{e}ncia.
686 @code{'hypotheses}: a hip@'{o}tese do nulo e a hip@'{o}tese alternativa a serem testadas.
689 @code{'statistic}: valor da amostra estat@'{i}stica usado para testar a hip@'{o}tese do nulo.
692 @code{'distribution}: distribuiç@~{a}o da amostra estat@'{i}stica, juntamente com seus par@^{a}metros.
695 @code{'p_value}: o valor de @math{p} do teste.
702 a igualdade das vari@^{a}ncias de duas populaç@~{o}es normais @'{e} verificado
703 contra a alternativa que a primeira @'{e} maior que a segunda.
705 @c equivalent code for R:
706 @c x <- c(20.4,62.5,61.3,44.2,11.1,23.7)
707 @c y <- c(1.2,6.9,38.7,20.4,17.2)
708 @c var.test(x,y,alternative="greater")
712 @c x: [20.4,62.5,61.3,44.2,11.1,23.7]$
713 @c y: [1.2,6.9,38.7,20.4,17.2]$
714 @c test_variance_ratio(x,y,'alternative='greater);
718 (%i2) x: [20.4,62.5,61.3,44.2,11.1,23.7]$
719 (%i3) y: [1.2,6.9,38.7,20.4,17.2]$
720 (%i4) test_variance_ratio(x,y,'alternative='greater);
721 | VARIANCE RATIO TEST
723 | ratio_estimate = 2.316933391522034
727 | conf_interval = [.3703504689507268, inf]
729 (%o4) | method = Variance ratio F-test. Unknown means.
731 | hypotheses = H0: var1 = var2 , H1: var1 > var2
733 | statistic = 2.316933391522034
735 | distribution = [f, 5, 4]
737 | p_value = .2179269692254457
747 @deffn {Funç@~{a}o} test_sign (@var{x})
748 @deffnx {Funç@~{a}o} test_sign (@var{x}, @var{opç@~{a}o_1}, @var{opç@~{a}o_2}, ...)
750 Esse @'{e} o teste de sinal n@~{a}o param@'{e}trico para a mediana de uma populaç@~{a}o cont@'{i}nua.
751 O argumento @var{x} @'{e} uma lista ou uma matriz coluna contendo uma amostra unidimensional.
758 @code{'alternative}, o valor padr@~{a}o @'{e} @code{'twosided}, @'{e} a hip@'{o}tese alternativa;
759 valores v@'{a}lidos s@~{a}o: @code{'twosided}, @code{'greater} e @code{'less}.
762 @code{'median}, o valor padr@~{a}o @'{e} @code{0}, @'{e} o valor da mediana a ser verificado.
766 A sa@'{i}da da funç@~{a}o @code{test_sign} @'{e} um objeto @code{inference_result} do Maxima
767 mostrando os seguintes resultados:
772 @code{'med_estimate}: a mediana da amostra.
775 @code{'method}: procedimento de infer@^{e}ncia.
778 @code{'hypotheses}: a hip@'{o}tese do nulo e a hip@'{o}tese alternativa a serem testadas.
781 @code{'statistic}: valor da amostra estat@'{i}stica usada para testar a hip@'{o}tese do nulo.
784 @code{'distribution}: distribuiç@~{a}o da amostra estat@'{i}stica, juntamente com seu(s) par@^{a}metro(s).
787 @code{'p_value}: o valor de @math{p} do teste.
793 Verifica se a populaç@~{a}o da qual a amostra foi tomada tem mediana 6,
794 contra a alternativa @math{H_1: median > 6}.
798 @c x: [2,0.1,7,1.8,4,2.3,5.6,7.4,5.1,6.1,6]$
799 @c test_sign(x,'median=6,'alternative='greater);
803 (%i2) x: [2,0.1,7,1.8,4,2.3,5.6,7.4,5.1,6.1,6]$
804 (%i3) test_sign(x,'median=6,'alternative='greater);
809 | method = Non parametric sign test.
811 (%o3) | hypotheses = H0: median = 6 , H1: median > 6
815 | distribution = [binomial, 10, 0.5]
817 | p_value = .05468749999999989
830 @deffn {Funç@~{a}o} test_signed_rank (@var{x})
831 @deffnx {Funç@~{a}o} test_signed_rank (@var{x}, @var{opç@~{a}o_1}, @var{opç@~{a}o_2}, ...)
833 Esse @'{e} o teste de ranque sinalizado de Wilcoxon para fazer infer@^{e}ncias sobre a mediana de uma
834 populaç@~{a}o cont@'{i}nua. O argumento @var{x} @'{e} uma lista ou uma matriz coluna
835 contendo uma amostra unidimensional. Executa uma aproximaç@~{a}o normal se o
836 tamanho da amostra for maior que 20, ou se existirem zeros ou houverem empates.
838 Veja tamb@'{e}m @code{pdf_rank_test} e @code{cdf_rank_test}.
845 @code{'median}, o valor padr@~{a}o @'{e} @code{0}, @'{e} o valor da mediana a ser verificado.
848 @code{'alternative}, o valor padr@~{a}o @'{e} @code{'twosided}, @'{e} a hip@'{o}tese alternativa;
849 valores v@'{a}lidos s@~{a}o: @code{'twosided}, @code{'greater} e @code{'less}.
853 A sa@'{i}da da funç@~{a}o @code{test_signed_rank} @'{e} um objeto @code{inference_result} do Maxima
854 com os seguintes resultados:
859 @code{'med_estimate}: a mediana da amostra.
862 @code{'method}: procedimento de infer@^{e}ncia.
865 @code{'hypotheses}: a hip@'{o}tese do nulo e a hip@'{o}tese alternativa a serem testadas.
868 @code{'statistic}: valor da amostra estat@'{i}stica usado para testar a hip@'{o}tese do nulo.
871 @code{'distribution}: distribuiç@~{a}o da amostra estat@'{i}stica, juntamente com seu(s) par@^{a}metro(s).
874 @code{'p_value}: o valor de @math{p} do teste.
880 Verifica a hip@'{o}tese do nulo @math{H_0: median = 15} contra a
881 alternativa @math{H_1: median > 15}. Esse @'{e} um teste exato, ua vez que
882 n@~{a}o exite empates.
884 @c equivalent code for R:
885 @c x <- c(17.1,15.9,13.7,13.4,15.5,17.6)
886 @c wilcox.test(x,mu=15,alternative="greater")
890 @c x: [17.1,15.9,13.7,13.4,15.5,17.6]$
891 @c test_signed_rank(x,median=15,alternative=greater);
895 (%i2) x: [17.1,15.9,13.7,13.4,15.5,17.6]$
896 (%i3) test_signed_rank(x,median=15,alternative=greater);
899 | med_estimate = 15.7
901 | method = Exact test
903 (%o3) | hypotheses = H0: med = 15 , H1: med > 15
907 | distribution = [signed_rank, 6]
912 Verifica a hip@'{o}tese do nulo @math{H_0: equal(median, 2.5)} contra a
913 alternativa @math{H_1: not equal(median, 2.5)}. Esse @'{e} um teste aproximado,
914 uma vez que ocorrem empates.
916 @c equivalent code for R:
917 @c y<-c(1.9,2.3,2.6,1.9,1.6,3.3,4.2,4,2.4,2.9,1.5,3,2.9,4.2,3.1)
918 @c wilcox.test(y,mu=2.5)
922 @c y:[1.9,2.3,2.6,1.9,1.6,3.3,4.2,4,2.4,2.9,1.5,3,2.9,4.2,3.1]$
923 @c test_signed_rank(y,median=2.5);
927 (%i2) y:[1.9,2.3,2.6,1.9,1.6,3.3,4.2,4,2.4,2.9,1.5,3,2.9,4.2,3.1]$
928 (%i3) test_signed_rank(y,median=2.5);
933 | method = Asymptotic test. Ties
935 (%o3) | hypotheses = H0: med = 2.5 , H1: med # 2.5
939 | distribution = [normal, 60.5, 17.58195097251724]
941 | p_value = .3628097734643669
952 @deffn {Funç@~{a}o} test_rank_sum (@var{x1}, @var{x2})
953 @deffnx {Funç@~{a}o} test_rank_sum (@var{x1}, @var{x2}, @var{opç@~{a}o_1})
955 Esse @'{e} o teste de Wilcoxon-Mann-Whitney para comparaç@~{a}o das medianas de duas
956 populaç@~{o}es cont@'{i}nuas. Os primeiros dois argumentos @var{x1} e @var{x2} s@~{a}o listas
957 ou matrizes colunas com os dados de duas amostras independentes. Executa aproximaç@~{a}o
958 normal se quaisquer dos tamanhos de amostra for maior que 10, ou se houverem empates.
965 @code{'alternative}, o valor padr@~{a}o @'{e} @code{'twosided}, @'{e} a hip@'{o}tese alternativa;
966 valores v@'{a}lidos s@~{a}o: @code{'twosided}, @code{'greater} e @code{'less}.
970 A sa@'{i}da da funç@~{a}o @code{test_rank_sum} @'{e} um objeto @code{inference_result} do Maxima
971 com os seguintes resultados:
976 @code{'method}: procedimento de infer@^{e}ncia.
979 @code{'hypotheses}: a hip@'{o}tese do nulo e a hip@'{o}tese alternativa a serem testadas.
982 @code{'statistic}: valor da amostra estat@'{i}stica usada para testar a hip@'{o}tese do nulo.
985 @code{'distribution}: distribuiç@~{a}o da amostra estat@'{i}stica, juntamente com seus par@^{a}metros.
988 @code{'p_value}: o valor de @math{p} do teste.
994 Verifica se populaç@~{o}es possuem medianas similares. Tamanhos de amotra
995 s@~{a}o pequenos e @'{e} feito um teste exato.
997 @c equivalent code for R:
998 @c x <- c(12,15,17,38,42,10,23,35,28)
999 @c y <- c(21,18,25,14,52,65,40,43)
1004 @c x:[12,15,17,38,42,10,23,35,28]$
1005 @c y:[21,18,25,14,52,65,40,43]$
1006 @c test_rank_sum(x,y);
1009 (%i1) load("stats")$
1010 (%i2) x:[12,15,17,38,42,10,23,35,28]$
1011 (%i3) y:[21,18,25,14,52,65,40,43]$
1012 (%i4) test_rank_sum(x,y);
1015 | method = Exact test
1017 | hypotheses = H0: med1 = med2 , H1: med1 # med2
1021 | distribution = [rank_sum, 9, 8]
1023 | p_value = .1995886466474702
1026 Agora, com grandes amostras e empates, o procedimento faz
1027 aproximaç@~{a}o norma. A hip@'{o}tese alternativa @'{e}
1028 @math{H_1: median1 < median2}.
1030 @c equivalent code for R:
1031 @c x <- c(39,42,35,13,10,23,15,20,17,27)
1032 @c y <- c(20,52,66,19,41,32,44,25,14,39,43,35,19,56,27,15)
1033 @c wilcox.test(x,y,alternative="less")
1037 @c x: [39,42,35,13,10,23,15,20,17,27]$
1038 @c y: [20,52,66,19,41,32,44,25,14,39,43,35,19,56,27,15]$
1039 @c test_rank_sum(x,y,'alternative='less);
1042 (%i1) load("stats")$
1043 (%i2) x: [39,42,35,13,10,23,15,20,17,27]$
1044 (%i3) y: [20,52,66,19,41,32,44,25,14,39,43,35,19,56,27,15]$
1045 (%i4) test_rank_sum(x,y,'alternative='less);
1048 | method = Asymptotic test. Ties
1050 | hypotheses = H0: med1 = med2 , H1: med1 < med2
1054 | distribution = [normal, 79.5, 18.95419580097078]
1056 | p_value = .05096985666598441
1067 @deffn {Funç@~{a}o} test_normality (@var{x})
1069 Teste de Shapiro-Wilk para normalidade. O argumento @var{x} @'{e} uma lista de n@'{u}meros, e o tamanho
1070 da amostra deve ser maior que 2 e menor ou igua a 5000, de outra forma, a funç@~{a}o
1071 @code{test_normality} sinaliza com um erro.
1075 [1] Algorithm AS R94, Applied Statistics (1995), vol.44, no.4, 547-551
1077 A sa@'{i}da da funç@~{a}o @code{test_normality} @'{e} um objeto @code{inference_result} do Maxima
1078 com os seguintes resultados:
1083 @code{'statistic}: valor do @var{W} estat@'{i}stico.
1086 @code{'p_value}: valor de @math{p} sob a hip@'{o}tese de normalidade.
1092 Verifica a normalidade de uma populaç@~{a}o, baseada em uma amostra de tamanho 9.
1094 @c equivalent code for R:
1095 @c x <- c(12,15,17,38,42,10,23,35,28)
1100 @c x:[12,15,17,38,42,10,23,35,28]$
1101 @c test_normality(x);
1104 (%i1) load("stats")$
1105 (%i2) x:[12,15,17,38,42,10,23,35,28]$
1106 (%i3) test_normality(x);
1107 | SHAPIRO - WILK TEST
1109 (%o3) | statistic = .9251055695162436
1111 | p_value = .4361763918860381
1124 @deffn {Funç@~{a}o} simple_linear_regression (@var{x})
1125 @deffnx {Funç@~{a}o} simple_linear_regression (@var{x} @var{opç@~{a}o_1})
1127 Regress@~{a}o linear simples, @math{y_i=a+b x_i+e_i}, onde os @math{e_i} s@~{a}o @math{N(0,sigma)}
1128 vari@'{a}veis aleat@'{o}rias independentes. O argumento @var{x} deve ser uma matriz de duas colunas ou uma lista de
1136 @code{'conflevel}, o valor padr@~{a}o @'{e} @code{95/100}, n@'{i}vel de confid@^{e}ncia para o intervalo de confid@^{e}ncia; isso deve
1137 ser uma express@~{a}o que tome valores em (0,1).
1140 @code{'regressor}, o valor padr@~{a}o @'{e} @code{'x}, nome da vari@'{a}vel independente.
1144 A sa@'{i}da da funç@~{a}o @code{simple_linear_regression} @'{e} um objeto @code{inference_result} do Maxima
1145 com os seguintes resultados:
1150 @code{'model}: a equaç@~{a}o ajustada. @'{U}til para fazer novas previs@~{o}es. Veja exemplos abaixo.
1153 @code{'means}: m@'{e}dia de duas vari@'{a}veis pseudo-aleat@'{o}rias.
1156 @code{'variances}: vari@^{a}ncias de ambas as vari@'{a}veis.
1159 @code{'correlation}: coeficiente de correlaç@~{a}o.
1162 @code{'adc}: coeficiente de determinaç@~{a}o ajustado.
1165 @code{'a_estimation}: estimador do par@^{a}metro @var{a}.
1168 @code{'a_conf_int}: intervalo de confid@^{e}ncia do par@^{a}metro @var{a}.
1171 @code{'b_estimation}: estimador do par@^{a}metro @var{b}.
1174 @code{'b_conf_int}: intervalo de confid@^{e}ncia do par@^{a}metro @var{b}.
1177 @code{'hypotheses}: a hip@'{o}tese do nulo e a hip@'{o}tese alternativa sobre o par@^{a}metro @var{b}.
1180 @code{'statistic}: valor da amostra estat@'{i}stica usado para testar a hip@'{o}tese do nulo.
1183 @code{'distribution}: distribuiç@~{a}o da amostra estat@'{i}stica, juntamente com seu par@^{a}metro.
1186 @code{'p_value}: o valor de @math{p} do teste sobre @var{b}.
1189 @code{'v_estimation}: estimador de vari@^{a}ncia imparcial, ou vari@^{a}ncia residual.
1192 @code{'v_conf_int}: intervalo de confid@^{e}ncia da vari@^{a}ncia.
1195 @code{'cond_mean_conf_int}: intervalo de confid@^{e}ncia paa a m@'{e}dia condicionada. Veja exemplos abaixo.
1198 @code{'new_pred_conf_int}: intervalo de confid@^{e}ncia para uma nova previs@~{a}o. Veja exemplos abaixo.
1201 @code{'residuals}: lista de pares (previs@~{a}o, res@'{i}duo), ordenados em relaç@~{a}o @`as previs@~{o}es.
1202 @'{U}til para achar o melhor da an@'{a}lise de ajuste. Veja exemplos abaixo.
1206 Somente os itens 1, 4, 14, 9, 10, 11, 12, e 13 acima, nessa ordem, s@~{a}o mostrados por padr@~{a}o. Os restantes
1207 escondem-se at@'{e} que o usu@'{a}rio faça uso de funç@~{o}es @code{items_inference} e @code{take_inference}.
1211 Ajustando um modelo linear para uma amostras de duas vari@'{a}veis. A entrada @code{%i4} monta p gr@'{a}fico
1212 da amostra junto com a linha de regress@~{a}o; a entrada @code{%i5}
1213 calcula @code{y} dado @code{x=113}; a m@'{e}dia e o
1214 intervalo de confid@^{e}ncia para uma nova previs@~{a}o quando @code{x=113} s@~{a}o tamb@'{e}m calculados.
1218 @c s:[[125,140.7],[130,155.1],[135,160.3],[140,167.2],[145,169.8]]$
1219 @c z:simple_linear_regression(s,conflevel=0.99);
1220 @c plot2d([[discrete, s], take_inference(model,z)],
1222 @c [gnuplot_curve_styles, ["with points","with lines"]] )$
1223 @c take_inference(model,z), x=133;
1224 @c take_inference(means,z);
1225 @c take_inference(new_pred_conf_int,z), x=133;
1228 (%i1) load("stats")$
1229 (%i2) s:[[125,140.7],[130,155.1],[135,160.3],[140,167.2],[145,169.8]]$
1230 (%i3) z:simple_linear_regression(s,conflevel=0.99);
1231 | SIMPLE LINEAR REGRESSION
1233 | model = 1.405999999999985 x - 31.18999999999804
1235 | correlation = .9611685255255155
1237 | v_estimation = 13.57966666666665
1239 (%o3) | b_conf_int = [.04469633662525263, 2.767303663374718]
1241 | hypotheses = H0: b = 0 ,H1: b # 0
1243 | statistic = 6.032686683658114
1245 | distribution = [student_t, 3]
1247 | p_value = 0.0038059549413203
1248 (%i4) plot2d([[discrete, s], take_inference(model,z)],
1250 [gnuplot_curve_styles, ["with points","with lines"]] )$
1251 (%i5) take_inference(model,z), x=133;
1253 (%i6) take_inference(means,z);
1254 (%o6) [135.0, 158.62]
1255 (%i7) take_inference(new_pred_conf_int,z), x=133;
1256 (%o7) [132.0728595995113, 179.5431404004887]
1292 @node Funç@~{o}es e Vari@'{a}veis Definidas para distribuiç@~{o}es especiais, , Funç@~{o}es e Vari@'{a}veis Definidas para stats, Top
1293 @section Funç@~{o}es e Vari@'{a}veis Definidas para distribuiç@~{o}es especiais
1296 @deffn {Funç@~{a}o} pdf_signed_rank (@var{x}, @var{n})
1297 Funç@~{a}o densidade de probabilidade da distribuiç@~{a}o exata da
1298 estat@'{i}stica do rank sinalizado. O argumento @var{x} @'{e} um n@'{u}mero
1299 real e @var{n} um inteiro positivo.
1301 Veja tamb@'{e}m @code{test_signed_rank}.
1304 @deffn {Funç@~{a}o} cdf_signed_rank (@var{x}, @var{n})
1305 Funç@~{a}o de densidade cumulativa da distribuiç@~{a}o exata da
1306 estat@'{i}stica do rank sinalizado. O argumento @var{x} @'{e} um n@'{u}mero
1307 real e @var{n} um inteiro positivo.
1309 Veja tamb@'{e}m @code{test_signed_rank}.
1312 @deffn {Funç@~{a}o} pdf_rank_sum (@var{x}, @var{n}, @var{m})
1313 Funç@~{a}o densidade de probabilidade da distribuiç@~{a}o exata da
1314 estat@'{i}stica do somat@'{o}rio do rank. O argumento @var{x} @'{e} um n@'{u}mero
1315 real e @var{n} e @var{m} s@~{a}o ambos inteiros positivos.
1317 Veja tamb@'{e}m @code{test_rank_sum}.
1320 @deffn {Funç@~{a}o} cdf_rank_sum (@var{x}, @var{n}, @var{m})
1321 Funç@~{a}o de densidade cumulativa da distribuiç@~{a}o exata da
1322 estat@'{i}stica do somat@'{o}rio do rank. O argumento @var{x} @'{e} um n@'{u}mero
1323 real e @var{n} e @var{m} s@~{a}o ambos inteiro positivos.
1325 Veja tamb@'{e}m @code{test_rank_sum}.