<!--{{{-->
<link rel='alternate' type='application/rss+xml' title='RSS' href='index.xml' />
<!--}}}-->
Background: #fff
Foreground: #000
PrimaryPale: #8cf
PrimaryLight: #18f
PrimaryMid: #04b
PrimaryDark: #014
SecondaryPale: #ffc
SecondaryLight: #fe8
SecondaryMid: #db4
SecondaryDark: #841
TertiaryPale: #eee
TertiaryLight: #ccc
TertiaryMid: #999
TertiaryDark: #666
Error: #f88
/*{{{*/
body {background:[[ColorPalette::Background]]; color:[[ColorPalette::Foreground]];}

a {color:[[ColorPalette::PrimaryMid]];}
a:hover {background-color:[[ColorPalette::PrimaryMid]]; color:[[ColorPalette::Background]];}
a img {border:0;}

h1,h2,h3,h4,h5,h6 {color:[[ColorPalette::SecondaryDark]]; background:transparent;}
h1 {border-bottom:2px solid [[ColorPalette::TertiaryLight]];}
h2,h3 {border-bottom:1px solid [[ColorPalette::TertiaryLight]];}

.button {color:[[ColorPalette::PrimaryDark]]; border:1px solid [[ColorPalette::Background]];}
.button:hover {color:[[ColorPalette::PrimaryDark]]; background:[[ColorPalette::SecondaryLight]]; border-color:[[ColorPalette::SecondaryMid]];}
.button:active {color:[[ColorPalette::Background]]; background:[[ColorPalette::SecondaryMid]]; border:1px solid [[ColorPalette::SecondaryDark]];}

.header {background:[[ColorPalette::PrimaryMid]];}
.headerShadow {color:[[ColorPalette::Foreground]];}
.headerShadow a {font-weight:normal; color:[[ColorPalette::Foreground]];}
.headerForeground {color:[[ColorPalette::Background]];}
.headerForeground a {font-weight:normal; color:[[ColorPalette::PrimaryPale]];}

.tabSelected{color:[[ColorPalette::PrimaryDark]];
	background:[[ColorPalette::TertiaryPale]];
	border-left:1px solid [[ColorPalette::TertiaryLight]];
	border-top:1px solid [[ColorPalette::TertiaryLight]];
	border-right:1px solid [[ColorPalette::TertiaryLight]];
}
.tabUnselected {color:[[ColorPalette::Background]]; background:[[ColorPalette::TertiaryMid]];}
.tabContents {color:[[ColorPalette::PrimaryDark]]; background:[[ColorPalette::TertiaryPale]]; border:1px solid [[ColorPalette::TertiaryLight]];}
.tabContents .button {border:0;}

#sidebar {}
#sidebarOptions input {border:1px solid [[ColorPalette::PrimaryMid]];}
#sidebarOptions .sliderPanel {background:[[ColorPalette::PrimaryPale]];}
#sidebarOptions .sliderPanel a {border:none;color:[[ColorPalette::PrimaryMid]];}
#sidebarOptions .sliderPanel a:hover {color:[[ColorPalette::Background]]; background:[[ColorPalette::PrimaryMid]];}
#sidebarOptions .sliderPanel a:active {color:[[ColorPalette::PrimaryMid]]; background:[[ColorPalette::Background]];}

.wizard {background:[[ColorPalette::PrimaryPale]]; border:1px solid [[ColorPalette::PrimaryMid]];}
.wizard h1 {color:[[ColorPalette::PrimaryDark]]; border:none;}
.wizard h2 {color:[[ColorPalette::Foreground]]; border:none;}
.wizardStep {background:[[ColorPalette::Background]]; color:[[ColorPalette::Foreground]];
	border:1px solid [[ColorPalette::PrimaryMid]];}
.wizardStep.wizardStepDone {background:[[ColorPalette::TertiaryLight]];}
.wizardFooter {background:[[ColorPalette::PrimaryPale]];}
.wizardFooter .status {background:[[ColorPalette::PrimaryDark]]; color:[[ColorPalette::Background]];}
.wizard .button {color:[[ColorPalette::Foreground]]; background:[[ColorPalette::SecondaryLight]]; border: 1px solid;
	border-color:[[ColorPalette::SecondaryPale]] [[ColorPalette::SecondaryDark]] [[ColorPalette::SecondaryDark]] [[ColorPalette::SecondaryPale]];}
.wizard .button:hover {color:[[ColorPalette::Foreground]]; background:[[ColorPalette::Background]];}
.wizard .button:active {color:[[ColorPalette::Background]]; background:[[ColorPalette::Foreground]]; border: 1px solid;
	border-color:[[ColorPalette::PrimaryDark]] [[ColorPalette::PrimaryPale]] [[ColorPalette::PrimaryPale]] [[ColorPalette::PrimaryDark]];}

.wizard .notChanged {background:transparent;}
.wizard .changedLocally {background:#80ff80;}
.wizard .changedServer {background:#8080ff;}
.wizard .changedBoth {background:#ff8080;}
.wizard .notFound {background:#ffff80;}
.wizard .putToServer {background:#ff80ff;}
.wizard .gotFromServer {background:#80ffff;}

#messageArea {border:1px solid [[ColorPalette::SecondaryMid]]; background:[[ColorPalette::SecondaryLight]]; color:[[ColorPalette::Foreground]];}
#messageArea .button {color:[[ColorPalette::PrimaryMid]]; background:[[ColorPalette::SecondaryPale]]; border:none;}

.popupTiddler {background:[[ColorPalette::TertiaryPale]]; border:2px solid [[ColorPalette::TertiaryMid]];}

.popup {background:[[ColorPalette::TertiaryPale]]; color:[[ColorPalette::TertiaryDark]]; border-left:1px solid [[ColorPalette::TertiaryMid]]; border-top:1px solid [[ColorPalette::TertiaryMid]]; border-right:2px solid [[ColorPalette::TertiaryDark]]; border-bottom:2px solid [[ColorPalette::TertiaryDark]];}
.popup hr {color:[[ColorPalette::PrimaryDark]]; background:[[ColorPalette::PrimaryDark]]; border-bottom:1px;}
.popup li.disabled {color:[[ColorPalette::TertiaryMid]];}
.popup li a, .popup li a:visited {color:[[ColorPalette::Foreground]]; border: none;}
.popup li a:hover {background:[[ColorPalette::SecondaryLight]]; color:[[ColorPalette::Foreground]]; border: none;}
.popup li a:active {background:[[ColorPalette::SecondaryPale]]; color:[[ColorPalette::Foreground]]; border: none;}
.popupHighlight {background:[[ColorPalette::Background]]; color:[[ColorPalette::Foreground]];}
.listBreak div {border-bottom:1px solid [[ColorPalette::TertiaryDark]];}

.tiddler .defaultCommand {font-weight:bold;}

.shadow .title {color:[[ColorPalette::TertiaryDark]];}

.title {color:[[ColorPalette::SecondaryDark]];}
.subtitle {color:[[ColorPalette::TertiaryDark]];}

.toolbar {color:[[ColorPalette::PrimaryMid]];}
.toolbar a {color:[[ColorPalette::TertiaryLight]];}
.selected .toolbar a {color:[[ColorPalette::TertiaryMid]];}
.selected .toolbar a:hover {color:[[ColorPalette::Foreground]];}

.tagging, .tagged {border:1px solid [[ColorPalette::TertiaryPale]]; background-color:[[ColorPalette::TertiaryPale]];}
.selected .tagging, .selected .tagged {background-color:[[ColorPalette::TertiaryLight]]; border:1px solid [[ColorPalette::TertiaryMid]];}
.tagging .listTitle, .tagged .listTitle {color:[[ColorPalette::PrimaryDark]];}
.tagging .button, .tagged .button {border:none;}

.footer {color:[[ColorPalette::TertiaryLight]];}
.selected .footer {color:[[ColorPalette::TertiaryMid]];}

.sparkline {background:[[ColorPalette::PrimaryPale]]; border:0;}
.sparktick {background:[[ColorPalette::PrimaryDark]];}

.error, .errorButton {color:[[ColorPalette::Foreground]]; background:[[ColorPalette::Error]];}
.warning {color:[[ColorPalette::Foreground]]; background:[[ColorPalette::SecondaryPale]];}
.lowlight {background:[[ColorPalette::TertiaryLight]];}

.zoomer {background:none; color:[[ColorPalette::TertiaryMid]]; border:3px solid [[ColorPalette::TertiaryMid]];}

.imageLink, #displayArea .imageLink {background:transparent;}

.annotation {background:[[ColorPalette::SecondaryLight]]; color:[[ColorPalette::Foreground]]; border:2px solid [[ColorPalette::SecondaryMid]];}

.viewer .listTitle {list-style-type:none; margin-left:-2em;}
.viewer .button {border:1px solid [[ColorPalette::SecondaryMid]];}
.viewer blockquote {border-left:3px solid [[ColorPalette::TertiaryDark]];}

.viewer table, table.twtable {border:2px solid [[ColorPalette::TertiaryDark]];}
.viewer th, .viewer thead td, .twtable th, .twtable thead td {background:[[ColorPalette::SecondaryMid]]; border:1px solid [[ColorPalette::TertiaryDark]]; color:[[ColorPalette::Background]];}
.viewer td, .viewer tr, .twtable td, .twtable tr {border:1px solid [[ColorPalette::TertiaryDark]];}

.viewer pre {border:1px solid [[ColorPalette::SecondaryLight]]; background:[[ColorPalette::SecondaryPale]];}
.viewer code {color:[[ColorPalette::SecondaryDark]];}
.viewer hr {border:0; border-top:dashed 1px [[ColorPalette::TertiaryDark]]; color:[[ColorPalette::TertiaryDark]];}

.highlight, .marked {background:[[ColorPalette::SecondaryLight]];}

.editor input {border:1px solid [[ColorPalette::PrimaryMid]];}
.editor textarea {border:1px solid [[ColorPalette::PrimaryMid]]; width:100%;}
.editorFooter {color:[[ColorPalette::TertiaryMid]];}

#backstageArea {background:[[ColorPalette::Foreground]]; color:[[ColorPalette::TertiaryMid]];}
#backstageArea a {background:[[ColorPalette::Foreground]]; color:[[ColorPalette::Background]]; border:none;}
#backstageArea a:hover {background:[[ColorPalette::SecondaryLight]]; color:[[ColorPalette::Foreground]]; }
#backstageArea a.backstageSelTab {background:[[ColorPalette::Background]]; color:[[ColorPalette::Foreground]];}
#backstageButton a {background:none; color:[[ColorPalette::Background]]; border:none;}
#backstageButton a:hover {background:[[ColorPalette::Foreground]]; color:[[ColorPalette::Background]]; border:none;}
#backstagePanel {background:[[ColorPalette::Background]]; border-color: [[ColorPalette::Background]] [[ColorPalette::TertiaryDark]] [[ColorPalette::TertiaryDark]] [[ColorPalette::TertiaryDark]];}
.backstagePanelFooter .button {border:none; color:[[ColorPalette::Background]];}
.backstagePanelFooter .button:hover {color:[[ColorPalette::Foreground]];}
#backstageCloak {background:[[ColorPalette::Foreground]]; opacity:0.6; filter:'alpha(opacity=60)';}
/*}}}*/
/*{{{*/
* html .tiddler {height:1%;}

body {font-size:.75em; font-family:arial,helvetica; margin:0; padding:0;}

h1,h2,h3,h4,h5,h6 {font-weight:bold; text-decoration:none;}
h1,h2,h3 {padding-bottom:1px; margin-top:1.2em;margin-bottom:0.3em;}
h4,h5,h6 {margin-top:1em;}
h1 {font-size:1.35em;}
h2 {font-size:1.25em;}
h3 {font-size:1.1em;}
h4 {font-size:1em;}
h5 {font-size:.9em;}

hr {height:1px;}

a {text-decoration:none;}

dt {font-weight:bold;}

ol {list-style-type:decimal;}
ol ol {list-style-type:lower-alpha;}
ol ol ol {list-style-type:lower-roman;}
ol ol ol ol {list-style-type:decimal;}
ol ol ol ol ol {list-style-type:lower-alpha;}
ol ol ol ol ol ol {list-style-type:lower-roman;}
ol ol ol ol ol ol ol {list-style-type:decimal;}

.txtOptionInput {width:11em;}

#contentWrapper .chkOptionInput {border:0;}

.externalLink {text-decoration:underline;}

.indent {margin-left:3em;}
.outdent {margin-left:3em; text-indent:-3em;}
code.escaped {white-space:nowrap;}

.tiddlyLinkExisting {font-weight:bold;}
.tiddlyLinkNonExisting {font-style:italic;}

/* the 'a' is required for IE, otherwise it renders the whole tiddler in bold */
a.tiddlyLinkNonExisting.shadow {font-weight:bold;}

#mainMenu .tiddlyLinkExisting,
	#mainMenu .tiddlyLinkNonExisting,
	#sidebarTabs .tiddlyLinkNonExisting {font-weight:normal; font-style:normal;}
#sidebarTabs .tiddlyLinkExisting {font-weight:bold; font-style:normal;}

.header {position:relative;}
.header a:hover {background:transparent;}
.headerShadow {position:relative; padding:4.5em 0 1em 1em; left:-1px; top:-1px;}
.headerForeground {position:absolute; padding:4.5em 0 1em 1em; left:0px; top:0px;}

.siteTitle {font-size:3em;}
.siteSubtitle {font-size:1.2em;}

#mainMenu {position:absolute; left:0; width:10em; text-align:right; line-height:1.6em; padding:1.5em 0.5em 0.5em 0.5em; font-size:1.1em;}

#sidebar {position:absolute; right:3px; width:16em; font-size:.9em;}
#sidebarOptions {padding-top:0.3em;}
#sidebarOptions a {margin:0 0.2em; padding:0.2em 0.3em; display:block;}
#sidebarOptions input {margin:0.4em 0.5em;}
#sidebarOptions .sliderPanel {margin-left:1em; padding:0.5em; font-size:.85em;}
#sidebarOptions .sliderPanel a {font-weight:bold; display:inline; padding:0;}
#sidebarOptions .sliderPanel input {margin:0 0 0.3em 0;}
#sidebarTabs .tabContents {width:15em; overflow:hidden;}

.wizard {padding:0.1em 1em 0 2em;}
.wizard h1 {font-size:2em; font-weight:bold; background:none; padding:0; margin:0.4em 0 0.2em;}
.wizard h2 {font-size:1.2em; font-weight:bold; background:none; padding:0; margin:0.4em 0 0.2em;}
.wizardStep {padding:1em 1em 1em 1em;}
.wizard .button {margin:0.5em 0 0; font-size:1.2em;}
.wizardFooter {padding:0.8em 0.4em 0.8em 0;}
.wizardFooter .status {padding:0 0.4em; margin-left:1em;}
.wizard .button {padding:0.1em 0.2em;}

#messageArea {position:fixed; top:2em; right:0; margin:0.5em; padding:0.5em; z-index:2000; _position:absolute;}
.messageToolbar {display:block; text-align:right; padding:0.2em;}
#messageArea a {text-decoration:underline;}

.tiddlerPopupButton {padding:0.2em;}
.popupTiddler {position: absolute; z-index:300; padding:1em; margin:0;}

.popup {position:absolute; z-index:300; font-size:.9em; padding:0; list-style:none; margin:0;}
.popup .popupMessage {padding:0.4em;}
.popup hr {display:block; height:1px; width:auto; padding:0; margin:0.2em 0;}
.popup li.disabled {padding:0.4em;}
.popup li a {display:block; padding:0.4em; font-weight:normal; cursor:pointer;}
.listBreak {font-size:1px; line-height:1px;}
.listBreak div {margin:2px 0;}

.tabset {padding:1em 0 0 0.5em;}
.tab {margin:0 0 0 0.25em; padding:2px;}
.tabContents {padding:0.5em;}
.tabContents ul, .tabContents ol {margin:0; padding:0;}
.txtMainTab .tabContents li {list-style:none;}
.tabContents li.listLink { margin-left:.75em;}

#contentWrapper {display:block;}
#splashScreen {display:none;}

#displayArea {margin:1em 17em 0 14em;}

.toolbar {text-align:right; font-size:.9em;}

.tiddler {padding:1em 1em 0;}

.missing .viewer,.missing .title {font-style:italic;}

.title {font-size:1.6em; font-weight:bold;}

.missing .subtitle {display:none;}
.subtitle {font-size:1.1em;}

.tiddler .button {padding:0.2em 0.4em;}

.tagging {margin:0.5em 0.5em 0.5em 0; float:left; display:none;}
.isTag .tagging {display:block;}
.tagged {margin:0.5em; float:right;}
.tagging, .tagged {font-size:0.9em; padding:0.25em;}
.tagging ul, .tagged ul {list-style:none; margin:0.25em; padding:0;}
.tagClear {clear:both;}

.footer {font-size:.9em;}
.footer li {display:inline;}

.annotation {padding:0.5em; margin:0.5em;}

* html .viewer pre {width:99%; padding:0 0 1em 0;}
.viewer {line-height:1.4em; padding-top:0.5em;}
.viewer .button {margin:0 0.25em; padding:0 0.25em;}
.viewer blockquote {line-height:1.5em; padding-left:0.8em;margin-left:2.5em;}
.viewer ul, .viewer ol {margin-left:0.5em; padding-left:1.5em;}

.viewer table, table.twtable {border-collapse:collapse; margin:0.8em 1.0em;}
.viewer th, .viewer td, .viewer tr,.viewer caption,.twtable th, .twtable td, .twtable tr,.twtable caption {padding:3px;}
table.listView {font-size:0.85em; margin:0.8em 1.0em;}
table.listView th, table.listView td, table.listView tr {padding:0px 3px 0px 3px;}

.viewer pre {padding:0.5em; margin-left:0.5em; font-size:1.2em; line-height:1.4em; overflow:auto;}
.viewer code {font-size:1.2em; line-height:1.4em;}

.editor {font-size:1.1em;}
.editor input, .editor textarea {display:block; width:100%; font:inherit;}
.editorFooter {padding:0.25em 0; font-size:.9em;}
.editorFooter .button {padding-top:0px; padding-bottom:0px;}

.fieldsetFix {border:0; padding:0; margin:1px 0px;}

.sparkline {line-height:1em;}
.sparktick {outline:0;}

.zoomer {font-size:1.1em; position:absolute; overflow:hidden;}
.zoomer div {padding:1em;}

* html #backstage {width:99%;}
* html #backstageArea {width:99%;}
#backstageArea {display:none; position:relative; overflow: hidden; z-index:150; padding:0.3em 0.5em;}
#backstageToolbar {position:relative;}
#backstageArea a {font-weight:bold; margin-left:0.5em; padding:0.3em 0.5em;}
#backstageButton {display:none; position:absolute; z-index:175; top:0; right:0;}
#backstageButton a {padding:0.1em 0.4em; margin:0.1em;}
#backstage {position:relative; width:100%; z-index:50;}
#backstagePanel {display:none; z-index:100; position:absolute; width:90%; margin-left:3em; padding:1em;}
.backstagePanelFooter {padding-top:0.2em; float:right;}
.backstagePanelFooter a {padding:0.2em 0.4em;}
#backstageCloak {display:none; z-index:20; position:absolute; width:100%; height:100px;}

.whenBackstage {display:none;}
.backstageVisible .whenBackstage {display:block;}
/*}}}*/
/***
StyleSheet for use when a translation requires any css style changes.
This StyleSheet can be used directly by languages such as Chinese, Japanese and Korean which need larger font sizes.
***/
/*{{{*/
body {font-size:0.8em;}
#sidebarOptions {font-size:1.05em;}
#sidebarOptions a {font-style:normal;}
#sidebarOptions .sliderPanel {font-size:0.95em;}
.subtitle {font-size:0.8em;}
.viewer table.listView {font-size:0.95em;}
/*}}}*/
/*{{{*/
@media print {
#mainMenu, #sidebar, #messageArea, .toolbar, #backstageButton, #backstageArea {display: none !important;}
#displayArea {margin: 1em 1em 0em;}
noscript {display:none;} /* Fixes a feature in Firefox 1.5.0.2 where print preview displays the noscript content */
}
/*}}}*/
<!--{{{-->
<div class='header' macro='gradient vert [[ColorPalette::PrimaryLight]] [[ColorPalette::PrimaryMid]]'>
<div class='headerShadow'>
<span class='siteTitle' refresh='content' tiddler='SiteTitle'></span>&nbsp;
<span class='siteSubtitle' refresh='content' tiddler='SiteSubtitle'></span>
</div>
<div class='headerForeground'>
<span class='siteTitle' refresh='content' tiddler='SiteTitle'></span>&nbsp;
<span class='siteSubtitle' refresh='content' tiddler='SiteSubtitle'></span>
</div>
</div>
<div id='mainMenu' refresh='content' tiddler='MainMenu'></div>
<div id='sidebar'>
<div id='sidebarOptions' refresh='content' tiddler='SideBarOptions'></div>
<div id='sidebarTabs' refresh='content' force='true' tiddler='SideBarTabs'></div>
</div>
<div id='displayArea'>
<div id='messageArea'></div>
<div id='tiddlerDisplay'></div>
</div>
<!--}}}-->
<!--{{{-->
<div class='toolbar' macro='toolbar [[ToolbarCommands::ViewToolbar]]'></div>
<div class='title' macro='view title'></div>
<div class='subtitle'><span macro='view modifier link'></span>, <span macro='view modified date'></span> (<span macro='message views.wikified.createdPrompt'></span> <span macro='view created date'></span>)</div>
<div class='tagging' macro='tagging'></div>
<div class='tagged' macro='tags'></div>
<div class='viewer' macro='view text wikified'></div>
<div class='tagClear'></div>
<!--}}}-->
<!--{{{-->
<div class='toolbar' macro='toolbar [[ToolbarCommands::EditToolbar]]'></div>
<div class='title' macro='view title'></div>
<div class='editor' macro='edit title'></div>
<div macro='annotations'></div>
<div class='editor' macro='edit text'></div>
<div class='editor' macro='edit tags'></div><div class='editorFooter'><span macro='message views.editor.tagPrompt'></span><span macro='tagChooser excludeLists'></span></div>
<!--}}}-->
To get started with this blank [[TiddlyWiki]], you'll need to modify the following tiddlers:
* [[SiteTitle]] & [[SiteSubtitle]]: The title and subtitle of the site, as shown above (after saving, they will also appear in the browser title bar)
* [[MainMenu]]: The menu (usually on the left)
* [[DefaultTiddlers]]: Contains the names of the tiddlers that you want to appear when the TiddlyWiki is opened
You'll also need to enter your username for signing your edits: <<option txtUserName>>
These [[InterfaceOptions]] for customising [[TiddlyWiki]] are saved in your browser

Your username for signing your edits. Write it as a [[WikiWord]] (eg [[JoeBloggs]])

<<option txtUserName>>
<<option chkSaveBackups>> [[SaveBackups]]
<<option chkAutoSave>> [[AutoSave]]
<<option chkRegExpSearch>> [[RegExpSearch]]
<<option chkCaseSensitiveSearch>> [[CaseSensitiveSearch]]
<<option chkAnimate>> [[EnableAnimations]]

----
Also see [[AdvancedOptions]]
<<importTiddlers>>
我們已經知道伯努利試驗之成功機率$p$的最大概似估計式:
$$
\hat p = \frac{\sum_{i=1}^n y_i}{n}
$$
其中$y_1, y_2, \cdots, y_n$是一組獨立同分配的伯努利隨機變數。

我們已經有一些經驗。
# $\sum_{i=1}^n y_i$是一種二項隨機變數。
# $\sum_{i=1}^n y_i$的機率分配是所謂的二項分配。
所以你認為成功機率的最大概似估計式(一種隨機變數)的機率分配(也就是我們常用的抽樣分配)是
# 伯努利分配
# 二項分配
# 常態分配
三選一。

+++[證明]
| $\sum_{i=1}^n y_i$ | 0 | 1 | 2 | ... | $n$ |
| $Pr(\sum_{i=1}^n y_i)$ | $C_0^n p^0 (1 - p)^n$ | $C_0^n p^1 (1 - p)^{n - 1}$ | $C_0^n p^2 (1 - p)^{n - 2}$ | ... | $C_0^n p^n (1 - p)^0$ |
| $\hat p$ | $\frac{0}{n}$ | $\frac{1}{n}$ | $\frac{2}{n}$ | ... | $\frac{n}{n}$ |
| $Pr(\hat p)$ | +++[答案]=== | +++[答案]=== | +++[答案]=== | ... | +++[答案]=== |
===
!結論
$$
n \hat p = \sum_{i = 1}^n y_i \sim BIN(n, p)
$$
{{{
         姓名:                        學號:
}}}
{{{
所有正確答案都必須被挑出來,否則不算分。謝謝你願意跟我一起學習,如果你覺得被我虐待了,對不起,請原諒我。
}}}
|(1a)$\mbox{____________________}$ |(1b)$\mbox{____________________}$ |(2a)$\mbox{____________________}$ |(2b)$\mbox{____________________}$ |
|(2c)$\mbox{____________________}$ |(3a)$\mbox{____________________}$ |(3b)$\mbox{____________________}$ |(3c)$\mbox{____________________}$ |
|(3d)$\mbox{____________________}$ |(3e)$\mbox{____________________}$ |(4a)$\mbox{____________________}$ |(4b)$\mbox{____________________}$ |
|(4c)$\mbox{____________________}$ |(4d)$\mbox{____________________}$ |(4e)$\mbox{____________________}$ |(4f)$\mbox{____________________}$ |
|(4g)$\mbox{____________________}$ |(4h)$\mbox{____________________}$ |(4i)$\mbox{____________________}$ |(4j)$\mbox{____________________}$ |
|(5a)$\mbox{____________________}$ |(5b)$\mbox{____________________}$ |(6a)$\mbox{____________________}$ |(6b)$\mbox{____________________}$ |
|(6c)$\mbox{____________________}$ |()$\mbox{____________________}$ |()$\mbox{____________________}$ |()$\mbox{____________________}$ |
----
{{{
請上傳調查證據、兩次調查個別以及合併的數據、跟兩次報告的投影片。
}}}
# 訪員訓練
## (4%)「大學生的隨身包包幾兩重」收集到的數據是哪一種數據?
### @@連續型數據@@
### 離散型數據
### 以上皆是
### 以上皆非
## (4%)「大學生的隨身包包有幾本教科書」收集到的數據是哪一種數據?
### 連續型數據
### @@離散型數據@@
### 以上皆是
### 以上皆非
# 問卷調查
## (4%)關於「問卷調查」的定義,以下哪一些敘述是正確的?
### @@在特定期間內實施@@
### @@依一定規則選擇受訪對象@@
### @@必須取得多數人的回答@@
### @@有些調查只問女性同胞@@
## (4%)關於「訪問面談調查」,以下哪一些敘述是正確的?
### 在「調查員家中」調查
### 問卷由「受訪者」填寫
### 以上皆是
### @@以上皆非@@
## (4%)關於「電話調查」,以下哪一些敘述是正確的?
### @@在「受訪者家中」調查@@
### 問卷由「受訪者」填寫
### 以上皆是
### 以上皆非
# 簡單隨機抽樣的$V(\bar y)$跟$V(\hat t)$
## (4%)關於$\bar y$的表示式$\sum_{i=1}^N Z_i \times (y_i/n)$,以下哪一些敘述是正確的?
### @@符號$Z_i$是隨機的@@
### @@符號$Z_i$表示第$i$個學生(比如說)有沒有被抽到的指標變數@@
### 符號$y_i$也是隨機的
### 以上皆是
## (4%)關於表示式$\sum_{i=1}^N Z_i \times (y_i/n)$中的符號,以下哪一些敘述是正確的?
### @@符號$n$是樣本數@@
### @@符號$N$表示名冊內有多少人@@
### @@以上皆是@@
### 以上皆非
## (4%)關於$V(\hat t) = N^2 \times (1 - n/N) \times S^2/n$,以下哪一些敘述是正確的?
### @@$1 - n/N$叫做「有限母體校正項」@@
### $S^2$是樣本變異數
### 以上皆是
### 以上皆非
## (4%)關於$\bar y$,以下哪一些敘述是正確的?
### @@$\bar y$是母體平均的不偏估計式@@
### @@$V(\bar y) = (1 - n/N) \times S^2/n$@@
### @@以上皆是@@
### 以上皆非
## (4%)關於證明$V(\bar y)$,以下哪一些敘述是正確的?
### 會用到$E(\bar y)$
### @@會用到$V(Z_i)$@@
### @@會用到$Cov(Z_i, Z_j), i \ne j$@@
### 以上皆是
# 分層抽樣的理論與計算。以下關於分層抽樣的題目,++++[請根據下述表格作答:]
| 層 | $N_h$ | $n_h$ | $\bar y_h$ | $s_h^2$ | $\hat t_h$ | $\hat{V(\hat t_h)}$ | 成本$c$ |
| 1 | 400| 98| 24.1| 5575| 9640| 6872040.82| 40|
| 2 | 30| 10| 25.6| 4064| 768|| 3|
| 3 | 61| 37| 267.6| 347556| 16324|| 6|
| 4 | 18|| 179.0| 22798| 3222|| 2|
| 5 | 70| 39| 293.7| 123578||| 7|
| 6 | 120| 21| 33.2| 9795||| 12|
||| $n = 211$|||| 34105732.43||
===

## (4%)$n_4$等於多少?
### 4
### 5
### @@6@@
### 以上皆非
## (4%)$\hat t_5$等於多少?
### 22559
### 21559
### @@20559@@
### 以上皆非
## (4%)$\hat t_6$等於多少?
### @@3984@@
### 3884
### 3784
### 以上皆非
## (4%)$\hat{V(\hat t_2)}$等於多少?
### @@243840.00@@
### 244840.00
### 245840.00
### 以上皆非
## (4%)$\hat{V(\hat t_4)}$等於多少?
### 820722.00
### 820725.00
### @@820728.00@@
### 以上皆非
## (4%)重新考慮分配總樣本數$n = 211$。如果是按照$N_h$的比例分配,那麼$n_1$最靠近哪一個整數?
### @@121@@
### 120
### 119
### 以上皆非
## (4%)繼續考慮分配總樣本數$n = 211$的問題。這一回要「最佳(小)化成本」(個別樣本數正比於$N_h \times S_h/\sqrt{c_h}$),並且假設$s_h$是真實的$S_h$,那麼$n_1$最靠近哪一個整數?
### 26
### 27
### @@28@@
### 以上皆非
## (4%)根據題意所提供的表格,母體總和的估計$\hat t$等於多少?
### 52497
### @@54497@@
### 56497
### 以上皆非
## (4%)$\hat{V(\hat t)}$最接近哪一個數字?
### 34107732.43
### 34106732.43
### @@34105732.43@@
### 以上皆非
## (4%)根據題意所提供的表格,必須進行幾次的「簡單隨機抽樣」?
### 4
### 5
### @@6@@
### 7
# 分層抽樣的符號系統
##(4%)關於符號「︿(hat)」,以下哪一些敘述是正確的?
### @@代表「(統計)估計」這一項技術@@
### @@計算時一定得使用來自樣本的資訊@@
### @@以上皆是@@
### 以上皆非
##(4%)關於符號「$\bar{\,\,}$(bar)」,以下哪一些敘述是正確的?
### 代表「(統計)估計」這一項技術
### 計算時一定得使用來自樣本的資訊
### 以上皆是
### @@以上皆非@@
# 大學生閱讀行為問卷的假說
##(4%)「相關」用哪一項符號表達?
### $\mu$
### $\sigma$
### @@$\rho$@@
### 以上皆非
##(4%)如何表達「比例上超過五成」這樣的概念?
### $\mu > 50%$
### @@$p > 0.5$@@
### $\sigma > 50%$
### 以上皆非
##(4%)假說「$\mu < 2 \mbox{小時}$」可能代表哪一句中文?
### @@商學院學生的平均閱讀時數低於2小時@@
### 逢甲大學學生的平均閱讀時數不高於2小時
### 以上皆是
### 以上皆非
# (20%)【R】
## (2%)@@replace = TRUE@@。修正sample(x=c(0,2),replace=FALSE,size=10,prob=c(0.4,0.6))的錯誤,如果size=10是對的。
## (2%)@@prob = c(0.4,0.5,0.1)@@。修正sample(x=c(0,1,2),replace=TRUE,size=10,prob=c(0.4,0.5))的錯誤,如果x=c(0,1,2)是對的。
## (2%)@@0.1037664@@。dmultinom(x = c(0, 2, 8), prob = c(0.1, 0.2, 0.7)),等於多少?
## (2%)@@0.1760327@@。dnorm(1, mean=0, sd=2),等於多少?
## (2%)@@0.0000@@。dbinom(3, 5, 0.01),等於多少?
## (2%)@@0.05399097@@。dnorm(2,0,1)等於多少?
## (2%)@@rnorm(10, 10, 3)@@。用R產生10個來自$N(10, 3^2)$的亂數。請寫下所需的R命令。
## (2%)@@1@@。sum(c(TRUE, FALSE, FALSE)),等於多少?
## (2%)@@39916800@@。factorial(11),等於多少?
## (2%)@@252@@。choose(10,5),等於多少?
# 【伯努利分配與二項分配】
## (10%)你的隨機樣本$y_1, y_2, \cdots, y_{10} \sim^{iid} \mbox{二項分配}(n = 5, p)$,請推導成功機率$p$的++++[最大概似估計式。]
----
【步驟一】寫下(隨機)樣本之母體的機率分配:
$$
f(y) = C^5_y p^y (1 - p)^{5 - y}
$$
【步驟二】引用概似函數的定義,定義本題之隨機樣本的概似函數:
$$
L = f(y_1) \times f(y_2) \times \cdots \times f(y_{10}) = \Pi_{i=1}^{10} C^5_{y_i} p^{y_i} (1 - p)^{5 - y_i}
$$
所以
$$
l = \log(L) = \sum_{i=1}^{10} [\log(C^5_{y_i}) + y_i \times \log(p) + (5 - y_i) \times \log(1 - p)]
$$
【步驟三】對$l$取$p$的一次微分:
$$
\frac{d l}{d p} = \sum_{i=1}^{10} [\frac{y_i}{p} - \frac{5 - y_i}{1 - p}]
$$
【步驟四】令步驟三的結果等於$0$,解得$p$的最大概似估計式:
$$
\frac{d l}{d p} = \sum_{i=1}^{10} [\frac{y_i}{p} - \frac{5 - y_i}{1 - p}] = 0
$$
得到
$$
\hat p = \frac{\sum_{i=1}^{10} y_i}{10 \times 5} = \frac{\sum_{i=1}^{10} y_i}{50}
$$
----
===

## (10%)假如第一小題真正的成功機率是$1/2$,計算成功機率$p$之最大概似估計的++++[期望值。]
----
$$
E(\frac{\sum_{i=1}^{10} y_i}{50}) = \frac{\sum_{i=1}^{10} E(y_i)}{50} = \frac{\sum_{i=1}^{10} 5 \times p}{50} = p = 1/2
$$
----
===

## (5%)用R產生10個來自某一枚公平銅板的試驗結果。換言之,++++[寫一段R程式模擬丟一枚公平銅板10次。]
----
令H表示【人頭朝上】;令T表示【梅花朝上】。
{{{
sample(x = c("H", "T"), size = 10, replace = TRUE, prob = c(0.5,0.5))
}}}
其中題意希望我們【丟一枚公平銅板】,帶出【prob = c(0.5,0.5)】;而【10次】帶出【size = 10】。這個例子不用數字改用文字,只是想告訴各位文字也可以用來定義我們的籤袋。結果可能是
{{{
"H" "T" "H" "H" "T" "H" "T" "H" "H" "H"
}}}
===

## (5%)假如利用上一題的R程式得到數據$1, 0, 1, 1, 1, 1, 1, 1, 0, 1$,請問成功機率$p$的++++[最大概似估計(把數據代入第一小題的估計式就是答案)。]
----
$$
\hat p = \frac{\sum_{i=1}^{10} y_i}{10 \times n} = \frac{1 + 0 + 1 + 1 + 1 + 1 + 1 + 1 + 0 + 1}{10 \times 1} = 8/10
$$
----
===

## (5%)($z_{0.025} = 1.96$)利用上一題的數據,在$\alpha = 0.05$之下利用【瓦得檢定】決定【拒絕】還是【不拒絕】成功機率$p$的假設檢定$H_0: p = 1/2 \mbox{ vs } H_1: p \ne 1/2$++++[之虛無假設。]
----
$$
z = \frac{8/10 - 1/2}{\sqrt{8/10 \times 2/10 / 10}} = 2.3717 > 1.96
$$
所以我們拒絕虛無假設$H_0: p = 1/2$。
----
===

## (5%)利用上上一題的數據,利用【分數檢定】反轉成功機率$p$的95%信賴區間++++[。]
----
根據課堂練習的結果,我們知道以下的不等式是成立的
$$
(1 + \frac{\chi_{1, 0.05}^2}{n}) p^2 - (2 \hat p + \frac{\chi_{1, 0.05}^2}{n}) p + \hat p^2 \le 0
$$
【注意】$z_{0.025}^2 = \chi_{1, 0.05}^2$。
代入已知條件,得知
$$
\begin{eqnarray}
(1 + \frac{3.84146}{10}) p^2 - (1.6 + \frac{3.84146}{10}) p + 0.64 & \le & 0 \\
1.384146 p^2 - 1.984146 p + 0.64 & \le & 0 \\
\end{eqnarray}
$$
所以
$$
p \in (0.4901624, 0.9433179)
$$
【注意】一元二次方程式的解公式是$\frac{-b \pm \sqrt{b^2 - 4ac}}{2a}$
----
===

## (20%)我們想利用R程式【binom.test(x, n, p = 0.5, alternative = c("two.sided", "less", "greater"), conf.level)】跟第四小題(d.)的數據檢定第五小題(e.)的假設檢定$H_0: p = 1/2 \mbox{ vs } H_1: p \ne 1/2$。請問:
### (5%)【x】等於多少?++++[(R程式中的【x】應該填入多少?)]
{{{
8
}}}
===

### (5%)【n】++++[等於多少?]
{{{
10
}}}
===

### (5%)【alternative】++++[等於哪一個選項?]
{{{
"two.sided"
}}}
===

### (5%)【conf.level】++++[等於多少?]
{{{
0.95
}}}
===

## (10%)已知二項分配的試驗次數$n$如果等於$1$,二項分配就會是伯努利分配。現在試驗次數不再是$5$,而是$1$,請回答:
### (5%)你的隨機樣本現在改寫為$y_1, y_2, \cdots, y_{10} \sim^{iid} \mbox{伯努利分配}(n = 1, p)$,定義這一組隨機樣本的【對數概似函數$l$】++++[:]
----
把$n = 1$代入前面問題的答案
$$
l = \sum_{i=1}^{10} [\log(C^1_{y_i}) + y_i \times \log(p) + (1 - y_i) \times \log(1 - p)] = \sum_{i=1}^{10} [y_i \times \log(p) + (1 - y_i) \times \log(1 - p)]
$$
----
===

### (5%)我們依舊有興趣檢定$H_0: p = 1/2 \mbox{ vs } H_1: p \ne 1/2$,但是這一回我們想用【概似比檢定】。請利用第四小題(d.)的數據計算它的檢定統計量$\chi^2 = -2\log(L(p_0)/L(\hat p))$++++[。]
----
【注意】
$$
\chi^2 = -2\log(L(p_0)/L(\hat p)) = -2 (l(p_0) - l(\hat p))
$$
----
$$
\begin{eqnarray}
l(1/2) & = & \sum_{i=1}^{10} [y_i \times \log(1/2) + (1 - y_i) \times \log(1 - 1/2)] \\
 & = & \log(1/2) \sum_{i=1}^{10} [y_i + (1 - y_i)] \\
 & = & 10 \times \log(1/2) \\
 & = & -10 \times \log(2) \\
\end{eqnarray}
$$
而且
$$
\begin{eqnarray}
l(8/10) & = & \sum_{i=1}^{10} [y_i \times \log(8/10) + (1 - y_i) \times \log(1 - 8/10)] \\
 & = & \sum_{i=1}^{10} [y_i \times \log(4 \times 2/10) + (1 - y_i) \times \log(2/10)] \\
 & = & \sum_{i=1}^{10} [y_i \times [\log(4) + \log(2/10)] + (1 - y_i) \times \log(2/10)] \\
 & = & \log(1/5) \sum_{i=1}^{10} [y_i + (1 - y_i)] + \log(4) \sum_{i=1}^{10} y_i \\
 & = & 10 \times \log(1/5) + \log(4) \sum_{i=1}^{10} y_i \\
 & = & 8 \log(4) - 10 \log(5) \\
\end{eqnarray}
$$
因此
$$
\chi^2 = -2 (l(p_0) - l(\hat p)) = -2 \times (-10 \times \log(2) - 8 \log(4) + 10 \log(5)) = 3.854895
$$
----
===

## (10%)我們依舊有興趣檢定銅板是不是公平的虛無假設$H_0: p = 1/2$。在課堂上已經知道利用伯努利數據得到的成功機率$p$最大概似估計式$\sum_{i=1}^n y_i / n$,它的抽樣分配跟隨機變數$\sum_{i=1}^n y_i$一樣是二項分配$Binom(n, p)$。請問:
### (5%)虛無假設成立的條件下,(本小題的條件下)成功機率$p$的最大概似估計式服從什麼++++[分配?]
----
根據[[第一次平常考|2009第一次平常考]],我們知道成功機率$p$的最大概似估計式服從
$$
\mbox{二項分配}(n = 10, p = 1/2), n \times \hat p = 0, 1, 2, \cdots, n
$$
----
===

### (5%)利用第四小題(d.)的數據計算假設檢定$H_0: p = 1/2 \mbox{ vs } H_1: p > 1/2$的$p$值++++[(它是一種不利虛無假設的機率)。]
----
根據上一題的結論,我們知道本題右尾檢定的$p$值如下所示:
$$
Pr(10 \times \hat p \ge 8) = Pr(X = 8) + Pr(X = 9) + Pr(X = 10) = 0.0546875
$$
其中$X$表示成功的次數。
(因此我們不會拒絕虛無假設$H_0: p = 1/2$)
----
===
{{{
答案欄(每一道題目佔4%。在這裡找不到答案者不計分。)注意:「單選」還是「複選」請自行判斷。
}}}
|(1)$\mbox{__a c d________}$ |(2)$\mbox{___c_______}$ |(3)$\mbox{___c_______}$ |(4)$\mbox{___a_______}$ |(5)$\mbox{___c_______}$ |
|(6) a |(7) a |(8) a |(9) c |(10) b |
|(11) a b c d |(12) b |(13) c |(14) b |(15) c |
|(16) a |(17) a |(18) b |(19) b c |(20) a b |
|(21) a c |(22) a |(23) a |(24) d |(25) a |
{{{

}}}
# 以下哪一道指令被用來進行「適合度卡方檢定」?
## chisq.test(c(1, 2, 3))
## chisq.test(c(1, 2, 3), c(1, 2, 3))
## chisq.test(c(1, 2, 3),, c(0.1, 0.3, 0.6))
## chisq.test(matrix(c(1,2,3),1,3))
# 如果 chisq.test(x)是一道「同質性卡方檢定」的指令,那麼x是?
## 行向量
## 列向量
## 矩陣
## 以上皆是
# 這一道++++[獨立性卡方檢定]
{{{
chisq.test(rbind(c(1, 2, 3), c(1, 2, 3), c(1, 2, 3)))
}}}
===
的自由度是多少?
## 9
## 6
## 4
## 5
# ++++[這一道指令]
{{{
chisq.test(c(1, 2, 3))
}}}
===
的$X^2$是多少?
## 1.0
## 1.5
## 2.0
## 2.5
# 我們知道這一道++++[獨立性卡方檢定]
{{{
chisq.test(rbind(c(1, 2, 3), c(1, 2, 3), c(1, 2, 3)))
}}}
===
的$X^2$是「0」,所以它的p值(p-value)是多少?
## 0.95
## 0.5
## 1.0
## 1.1
# 同上一題,位置[1,1]那個位置的「皮爾森殘差」等於多少?
## 0.0
## 0.1
## 0.2
## 0.3
# 同上上一題,「概似比統計量$G^2$」等於多少?
## 0.0
## 0.5
## 1.0
## 1.5
# 繼續第6題,位置[1,1]那個位置的「標準化殘差」等於多少?
## 0.0
## 0.1
## 0.2
## 0.3
# 假設我有一個++++[矩陣]
{{{
matrix(c(3,1,1,3), 2, 2)
}}}
===
有興趣它的「勝算比」。請問勝算比的最大概似估計是多少?
## 6.4
## 5.4
## 9.0
## 9.5
# 同上題,用R得知關於勝算比雙尾費雪正確檢定的p值(p value)是「0.4857」。請問「勝算比大於1」之費雪正確檢定的p值是多少?
## 0.4857
## 0.2429
## 0.1215
## 0.0608
# 哪一道指令可以得到數據「c(1, 2, 3)」相對頻率的「圓餅圖」?
## pie(c(1, 2, 3))
## pie(c(1, 2, 3)/6)
## pie(c(0.1, 0.2, 0.3))
## pie(c(2, 4, 6))
# 哪一道指令可以得到數據「c(1, 2, 3)」相對頻率的「直條圖」?
## barplot(c(1, 2, 3))
## barplot(c(1, 2, 3)/6)
## barplot(c(0.1, 0.2, 0.3))
## barplot(c(2, 4, 6))
# 假設我有一個++++[矩陣]
{{{
matrix(c(3,0,1,4), 2, 2)
}}}
===
有興趣它的「勝算比」。請問勝算比的最大概似估計是多少?
## 23
## 22
## 21
## 20
# 同第9題,該表格的「獨立性卡方檢定」沒經過「葉氏校正」的$X^2$等於多少?
## 1
## 2
## 3
## 4
# 同第9題。$2 \times 2$表格的++++[「葉氏校正$X^2$」]
$$
\sum_{i=1}^2 \sum_{j=1}^2 \frac{(|O_{ij} - E_{ij}| - 0.5)^2}{E_{ij}}
$$
===
請計算該表格的葉氏校正$X^2$。
## 0.3
## 0.4
## 0.5
## 0.6
# 再一次利用$2 \times 2$++++[表格]
{{{
O = matrix(c(3,1,1,3), 2, 2)
}}}
===
請問指令「rSUM = apply(O, 1, sum)」得到
## [1] 4 4
## [1] 4 5
## [1] 5 4
## [1] 3 3
# 同上一題。指令「cSUM = apply(O, 2, sum)」得到
## [1] 4 4
## [1] 4 5
## [1] 5 4
## [1] 3 3
# 利用上兩題。指令「rSUM %*% t(cSUM) / sum(O)」得到該表格的
## 觀察值
## 期望值
## 皮爾森殘差
## 標準化殘差
# 哪幾個答案可以得到「同質性卡方檢定的$X^2$」?其中「x」跟「y」是觀察值向量,也是我們有興趣知道是否同質的兩個觀察值向量。
## chisq.test(x,,y)
## chisq.test(rbind(x,y))
## O = cbind(x, y); chisq.test(O)
## 以上皆是
# 假設你的伯努利數據++++[如下]
{{{
1,0,0,1,1,1
}}}
===
請問成功機率$p$的最大概似估計是多少?
## 4/6
## 2/3
## 1/3
## 1/2
# 假設你有以下這樣的++++[數據]
|| 滿意 | 普通 | 不滿意 |
| 同意 | 1 | 2 | 3 |
| 不同意 | 7 | 8 | 9 |
| 普通 | 4 | 5 | 6 |
===
如果想要進行「線性趨勢檢定」,你的「列聯表」必須等於?
## ++++[矩陣]
{{{
matrix(c(1,2,3,4,5,6,7,8,9), 3, 3)
}}}
===

## ++++[矩陣]
{{{
matrix(c(1,7,4,2,8,5,3,9,6), 3, 3)
}}}
===

## ++++[矩陣]
{{{
matrix(c(1,4,7,2,5,8,3,6,9), 3, 3)
}}}
===

## ++++[矩陣]
{{{
matrix(c(1,2,3,7,8,9,4,5,6), 3, 3)
}}}
===

# 已知線性趨勢檢定的++++[統計量如下]
$$
M^2 = (n_{..} - 1) \times \left(\frac{\sum_{i=1}^r \sum_{j=1}^c (u_i - \bar u)(v_j - \bar v) \frac{n_{ij}}{n_{..}}}{\sqrt{[\sum_{i=1}^r (u_i - \bar u)^2 \frac{n_{i.}}{n_{..}}][\sum_{j=1}^r (v_j - \bar v)^2 \frac{n_{.j}}{n_{..}}]}}\right)^2
$$
===
進一步假設,$u_1 (\mbox{滿意}) = 1$, $u_2 (\mbox{普通}) = 2$, $u_3 (\mbox{不滿意}) = 3$, $v_1 (\mbox{同意}) = -1$, $v_2 (\mbox{普通}) = 0$, $v_3 (\mbox{不同意}) = 1$。請問上一題表格++++[的]
$$
\sum_{i=1}^r \sum_{j=1}^c (u_i - \bar u)(v_j - \bar v) \frac{n_{ij}}{n_{..}}
$$
===
等於多少?
## 0.00
## 0.05
## 0.10
## 0.15
#(繼續第22題)請問上一題表格的$M^2$等於多少?
## 0.00
## 0.05
## 0.10
## 0.15
# 以下哪一個「標準化殘差」,你認為太不尋常了!
## $0$
## $-1$
## $4$
## $5$
#  請利用第21題的數據,請問兩道問題都回答「普通」的機率之最大概似估計是多少?
## 1/9
## 2/9
## 3/9 
## 4/9
# (25%)【填充題】
## (5%)什麼是【2009大學生閱讀行為調查】的實驗單元?+++[答案]$\mbox{大學生}$===

## (5%)++++[你會給以下這一道題目]
{{{
你喜歡狗?還是喜歡貓?
}}}
===
什麼樣的測量尺度?+++[答案]$\mbox{順序尺度}$===

## (5%)++++[這一項變數]
{{{
時間
}}}
===
的測量尺度?+++[答案]$\mbox{區間尺度}$===

## (5%)【60公斤】的單位?+++[答案]$\mbox{公斤}$===

## (5%)你覺得哪一個溫度不可能是人類的++++[體溫?]
$35^\circ C, 36^\circ C, 38^\circ C, 40^\circ C, 100^\circ C, $,+++[答案]$100^\circ C$===

===

# (15%)【測量尺度】
## (5%)【你的體重超過50公斤嗎?】用哪一種測量尺度?+++[答案]$\mbox{名目尺度}$===

## (5%)【指定「1」給$0 < \mbox{你的體重} \le40$】、【指定「2」給$40 < \mbox{你的體重} \le80$】、【指定「3」給$80 < \mbox{你的體重}$】的測量尺度是哪一種?+++[答案]$\mbox{順序尺度}$===

## (5%)【指定「0」給$0 < \mbox{你的體重} \le40$】所定義的「0」是區間尺度的0,還是比例尺度的0?+++[答案]$\mbox{區間尺度}$===

# (5%)【二項分配】假設以下的隨機樣本來自某一個成功機率是$p = 0.3$的++++[伯努利分配]
$$
X_1, X_2, \cdots, X_5
$$
===
發現樣本平均$\sum_{i=1}^5 X_i / 5$的機率分配。(請用表格的方式呈現你的答案。)+++[答案]
----
根據[[$\hat p$的抽樣分配]],我們知道$\sum_{i=1}^n X_i / n$的抽樣分配就是$\sum_{i=1}^n X_i$的抽樣分配$Binom(n, p)$。因此
$$
\sum_{i=1}^5 X_i / 5 \sim Binom(5, 0.3)
$$
----
===

# (5%)【多項分配】假設變數向量$(X_1, X_2, X_3)$服從++++[多項分配]
$$
(n = 10, p_1 = 0.2, p_2 = 0.3, p_3 = 0.5) 
$$
===
發現第一個變數$X_1$的機率分配。+++[答案]
----
根據[[多項分配]],假如定義【成功表示試驗的結果是$A_1$】以及【失敗表示試驗的結果不是$A_1$】,那麼$X_1$就是$n = 10$試驗有幾次成功的隨機變數。因為
# 每一次不是成功就是失敗,只有兩種選擇。
# 每一次看到成功的機率都是$p_1 = 0.2$。
# 試驗彼此之間是獨立的(因為多項試驗之間是獨立的)。
所以
$$
X_1 \sim Binom(n = 10, p = 0.2)
$$
----
===

# (5%)【常態分配】以下常態分配之線性組合服從什麼++++[分配]
$$
3 \times N(10, 5^2) - N(4, 12^2) - 2 \times N(0, 13^2)
$$
===
(所有常態隨機變數彼此間都是獨立的。)+++[答案]
----
令$X = 3 \times N(10, 5^2) - N(4, 12^2) - 2 \times N(0, 13^2)$。加上
$$
E(X) = 3 \times 10 + (-1) \times 4 + (-2) \times 0 = 26
$$
以及因為獨立的假設,
$$
V(X) = 3^2 \times 5^2 + (-1)^2 \times 12^2 + (-2)^2 \times 13^2 = 225 + 144 + 676 = 1045
$$
所以
$$
X \sim N(26, 1045)
$$
【注意:常態分配的基本性質告訴我們常態隨機變數的線性組合是常態隨機變數。】
----
===

# (50%)【R】
## (5%)+++[答案]【replace=FALSE】或者【size=10】。===sample(x=c(0,2),replace=FALSE,size=10,prob=c(0.4,0.6)),哪裡錯?
## (5%)+++[答案]【prob=c(0.4,0.5)】。===sample(x=c(0,2),replace=TRUE,size=10,prob=c(0.4,0.5)),哪裡錯?
## (5%)+++[答案]120。===factorial(5),等於多少?
## (5%)+++[答案]210。===choose(10,4),等於多少?
## (5%)+++[答案]0.1037664。===dmultinom(x = c(0, 2, 8), prob = c(0.1, 0.2, 0.7)),等於多少?
## (5%)+++[答案]0.1760327。===dnorm(1, mean=0, sd=2),等於多少?
## (5%)+++[答案]9.801e-06。===dbinom(3, 5, 0.01),等於多少?
## (5%)+++[答案]不對(實際上是等於)。===pnorm(2,0,1)大於pnorm(4,2,1)對不對?
## (5%)+++[答案]【rnorm(10)】。===用R產生10個來自標準常態分配的亂數。請寫下所需的R命令。
## (5%)+++[答案]2。===sum(c(TRUE, TRUE, FALSE)),等於多少?
# (5%)【最大概似估計】隨機樣本來自伯努利分配
$$
y_1, y_2, \cdots, y_n \buildrel {iid} \over \sim BER(p)
$$
>(2%)【步驟一】
$$
f(y) = p^y (1 - p)^{1 - y}
$$
>(1%)【步驟二】
$$
\begin{eqnarray}
L(p | y_1, y_2, \cdots, y_n) & = & \\
\end{eqnarray}
$$
>(1%)【步驟三】
$$
\frac{\partial \log L}{\partial p} = 
$$
>(1%)【步驟四】
解上述步驟得到的方程式,我們發現平均$p$的最大概似估計是
$$
\hat p = \frac{\sum_{i=1}^n y_i}{n}
$$
{{{
         姓名:                        學號:
}}}
請利用以下數據回答所有問題:
| 性別 | A | B | C |
| 男性 | 60 | 81 | 75 |
| 女性 | 75 | 87 | 86 |
假設【性別】是問卷的一道題目,而【A, B, C】是另一道題目的選項。研究者問了100位男性,也問了100位女性。那一道題目問的是
{{{
什麼原因造成青少年犯罪?
}}}
*【A】the increasing gap in income between the rich and poor,
*【B】the increase in the percentage of single-parent families,
*【C】insufficient time spent by parents with their children,
# (5%)$\mbox{_________d___________}$上述表格是一種多少乘多少的列聯表。
## $4 \times 3$、
## $3 \times 4$、
## $3 \times 2$、
## $2 \times 3$。
# (5%)$\mbox{_________d___________}$假設上述表格放在一個R的矩陣(取名為crime),以下哪一道指令可以得到你眼睛看到的結果(上述表格的數字部份)?
## matrix(c(60,81,75,75,87,86),3,2)、
## matrix(c(60,81,75,75,87,86),2,3)、
## matrix(c(60,75,81,87,75,86),3,2)、
## matrix(c(60,75,81,87,75,86),2,3)。
# (5%)$\mbox{_________b___________}$假設男性的答案放在【crime】的第一列,女性的答案放在【crime】的第二列。下列哪一道指令可以得到【男性答題之分配】與【女性答題之分配】一致的【同質性檢定】結果?
## chisq.test(rbind(crime[,1], crime[,2]))
## chisq.test(rbind(crime[1,], crime[2,]))
## chisq.test(rbind(crime[1,], crime[,2]))
# (5%)如果我想利用chisq.test()檢定【性別】與【犯罪原因】之【獨立性】,請問R怎麼寫?$\mbox{_________chisq.test(crime)___________}$
# (5%)$\mbox{_________b___________}$那一道【A, B, C】選項的問題屬於
## 單選題
## 複選題
## 人口統計
# (5%)【crime】這個表格可以進行【獨立性檢定】嗎?請圈選並且寫下你的理由(沒有正確的理由不計分!)
## 可以。原因:$\mbox{____________________________________________________________}$
## 不可以。原因:$\mbox{因為選項之間並沒有獨立。}$
# 不管【crime】這個表格可不可以進行【獨立性檢定】,我們依舊可以請chisq.test()幫我們計算【獨立性檢定】相關的一些統計量。請用你的計算機驗證chisq.test()的++++[結果:]
{{{
	Pearson's Chi-squared test

data:  crime 
X-squared = 0.4276, df = 2, p-value = 0.8075
}}}
===

## (5%)++++[【X-squared = 0.4276】]
{{{
O = crime
rSUM = apply(O, 1, sum)
cSUM = apply(O, 2, sum)
E = rSUM %*% t(cSUM) / sum(O)
XX = sum((O - E)^2 / E)
XX
[1] 0.4276426
> O
     [,1] [,2] [,3]
[1,]   60   81   75
[2,]   75   87   86
> E
         [,1]    [,2]     [,3]
[1,] 62.84483 78.2069 74.94828
[2,] 72.15517 89.7931 86.05172
}}}
===

## (5%)++++[【df = 2】]
{{{
(2 - 1)*(3 - 1) = 2
}}}
===

# 關於以下的指令跟++++[結果:]
{{{
> chisq.test(crime[1,])

	Chi-squared test for given probabilities

data:  crime[1, ] 
X-squared = 3.25, df = 2, p-value = 0.1969
}}}
===

## 請用你的計算機驗證上述的結果:
### (5%)++++[【X-squared = 3.25】]
{{{
O = crime[1,]
E = sum(O) * rep(1/length(O), length(O))
XX = sum((O - E)^2 / E)
XX
[1] 3.25
> O
[1] 60 81 75
> E
[1] 72 72 72
}}}
===

### (5%)++++[【df = 2】]
{{{
3 - 1 = 2
}}}
===

## (5%)$\mbox{__________c__________}$上述結果乃是利用chisq.test()進行哪一種檢定
### 獨立性檢定
### 同質性檢定
### 適合度檢定
## (5%)假設上述檢定的【p-value】放在【p.value】內,請問【ifelse(p.value<0.05, TRUE, FALSE)】得到的答案是(沒有正確的理由不計分!)
### 【TRUE】。原因:$\mbox{____________________________________________________________}$
### 【FALSE】。原因:$\mbox{0.1969 > 0.05}$
# (5%)寫下指令【chisq.test(crime[1,], p=c(6,7,8), rescale.p=TRUE)】的++++[虛無假設]
【計算欄】
{{{
p = c(6,7,8)
p = p / sum(p)
> p
[1] 0.2857143 0.3333333 0.3809524
}}}
【答案欄】
$$
H_0: p_{m,1} = \mbox{6/21}, p_{m,2} = \mbox{7/21}, p_{m,3} = \mbox{8/21}
$$
===

# 假設用題意的表格所定義的矩陣【crime】是一個$2 \times 3$的矩陣,
## (5%)$\mbox{__464______}$指令【sum(crime)】的答案是多少?
## (5%)$\mbox{__135______}$指令【sum(crime[1:2,1])】的答案是多少?
## (5%)$\mbox{__216______}$指令【sum(crime[1,])】的答案是多少?
## (5%)$\mbox{__464______}$指令【sum(crime[1:2,])】的答案是多少?
## (5%)$\mbox{__161______}$指令【sum(crime[,3])】的答案是多少?
# 假設數據被合併++++[為]
| 性別 | A | 非A |
| 男性 | 60 | $\mbox{_________156_______}$ |
| 女性 | 75 | $\mbox{_________173_______}$ |
===

## (5%)在上面的表格補上遺漏的數字。
## (5%)$\mbox{____i____}$計算【男性】對上【女性】答選項【A】的相對風險?(四捨五入到小數點第四位)++++[【計算欄】]
{{{
n11 = 60
n12 = 156
n21 = 75
n22 = 173
RR = (n11/(n11+n12)) / (n21/(n21+n22))
RR
[1] 0.9185185
}}}
===

### 0.9185
### 0.9184
### 0.9183
### 0.9182
## (5%)$\mbox{____ii____}$利用網頁的符號n11, n12, n21, n22,誰是計算相對風險的R程式碼,++++[【計算欄】]
{{{
n11 = 60
n12 = 156
n21 = 75
n22 = 173
RR = (n11/(n11+n12)) / (n21/(n21+n22))
RR
}}}
===

### ~RRcrime = (n11/(n11+n21)) / (n21/(n21+n22))
### ~RRcrime = (n11/(n11+n12)) / (n21/(n21+n22))
### ~RRcrime = (n11/(n11+n22)) / (n21/(n12+n21))
### ~RRcrime = (n11/n12) / (n21/n22)
## (5%)$\mbox{____ii____}$假設因為某種不知名的原因【男性哪一列的第二個數字等於0】,也就是說【n12 = 0 】,其他數字維持不變,請計算【男性】對上【女性】答選項【A】的勝算比?(四捨五入到小數點第四位)++++[【計算欄】]
{{{
n11 = 60
n12 = 0
n21 = 75
n22 = 173
OR0 = ((n11+0.5)*(n22+0.5)) / ((n12+0.5)*(n21+0.5))
OR0
[1] 278.0596
}}}
===

### 278.0595
### 278.0596
### 278.0597
### 278.0598
# (4%)(只能修正一個等號「=」)修正sample(x=c(0,2),replace=FALSE,size=10,prob=c(0.4,0.6))的錯誤,如果size=10是對的。
# (4%)(只能修正一個等號「=」)修正sample(x=c(0,1,2),replace=TRUE,size=10,prob=c(0.4,0.5))的錯誤,如果x=c(0,1,2)是對的,而且「得到1的機會是0.4」、「得到2的機會是0.5」。
# (4%)factorial(11),等於多少?
# (4%)【sample(5)】可能會得到什麼樣的答案:
## @@[1] 3 5 1 4 2@@
## [1] 3 5 1 4 4
## [1] 3 5 3 4 2
## @@[1] 5 4 3 2 1@@
# (4%)【sample(10, 3, T)】會得到幾個樣本?
## 10
## @@3@@
## 答案a. b.皆是
## 答案a. b.皆非
# (4%)【sample(c(3,7,9), 3, T, prob=c(0,0,1))】會抽到【3】嗎?
## 會
## @@不會@@
## 答案a. b.皆是
## 答案a. b.皆非
# (4%)假如【B】是一個【3乘5】的【data.frame】,【sample(B, 3)】會抽到?
## 三筆觀察值
## @@三個變數@@
## @@三行@@
## 三列
# (4%)【sample(3, 3, 0)】會得到什麼樣的答案:
## @@[1] 3 2 1@@
## @@[1] 1 3 2@@
## @@答案a. b.皆是@@
## 答案a. b.皆非
# (4%)【sample(3, 3, 1)】會得到什麼樣的答案:
## @@[1] 3 3 3@@
## @@[1] 1 2 3@@
## @@答案a. b.皆是@@
## 答案a. b.皆非
# (4%)【$N = 5, n = 2$】,總共有幾個【樣本集合$S$】?
## @@choose(5,2)@@
## @@$C^5_2$@@
## @@$10$@@
## @@答案a. b.皆是@@
# (4%)函示【subsets()】來自哪一個套件?
## base
## stat
## @@~BHH2@@
## epiR
# (4%)【subsets(10, 5)】對應哪一個大寫的$N$】?
## @@10@@
## 5
## 答案a. b.皆是
## 答案a. b.皆非
# (4%)我問了班上兩個人的體重【一個答53公斤、一個答68公斤】,如果班上總共50人,請估計班上所有同學體重的總和是多少公斤:$\mbox{_________________________________}$
# (4%)「繼續上一題」。你如何改進上述問題的答案?
## 問更多人
## @@問更多班上的同學@@
## 答案a. b.皆是
## 答案a. b.皆非
# (4%)【如果我們班每一個人都是19歲,那麼統計系的每一個人也都是19歲?】如何驗證上述命題的真偽?
## @@對統計系每一班10個人作年齡調查@@
## @@找認識的統計系學長姐或學弟妹問他們的年齡@@
## @@要求不是大二的統計系學生拿出身份證驗證年齡@@
## 答案a. b. c.皆非
# (4%)【subsets(10, 5)】會得到哪一個矩陣】?
## @@$252 \times 5$@@
## $5 \times 252$
## 答案a. b.皆是
## 答案a. b.皆非
# (4%)假設土地公的摸彩箱是$y = \{2, 2, 4, 4\}$。請問它的名冊是哪一個集合?
## $\{2, 2, 4, 4\}$
## $\{2, 4\}$
## @@$\{1, 2, 3, 4\}$@@
## 答案a. b.皆是
# (4%)「繼續上一題」。母體總和是多少?$\mbox{_________________________________}$
# (4%)「繼續上一題」。母體平均數等於多少?$\mbox{_________________________________}$
# (4%)「$y_1$」($y$代表某一個我們有興趣的變數)的$1$可能來自哪一個集合?
## 樣本
## @@樣本集合(比如說課堂上榕樹例子的{1, 3, 5})@@
## 母體
## @@名冊@@
# (4%)哪一些主張是正確的?
## @@樣本來自母體。@@
## 樣本集合(比如說課堂上榕樹例子的{1, 3, 5})來自母體。
## @@樣本集合來自名冊。@@
## 名冊來自母體。
# (4%)關於語法【epi.simplesize(N = 1E+06, sd, Py, epsilon, method = "mean", conf.level = 0.95)】,哪一些是正確的?
## @@N跟我們上課慣用的N是同一個。@@
## sd輸入關於母體平均數的估計。
## 信心水準只能等於95%。
## 針對母體總和計算所需要的樣本數。
# (4%)【epi.simplesize()】適用哪一種母體?
## @@有限母體@@
## 無限母體
## 答案a. b.皆是
## 答案a. b.皆非
# (4%)用初等統計學課本揭露的樣本數公式得知以下R程式碼【epi.simplesize(N = 278, sd = 30, Py = NA, epsilon = 10, method = "mean", conf.level = 0.95)】的答案是多少?
## [1] 29
## [1] 30
## @@[1] 31@@
## [1] 32
# 假如A是一個3x3的表(data.frame),請問A[sample(1:3, 2),]會隨機看到
## 兩變數
## @@兩案例@@
## 答案a. b.皆是
## 答案a. b.皆非
# (4%)@@replace = TRUE@@。(只能修正一個等號「=」)修正sample(x=c(0,2),replace=FALSE,size=10,prob=c(0.4,0.6))的錯誤,如果size=10是對的。
# (4%)@@prob = c(0.4,0.5,0.1)@@。(只能修正一個等號「=」)修正sample(x=c(0,1,2),replace=TRUE,size=10,prob=c(0.4,0.5))的錯誤,如果x=c(0,1,2)是對的,而且「得到1的機會是0.4」、「得到2的機會是0.5」。
# (4%)@@39916800@@。factorial(11),等於多少?
# (4%)【sample(5)】可能會得到什麼樣的答案:
## @@[1] 3 5 1 4 2@@
## [1] 3 5 1 4 4
## [1] 3 5 3 4 2
## @@[1] 5 4 3 2 1@@
# (4%)【sample(10, 3, T)】會得到幾個樣本?
## 10
## @@3@@
## 答案a. b.皆是
## 答案a. b.皆非
# (4%)【sample(c(3,7,9), 3, T, prob=c(0,0,1))】會抽到【3】嗎?
## 會
## @@不會@@
## 答案a. b.皆是
## 答案a. b.皆非
# (4%)假如【B】是一個【3乘5】的【data.frame】,【sample(B, 3)】會抽到?
## 三筆觀察值
## @@三個變數@@
## @@三行@@
## 三列
# (4%)【sample(3, 3, 0)】會得到什麼樣的答案:
## @@[1] 3 2 1@@
## @@[1] 1 3 2@@
## @@答案a. b.皆是@@
## 答案a. b.皆非
# (4%)【sample(3, 3, 1)】會得到什麼樣的答案:
## @@[1] 3 3 3@@
## @@[1] 1 2 3@@
## @@答案a. b.皆是@@
## 答案a. b.皆非
# (4%)【$N = 5, n = 2$】,總共有幾個【樣本集合$S$】?
## @@choose(5,2)@@
## @@$C^5_2$@@
## @@$10$@@
## @@答案a. b.皆是@@
# (4%)函示【subsets()】來自哪一個套件?
## base
## stat
## @@~BHH2@@
## epiR
# (4%)【subsets(10, 5)】對應哪一個大寫的$N$】?
## @@10@@
## 5
## 答案a. b.皆是
## 答案a. b.皆非
# (4%)我問了班上兩個人的體重【一個答53公斤、一個答68公斤】,如果班上總共50人,請估計班上所有同學體重的總和是多少公斤:$\mbox{_________________________________}$
# (4%)「繼續上一題」。你如何改進上述問題的答案?
## 問更多人
## @@問更多班上的同學@@
## 答案a. b.皆是
## 答案a. b.皆非
# (4%)【如果我們班每一個人都是19歲,那麼統計系的每一個人也都是19歲?】如何驗證上述命題的真偽?
## @@對統計系每一班10個人作年齡調查@@
## @@找認識的統計系學長姐或學弟妹問他們的年齡@@
## @@要求不是大二的統計系學生拿出身份證驗證年齡@@
## 答案a. b. c.皆非
# (4%)【subsets(10, 5)】會得到哪一個矩陣】?
## @@$252 \times 5$@@
## $5 \times 252$
## 答案a. b.皆是
## 答案a. b.皆非
# (4%)假設土地公的摸彩箱是$y = \{2, 2, 4, 4\}$。請問它的名冊是哪一個集合?
## $\{2, 2, 4, 4\}$
## $\{2, 4\}$
## @@$\{1, 2, 3, 4\}$@@
## 答案a. b.皆是
# (4%)「繼續上一題」。母體總和是多少?$\mbox{_________________________________}$
# (4%)「繼續上一題」。母體平均數等於多少?$\mbox{_________________________________}$
# (4%)「$y_1$」($y$代表某一個我們有興趣的變數)的$1$可能來自哪一個集合?
## 樣本
## @@樣本集合(比如說課堂上榕樹例子的{1, 3, 5})@@
## 母體
## @@名冊@@
# (4%)哪一些主張是正確的?
## @@樣本來自母體。@@
## 樣本集合(比如說課堂上榕樹例子的{1, 3, 5})來自母體。
## @@樣本集合來自名冊。@@
## 名冊來自母體。
# (4%)關於語法【epi.simplesize(N = 1E+06, sd, Py, epsilon, method = "mean", conf.level = 0.95)】,哪一些是正確的?
## @@N跟我們上課慣用的N是同一個。@@
## sd輸入關於母體平均數的估計。
## 信心水準只能等於95%。
## 針對母體總和計算所需要的樣本數。
# (4%)【epi.simplesize()】適用哪一種母體?
## @@有限母體@@
## 無限母體
## 答案a. b.皆是
## 答案a. b.皆非
# (4%)用初等統計學課本揭露的樣本數公式得知以下R程式碼【epi.simplesize(N = 278, sd = 30, Py = NA, epsilon = 10, method = "mean", conf.level = 0.95)】的答案是多少?
## [1] 29
## [1] 30
## @@[1] 31@@
## [1] 32
# 假如A是一個3x3的表(data.frame),請問A[sample(1:3, 2),]會隨機看到
## 兩變數
## @@兩案例@@
## 答案a. b.皆是
## 答案a. b.皆非
| $X$跟$Y$的聯合分配 | $Y = 1$ | $Y = 0$ | $X$的邊際分配 |
| $X = 1$ | $p_{11}$ | $p_{12}$ | $p_1$ |
| $X = 0$ | $p_{21}$ | $p_{22}$ | $1 - p_1$ |
| $Y$的邊際分配 | $p_2$ | $1 - p_2$ ||
# $X$變數代表一道問卷的題目。
# $Y$變數代表另一道問卷的題目。
| 週次 |>| 日期 | 內容 | 課堂活動 | R實習 | BB | 考試 | 講義頁數 |
|~| 乙班 | 甲班 |~|~|~|~|~|~|~|
| 1 | 02/16 | 02/17 | [[課程簡介|課程簡介(逢甲大學97學年度)]] | 深夜加油站遇上蘇格拉底 || 電影觀賞感言 |||
| 2 | 23 | 24 |bgcolor:black; [[觀賞R的第一支指導影片|第一支指導影片]] | 編輯講義的頁碼 | 下載並安裝最新版的R | 眼睛採礦波士頓的公寓數據 |||
|~|~|~| [[數據|數據教室版]] |~|~|~|~||
|~|~|~| [[二項分配|二項分配教室版]] |~|~|~|~| pp. 20~ (1.2.1) |
| 3 | 03/02 | 03/03 | [[介紹有用投影片的一部份]] || [[我要跟R交朋友]] ||[[評比計畫]] ||
|~|~|~|bgcolor:black; [[Using R to look at distributions (I)]] |~| [[第一次R在家實習]] |~|~||
|~|~|~| [[多項分配|多項分配教室版]] |~|||~||
|~|~|~|bgcolor:black; [[Using R to look at distributions (II)]] |~|||~||
|~|~|~| [[常態分配|常態分配教室版]] |~|||~||
| 51/2 | 03/21 | 03/21 |>|>|>| 有事無法參加考試者,請事先請假。 |>| [[第一次小考|2009年第一次小考]](借五間教室) |
[[最新消息]]
[[訪員訓練時間表]]
[[有誰跟你一起?]]
根據$E(X)$的定義:
$$
E(X) = x_1 \times Pr(x_1) + x_2 \times Pr(x_2) + \cdots + x_k \times P(x_k)
$$
所以,$E(X)$的本質是「『$x_1, x_2, \dots, x_k$』的一種線性組合」,其中「$x_i$」的係數是發生「$x_i$」的機率「$Pr(x_i)$」。因為「$Pr(x_i)$」沒有單位,所以「$E(X)$」會跟$X$同單位,也就是說$E(X)$會發生在「$x$軸」的某一個地方。

加上我們知道「$E(X)$就是機率分配的『重心』」,所以「$X$的期望值」不會高過「$X$的最大值」,也不會低於「$X$的最小值」。
一般而言,證明「公式的正確性」可能有幾種作法:
# 從「=」的左邊出發,往右邊前進;
# 從「=」的右邊出發,往左邊前進;
# 從「=」的左右兩邊分別出發,相遇在某一個等號。
課堂上的例子,$E(3X - 2)$想要跟你討論
# 利用$E(h(X))$的定義加上$h(X)=3X - 2$計算$E(3X - 2)$;
# 利用$E(X)$的定義計算$3E(X) - 2$;
# 利用上述的結果,在這個例子上面,驗證$E(3X - 2)$跟$3E(X) - 2$是相等的。
因為課堂上舉的機率分配是一種「對稱的機率分配」,所以
# $E(X)$就等於「機率分配對稱中心所在的位置(的數字)」。
# 因為$3X - 2$是一種「一對一的函數」,所以$E(3X - 2)$的答案也是「機率分配對稱中心所在的位置」,但是這時候,機率分配是$3X - 2$的,而不是$X$的機率分配。
綜合而言,我在課堂上試圖示範幾種計算期望值的作法:
# 代公式;
# 利用機率分配的對稱性加上重心的性質;
# 一對一函數的性質,加上機率分配的對稱性;
# 最後,希望在數學證明之前讓你相信「$E(aX + b)=aE(X) + b$」。
<html><div align="center"><iframe src ="http://www.moztw.org/" width="100%" align="center" height=400"></iframe></div></html>
/***
|Name|FontSizePlugin|
|Created by|SaqImtiaz|
|Location|http://tw.lewcid.org/#FontSizePlugin|
|Version|1.0|
|Requires|~TW2.x|
!Description:
Resize tiddler text on the fly. The text size is remembered between sessions by use of a cookie.
You can customize the maximum and minimum allowed sizes.
(only affects tiddler content text, not any other text)

Also, you can load a TW file with a font-size specified in the url.
Eg: http://tw.lewcid.org/#font:110

!Demo:
Try using the font-size buttons in the sidebar, or in the MainMenu above.

!Installation:
Copy the contents of this tiddler to your TW, tag with systemConfig, save and reload your TW.
Then put {{{<<fontSize "font-size:">>}}} in your SideBarOptions tiddler, or anywhere else that you might like.

!Usage
{{{<<fontSize>>}}} results in <<fontSize>>
{{{<<fontSize font-size: >>}}} results in <<fontSize font-size:>>

!Customizing:
The buttons and prefix text are wrapped in a span with class fontResizer, for easy css styling.
To change the default font-size, and the maximum and minimum font-size allowed, edit the config.fontSize.settings section of the code below.

!Notes:
This plugin assumes that the initial font-size is 100% and then increases or decreases the size by 10%. This stepsize of 10% can also be customized.

!History:
*27-07-06, version 1.0 : prevented double clicks from triggering editing of containing tiddler.
*25-07-06,  version 0.9

!Code
***/

//{{{
config.fontSize={};

//configuration settings
config.fontSize.settings =
{
            defaultSize : 100,  // all sizes in %
            maxSize : 200,
            minSize : 40,
            stepSize : 10
};

//startup code
var fontSettings = config.fontSize.settings;

if (!config.options.txtFontSize)
            {config.options.txtFontSize = fontSettings.defaultSize;
            saveOptionCookie("txtFontSize");}
setStylesheet(".tiddler .viewer {font-size:"+config.options.txtFontSize+"%;}\n","fontResizerStyles");
setStylesheet("#contentWrapper .fontResizer .button {display:inline;font-size:105%; font-weight:bold; margin:0 1px; padding: 0 3px; text-align:center !important;}\n .fontResizer {margin:0 0.5em;}","fontResizerButtonStyles");

//macro
config.macros.fontSize={};
config.macros.fontSize.handler = function (place,macroName,params,wikifier,paramString,tiddler)
{

               var sp = createTiddlyElement(place,"span",null,"fontResizer");
               sp.ondblclick=this.onDblClick;
               if (params[0])
                           createTiddlyText(sp,params[0]);
               createTiddlyButton(sp,"+","increase font-size",this.incFont);
               createTiddlyButton(sp,"=","reset font-size",this.resetFont);
               createTiddlyButton(sp,"–","decrease font-size",this.decFont);
}

config.macros.fontSize.onDblClick = function (e)
{
             if (!e) var e = window.event;
             e.cancelBubble = true;
             if (e.stopPropagation) e.stopPropagation();
             return false;
}

config.macros.fontSize.setFont = function ()
{
               saveOptionCookie("txtFontSize");
               setStylesheet(".tiddler .viewer {font-size:"+config.options.txtFontSize+"%;}\n","fontResizerStyles");
}

config.macros.fontSize.incFont=function()
{
               if (config.options.txtFontSize < fontSettings.maxSize)
                  config.options.txtFontSize = (config.options.txtFontSize*1)+fontSettings.stepSize;
               config.macros.fontSize.setFont();
}

config.macros.fontSize.decFont=function()
{

               if (config.options.txtFontSize > fontSettings.minSize)
                  config.options.txtFontSize = (config.options.txtFontSize*1) - fontSettings.stepSize;
               config.macros.fontSize.setFont();
}

config.macros.fontSize.resetFont=function()
{

               config.options.txtFontSize=fontSettings.defaultSize;
               config.macros.fontSize.setFont();
}

config.paramifiers.font =
{
               onstart: function(v)
                  {
                   config.options.txtFontSize = v;
                   config.macros.fontSize.setFont();
                  }
};
//}}}
/***
|Name|HoverMenuPlugin|
|Created by|SaqImtiaz|
|Location|http://tw.lewcid.org/#HoverMenuPlugin|
|Version|1.11|
|Requires|~TW2.x|
!Description:
Provides a hovering menu on the edge of the screen for commonly used commands, that scrolls with the page.

!Demo:
Observe the hovering menu on the right edge of the screen.

!Installation:
Copy the contents of this tiddler to your TW, tag with systemConfig, save and reload your TW.
To customize your HoverMenu, edit the HoverMenu shadow tiddler.

To customize whether the menu sticks to the right or left edge of the screen, and its start position, edit the HoverMenu configuration settings part of the code below. It's well documented, so don't be scared!

The menu has an id of hoverMenu, in case you want to style the buttons in it using css.

!Notes:
Since the default HoverMenu contains buttons for toggling the side bar and jumping to the top of the screen and to open tiddlers, the ToggleSideBarMacro, JumpMacro and the JumpToTopMacro are included in this tiddler, so you dont need to install them separately. Having them installed separately as well could lead to complications.

If you dont intend to use these three macros at all, feel free to remove those sections of code in this tiddler.

!To Do:
* rework code to allow multiple hovering menus in different positions, horizontal etc.
* incorporate code for keyboard shortcuts that correspond to the buttons in the hovermenu

!History:
*03-08-06, ver 1.1.2: compatibility fix with SelectThemePlugin
*03-08-06,  ver 1.11: fixed error with button tooltips
*27-07-06, ver 1.1 : added JumpMacro to hoverMenu
*23-07-06

!Code
***/

/***
start HoverMenu plugin code
***/
//{{{
config.hoverMenu={};
//}}}

/***
HoverMenu configuration settings
***/
//{{{
config.hoverMenu.settings={
               align: 'right',    //align menu to right or left side of screen, possible values are 'right' and 'left'               
               x: 1,              // horizontal distance of menu from side of screen, increase to your liking.
               y: 158            //vertical distance of menu from top of screen at start, increase or decrease to your liking
               };
//}}}

//{{{
//continue HoverMenu plugin code
config.hoverMenu.handler=function()
{              
               if (!document.getElementById("hoverMenu"))
               {
               var theMenu = createTiddlyElement(document.getElementById("contentWrapper"), "div","hoverMenu");
               theMenu.setAttribute("refresh","content");
               theMenu.setAttribute("tiddler","HoverMenu");
               var menuContent = store.getTiddlerText("HoverMenu");
               wikify(menuContent,theMenu);
              }

	       var Xloc = this.settings.x;
	       Yloc =this.settings.y;
	       var ns = (navigator.appName.indexOf("Netscape") != -1);
	       function SetMenu(id)
                        {
		        var GetElements=document.getElementById?document.getElementById(id):document.all?document.all[id]:document.layers[id];
		        if(document.layers)GetElements.style=GetElements;
		        GetElements.sP=function(x,y){this.style[config.hoverMenu.settings.align]=x +"px";this.style.top=y +"px";};
		        GetElements.x = Xloc;
		        GetElements.y = findScrollY();
		        GetElements.y += Yloc;
		        return GetElements;
	                }
               window.LoCate_XY=function()
                        {
		        var pY =  findScrollY();
                        ftlObj.y += (pY + Yloc - ftlObj.y)/15;
		        ftlObj.sP(ftlObj.x, ftlObj.y);
		        setTimeout("LoCate_XY()", 10);
	                }
               ftlObj = SetMenu("hoverMenu");
	       LoCate_XY();
};

window.old_lewcid_hovermenu_restart = restart;
restart = function()
{
               window.old_lewcid_hovermenu_restart();
               config.hoverMenu.handler();
};

setStylesheet(
"#hoverMenu .imgLink, #hoverMenu .imgLink:hover {border:none; padding:0px; float:right; margin-bottom:2px; margin-top:0px;}\n"+
"#hoverMenu  .button, #hoverMenu  .tiddlyLink {border:none; font-weight:bold; background:#18f; color:#FFF; padding:0 5px; float:right; margin-bottom:4px;}\n"+
"#hoverMenu .button:hover, #hoverMenu .tiddlyLink:hover {font-weight:bold; border:none; color:#fff; background:#000; padding:0 5px; float:right; margin-bottom:4px;}\n"+
"#hoverMenu .button {width:100%; text-align:center}"+
"#hoverMenu { position:absolute; width:7px;}\n"+
"\n","hoverMenuStyles");


config.macros.renameButton={};
config.macros.renameButton.handler = function(place,macroName,params,wikifier,paramString,tiddler)
{

               if (place.lastChild.tagName!="BR")
                     {
                      place.lastChild.firstChild.data = params[0];
                      if (params[1]) {place.lastChild.title = params[1];}
                     }
};

config.shadowTiddlers["HoverMenu"]="<<top>>\n<<toggleSideBar>><<renameButton '>' >>\n<<jump j '' top>>\n<<saveChanges>><<renameButton s 'Save TiddlyWiki'>>\n<<newTiddler>><<renameButton n>>\n";
//}}}
//end HoverMenu plugin code

//Start ToggleSideBarMacro code
//{{{
config.macros.toggleSideBar={};

config.macros.toggleSideBar.settings={
         styleHide :  "#sidebar { display: none;}\n"+"#contentWrapper #displayArea { margin-right: 1em;}\n"+"",
         styleShow : " ",
         arrow1: "«",
         arrow2: "»"
};

config.macros.toggleSideBar.handler=function (place,macroName,params,wikifier,paramString,tiddler)
{
          var tooltip= params[1]||'toggle sidebar';
          var mode = (params[2] && params[2]=="hide")? "hide":"show";
          var arrow = (mode == "hide")? this.settings.arrow1:this.settings.arrow2;
          var label= (params[0]&&params[0]!='.')?params[0]+" "+arrow:arrow;
          var theBtn = createTiddlyButton(place,label,tooltip,this.onToggleSideBar,"button HideSideBarButton");
          if (mode == "hide")
             { 
             (document.getElementById("sidebar")).setAttribute("toggle","hide");
              setStylesheet(this.settings.styleHide,"ToggleSideBarStyles");
             }
};

config.macros.toggleSideBar.onToggleSideBar = function(){
          var sidebar = document.getElementById("sidebar");
          var settings = config.macros.toggleSideBar.settings;
          if (sidebar.getAttribute("toggle")=='hide')
             {
              setStylesheet(settings.styleShow,"ToggleSideBarStyles");
              sidebar.setAttribute("toggle","show");
              this.firstChild.data= (this.firstChild.data).replace(settings.arrow1,settings.arrow2);
              }
          else
              {    
               setStylesheet(settings.styleHide,"ToggleSideBarStyles");
               sidebar.setAttribute("toggle","hide");
               this.firstChild.data= (this.firstChild.data).replace(settings.arrow2,settings.arrow1);
              }

     return false;
}

setStylesheet(".HideSideBarButton .button {font-weight:bold; padding: 0 5px;}\n","ToggleSideBarButtonStyles");
//}}}
//end ToggleSideBarMacro code

//start JumpToTopMacro code
//{{{
config.macros.top={};
config.macros.top.handler=function(place,macroName)
{
               createTiddlyButton(place,"^","jump to top",this.onclick);
}
config.macros.top.onclick=function()
{
               window.scrollTo(0,0);
};

config.commands.top =
{
               text:" ^ ",
               tooltip:"jump to top"
};

config.commands.top.handler = function(event,src,title)
{
               window.scrollTo(0,0);
}
//}}}
//end JumpToStartMacro code

//start JumpMacro code
//{{{
config.macros.jump= {};
config.macros.jump.handler = function (place,macroName,params,wikifier,paramString,tiddler)
{
        var label = (params[0] && params[0]!=".")? params[0]: 'jump';
        var tooltip = (params[1] && params[1]!=".")? params[1]: 'jump to an open tiddler';
        var top = (params[2] && params[2]=='top') ? true: false;        

        var btn =createTiddlyButton(place,label,tooltip,this.onclick);
        if (top==true)
              btn.setAttribute("top","true")
}

config.macros.jump.onclick = function(e)
{
        if (!e) var e = window.event;
        var theTarget = resolveTarget(e);
        var top = theTarget.getAttribute("top");
	var popup = Popup.create(this);
	if(popup)
		{
                 if(top=="true")
                                {createTiddlyButton(createTiddlyElement(popup,"li"),'Top ↑','Top of TW',config.macros.jump.top);
                                 createTiddlyElement(popup,"hr");}
		
		story.forEachTiddler(function(title,element) {
			createTiddlyLink(createTiddlyElement(popup,"li"),title,true);
			});
                }
	Popup.show(popup,false);
	e.cancelBubble = true;
	if (e.stopPropagation) e.stopPropagation();
	return false;
}

config.macros.jump.top = function()
{
       window.scrollTo(0,0);
}
//}}}
//end JumpMacro code

//utility functions
//{{{
Popup.show = function(unused,slowly)
{
	var curr = Popup.stack[Popup.stack.length-1];
	var rootLeft = findPosX(curr.root);
	var rootTop = findPosY(curr.root);
	var rootHeight = curr.root.offsetHeight;
	var popupLeft = rootLeft;
	var popupTop = rootTop + rootHeight;
	var popupWidth = curr.popup.offsetWidth;
	var winWidth = findWindowWidth();
        if (isChild(curr.root,'hoverMenu'))
              var x = config.hoverMenu.settings.x;
        else
              var x = 0;
	if(popupLeft + popupWidth+x > winWidth)
		popupLeft = winWidth - popupWidth -x;
        if (isChild(curr.root,'hoverMenu'))
  	        {curr.popup.style.right = x + "px";}
        else
                curr.popup.style.left = popupLeft + "px";
	curr.popup.style.top = popupTop + "px";
	curr.popup.style.display = "block";
	addClass(curr.root,"highlight");
	if(config.options.chkAnimate)
		anim.startAnimating(new Scroller(curr.popup,slowly));
	else
		window.scrollTo(0,ensureVisible(curr.popup));
}

window.isChild = function(e,parentId) {
        while (e != null) {
                var parent = document.getElementById(parentId);
                if (parent == e) return true;
                e = e.parentNode;
                }
        return false;
};
//}}}


/***
|''Name:''|LoadRemoteFileThroughProxy (previous LoadRemoteFileHijack)|
|''Description:''|When the TiddlyWiki file is located on the web (view over http) the content of [[SiteProxy]] tiddler is added in front of the file url. If [[SiteProxy]] does not exist "/proxy/" is added. |
|''Version:''|1.1.0|
|''Date:''|mar 17, 2007|
|''Source:''|http://tiddlywiki.bidix.info/#LoadRemoteFileHijack|
|''Author:''|BidiX (BidiX (at) bidix (dot) info)|
|''License:''|[[BSD open source license|http://tiddlywiki.bidix.info/#%5B%5BBSD%20open%20source%20license%5D%5D ]]|
|''~CoreVersion:''|2.2.0|
***/
//{{{
version.extensions.LoadRemoteFileThroughProxy = {
 major: 1, minor: 1, revision: 0, 
 date: new Date("mar 17, 2007"), 
 source: "http://tiddlywiki.bidix.info/#LoadRemoteFileThroughProxy"};

if (!window.bidix) window.bidix = {}; // bidix namespace
if (!bidix.core) bidix.core = {};

bidix.core.loadRemoteFile = loadRemoteFile;
loadRemoteFile = function(url,callback,params)
{
 if ((document.location.toString().substr(0,4) == "http") && (url.substr(0,4) == "http")){ 
 url = store.getTiddlerText("SiteProxy", "/proxy/") + url;
 }
 return bidix.core.loadRemoteFile(url,callback,params);
}
//}}}
[[導讀]]
[[開講了]]
[[鸚鵡的啟示]]
[[學長的一封信]]
[[有誰跟你一起?]]
----
抽樣調查
[[預定進度表|預定進度表(逢甲大學98學年度上學期)]]
[[訪員訓練時間表]]
[[評比計畫|抽樣調查評比計畫]]
[[每週上課實錄]]
----
[[統計資料分析期末報告]]
----
抽樣調查主題
[[預備知識]]
[[隨機抽樣設計]]
[[簡單隨機抽樣設計]]
[[系統抽樣設計]]
[[集體抽樣設計]]
[[分層抽樣設計]]
[[問卷設計]]
[[案例分析]]
----
統計資料分析主題
[[離散資料]]
[[跟離散資料有關的分配]]
[[估計離散資料的分配]]
[[樣本比例的抽樣分配]]
[[二項比例的信賴區間]]
[[二項比例的假設檢定]]
[[比例差距的檢定]]
[[相對風險]]
[[勝算比]]
[[卡方檢定]]
[[線性趨勢檢定]]
[[費雪正確檢定]]
----
支持題材
[[符號表]]
[[R入口]]
[[R的Q&A]]
[[Q&A]]
[[複習題解答]]
[[有趣的題材]]
----
課程
[[初等統計學|http://easystats.tiddlyspot.com/]]
[[圖書館統計研習營|http://talkstats.tiddlyspot.com/]]
[[97學年度統計資料分析預定進度表|預定進度表(逢甲大學97學年度下學期)]]
----
抽樣調查考古題
[[第一次平常考|抽樣調查第一次平常考]]
[[期中考|抽樣調查期中考]]
[[第二次平常考|抽樣調查第二次平常考]]
[[期末考|抽樣調查期末考]]
----
統計資料分析考古題
[[第一次平常考|2009第一次平常考]]
[[期中考|2009期中考]]
[[第二次平常考|2009第二次平常考]]
[[期末考|2009期末考]]
----
合作夥伴
[[R|R本店]]
[[jsMath]]
[[FireFox]]
[[TiddlyWiki]]
[[指定參考書]]
[[統計方法決策樹]]
----
[[課程網頁與講義的愛恨情仇]]
[[用TiddlyWiki紀錄個人的學習歷程]]
----
[[歡迎寫信指教|mailto:cwu@fcu.edu.tw]]
/***
|Name|NestedSlidersPlugin|
|Source|http://www.TiddlyTools.com/#NestedSlidersPlugin|
|Documentation|http://www.TiddlyTools.com/#NestedSlidersPluginInfo|
|Version|2.3.4|
|Author|Eric Shulman - ELS Design Studios|
|License|http://www.TiddlyTools.com/#LegalStatements <br>and [[Creative Commons Attribution-ShareAlike 2.5 License|http://creativecommons.org/licenses/by-sa/2.5/]]|
|~CoreVersion|2.1|
|Type|plugin|
|Requires||
|Overrides||
|Description|show content in nest-able sliding/floating panels, without creating separate tiddlers for each panel's content|
This plugin adds new wiki syntax for embedding 'slider' panels directly into tiddler content.  
!!!!!Documentation
>see [[NestedSlidersPluginInfo]]
!!!!!Configuration
<<<
Enable animation for slider panels
<<option chkFloatingSlidersAnimate>> allow sliders to animate when opening/closing
>(note: This setting is in //addition// to the general option for enabling/disabling animation effects:
><<option chkAnimate>> enable animations (entire document)
>For slider animation to occur, you must also allow animation in general.

Debugging messages for 'lazy sliders' deferred rendering:
<<option chkDebugLazySliderDefer>> show debugging alert when deferring slider rendering
<<option chkDebugLazySliderRender>> show debugging alert when deferred slider is actually rendered
<<<
!!!!!Revisions
<<<
2008.01.08 - [*.*.*] plugin size reduction: documentation moved to ...Info tiddler
2007.12.28 - 2.3.4 added hijack for Animator.prototype.startAnimating().  Previously, the plugin code simply set the overflow to "visible" after animation.  This code tweak corrects handling of elements that were styled with overflow=hidden/auto/scroll before animation by saving the overflow style and then restoring it after animation has completed.
|please see [[NestedSlidersPluginInfo]] for additional revision details|
2005.11.03 - 1.0.0 initial public release.  Thanks to RodneyGomes, GeoffSlocock, and PaulPetterson for suggestions and experiments.
<<<
!!!!!Code
***/
//{{{
version.extensions.nestedSliders = {major: 2, minor: 3, revision: 4, date: new Date(2007,12,28)};
//}}}

//{{{
// options for deferred rendering of sliders that are not initially displayed
if (config.options.chkDebugLazySliderDefer==undefined) config.options.chkDebugLazySliderDefer=false;
if (config.options.chkDebugLazySliderRender==undefined) config.options.chkDebugLazySliderRender=false;
if (config.options.chkFloatingSlidersAnimate==undefined) config.options.chkFloatingSlidersAnimate=false;

// default styles for 'floating' class
setStylesheet(".floatingPanel { position:absolute; z-index:10; padding:0.5em; margin:0em; \
	background-color:#eee; color:#000; border:1px solid #000; text-align:left; }","floatingPanelStylesheet");
//}}}

//{{{
config.formatters.push( {
	name: "nestedSliders",
	match: "\\n?\\+{3}",
	terminator: "\\s*\\={3}\\n?",
	lookahead: "\\n?\\+{3}(\\+)?(\\([^\\)]*\\))?(\\!*)?(\\^(?:[^\\^\\*\\[\\>]*\\^)?)?(\\*)?(?:\\{\\{([\\w]+[\\s\\w]*)\\{)?(\\[[^\\]]*\\])?(\\[[^\\]]*\\])?(?:\\}{3})?(\\#[^:]*\\:)?(\\>)?(\\.\\.\\.)?\\s*",
	handler: function(w)
		{
			lookaheadRegExp = new RegExp(this.lookahead,"mg");
			lookaheadRegExp.lastIndex = w.matchStart;
			var lookaheadMatch = lookaheadRegExp.exec(w.source)
			if(lookaheadMatch && lookaheadMatch.index == w.matchStart)
			{
				// var defopen=lookaheadMatch[1]
				// var cookiename=lookaheadMatch[2]
				// var header=lookaheadMatch[3]
				// var panelwidth=lookaheadMatch[4]
				// var transient=lookaheadMatch[5]
				// var class=lookaheadMatch[6]
				// var label=lookaheadMatch[7]
				// var openlabel=lookaheadMatch[8]
				// var panelID=lookaheadMatch[9]
				// var blockquote=lookaheadMatch[10]
				// var deferred=lookaheadMatch[11]

				// location for rendering button and panel
				var place=w.output;

				// default to closed, no cookie, no accesskey, no alternate text/tip
				var show="none"; var cookie=""; var key="";
				var closedtext=">"; var closedtip="";
				var openedtext="<"; var openedtip="";

				// extra "+", default to open
				if (lookaheadMatch[1]) show="block";

				// cookie, use saved open/closed state
				if (lookaheadMatch[2]) {
					cookie=lookaheadMatch[2].trim().slice(1,-1);
					cookie="chkSlider"+cookie;
					if (config.options[cookie]==undefined)
						{ config.options[cookie] = (show=="block") }
					show=config.options[cookie]?"block":"none";
				}

				// parse label/tooltip/accesskey: [label=X|tooltip]
				if (lookaheadMatch[7]) {
					var parts=lookaheadMatch[7].trim().slice(1,-1).split("|");
					closedtext=parts.shift();
					if (closedtext.substr(closedtext.length-2,1)=="=")	
						{ key=closedtext.substr(closedtext.length-1,1); closedtext=closedtext.slice(0,-2); }
					openedtext=closedtext;
					if (parts.length) closedtip=openedtip=parts.join("|");
					else { closedtip="show "+closedtext; openedtip="hide "+closedtext; }
				}

				// parse alternate label/tooltip: [label|tooltip]
				if (lookaheadMatch[8]) {
					var parts=lookaheadMatch[8].trim().slice(1,-1).split("|");
					openedtext=parts.shift();
					if (parts.length) openedtip=parts.join("|");
					else openedtip="hide "+openedtext;
				}

				var title=show=='block'?openedtext:closedtext;
				var tooltip=show=='block'?openedtip:closedtip;

				// create the button
				if (lookaheadMatch[3]) { // use "Hn" header format instead of button/link
					var lvl=(lookaheadMatch[3].length>6)?6:lookaheadMatch[3].length;
					var btn = createTiddlyElement(createTiddlyElement(place,"h"+lvl,null,null,null),"a",null,lookaheadMatch[6],title);
					btn.onclick=onClickNestedSlider;
					btn.setAttribute("href","javascript:;");
					btn.setAttribute("title",tooltip);
				}
				else
					var btn = createTiddlyButton(place,title,tooltip,onClickNestedSlider,lookaheadMatch[6]);
				btn.innerHTML=title; // enables use of HTML entities in label

				// set extra button attributes
				btn.setAttribute("closedtext",closedtext);
				btn.setAttribute("closedtip",closedtip);
				btn.setAttribute("openedtext",openedtext);
				btn.setAttribute("openedtip",openedtip);
				btn.sliderCookie = cookie; // save the cookiename (if any) in the button object
				btn.defOpen=lookaheadMatch[1]!=null; // save default open/closed state (boolean)
				btn.keyparam=key; // save the access key letter ("" if none)
				if (key.length) {
					btn.setAttribute("accessKey",key); // init access key
					btn.onfocus=function(){this.setAttribute("accessKey",this.keyparam);}; // **reclaim** access key on focus
				}
				btn.onmouseover=function(event) // mouseover on button aligns floater position with button
					{ if (window.adjustSliderPos) window.adjustSliderPos(this.parentNode,this,this.sliderPanel); }

				// create slider panel
				var panelClass=lookaheadMatch[4]?"floatingPanel":"sliderPanel";
				var panelID=lookaheadMatch[9]; if (panelID) panelID=panelID.slice(1,-1); // trim off delimiters
				var panel=createTiddlyElement(place,"div",panelID,panelClass,null);
				panel.button = btn; // so the slider panel know which button it belongs to
				btn.sliderPanel=panel; // so the button knows which slider panel it belongs to
				panel.defaultPanelWidth=(lookaheadMatch[4] && lookaheadMatch[4].length>2)?lookaheadMatch[4].slice(1,-1):"";
				panel.setAttribute("transient",lookaheadMatch[5]=="*"?"true":"false");
				panel.style.display = show;
				panel.style.width=panel.defaultPanelWidth;
				panel.onmouseover=function(event) // mouseover on panel aligns floater position with button
					{ if (window.adjustSliderPos) window.adjustSliderPos(this.parentNode,this.button,this); }

				// render slider (or defer until shown) 
				w.nextMatch = lookaheadMatch.index + lookaheadMatch[0].length;
				if ((show=="block")||!lookaheadMatch[11]) {
					// render now if panel is supposed to be shown or NOT deferred rendering
					w.subWikify(lookaheadMatch[10]?createTiddlyElement(panel,"blockquote"):panel,this.terminator);
					// align floater position with button
					if (window.adjustSliderPos) window.adjustSliderPos(place,btn,panel);
				}
				else {
					var src = w.source.substr(w.nextMatch);
					var endpos=findMatchingDelimiter(src,"+++","===");
					panel.setAttribute("raw",src.substr(0,endpos));
					panel.setAttribute("blockquote",lookaheadMatch[10]?"true":"false");
					panel.setAttribute("rendered","false");
					w.nextMatch += endpos+3;
					if (w.source.substr(w.nextMatch,1)=="\n") w.nextMatch++;
					if (config.options.chkDebugLazySliderDefer) alert("deferred '"+title+"':\n\n"+panel.getAttribute("raw"));
				}
			}
		}
	}
)

// TBD: ignore 'quoted' delimiters (e.g., "{{{+++foo===}}}" isn't really a slider)
function findMatchingDelimiter(src,starttext,endtext) {
	var startpos = 0;
	var endpos = src.indexOf(endtext);
	// check for nested delimiters
	while (src.substring(startpos,endpos-1).indexOf(starttext)!=-1) {
		// count number of nested 'starts'
		var startcount=0;
		var temp = src.substring(startpos,endpos-1);
		var pos=temp.indexOf(starttext);
		while (pos!=-1)  { startcount++; pos=temp.indexOf(starttext,pos+starttext.length); }
		// set up to check for additional 'starts' after adjusting endpos
		startpos=endpos+endtext.length;
		// find endpos for corresponding number of matching 'ends'
		while (startcount && endpos!=-1) {
			endpos = src.indexOf(endtext,endpos+endtext.length);
			startcount--;
		}
	}
	return (endpos==-1)?src.length:endpos;
}
//}}}

//{{{
window.onClickNestedSlider=function(e)
{
	if (!e) var e = window.event;
	var theTarget = resolveTarget(e);
	var theLabel = theTarget.firstChild.data;
	var theSlider = theTarget.sliderPanel
	var isOpen = theSlider.style.display!="none";

	// toggle label
	theTarget.innerHTML=isOpen?theTarget.getAttribute("closedText"):theTarget.getAttribute("openedText");
	// toggle tooltip
	theTarget.setAttribute("title",isOpen?theTarget.getAttribute("closedTip"):theTarget.getAttribute("openedTip"));

	// deferred rendering (if needed)
	if (theSlider.getAttribute("rendered")=="false") {
		if (config.options.chkDebugLazySliderRender)
			alert("rendering '"+theLabel+"':\n\n"+theSlider.getAttribute("raw"));
		var place=theSlider;
		if (theSlider.getAttribute("blockquote")=="true")
			place=createTiddlyElement(place,"blockquote");
		wikify(theSlider.getAttribute("raw"),place);
		theSlider.setAttribute("rendered","true");
	}
	// show/hide the slider
	if(config.options.chkAnimate && (!hasClass(theSlider,'floatingPanel') || config.options.chkFloatingSlidersAnimate))
		anim.startAnimating(new Slider(theSlider,!isOpen,e.shiftKey || e.altKey,"none"));
	else
		theSlider.style.display = isOpen ? "none" : "block";
	// reset to default width (might have been changed via plugin code)
	theSlider.style.width=theSlider.defaultPanelWidth;
	// align floater panel position with target button
	if (!isOpen && window.adjustSliderPos) window.adjustSliderPos(theSlider.parentNode,theTarget,theSlider);
	// if showing panel, set focus to first 'focus-able' element in panel
	if (theSlider.style.display!="none") {
		var ctrls=theSlider.getElementsByTagName("*");
		for (var c=0; c<ctrls.length; c++) {
			var t=ctrls[c].tagName.toLowerCase();
			if ((t=="input" && ctrls[c].type!="hidden") || t=="textarea" || t=="select")
				{ ctrls[c].focus(); break; }
		}
	}
	var cookie=theTarget.sliderCookie;
	if (cookie && cookie.length) {
		config.options[cookie]=!isOpen;
		if (config.options[cookie]!=theTarget.defOpen)
			saveOptionCookie(cookie);
		else { // remove cookie if slider is in default display state
			var ex=new Date(); ex.setTime(ex.getTime()-1000);
			document.cookie = cookie+"=novalue; path=/; expires="+ex.toGMTString();
		}
	}
	// prevent SHIFT-CLICK from being processed by browser (opens blank window... yuck!)
	// but allow plain click to bubble up to page background (to dismiss open popup, if any)
	if (e.shiftKey) { e.cancelBubble=true; if (e.stopPropagation) e.stopPropagation(); }
	return false;
}
//}}}

//{{{
// click in document background closes transient panels 
document.nestedSliders_savedOnClick=document.onclick;
document.onclick=function(ev) { if (!ev) var ev=window.event; var target=resolveTarget(ev);
	// call original click handler
	if (document.nestedSliders_savedOnClick)
		var retval=document.nestedSliders_savedOnClick.apply(this,arguments);
	// if click was inside transient panel (or something contained by a transient panel)... leave it alone
	var p=target;
	while (p)
		if ((hasClass(p,"floatingPanel")||hasClass(p,"sliderPanel"))&&p.getAttribute("transient")=="true") break;
		else p=p.parentNode;
	if (p) return retval;
	// otherwise, find and close all transient panels...
	var all=document.all?document.all:document.getElementsByTagName("DIV");
	for (var i=0; i<all.length; i++) {
		 // if it is not a transient panel, or the click was on the button that opened this panel, don't close it.
		if (all[i].getAttribute("transient")!="true" || all[i].button==target) continue;
		// otherwise, if the panel is currently visible, close it by clicking it's button
		if (all[i].style.display!="none") window.onClickNestedSlider({target:all[i].button}) 
	}
	return retval;
};
//}}}

//{{{
// adjust floating panel position based on button position
if (window.adjustSliderPos==undefined) window.adjustSliderPos=function(place,btn,panel) {
	if (hasClass(panel,"floatingPanel")) {
		var left=0;
		var top=btn.offsetHeight; 
		if (place.style.position!="relative") {
			var left=findPosX(btn);
			var top=findPosY(btn)+btn.offsetHeight;
			var p=place; while (p && !hasClass(p,'floatingPanel')) p=p.parentNode;
			if (p) { left-=findPosX(p); top-=findPosY(p); }
		}
		if (findPosX(btn)+panel.offsetWidth > getWindowWidth())  // adjust position to stay inside right window edge
			left-=findPosX(btn)+panel.offsetWidth-getWindowWidth()+15; // add extra 15px 'fudge factor'
		panel.style.left=left+"px"; panel.style.top=top+"px";
	}
}

function getWindowWidth() {
	if(document.width!=undefined)
		return document.width; // moz (FF)
	if(document.documentElement && ( document.documentElement.clientWidth || document.documentElement.clientHeight ) )
		return document.documentElement.clientWidth; // IE6
	if(document.body && ( document.body.clientWidth || document.body.clientHeight ) )
		return document.body.clientWidth; // IE4
	if(window.innerWidth!=undefined)
		return window.innerWidth; // IE - general
	return 0; // unknown
}
//}}}

//{{{
// TW2.1 and earlier:
// hijack Slider animation handler 'stop' handler so overflow is visible after animation has completed
Slider.prototype.coreStop = Slider.prototype.stop;
Slider.prototype.stop = function()
	{ this.coreStop.apply(this,arguments); this.element.style.overflow = "visible"; }

// TW2.2+
// hijack start/stop handlers so overflow style is saved and restored after animation has completed
if (version.major+.1*version.minor+.01*version.revision>=2.2) {
/**
	Animator.prototype.core_startAnimating = Animator.prototype.startAnimating;
	Animator.prototype.startAnimating = function() {
		for(var t=0; t<arguments.length; t++)
			arguments[t].element.save_overflow=arguments[t].element.style.overflow;
		return this.core_startAnimating.apply(this,arguments);
	};
**/
	Morpher.prototype.coreStop = Morpher.prototype.stop;
	Morpher.prototype.stop = function() {
		this.coreStop.apply(this,arguments);
		this.element.style.overflow = this.element.save_overflow||"visible";
	};
}
//}}}
/***
|''Name:''|PasswordOptionPlugin|
|''Description:''|Extends TiddlyWiki options with non encrypted password option.|
|''Version:''|1.0.2|
|''Date:''|Apr 19, 2007|
|''Source:''|http://tiddlywiki.bidix.info/#PasswordOptionPlugin|
|''Author:''|BidiX (BidiX (at) bidix (dot) info)|
|''License:''|[[BSD open source license|http://tiddlywiki.bidix.info/#%5B%5BBSD%20open%20source%20license%5D%5D ]]|
|''~CoreVersion:''|2.2.0 (Beta 5)|
***/
//{{{
version.extensions.PasswordOptionPlugin = {
	major: 1, minor: 0, revision: 2, 
	date: new Date("Apr 19, 2007"),
	source: 'http://tiddlywiki.bidix.info/#PasswordOptionPlugin',
	author: 'BidiX (BidiX (at) bidix (dot) info',
	license: '[[BSD open source license|http://tiddlywiki.bidix.info/#%5B%5BBSD%20open%20source%20license%5D%5D]]',
	coreVersion: '2.2.0 (Beta 5)'
};

config.macros.option.passwordCheckboxLabel = "Save this password on this computer";
config.macros.option.passwordInputType = "password"; // password | text
setStylesheet(".pasOptionInput {width: 11em;}\n","passwordInputTypeStyle");

merge(config.macros.option.types, {
	'pas': {
		elementType: "input",
		valueField: "value",
		eventName: "onkeyup",
		className: "pasOptionInput",
		typeValue: config.macros.option.passwordInputType,
		create: function(place,type,opt,className,desc) {
			// password field
			config.macros.option.genericCreate(place,'pas',opt,className,desc);
			// checkbox linked with this password "save this password on this computer"
			config.macros.option.genericCreate(place,'chk','chk'+opt,className,desc);			
			// text savePasswordCheckboxLabel
			place.appendChild(document.createTextNode(config.macros.option.passwordCheckboxLabel));
		},
		onChange: config.macros.option.genericOnChange
	}
});

merge(config.optionHandlers['chk'], {
	get: function(name) {
		// is there an option linked with this chk ?
		var opt = name.substr(3);
		if (config.options[opt]) 
			saveOptionCookie(opt);
		return config.options[name] ? "true" : "false";
	}
});

merge(config.optionHandlers, {
	'pas': {
 		get: function(name) {
			if (config.options["chk"+name]) {
				return encodeCookie(config.options[name].toString());
			} else {
				return "";
			}
		},
		set: function(name,value) {config.options[name] = decodeCookie(value);}
	}
});

// need to reload options to load passwordOptions
loadOptionsCookie();

/*
if (!config.options['pasPassword'])
	config.options['pasPassword'] = '';

merge(config.optionsDesc,{
		pasPassword: "Test password"
	});
*/
//}}}
// AJAX code adapted from http://timmorgan.org/mini
// This is already loaded by ziddlywiki...
if(typeof(window["ajax"]) == "undefined") {
  ajax = {
      x: function(){try{return new ActiveXObject('Msxml2.XMLHTTP')}catch(e){try{return new ActiveXObject('Microsoft.XMLHTTP')}catch(e){return new XMLHttpRequest()}}},
      gets: function(url){var x=ajax.x();x.open('GET',url,false);x.send(null);return x.responseText}
  }
}

// Load jsMath
jsMath = {
  Setup: {inited: 1},          // don't run jsMath.Setup.Body() yet
  Autoload: {root: new String(document.location).replace(/[^\/]*$/,'jsMath/')}  // URL to jsMath directory, change if necessary
};
var jsMathstr;
try {
  jsMathstr = ajax.gets(jsMath.Autoload.root+"jsMath.js");
} catch(e) {
  alert("jsMath was not found: you must place the 'jsMath' directory in the same place as this file.  "
       +"The error was:\n"+e.name+": "+e.message);
  throw(e);  // abort eval
}
try {
  window.eval(jsMathstr);
} catch(e) {
  alert("jsMath failed to load.  The error was:\n"+e.name + ": " + e.message + " on line " + e.lineNumber);
}
jsMath.Setup.inited=0;  //  allow jsMath.Setup.Body() to run again

// Define wikifers for latex
config.formatterHelpers.mathFormatHelper = function(w) {
    var e = document.createElement(this.element);
    e.className = this.className;
    var endRegExp = new RegExp(this.terminator, "mg");
    endRegExp.lastIndex = w.matchStart+w.matchLength;
    var matched = endRegExp.exec(w.source);
    if(matched) {
        var txt = w.source.substr(w.matchStart+w.matchLength, 
            matched.index-w.matchStart-w.matchLength);
        if(this.keepdelim) {
          txt = w.source.substr(w.matchStart, matched.index+matched[0].length-w.matchStart);
        }
        e.appendChild(document.createTextNode(txt));
        w.output.appendChild(e);
        w.nextMatch = endRegExp.lastIndex;
    }
}

config.formatters.push({
  name: "displayMath1",
  match: "\\\$\\\$",
  terminator: "\\\$\\\$\\n?", // 2.0 compatability
  termRegExp: "\\\$\\\$\\n?",
  element: "div",
  className: "math",
  handler: config.formatterHelpers.mathFormatHelper
});

config.formatters.push({
  name: "inlineMath1",
  match: "\\\$", 
  terminator: "\\\$", // 2.0 compatability
  termRegExp: "\\\$",
  element: "span",
  className: "math",
  handler: config.formatterHelpers.mathFormatHelper
});

var backslashformatters = new Array(0);

backslashformatters.push({
  name: "inlineMath2",
  match: "\\\\\\\(",
  terminator: "\\\\\\\)", // 2.0 compatability
  termRegExp: "\\\\\\\)",
  element: "span",
  className: "math",
  handler: config.formatterHelpers.mathFormatHelper
});

backslashformatters.push({
  name: "displayMath2",
  match: "\\\\\\\[",
  terminator: "\\\\\\\]\\n?", // 2.0 compatability
  termRegExp: "\\\\\\\]\\n?",
  element: "div",
  className: "math",
  handler: config.formatterHelpers.mathFormatHelper
});

backslashformatters.push({
  name: "displayMath3",
  match: "\\\\begin\\{equation\\}",
  terminator: "\\\\end\\{equation\\}\\n?", // 2.0 compatability
  termRegExp: "\\\\end\\{equation\\}\\n?",
  element: "div",
  className: "math",
  handler: config.formatterHelpers.mathFormatHelper
});

// These can be nested.  e.g. \begin{equation} \begin{array}{ccc} \begin{array}{ccc} ...
backslashformatters.push({
  name: "displayMath4",
  match: "\\\\begin\\{eqnarray\\}",
  terminator: "\\\\end\\{eqnarray\\}\\n?", // 2.0 compatability
  termRegExp: "\\\\end\\{eqnarray\\}\\n?",
  element: "div",
  className: "math",
  keepdelim: true,
  handler: config.formatterHelpers.mathFormatHelper
});

// The escape must come between backslash formatters and regular ones.
// So any latex-like \commands must be added to the beginning of
// backslashformatters here.
backslashformatters.push({
    name: "escape",
    match: "\\\\.",
    handler: function(w) {
        w.output.appendChild(document.createTextNode(w.source.substr(w.matchStart+1,1)));
        w.nextMatch = w.matchStart+2;
    }
});

config.formatters=backslashformatters.concat(config.formatters);

window.wikify = function(source,output,highlightRegExp,tiddler)
{
    if(source && source != "") {
        if(version.major == 2 && version.minor > 0) {
            var wikifier = new Wikifier(source,getParser(tiddler),highlightRegExp,tiddler);
            wikifier.subWikifyUnterm(output);
        } else {
            var wikifier = new Wikifier(source,formatter,highlightRegExp,tiddler);
            wikifier.subWikify(output,null);
        }
        jsMath.ProcessBeforeShowing();
    }
}
[[期望值|期望值的Q&A]]
[[計算樣本平均的期望值與變異數]]
[[計算樣本比例的期望值與變異數]]
[[計算二項分配成功機率之不偏估計式的期望值與變異數]]
[[計算樣本線性組合的期望值與變異數]]
!中央極限定理
{{{
qnorm()
}}}
!常態$t$檢定
{{{
qt()
}}}
!二項比例的小樣本信賴區間
{{{
dbinom()
}}}
!binom.test()
{{{
binom.test(x, n, p = 0.5,
           alternative = c("two.sided", "less", "greater"),
           conf.level = 0.95)
}}}
# x表示你的觀察值。某一項成功次數的觀察值。
# n表示伯努利試驗次數。
# p表示成功的機率之虛無值($p_0$)。
# alternative表示對立假設的方向。
## two.sided表示雙尾。
## less表示左尾。
## greater表示右尾。
# conf.level就是假設檢定的信賴係數,等於$1 - \alpha$。
!prop.test()
{{{
prop.test(x, n, p = NULL,
          alternative = c("two.sided", "less", "greater"),
          conf.level = 0.95, correct = TRUE)
}}}
# x表示你的觀察值。某一項成功次數的觀察值。
# n表示伯努利試驗次數。
# p表示成功的機率之虛無值($p_0$)。
# alternative表示對立假設的方向。
## two.sided表示雙尾。
## less表示左尾。
## greater表示右尾。
# conf.level就是假設檢定的信賴係數,等於$1 - \alpha$。
# correct表示同意使用「連續性校正」。
數據是不是來自[[常態分配]]?
# qqnorm()
# qqline()
# qqplot()
[[關於R]]
[[我要跟R交朋友]]
!R與數據
# [[vector]]
# [[matrix]]
# [[data.frame]]
# [[list]]
!R與分配
# R與伯努利分配
## [[產生伯努利數據]]
## [[一張伯努利分配的圖]]
# R與二項分配
## [[產生二項數據]]
## [[計算二項機率]]
## [[計算累加二項機率]]
## [[一張二項分配的圖]]
## [[一張累加二項分配的圖]]
# R與多項分配
## [[與多項分配有關的兩項R函示]]
## [[用圖形呈現多項分配]]
# R與常態分配
## [[產生常態數據]]
## [[計算常態機率]]
## [[繪製常態分配]]
!R與信賴區間
!R與假設檢定
!R在家實習
[[第一次R在家實習]]
[[第二次R在家實習]]
[[第三次R在家實習]]
[[第四次R在家實習]]
[[第五次R在家實習]]
!指導影片
[[第一支指導影片]]
[[第二支指導影片]]
<html><div align="center"><iframe src ="http://www.r-project.org/doc/bib/R-books.html" width="100%" align="center" height=400"></iframe></div></html>
<html><div align="center"><iframe src ="http://www.r-project.org/" width="100%" align="center" height=400"></iframe></div></html>
# 【學生一】
>我想請問關於R
>sample(x=c(0,2),replace=FALSE,size=10,prob=c(0.4,0.6))
>這個程式碼,replace=FALSE,是取後不放回的意思嗎?
>所以母體size不能為10大於樣本?
+++[老師的回答]
{{{
你的袋子只有兩個數字
一個0
一個2
如果你設定replace=FALSE(取後不放回)
那麼你只能對你的袋子取樣兩次
因為兩次之後
袋子就空空如也
換言之
size無法超過2

錯誤訊息

cannot take a sample larger than the population when 'replace = FALSE'

就是這個意思
}}}
===
+++[大家來找碴]
請訂正這位同學的來信!
===
!教過的指令與函示
q()
weight = scan()
weight
weight[1]
weight[14]
weight[15]
mean(weight)
median(weight)
sd(weight)
var(weight)
data.frame()
edit(table26)
!注意事項
# R會分大小寫:weight跟Weight,WEIGHT,或是任何一個、兩個、...字母改成大寫的名字都不一樣。
[[What is R?|http://www.r-project.org/about.html]]
[[Enter the gallery|http://addictedtor.free.fr/graphiques/]]
| 中文意思 | R函示 | 餵什麼(舉例說明) | 出現在哪裡? | 記憶術 |
| 抽樣 | sample() | x = c(0, 1), size = 1, replace = TRUE, prob = c(0.8, 0.2) |||
| 加總 |||||
| 來自二項分配的亂數 |||||
| 階乘 |||||
| 組合 |||||
| 二項機率 |||||
| 累加二項機率 |||||
| 來自多項分配的亂數 |||||
| 多項機率 |||||
| 繪製兩維的散佈圖 |||||
!!!語法ㄧ
{{{
>
}}}
【R Console】視窗的最下方出現這個符號,表示R已經準備好接受你的命令。這個符號叫做【提示符號】。
!!!語法二
{{{
#
}}}
R不會理會這個符號之後的任何符號。這表示你可以在【#】之後寫中文。
!!!語法三
{{{
=
}}}
R利用【=】號把左邊的計算結果【存放在】或是【指定給】右邊的物件(object)。物件是一個資訊專有名詞,在R的世界,物件可能是向量、矩陣、表格、一張圖等等。物件之間用【名字】區分彼此。比如說,兩個向量,一個叫做x,一個叫做y。
!!!語法四
{{{
,
}}}
被用來區分物件。
!!!語法五
數學公式的語法跟你的電子計算機的語法幾乎一模一樣。所用的符號也幾乎一模一樣。
!!!語法六
那些別人幫我們寫好的工具,比如說,第一個我們接觸到的sample(),它在R的世界裡叫做function,老師翻譯為【函示】。按照sample()定義的方式在小括號內【餵】你希望得到答案的設定,像
>sample(x = c(0, 1), size = 1, replace = TRUE, prob = c(0.8, 0.2))
中的
>x = c(0, 1), size = 1, replace = TRUE, prob = c(0.8, 0.2)
sample()就會【回】你根據設定計算出來的物件。如果你要繼續使用sample()回你的物件,可以利用【=】號存放在一個你自己定義的名字。
!!!語法七:R求助系統
{{{
> help(log) # help on the function log()
> ?help # same thing
> help() # general help (i.e. help on help())
> help(help) # same thing
> args(log) # shorter version of help(log) giving only the arguments to log()
}}}
!!!語法八:R內建搜尋引擎
{{{
> help.start() # open an interactive help window
}}}
!!!語法九
想知道某個名字的內容,只要在提示符號【>】之後鍵入那個名字。
{{{
table()
}}}
----
{{{
tabulate(), ftable(), margin.table(), prop.table(), addmargins()
}}}
!Usage
{{{
chisq.test(x, y)
}}}
!Arguments
* x = a vector.
* y = a vector.
!Details
>Again, the entries of x must be non-negative integers. Otherwise, x and y must be vectors or factors of the same length.
!Value
* statistic = the value the chi-squared test statistic.
* parameter = the degrees of freedom of the approximate chi-squared distribution of the test statistic, NA if the p-value is computed by Monte Carlo simulation.
* p.value = the p-value for the test.
* method = a character string indicating the type of test performed, and whether Monte Carlo simulation or continuity correction was used.
* data.name = a character string giving the name(s) of the data.
* observed = the observed counts.
* expected = the expected counts under the null hypothesis.
* residuals = the Pearson residuals, (observed - expected) / sqrt(expected).
----
【例子】
{{{
> test
     [,1] [,2]
[1,]    3    4
[2,]    5    2
> chisq.test(x=test[,1], y=test[,2])

	Pearson's Chi-squared test with Yates' continuity correction

data:  test[, 1] and test[, 2] 
X-squared = 0, df = 1, p-value = 1

Warning message:
In chisq.test(x = test[, 1], y = test[, 2]) :
  Chi-squared approximation may be incorrect
}}}
!Usage
{{{
chisq.test(x, correct = TRUE)
}}}
!Arguments
* x = a matrix.
* correct = a logical indicating whether to apply continuity correction when computing the test statistic for @@2x2@@ tables: one half is subtracted from all |O-E| differences.
!Details
>If x is a matrix with at least two rows and columns, it is taken as a two-dimensional contingency table. Again, the entries of x must be non-negative integers. Then, Pearson's chi-squared test of the null hypothesis that the joint distribution of the cell counts in a 2-dimensional contingency table is the product of the row and column marginals is performed.
!Value
* statistic = the value the chi-squared test statistic.
* parameter = the degrees of freedom of the approximate chi-squared distribution of the test statistic, NA if the p-value is computed by Monte Carlo simulation.
* p.value = the p-value for the test.
* method = a character string indicating the type of test performed, and whether Monte Carlo simulation or continuity correction was used.
* data.name = a character string giving the name(s) of the data.
* observed = the observed counts.
* expected = the expected counts under the null hypothesis.
* residuals = the Pearson residuals, (observed - expected) / sqrt(expected).
----
【例子】
{{{
> test
     [,1] [,2]
[1,]    3    4
[2,]    5    2
> chisq.test(test)

	Pearson's Chi-squared test with Yates' continuity correction

data:  test 
X-squared = 0.2917, df = 1, p-value = 0.5892

Warning message:
In chisq.test(test) : Chi-squared approximation may be incorrect
> 
}}}
!Usage
{{{
chisq.test(x, p = rep(1/length(x), length(x)))
}}}
!Arguments
* x = a vector.
* p = a vector of probabilities of the same length of x. An error is given if any entry of p is negative.
!Details
>If x is a vector and y is not given, then a goodness-of-fit test is performed (x is treated as a one-dimensional contingency table). The entries of x must be non-negative integers. In this case, the hypothesis tested is whether the population probabilities equal those in p, or are all equal if p is not given.
!Value
* statistic = the value the chi-squared test statistic.
* parameter = the degrees of freedom of the approximate chi-squared distribution of the test statistic, NA if the p-value is computed by Monte Carlo simulation.
* p.value = the p-value for the test.
* method = a character string indicating the type of test performed, and whether Monte Carlo simulation or continuity correction was used.
* data.name = a character string giving the name(s) of the data.
* observed = the observed counts.
* expected = the expected counts under the null hypothesis.
* residuals = the Pearson residuals, (observed - expected) / sqrt(expected).
----
【例子】
{{{
> test
     [,1] [,2]
[1,]    3    4
[2,]    5    2
> chisq.test(x=test[,1])

	Chi-squared test for given probabilities

data:  test[, 1] 
X-squared = 0.5, df = 1, p-value = 0.4795

Warning message:
In chisq.test(x = test[, 1]) : Chi-squared approximation may be incorrect
}}}
有限母體的抽樣技術, (<<version>>), <<fontSize "">>
抽樣調查/統計資料分析
<html><div align="center"><iframe src ="http://www.tiddlywiki.com/" width="100%" align="center" height=400"></iframe></div></html>
/***
Description: Contains the stuff you need to use Tiddlyspot
Note, you also need UploadPlugin, PasswordOptionPlugin and LoadRemoteFileThroughProxy
from http://tiddlywiki.bidix.info for a complete working Tiddlyspot site.
***/
//{{{

// edit this if you are migrating sites or retrofitting an existing TW
config.tiddlyspotSiteId = 'mydiscrete';

// make it so you can by default see edit controls via http
config.options.chkHttpReadOnly = false;
window.readOnly = false; // make sure of it (for tw 2.2)
window.showBackstage = true; // show backstage too

// disable autosave in d3
if (window.location.protocol != "file:")
	config.options.chkGTDLazyAutoSave = false;

// tweak shadow tiddlers to add upload button, password entry box etc
with (config.shadowTiddlers) {
	SiteUrl = 'http://'+config.tiddlyspotSiteId+'.tiddlyspot.com';
	SideBarOptions = SideBarOptions.replace(/(<<saveChanges>>)/,"$1<<tiddler TspotSidebar>>");
	OptionsPanel = OptionsPanel.replace(/^/,"<<tiddler TspotOptions>>");
	DefaultTiddlers = DefaultTiddlers.replace(/^/,"[[WelcomeToTiddlyspot]] ");
	MainMenu = MainMenu.replace(/^/,"[[WelcomeToTiddlyspot]] ");
}

// create some shadow tiddler content
merge(config.shadowTiddlers,{

'WelcomeToTiddlyspot':[
 "This document is a ~TiddlyWiki from tiddlyspot.com.  A ~TiddlyWiki is an electronic notebook that is great for managing todo lists, personal information, and all sorts of things.",
 "",
 "@@font-weight:bold;font-size:1.3em;color:#444; //What now?// &nbsp;&nbsp;@@ Before you can save any changes, you need to enter your password in the form below.  Then configure privacy and other site settings at your [[control panel|http://" + config.tiddlyspotSiteId + ".tiddlyspot.com/controlpanel]] (your control panel username is //" + config.tiddlyspotSiteId + "//).",
 "<<tiddler TspotControls>>",
 "See also GettingStarted.",
 "",
 "@@font-weight:bold;font-size:1.3em;color:#444; //Working online// &nbsp;&nbsp;@@ You can edit this ~TiddlyWiki right now, and save your changes using the \"save to web\" button in the column on the right.",
 "",
 "@@font-weight:bold;font-size:1.3em;color:#444; //Working offline// &nbsp;&nbsp;@@ A fully functioning copy of this ~TiddlyWiki can be saved onto your hard drive or USB stick.  You can make changes and save them locally without being connected to the Internet.  When you're ready to sync up again, just click \"upload\" and your ~TiddlyWiki will be saved back to tiddlyspot.com.",
 "",
 "@@font-weight:bold;font-size:1.3em;color:#444; //Help!// &nbsp;&nbsp;@@ Find out more about ~TiddlyWiki at [[TiddlyWiki.com|http://tiddlywiki.com]].  Also visit [[TiddlyWiki.org|http://tiddlywiki.org]] for documentation on learning and using ~TiddlyWiki. New users are especially welcome on the [[TiddlyWiki mailing list|http://groups.google.com/group/TiddlyWiki]], which is an excellent place to ask questions and get help.  If you have a tiddlyspot related problem email [[tiddlyspot support|mailto:support@tiddlyspot.com]].",
 "",
 "@@font-weight:bold;font-size:1.3em;color:#444; //Enjoy :)// &nbsp;&nbsp;@@ We hope you like using your tiddlyspot.com site.  Please email [[feedback@tiddlyspot.com|mailto:feedback@tiddlyspot.com]] with any comments or suggestions."
].join("\n"),

'TspotControls':[
 "| tiddlyspot password:|<<option pasUploadPassword>>|",
 "| site management:|<<upload http://" + config.tiddlyspotSiteId + ".tiddlyspot.com/store.cgi index.html . .  " + config.tiddlyspotSiteId + ">>//(requires tiddlyspot password)//<br>[[control panel|http://" + config.tiddlyspotSiteId + ".tiddlyspot.com/controlpanel]], [[download (go offline)|http://" + config.tiddlyspotSiteId + ".tiddlyspot.com/download]]|",
 "| links:|[[tiddlyspot.com|http://tiddlyspot.com/]], [[FAQs|http://faq.tiddlyspot.com/]], [[blog|http://tiddlyspot.blogspot.com/]], email [[support|mailto:support@tiddlyspot.com]] & [[feedback|mailto:feedback@tiddlyspot.com]], [[donate|http://tiddlyspot.com/?page=donate]]|"
].join("\n"),

'TspotSidebar':[
 "<<upload http://" + config.tiddlyspotSiteId + ".tiddlyspot.com/store.cgi index.html . .  " + config.tiddlyspotSiteId + ">><html><a href='http://" + config.tiddlyspotSiteId + ".tiddlyspot.com/download' class='button'>download</a></html>"
].join("\n"),

'TspotOptions':[
 "tiddlyspot password:",
 "<<option pasUploadPassword>>",
 ""
].join("\n")

});
//}}}
| !date | !user | !location | !storeUrl | !uploadDir | !toFilename | !backupdir | !origin |
| 28/10/2012 10:11:51 | YourName | [[/|http://mydiscrete.tiddlyspot.com/]] | [[store.cgi|http://mydiscrete.tiddlyspot.com/store.cgi]] | . | [[index.html | http://mydiscrete.tiddlyspot.com/index.html]] | . | failed |
| 28/10/2012 10:12:27 | YourName | [[/|http://mydiscrete.tiddlyspot.com/]] | [[store.cgi|http://mydiscrete.tiddlyspot.com/store.cgi]] | . | [[index.html | http://mydiscrete.tiddlyspot.com/index.html]] | . | failed |
| 28/10/2012 10:13:11 | YourName | [[/|http://mydiscrete.tiddlyspot.com/]] | [[store.cgi|http://mydiscrete.tiddlyspot.com/store.cgi]] | . | [[index.html | http://mydiscrete.tiddlyspot.com/index.html]] | . | ok |
| 28/10/2012 10:14:17 | YourName | [[/|http://mydiscrete.tiddlyspot.com/]] | [[store.cgi|http://mydiscrete.tiddlyspot.com/store.cgi]] | . | [[index.html | http://mydiscrete.tiddlyspot.com/index.html]] | . | ok |
| 28/10/2012 10:18:25 | YourName | [[/|http://mydiscrete.tiddlyspot.com/]] | [[store.cgi|http://mydiscrete.tiddlyspot.com/store.cgi]] | . | [[index.html | http://mydiscrete.tiddlyspot.com/index.html]] | . | ok |
| 28/10/2012 10:41:15 | YourName | [[/|http://mydiscrete.tiddlyspot.com/]] | [[store.cgi|http://mydiscrete.tiddlyspot.com/store.cgi]] | . | [[index.html | http://mydiscrete.tiddlyspot.com/index.html]] | . | ok |
| 28/10/2012 10:53:52 | YourName | [[/|http://mydiscrete.tiddlyspot.com/]] | [[store.cgi|http://mydiscrete.tiddlyspot.com/store.cgi]] | . | [[index.html | http://mydiscrete.tiddlyspot.com/index.html]] | . | ok |
| 28/10/2012 10:59:43 | YourName | [[/|http://mydiscrete.tiddlyspot.com/]] | [[store.cgi|http://mydiscrete.tiddlyspot.com/store.cgi]] | . | [[index.html | http://mydiscrete.tiddlyspot.com/index.html]] | . | ok |
| 28/10/2012 11:01:14 | YourName | [[/|http://mydiscrete.tiddlyspot.com/]] | [[store.cgi|http://mydiscrete.tiddlyspot.com/store.cgi]] | . | [[index.html | http://mydiscrete.tiddlyspot.com/index.html]] | . | ok |
| 28/10/2012 11:01:57 | YourName | [[/|http://mydiscrete.tiddlyspot.com/]] | [[store.cgi|http://mydiscrete.tiddlyspot.com/store.cgi]] | . | [[index.html | http://mydiscrete.tiddlyspot.com/index.html]] | . |
/***
|''Name:''|UploadPlugin|
|''Description:''|Save to web a TiddlyWiki|
|''Version:''|4.1.3|
|''Date:''|Feb 24, 2008|
|''Source:''|http://tiddlywiki.bidix.info/#UploadPlugin|
|''Documentation:''|http://tiddlywiki.bidix.info/#UploadPluginDoc|
|''Author:''|BidiX (BidiX (at) bidix (dot) info)|
|''License:''|[[BSD open source license|http://tiddlywiki.bidix.info/#%5B%5BBSD%20open%20source%20license%5D%5D ]]|
|''~CoreVersion:''|2.2.0|
|''Requires:''|PasswordOptionPlugin|
***/
//{{{
version.extensions.UploadPlugin = {
	major: 4, minor: 1, revision: 3,
	date: new Date("Feb 24, 2008"),
	source: 'http://tiddlywiki.bidix.info/#UploadPlugin',
	author: 'BidiX (BidiX (at) bidix (dot) info',
	coreVersion: '2.2.0'
};

//
// Environment
//

if (!window.bidix) window.bidix = {}; // bidix namespace
bidix.debugMode = false;	// true to activate both in Plugin and UploadService
	
//
// Upload Macro
//

config.macros.upload = {
// default values
	defaultBackupDir: '',	//no backup
	defaultStoreScript: "store.php",
	defaultToFilename: "index.html",
	defaultUploadDir: ".",
	authenticateUser: true	// UploadService Authenticate User
};
	
config.macros.upload.label = {
	promptOption: "Save and Upload this TiddlyWiki with UploadOptions",
	promptParamMacro: "Save and Upload this TiddlyWiki in %0",
	saveLabel: "save to web", 
	saveToDisk: "save to disk",
	uploadLabel: "upload"	
};

config.macros.upload.messages = {
	noStoreUrl: "No store URL in parmeters or options",
	usernameOrPasswordMissing: "Username or password missing"
};

config.macros.upload.handler = function(place,macroName,params) {
	if (readOnly)
		return;
	var label;
	if (document.location.toString().substr(0,4) == "http") 
		label = this.label.saveLabel;
	else
		label = this.label.uploadLabel;
	var prompt;
	if (params[0]) {
		prompt = this.label.promptParamMacro.toString().format([this.destFile(params[0], 
			(params[1] ? params[1]:bidix.basename(window.location.toString())), params[3])]);
	} else {
		prompt = this.label.promptOption;
	}
	createTiddlyButton(place, label, prompt, function() {config.macros.upload.action(params);}, null, null, this.accessKey);
};

config.macros.upload.action = function(params)
{
		// for missing macro parameter set value from options
		if (!params) params = {};
		var storeUrl = params[0] ? params[0] : config.options.txtUploadStoreUrl;
		var toFilename = params[1] ? params[1] : config.options.txtUploadFilename;
		var backupDir = params[2] ? params[2] : config.options.txtUploadBackupDir;
		var uploadDir = params[3] ? params[3] : config.options.txtUploadDir;
		var username = params[4] ? params[4] : config.options.txtUploadUserName;
		var password = config.options.pasUploadPassword; // for security reason no password as macro parameter	
		// for still missing parameter set default value
		if ((!storeUrl) && (document.location.toString().substr(0,4) == "http")) 
			storeUrl = bidix.dirname(document.location.toString())+'/'+config.macros.upload.defaultStoreScript;
		if (storeUrl.substr(0,4) != "http")
			storeUrl = bidix.dirname(document.location.toString()) +'/'+ storeUrl;
		if (!toFilename)
			toFilename = bidix.basename(window.location.toString());
		if (!toFilename)
			toFilename = config.macros.upload.defaultToFilename;
		if (!uploadDir)
			uploadDir = config.macros.upload.defaultUploadDir;
		if (!backupDir)
			backupDir = config.macros.upload.defaultBackupDir;
		// report error if still missing
		if (!storeUrl) {
			alert(config.macros.upload.messages.noStoreUrl);
			clearMessage();
			return false;
		}
		if (config.macros.upload.authenticateUser && (!username || !password)) {
			alert(config.macros.upload.messages.usernameOrPasswordMissing);
			clearMessage();
			return false;
		}
		bidix.upload.uploadChanges(false,null,storeUrl, toFilename, uploadDir, backupDir, username, password); 
		return false; 
};

config.macros.upload.destFile = function(storeUrl, toFilename, uploadDir) 
{
	if (!storeUrl)
		return null;
		var dest = bidix.dirname(storeUrl);
		if (uploadDir && uploadDir != '.')
			dest = dest + '/' + uploadDir;
		dest = dest + '/' + toFilename;
	return dest;
};

//
// uploadOptions Macro
//

config.macros.uploadOptions = {
	handler: function(place,macroName,params) {
		var wizard = new Wizard();
		wizard.createWizard(place,this.wizardTitle);
		wizard.addStep(this.step1Title,this.step1Html);
		var markList = wizard.getElement("markList");
		var listWrapper = document.createElement("div");
		markList.parentNode.insertBefore(listWrapper,markList);
		wizard.setValue("listWrapper",listWrapper);
		this.refreshOptions(listWrapper,false);
		var uploadCaption;
		if (document.location.toString().substr(0,4) == "http") 
			uploadCaption = config.macros.upload.label.saveLabel;
		else
			uploadCaption = config.macros.upload.label.uploadLabel;
		
		wizard.setButtons([
				{caption: uploadCaption, tooltip: config.macros.upload.label.promptOption, 
					onClick: config.macros.upload.action},
				{caption: this.cancelButton, tooltip: this.cancelButtonPrompt, onClick: this.onCancel}
				
			]);
	},
	options: [
		"txtUploadUserName",
		"pasUploadPassword",
		"txtUploadStoreUrl",
		"txtUploadDir",
		"txtUploadFilename",
		"txtUploadBackupDir",
		"chkUploadLog",
		"txtUploadLogMaxLine"		
	],
	refreshOptions: function(listWrapper) {
		var opts = [];
		for(i=0; i<this.options.length; i++) {
			var opt = {};
			opts.push();
			opt.option = "";
			n = this.options[i];
			opt.name = n;
			opt.lowlight = !config.optionsDesc[n];
			opt.description = opt.lowlight ? this.unknownDescription : config.optionsDesc[n];
			opts.push(opt);
		}
		var listview = ListView.create(listWrapper,opts,this.listViewTemplate);
		for(n=0; n<opts.length; n++) {
			var type = opts[n].name.substr(0,3);
			var h = config.macros.option.types[type];
			if (h && h.create) {
				h.create(opts[n].colElements['option'],type,opts[n].name,opts[n].name,"no");
			}
		}
		
	},
	onCancel: function(e)
	{
		backstage.switchTab(null);
		return false;
	},
	
	wizardTitle: "Upload with options",
	step1Title: "These options are saved in cookies in your browser",
	step1Html: "<input type='hidden' name='markList'></input><br>",
	cancelButton: "Cancel",
	cancelButtonPrompt: "Cancel prompt",
	listViewTemplate: {
		columns: [
			{name: 'Description', field: 'description', title: "Description", type: 'WikiText'},
			{name: 'Option', field: 'option', title: "Option", type: 'String'},
			{name: 'Name', field: 'name', title: "Name", type: 'String'}
			],
		rowClasses: [
			{className: 'lowlight', field: 'lowlight'} 
			]}
};

//
// upload functions
//

if (!bidix.upload) bidix.upload = {};

if (!bidix.upload.messages) bidix.upload.messages = {
	//from saving
	invalidFileError: "The original file '%0' does not appear to be a valid TiddlyWiki",
	backupSaved: "Backup saved",
	backupFailed: "Failed to upload backup file",
	rssSaved: "RSS feed uploaded",
	rssFailed: "Failed to upload RSS feed file",
	emptySaved: "Empty template uploaded",
	emptyFailed: "Failed to upload empty template file",
	mainSaved: "Main TiddlyWiki file uploaded",
	mainFailed: "Failed to upload main TiddlyWiki file. Your changes have not been saved",
	//specific upload
	loadOriginalHttpPostError: "Can't get original file",
	aboutToSaveOnHttpPost: 'About to upload on %0 ...',
	storePhpNotFound: "The store script '%0' was not found."
};

bidix.upload.uploadChanges = function(onlyIfDirty,tiddlers,storeUrl,toFilename,uploadDir,backupDir,username,password)
{
	var callback = function(status,uploadParams,original,url,xhr) {
		if (!status) {
			displayMessage(bidix.upload.messages.loadOriginalHttpPostError);
			return;
		}
		if (bidix.debugMode) 
			alert(original.substr(0,500)+"\n...");
		// Locate the storeArea div's 
		var posDiv = locateStoreArea(original);
		if((posDiv[0] == -1) || (posDiv[1] == -1)) {
			alert(config.messages.invalidFileError.format([localPath]));
			return;
		}
		bidix.upload.uploadRss(uploadParams,original,posDiv);
	};
	
	if(onlyIfDirty && !store.isDirty())
		return;
	clearMessage();
	// save on localdisk ?
	if (document.location.toString().substr(0,4) == "file") {
		var path = document.location.toString();
		var localPath = getLocalPath(path);
		saveChanges();
	}
	// get original
	var uploadParams = new Array(storeUrl,toFilename,uploadDir,backupDir,username,password);
	var originalPath = document.location.toString();
	// If url is a directory : add index.html
	if (originalPath.charAt(originalPath.length-1) == "/")
		originalPath = originalPath + "index.html";
	var dest = config.macros.upload.destFile(storeUrl,toFilename,uploadDir);
	var log = new bidix.UploadLog();
	log.startUpload(storeUrl, dest, uploadDir,  backupDir);
	displayMessage(bidix.upload.messages.aboutToSaveOnHttpPost.format([dest]));
	if (bidix.debugMode) 
		alert("about to execute Http - GET on "+originalPath);
	var r = doHttp("GET",originalPath,null,null,username,password,callback,uploadParams,null);
	if (typeof r == "string")
		displayMessage(r);
	return r;
};

bidix.upload.uploadRss = function(uploadParams,original,posDiv) 
{
	var callback = function(status,params,responseText,url,xhr) {
		if(status) {
			var destfile = responseText.substring(responseText.indexOf("destfile:")+9,responseText.indexOf("\n", responseText.indexOf("destfile:")));
			displayMessage(bidix.upload.messages.rssSaved,bidix.dirname(url)+'/'+destfile);
			bidix.upload.uploadMain(params[0],params[1],params[2]);
		} else {
			displayMessage(bidix.upload.messages.rssFailed);			
		}
	};
	// do uploadRss
	if(config.options.chkGenerateAnRssFeed) {
		var rssPath = uploadParams[1].substr(0,uploadParams[1].lastIndexOf(".")) + ".xml";
		var rssUploadParams = new Array(uploadParams[0],rssPath,uploadParams[2],'',uploadParams[4],uploadParams[5]);
		var rssString = generateRss();
		// no UnicodeToUTF8 conversion needed when location is "file" !!!
		if (document.location.toString().substr(0,4) != "file")
			rssString = convertUnicodeToUTF8(rssString);	
		bidix.upload.httpUpload(rssUploadParams,rssString,callback,Array(uploadParams,original,posDiv));
	} else {
		bidix.upload.uploadMain(uploadParams,original,posDiv);
	}
};

bidix.upload.uploadMain = function(uploadParams,original,posDiv) 
{
	var callback = function(status,params,responseText,url,xhr) {
		var log = new bidix.UploadLog();
		if(status) {
			// if backupDir specified
			if ((params[3]) && (responseText.indexOf("backupfile:") > -1))  {
				var backupfile = responseText.substring(responseText.indexOf("backupfile:")+11,responseText.indexOf("\n", responseText.indexOf("backupfile:")));
				displayMessage(bidix.upload.messages.backupSaved,bidix.dirname(url)+'/'+backupfile);
			}
			var destfile = responseText.substring(responseText.indexOf("destfile:")+9,responseText.indexOf("\n", responseText.indexOf("destfile:")));
			displayMessage(bidix.upload.messages.mainSaved,bidix.dirname(url)+'/'+destfile);
			store.setDirty(false);
			log.endUpload("ok");
		} else {
			alert(bidix.upload.messages.mainFailed);
			displayMessage(bidix.upload.messages.mainFailed);
			log.endUpload("failed");			
		}
	};
	// do uploadMain
	var revised = bidix.upload.updateOriginal(original,posDiv);
	bidix.upload.httpUpload(uploadParams,revised,callback,uploadParams);
};

bidix.upload.httpUpload = function(uploadParams,data,callback,params)
{
	var localCallback = function(status,params,responseText,url,xhr) {
		url = (url.indexOf("nocache=") < 0 ? url : url.substring(0,url.indexOf("nocache=")-1));
		if (xhr.status == 404)
			alert(bidix.upload.messages.storePhpNotFound.format([url]));
		if ((bidix.debugMode) || (responseText.indexOf("Debug mode") >= 0 )) {
			alert(responseText);
			if (responseText.indexOf("Debug mode") >= 0 )
				responseText = responseText.substring(responseText.indexOf("\n\n")+2);
		} else if (responseText.charAt(0) != '0') 
			alert(responseText);
		if (responseText.charAt(0) != '0')
			status = null;
		callback(status,params,responseText,url,xhr);
	};
	// do httpUpload
	var boundary = "---------------------------"+"AaB03x";	
	var uploadFormName = "UploadPlugin";
	// compose headers data
	var sheader = "";
	sheader += "--" + boundary + "\r\nContent-disposition: form-data; name=\"";
	sheader += uploadFormName +"\"\r\n\r\n";
	sheader += "backupDir="+uploadParams[3] +
				";user=" + uploadParams[4] +
				";password=" + uploadParams[5] +
				";uploaddir=" + uploadParams[2];
	if (bidix.debugMode)
		sheader += ";debug=1";
	sheader += ";;\r\n"; 
	sheader += "\r\n" + "--" + boundary + "\r\n";
	sheader += "Content-disposition: form-data; name=\"userfile\"; filename=\""+uploadParams[1]+"\"\r\n";
	sheader += "Content-Type: text/html;charset=UTF-8" + "\r\n";
	sheader += "Content-Length: " + data.length + "\r\n\r\n";
	// compose trailer data
	var strailer = new String();
	strailer = "\r\n--" + boundary + "--\r\n";
	data = sheader + data + strailer;
	if (bidix.debugMode) alert("about to execute Http - POST on "+uploadParams[0]+"\n with \n"+data.substr(0,500)+ " ... ");
	var r = doHttp("POST",uploadParams[0],data,"multipart/form-data; ;charset=UTF-8; boundary="+boundary,uploadParams[4],uploadParams[5],localCallback,params,null);
	if (typeof r == "string")
		displayMessage(r);
	return r;
};

// same as Saving's updateOriginal but without convertUnicodeToUTF8 calls
bidix.upload.updateOriginal = function(original, posDiv)
{
	if (!posDiv)
		posDiv = locateStoreArea(original);
	if((posDiv[0] == -1) || (posDiv[1] == -1)) {
		alert(config.messages.invalidFileError.format([localPath]));
		return;
	}
	var revised = original.substr(0,posDiv[0] + startSaveArea.length) + "\n" +
				store.allTiddlersAsHtml() + "\n" +
				original.substr(posDiv[1]);
	var newSiteTitle = getPageTitle().htmlEncode();
	revised = revised.replaceChunk("<title"+">","</title"+">"," " + newSiteTitle + " ");
	revised = updateMarkupBlock(revised,"PRE-HEAD","MarkupPreHead");
	revised = updateMarkupBlock(revised,"POST-HEAD","MarkupPostHead");
	revised = updateMarkupBlock(revised,"PRE-BODY","MarkupPreBody");
	revised = updateMarkupBlock(revised,"POST-SCRIPT","MarkupPostBody");
	return revised;
};

//
// UploadLog
// 
// config.options.chkUploadLog :
//		false : no logging
//		true : logging
// config.options.txtUploadLogMaxLine :
//		-1 : no limit
//      0 :  no Log lines but UploadLog is still in place
//		n :  the last n lines are only kept
//		NaN : no limit (-1)

bidix.UploadLog = function() {
	if (!config.options.chkUploadLog) 
		return; // this.tiddler = null
	this.tiddler = store.getTiddler("UploadLog");
	if (!this.tiddler) {
		this.tiddler = new Tiddler();
		this.tiddler.title = "UploadLog";
		this.tiddler.text = "| !date | !user | !location | !storeUrl | !uploadDir | !toFilename | !backupdir | !origin |";
		this.tiddler.created = new Date();
		this.tiddler.modifier = config.options.txtUserName;
		this.tiddler.modified = new Date();
		store.addTiddler(this.tiddler);
	}
	return this;
};

bidix.UploadLog.prototype.addText = function(text) {
	if (!this.tiddler)
		return;
	// retrieve maxLine when we need it
	var maxLine = parseInt(config.options.txtUploadLogMaxLine,10);
	if (isNaN(maxLine))
		maxLine = -1;
	// add text
	if (maxLine != 0) 
		this.tiddler.text = this.tiddler.text + text;
	// Trunck to maxLine
	if (maxLine >= 0) {
		var textArray = this.tiddler.text.split('\n');
		if (textArray.length > maxLine + 1)
			textArray.splice(1,textArray.length-1-maxLine);
			this.tiddler.text = textArray.join('\n');		
	}
	// update tiddler fields
	this.tiddler.modifier = config.options.txtUserName;
	this.tiddler.modified = new Date();
	store.addTiddler(this.tiddler);
	// refresh and notifiy for immediate update
	story.refreshTiddler(this.tiddler.title);
	store.notify(this.tiddler.title, true);
};

bidix.UploadLog.prototype.startUpload = function(storeUrl, toFilename, uploadDir,  backupDir) {
	if (!this.tiddler)
		return;
	var now = new Date();
	var text = "\n| ";
	var filename = bidix.basename(document.location.toString());
	if (!filename) filename = '/';
	text += now.formatString("0DD/0MM/YYYY 0hh:0mm:0ss") +" | ";
	text += config.options.txtUserName + " | ";
	text += "[["+filename+"|"+location + "]] |";
	text += " [[" + bidix.basename(storeUrl) + "|" + storeUrl + "]] | ";
	text += uploadDir + " | ";
	text += "[[" + bidix.basename(toFilename) + " | " +toFilename + "]] | ";
	text += backupDir + " |";
	this.addText(text);
};

bidix.UploadLog.prototype.endUpload = function(status) {
	if (!this.tiddler)
		return;
	this.addText(" "+status+" |");
};

//
// Utilities
// 

bidix.checkPlugin = function(plugin, major, minor, revision) {
	var ext = version.extensions[plugin];
	if (!
		(ext  && 
			((ext.major > major) || 
			((ext.major == major) && (ext.minor > minor))  ||
			((ext.major == major) && (ext.minor == minor) && (ext.revision >= revision))))) {
			// write error in PluginManager
			if (pluginInfo)
				pluginInfo.log.push("Requires " + plugin + " " + major + "." + minor + "." + revision);
			eval(plugin); // generate an error : "Error: ReferenceError: xxxx is not defined"
	}
};

bidix.dirname = function(filePath) {
	if (!filePath) 
		return;
	var lastpos;
	if ((lastpos = filePath.lastIndexOf("/")) != -1) {
		return filePath.substring(0, lastpos);
	} else {
		return filePath.substring(0, filePath.lastIndexOf("\\"));
	}
};

bidix.basename = function(filePath) {
	if (!filePath) 
		return;
	var lastpos;
	if ((lastpos = filePath.lastIndexOf("#")) != -1) 
		filePath = filePath.substring(0, lastpos);
	if ((lastpos = filePath.lastIndexOf("/")) != -1) {
		return filePath.substring(lastpos + 1);
	} else
		return filePath.substring(filePath.lastIndexOf("\\")+1);
};

bidix.initOption = function(name,value) {
	if (!config.options[name])
		config.options[name] = value;
};

//
// Initializations
//

// require PasswordOptionPlugin 1.0.1 or better
bidix.checkPlugin("PasswordOptionPlugin", 1, 0, 1);

// styleSheet
setStylesheet('.txtUploadStoreUrl, .txtUploadBackupDir, .txtUploadDir {width: 22em;}',"uploadPluginStyles");

//optionsDesc
merge(config.optionsDesc,{
	txtUploadStoreUrl: "Url of the UploadService script (default: store.php)",
	txtUploadFilename: "Filename of the uploaded file (default: in index.html)",
	txtUploadDir: "Relative Directory where to store the file (default: . (downloadService directory))",
	txtUploadBackupDir: "Relative Directory where to backup the file. If empty no backup. (default: ''(empty))",
	txtUploadUserName: "Upload Username",
	pasUploadPassword: "Upload Password",
	chkUploadLog: "do Logging in UploadLog (default: true)",
	txtUploadLogMaxLine: "Maximum of lines in UploadLog (default: 10)"
});

// Options Initializations
bidix.initOption('txtUploadStoreUrl','');
bidix.initOption('txtUploadFilename','');
bidix.initOption('txtUploadDir','');
bidix.initOption('txtUploadBackupDir','');
bidix.initOption('txtUploadUserName','');
bidix.initOption('pasUploadPassword','');
bidix.initOption('chkUploadLog',true);
bidix.initOption('txtUploadLogMaxLine','10');


// Backstage
merge(config.tasks,{
	uploadOptions: {text: "upload", tooltip: "Change UploadOptions and Upload", content: '<<uploadOptions>>'}
});
config.backstageTasks.push("uploadOptions");


//}}}

!階段一:產生模擬數據
<<tabs "" [[產生伯努利數據]] "" [[產生伯努利數據]][[產生二項數據]] "" [[產生二項數據]][[計算二項機率]] "" [[計算二項機率]][[計算累加二項機率]] "" [[計算累加二項機率]][[課後練習題]] "" [[Using R to look at distributions (I)的課後練習題]]>>
!階段二:一張勝過千言萬語的圖
<<tabs "" [[一張伯努利分配的圖]] "" [[一張伯努利分配的圖]][[一張二項分配的圖]] "" [[一張二項分配的圖]][[一張累加二項分配的圖]] "" [[一張累加二項分配的圖]]>>

用R算出Table 1.1的所有數字。
----
+++[答案]===
<<tabs "" [[與多項分配(multinomial distribution)有關的兩項R函示]] "" [[與多項分配有關的兩項R函示]][[用圖形呈現多項分配]] "" [[用圖形呈現多項分配]]>>
{{{
dnorm(x, mean = 0, sd = 1)
pnorm(q, mean = 0, sd = 1)
qnorm(p, mean = 0, sd = 1)
rnorm(n, mean = 0, sd = 1)
}}}
----
上面這四個R函示可以幫助你計算
# 「d」代表 「density」,就是常態(機率)密度函數$f(\cdot)$。請參考[[常態分配的定義|常態分配的定義]]。
# 「p」代表 「cumulative probability」,就是累加常態(機率)密度函數$F(\cdot)$。請參考[[計算常態機率|計算常態機率]]。
# 「q」代表 「quantile」,就是逆累加常態(機率)密度函數$F^{-1}(\cdot)$。這就是你學過的[[逆查表|逆查表]]。
# 「r」代表 「random」。相信你已經熟悉這一個英文字,也能體會它在統計界的部份意義。繼續努力。
<<tabs "" [[請選擇]] "" [[]][[產生常態數據]] "" [[產生常態數據]][[計算常態機率]] "" [[用R計算常態機率]][[繪製常態分配]] "" [[繪製常態分配]]>>
!簡版
{{{
barplot(height, ...)
}}}
!細版
{{{
barplot(height, width = 1, space = NULL,
        names.arg = NULL, legend.text = NULL, beside = FALSE,
        horiz = FALSE, density = NULL, angle = 45,
        col = NULL, border = par("fg"),
        main = NULL, sub = NULL, xlab = NULL, ylab = NULL,
        xlim = NULL, ylim = NULL, xpd = TRUE, log = "",
        axes = TRUE, axisnames = TRUE,
        cex.axis = par("cex.axis"), cex.names = par("cex.axis"),
        inside = TRUE, plot = TRUE, axis.lty = 0, offset = 0,
        add = FALSE, args.legend = NULL, ...)
}}}
{{{
require(grDevices) # for colours
tN <- table(Ni <- stats::rpois(100, lambda=5))
r <- barplot(tN, col=rainbow(20))
#- type = "h" plotting *is* 'bar'plot
lines(r, tN, type='h', col='red', lwd=2)

barplot(tN, space = 1.5, axisnames=FALSE,
        sub = "barplot(..., space= 1.5, axisnames = FALSE)")

barplot(VADeaths, plot = FALSE)
barplot(VADeaths, plot = FALSE, beside = TRUE)

mp <- barplot(VADeaths) # default
tot <- colMeans(VADeaths)
text(mp, tot + 3, format(tot), xpd = TRUE, col = "blue")
barplot(VADeaths, beside = TRUE,
        col = c("lightblue", "mistyrose", "lightcyan",
                "lavender", "cornsilk"),
        legend = rownames(VADeaths), ylim = c(0, 100))
title(main = "Death Rates in Virginia", font.main = 4)

hh <- t(VADeaths)[, 5:1]
mybarcol <- "gray20"
mp <- barplot(hh, beside = TRUE,
        col = c("lightblue", "mistyrose",
                "lightcyan", "lavender"),
        legend = colnames(VADeaths), ylim= c(0,100),
        main = "Death Rates in Virginia", font.main = 4,
        sub = "Faked upper 2*sigma error bars", col.sub = mybarcol,
        cex.names = 1.5)
segments(mp, hh, mp, hh + 2*sqrt(1000*hh/100), col = mybarcol, lwd = 1.5)
stopifnot(dim(mp) == dim(hh))# corresponding matrices
mtext(side = 1, at = colMeans(mp), line = -2,
      text = paste("Mean", formatC(colMeans(hh))), col = "red")

# Bar shading example
barplot(VADeaths, angle = 15+10*1:5, density = 20, col = "black",
        legend = rownames(VADeaths))
title(main = list("Death Rates in Virginia", font = 4))

# border :
barplot(VADeaths, border = "dark blue") 

# log scales (not much sense here):
barplot(tN, col=heat.colors(12), log = "y")
barplot(tN, col=gray.colors(20), log = "xy")

# args.legend
barplot(height = cbind(x = c(465, 91) / 465 * 100,
                       y = c(840, 200) / 840 * 100,
                       z = c(37, 17) / 37 * 100),
        beside = FALSE,
        width = c(465, 840, 37),
        col = c(1, 2),
        legend.text = c("A", "B"),
        args.legend = list(x = "topleft"))
}}}
{{{
> test
     [,1] [,2]
[1,]    3    4
[2,]    5    2
> chisq.test(x=test[,1])

	Chi-squared test for given probabilities

data:  test[, 1] 
X-squared = 0.5, df = 1, p-value = 0.4795

Warning message:
In chisq.test(x = test[, 1]) : Chi-squared approximation may be incorrect
> chisq.test(x=test[,1], y=test[,2])

	Pearson's Chi-squared test with Yates' continuity correction

data:  test[, 1] and test[, 2] 
X-squared = 0, df = 1, p-value = 1

Warning message:
In chisq.test(x = test[, 1], y = test[, 2]) :
  Chi-squared approximation may be incorrect
> chisq.test(test)

	Pearson's Chi-squared test with Yates' continuity correction

data:  test 
X-squared = 0.2917, df = 1, p-value = 0.5892

Warning message:
In chisq.test(test) : Chi-squared approximation may be incorrect
> 
}}}
!來源
epi.clustersize {epiR}
!用途
{{{
Estimates the number of clusters to be sampled using a cluster-sample design
}}}
!用法
{{{
epi.clustersize(p, b, rho, epsilon, conf.level = 0.95)
}}}
!輸入
| p |the estimated prevalence of disease in the population. |
| b |the number of units to be sampled per cluster. |
| rho |the intra-cluster correlation, a measure of the variation between clusters compared with the variation within clusters. |
| epsilon |scalar, the acceptable absolute error. |
| conf.level |scalar, defining the level of confidence in the computed result. |
!例子
{{{
p = 0.10
b = 50
D = 7
rho = (D - 1) / (b - 1)
epi.clustersize(p = 0.10, b = 50, rho = rho, epsilon = 0.10, conf.level = 0.95)
}}}
!來源
{{{
epi.simplesize {epiR}
}}}
!目的
{{{
Sample size under under simple random sampling
}}}
!功能描述
Estimates the required sample size under under simple random sampling.
!用法
{{{
epi.simplesize(N = 1E+06, sd, epsilon, method = "mean", conf.level = 0.95)
}}}
!輸入
| 母體內包含多少單元的總數 | N |scalar, representing the population size. |
| 估計的標準差或是估計的母體比例 | sd |scalar, if method is total or mean this is the estimated standard deviation of the sampling variable. If method is proportion this is an estimate of the unknown population proportion. |
| 邊際可容忍誤差 | epsilon |the maximum absolute difference between our estimate and the unknown population value. |
| 目標參數(包括總和、平均、比例) | method |a character string indicating the method to be used. Options are total, mean, or proportion. |
| 信心水準 (0.90, 0.95, 0.99, 0.999等等) | conf.level |scalar, defining the level of confidence in the computed result. |
!輸出
{{{
Returns an integer defining the size of the sample is required.
}}}
!注意事項
If the calculated sample size is greater than 10% of the population, an adjusted sample size is returned.
!參考文獻
# Levy PS, Lemeshow S (1999). Sampling of Populations Methods and Applications. Wiley Series in Probability and Statistics, London, pp. 70 - 75.
# Scheaffer RL, Mendenhall W, Lyman Ott R (1996). Elementary Survey Sampling. Duxbury Press, New York, pp. 95.
!範例一
來自Sharon L. Lohr (1999) Sampling: Design and Analysis. Duxbury Press, New York, pp. 40.
{{{
> epi.simplesize(1251, 1/2, 0.03, "proportion", 0.95)
[1] 576
}}}
!範例二
{{{
## EXAMPLE 1
## We want to estimate the mean bodyweight of deer on a farm. There are 278
## animals present. We anticipate the standard deviation of body weight to be 
## around 30 kg. We would like to be 95% certain that our estimate is within 
## 10 kg of the true mean. How many deer should be sampled?

epi.simplesize(N = 278, sd = 30, epsilon = 10, method = "mean", 
   conf.level = 0.95)

## A sample of 31 deer are required.

## EXAMPLE 2
## We want to estimate the seroprevalence of Brucella abortus in a population 
## of cattle. An estimate of the unknown prevalence of B. abortus in this 
## population is 0.15. We would like to be 95% certain that our estimate is 
## within 20% of the true proportion of the population that is seropositive 
## to B. abortus. Calculate the required sample size.

## Convert relative error into absolute error:
sd <- 0.15
epsilon.r <- 0.20
epsilon <- epsilon.r * sd

epi.simplesize(N = 1E+06, sd = sd, epsilon = epsilon, method = "proportion", 
   conf.level = 0.95)

## A sample of 544 cattle are required.
}}}
!來源
epi.stratasize {epiR}
!用途
{{{
Sample size under stratified random sampling
}}}
!用法
{{{
epi.stratasize(strata.n, strata.mean, strata.var, epsilon, 
   method = "mean", conf.level = 0.95)
}}}
!輸入
| strata.n |vector, defining the size of each strata. |
| strata.mean |vector, representing the mean of each strata. |
| strata.var |vector, representing the variance of each strata. |
| epsilon |the maximum relative difference between our estimate and the unknown population value. |
| method |a character string indicating the method to be used. Options are mean, total, proportion, or pps. |
| conf.level |scalar, defining the level of confidence in the computed result. |
!例子
{{{
strata.n = c(600, 500, 400)
strata.mean = c(0.164, 0.166, 0.236)
strata.var = c(0.245, 0.296, 0.436)
epi.stratasize(strata.n, strata.mean, strata.var, epsilon = 0.20, method = "mean", conf.level = 0.95)
}}}
<html><div align="center"><iframe src ="http://www.math.union.edu/~dpvc/jsmath/" width="100%" align="center" height=400"></iframe></div></html>
{{{
pie(x, labels = names(x), edges = 200, radius = 0.8,
    clockwise = FALSE, init.angle = if(clockwise) 90 else 0,
    density = NULL, angle = 45, col = NULL, border = NULL,
    lty = NULL, main = NULL, ...)
}}}
{{{
require(grDevices)
pie(rep(1, 24), col = rainbow(24), radius = 0.9)

pie.sales <- c(0.12, 0.3, 0.26, 0.16, 0.04, 0.12)
names(pie.sales) <- c("Blueberry", "Cherry", "Apple", "Boston Cream", "Other", "Vanilla Cream")
pie(pie.sales) # default colours
pie(pie.sales, col = c("purple", "violetred1", "green3", "cornsilk", "cyan", "white"))
pie(pie.sales, col = gray(seq(0.4,1.0,length=6)))
pie(pie.sales, density = 10, angle = 15 + 10 * 1:6)
pie(pie.sales, clockwise=TRUE, main="pie(*, clockwise=TRUE)")
segments(0,0, 0,1, col= "red", lwd = 2)
text(0,1, "init.angle = 90", col= "red")

n <- 200
pie(rep(1,n), labels="", col=rainbow(n), border=NA, main = "pie(*, labels=\"\", col=rainbow(n), border=NA,..")
}}}
{{{
一項不利虛無假設的機率。
}}}
!$p$值的決策法則
>如果$p$值小於$\alpha$,研究者就會拒絕[[虛無假設]]。
* $p$值越小越不利[[虛無假設]],因為「$p$值是看到比現在[[檢定統計量]](觀察值)更極端(往不利虛無假設的方向走,也就是往研究假設的方向走)的機率」。
* 雖說「$p$值越小越不利[[虛無假設]]」,但是「$p$值要多小,我們才有信心拒絕[[虛無假設]]?」
* 如果$p$值小於
** $0.10$,我們有一些$H_0$錯誤的證據。
** $0.05$,我們有$H_0$錯誤強烈的證據。
** $0.01$,我們有$H_0$錯誤非常強烈的證據。
** $0.001$,我們有$H_0$錯誤極端強烈的證據。
* 以上這四個數字就是我們常用的$\alpha$。

當$p$值比$\alpha$小的時候,我們可能會有兩種想法:
# @@color:red;「認為$H_0$是對的」,只是我們幸運地看到「$H_0$下極端的現象」。@@這時候,你冒著「『犯[[型II錯誤]]的風險』,不拒絕虛無假設$H_0$」。
# @@color:blue;「認為$H_1$是對的」,有信心地「冒著『犯[[型I錯誤]]的風險』,拒絕虛無假設$H_0$」。@@
「科學思維」建議你,「認為$H_1$是對的,有信心地冒著『犯[[型I錯誤]]的風險』,拒絕虛無假設$H_0$」。
!!說明
上面這四段話,
* $0.10$,我們有一些$H_0$錯誤的證據。
* $0.05$,我們有$H_0$錯誤強烈的證據。
* $0.01$,我們有$H_0$錯誤非常強烈的證據。
* $0.001$,我們有$H_0$錯誤極端強烈的證據。
告訴你一般人或是說大部分的人們「同意」的看法。先不談「$\alpha$」,這四段文字指導你,根據世俗的標準看待$p$值的結果。然後轉化為拒絕虛無假設的信心。所以,$p$值愈小,你「應該(世俗的標準之下,也就是用一種『客觀的標準』評斷之)」愈有信心拒絕虛無假設。照說,用$p$值的方式決定「拒絕」還是「不拒絕」虛無假設,是不需要先說好所謂的「$\alpha$」,研究者會直接看$p$值的大小,決定「拒絕」還是「不拒絕」虛無假設。當然大部分的時候,研究者會在報告裡清楚記載$p$值,以昭公信。
!來源
{{{
sample {base}
}}}
!目的
{{{
Random Samples and Permutations
}}}
!功能描述
sample takes a sample of the specified size from the elements of x using either with or without replacement.
!用法
{{{
sample(x, size, replace = FALSE, prob = NULL)
}}}
!輸入
| 母體 | x |Either a (numeric, complex, character or logical) vector of more than one element from which to choose, or a positive integer. |
| 樣本數 | size |positive integer giving the number of items to choose. |
| 是否取後放回 | replace |Should sampling be with replacement? |
| 某單元被抽到的機率 | prob |A vector of probability weights for obtaining the elements of the vector being sampled. |
!範例
# 【從一串數字隨機挑選幾個數字?】
# 【從一個大表格隨機挑選幾個觀察值?】
解釋@@相似@@之真諦:
{{{
母體真的有樣本出現的現象?
}}}
!我如何得到以下這一些問題的答案:
# 如果我們班每一個人都是19歲,那麼統計系的每一個人也都是19歲?
# 我的學長19歲?+++[學生的答案]用問的?看基本資料?===

# 吳老師的年齡?+++[學生的答案]47,43,50,49,45,48,46,53,30===

# 統二甲有58人,全統計系有多少人的(有根據的猜測)估計?
## 每一個人根據58這一個數字猜測統計系有多少人?(寫在筆記裡,每一個數字都要有理由?)
## 每一個人上台來把剛剛猜測的數字利用scan()輸入R。+++[過程]
@@過程中出現過兩次錯誤,老師利用其他名字的變數暫存錯誤前已經輸入的數字,並且利用c(=combine)把新舊數據接合起來。@@
===

## 計算所有人答案的平均?(開始使用計算機)
## 計算所有人答案的標準差?
## 這一堆數字是母體還是樣本???+++[真相]
{{{
> stats
 [1] 450 464 488 464 460 464 486 468 464 509 500 464 476 470 464 464
[17] 464 400 500 480 490 472 478 464 464 464 461 464 480 520 464 480
[33] 480 464 464 464 480 464 470 452 452 480 440 464 464 458 476 464
[49] 480 440 464 480 480 456 472 460 466 480 464 474 512 464 400 446
[65] 448 464 480 464 440 416 479 472 464 480 484 499
}}}
===

## 利用亂數表挑到9個數字。
## 計算這9個數字的平均?
## 計算這9個數字的標準差?(要會使用計算機內提供標準差的功能!)
## 自己挑5個數字,並且計算它們的平均以及標準差?
## 除了平均與標準差,你還想知道什麼?+++[學生的答案]sum, range, 眾數, 中位數, var, c(min, $Q_1$, median, mean, $Q_3$, max)===

## 跟這一件事有關的R過程。+++[R]
{{{
stats = scan()
stats
stat=stats
stats = scan()
464
480
464
480
480
464
464
stat=c(stat, stats)
stats = scan()
length(stats)
stat
length(stat)
stats = c(stat, stats).
stats = c(stat, stats)
length(stats)
table(stats)
hist(stats)
mean(stats)
var(stats)
sd(stats)
max(stats)
min(stats)
range(stats)
stats
stats
stats[c(10,48,01,50,11,53,60,20,64)]
mean(stats[c(10,48,01,50,11,53,60,20,64)])
sd(stats[c(10,48,01,50,11,53,60,20,64)])
stats[c(12,65,22,59,57)]
mean(stats[c(12,65,22,59,57)])
sd(stats[c(12,65,22,59,57)])
stats[c(56,61,47,76,71)]
mean(stats[c(56,61,47,76,71)])
sd(stats[c(56,61,47,76,71)])
sort(stats[c(56,61,47,76,71)])
stats[sort(c(56,61,47,76,71))]
stats[c(1,2)]
stats[c(2,1)]
sample(1:76, 9, replace=FALSE)
sample(1:76, 9, replace=FALSE)
set.seed(123)
sample(1:76, 9, replace=FALSE)
set.seed(123)
sample(1:76, 9, replace=FALSE)
set.seed(0)
sample(1:76, 9, replace=FALSE)
set.seed(0)
sample(1:76, 9, replace=FALSE)
sample(1:76, 5, replace=FALSE)
secondFirst = sample(1:76, 5, replace=FALSE)
secondFirst
stats[secondFirst]
mean(stats[secondFirst])
sd(stats[secondFirst])
sum(stats[secondFirst])
range(stats[secondFirst])
median(stats[secondFirst])
mode(stats[secondFirst])
var(stats[secondFirst])
fivenumber(stats[secondFirst])
summary(stats[secondFirst])
}}}
===
<html><div align="center"><iframe src ="http://www.cyclismo.org/tutorial/R/" width="100%" align="center" height=400"></iframe></div></html>
{{{
x = 0:50
plot(x, dbinom(x, size = 50, prob = 0.20), type='h')
}}}
Type the text for 'New Tiddler'
!!請修改以下的命令,讓你得到一張累加二項分配的圖。
{{{
x = 0:50
plot(x, dbinom(x, size = 50, prob = 0.20), type='h')
}}}
機統!機統!機率與統計!統計統計,統統忘記!「統」字出現7次,幾次發一聲、幾次發二聲、幾次發三聲?答對者,免費進場;答錯者,磕三聲響頭,享五折優待,一樣可以進場聆聽榮彬爸爸講故事給你聽。故事包括「[[2008大學生閱讀行為調查]]」、「[[數據]]」、「[[估計與中央極限定理]]」、「[[假設檢定]]」、「[[抽樣設計]]」、「[[卡方檢定]]」等精彩內容。
----
+++[答案]@@color:blue;乩童!乩童!機率與統計!統計統計,通通忘記!@@===
如果//p//[[值|p值]]大於或是等於&alpha;,我們就不拒絕虛無假設。
一般初等統計學談論的中央極限定理,指的是樣本平均的中央極限定理。因為樣本比例本質上也是一種樣本平均,所以初等統計學的中央極限定理涵蓋兩項最基本的估計式,一項是一般連續數據的樣本平均,一項是二項數據(它們是一種離散數據)的樣本比例。只要樣本數$n$滿足一般人接受的大樣本條件:
# (連續數據)$n \ge 30$
# (離散數據)$n \hat p > 5 (10), n(1 - \hat p) > 5 (10)$
換言之,當我們援用中央極限定理回答問題的時候,記得大樣本條件必須被滿足。如果大樣本條件無法被滿足,我們就得尋求其他方式回答問題。
----
+++[中央極限定理的原型]
一組來自有限平均與有限變異數之母體的隨機樣本,令母體的$E(y) < \infty, V(y) < \infty$。只要樣本數$n$夠大,這一組隨機樣本的平均,它的抽樣分配(也就是它的機率分配)會//接近//以下這一種常態分配
$$
N(E(\bar y), V(\bar y))
$$
===

+++[定理一]
一組來自有限平均與有限變異數之母體的隨機樣本,令母體的$E(y) < \infty, V(y) < \infty$。只要樣本數$n$夠大,這一組隨機樣本的平均,它的抽樣分配(也就是它的機率分配)會//接近//以下這一種常態分配
$$
N(E(y), \frac{V(y)}{n})
$$
===

+++[定理二]
如果隨機樣本來自某一種連續變數,只要該變數的平均($\mu$)跟變異數($\sigma^2$)都是有限的,加上樣本數超過$30$,則這一組隨機樣本的平均,它的抽樣分配(也就是它的機率分配)會//接近//以下這一種常態分配
$$
N(\mu, \frac{\sigma^2}{n})
$$
===

+++[定理三]
如果隨機樣本來自某一種伯努利變數$BER(p)$,加上樣本數滿足$np > 5, n(1 - p) > 5$,則這一組隨機樣本的平均,也就是樣本比例的抽樣分配(也就是它的機率分配)會//接近//以下這一種常態分配
$$
N(p, \frac{p(1 - p)}{n})
$$
===

+++[定理四]
{{{
猜一下二項變數之隨機樣本的中央極限定理!
}}}
【解題過程】
>+++[步驟一]我們的[[隨機樣本]]來自哪裡?用符號表示之?===

>+++[步驟二]分辨[[樣本數]]與[[試驗次數]]?符號呢?===

>+++[步驟三]運用中央極限定理的原型,所以我們需要知道$E(\bar y)$跟$V(\bar y)$。===

>+++[步驟四]大樣本的條件?===

>+++[步驟五]寫下你的定理?===

===
<html><div align="center"><iframe src ="http://www.biosino.org/pages/newhtm/r/tchtml/index.html#Top" width="100%" align="center" height=400"></iframe></div></html>
{{{
testdiffprop=function(n11,n12,n21,n22,NULLvalue)
{
 n1=n11+n12
 n2=n21+n22
 p1hat=n11/n1
 p2hat=n21/n2
 z.diffprop=((p1hat-p2hat)-NULLvalue)/sqrt(p1hat*(1-p1hat)/n1 + p2hat*(1-p2hat)/n2)

 P.value=ifelse(p1hat>p2hat,2*(1-pnorm(z.diffprop)),2*pnrom(z.diffprop))
 Ifreject=ifelse(P.value<0.05,TRUE,FALSE)
}
>
> testdiffprop(189,10845,104,10933,0)
> print(testdiffprop(189,10845,104,10933,0))
[1] TRUE
}}}
weight = scan()
weight
mean(weight)
var(weight)
sd(weight)
range(weight)
max(weight)
weight[1]
weight[5]
weight[7]
table26 = data.frame(0)
table26
table26 = data.frame()
table26
table26 = edit(table26)
table26 = edit(table26)
table26[1,]
{{{
stats = scan()
472
464
480
stats
stats = c(stats, 472,464,480)
stats
table(stats)
mean(stats)
var(stats)
sd(stats)
median(stats)
max(stats)
min(stats)
box
boxplot
boxplot(stats)
stats
boxplot(stats[-45])
table(stats)
hist(stats)
hist(stats[-45])
par(mfrow=c(2,2))
boxplot(stats)
boxplot(stats[-45])
hist(stats)
hist(stats[-45])
stats
sample(stats, 9)
sample(stats, 10)
length(stats)
sample(1:58, 9)
sample(1:60, 9)
sample(1:60, 9)
sample(1:60, 9)
sample(1:60, 9)
set.seed(123)
sample(1:60, 9)
set.seed(123)
sample(1:60, 9)
set.seed(1234)
sample(1:60, 9)
1:60
1:10
sample(stats, 9)
sample(1:2, 10)
sample(1:2, 10, replace=T)
sample(1:2, 10, replace=F)
help(sample)
sample(1:2, 1)
sample(1:2, 1)
sample(1:2, 1)
sample(size=1,1:2)
sample(size=2,1:2)
sample(size=3,1:2)
sample(replace=T,size=3,1:2)
sample(1:2, 1, TRUE)
sample(1:2, 3, F)
sample(1:2, 3, T)
set.seed(123)
sample(1:2, 3, T)
set.seed(123)
sample(1:2, size=3, T)
stats
stats[c(37,57,03,56,06,12,19,17,46)]
mean(stats[c(37,57,03,56,06,12,19,17,46)])
var(stats[c(37,57,03,56,06,12,19,17,46)])
sd(stats[c(37,57,03,56,06,12,19,17,46)])
hist(stats[c(37,57,03,56,06,12,19,17,46)])
hist(stats[c(37,57,03,56,06,12,19,17,46)])
hist(stats)
hist(stats[-45])
new.device()
par(mfrow=c(2,2))
hist(stats[-45])
par(mfrow=c(2,2))
hist(stats[-45])
hist(stats[c(37,57,03,56,06,12,19,17,46)])
hist(stats[sample(1:58,9)])
hist(stats[sample(1:58,9)])
hist(stats[-45])
hist(stats[sample(1:58,9)])
hist(stats[sample(1:58,9)])
hist(stats[sample(1:58,9)])
stats
mode(stats)
range(stats)
min(stats)
max(stats)
}}}
最簡單的數據叫做「伯努利數據」。它們來自一種名目尺度,我們看得到的觀察值不是「成功」就是「失敗」。如果用$y$代表某一種「伯努利變數(一種會產生伯努利數據的變數)」,並且用「1」表示所謂的「成功」、用「0」表示所謂的「失敗」,那麼$y$可能等於1,也可能等於0。習慣上用數字$p$表示$y$等於1的可能性。也就是說
$$
Pr(y = 1) = p,
$$
其中$Pr$代表機率(Probability)的縮寫。

習慣上,觀察一次伯努利變數,也會被說成「作一次伯努利試驗」。
----
【課堂練習】
>【Q1】代表「成功」的「1」跟「1隻母老虎」的「1」一樣?還是不一樣?
>【Q2】用$p$表示$y$等於0的可能性?
>【Q3】在你的經驗裡,找到幾個伯努利變數的例子?
>【複習題一】伯努利隨機變數$y$的期望值等於多少?
>【複習題二】伯努利隨機變數$y$的變異數等於多少?
>【複習題三】伯努利隨機變數$y$的標準差等於多少?
----
有了上述課堂練習的經驗之後,我們可以用以下的表格表示隨機變數$y$的+++[機率分配。]
| $y$ | 1 | 0 |
| $Pr(y)$ | $p$ | $1 - p$ |
===
這個表格的正式名稱叫做「伯努利機率分配」。
----
接下來,我們即將進入「不只一個伯努利變數(也就是一連串的伯努利變數)」的世界。假設有$n$個$y$,記作
$$
y_1, y_2, \dots, y_n
$$
並且進一步假設它們都是來自上述的伯努利機率分配,而且彼此之間互不影響(比如說,$y_1 = 1$不會影響其他任何一個$y$的觀察值會是1還是0)。在這個世界裡,我們可能看到數據
$$
0001, 10111, 001010, \cdots
$$
----
【課堂練習】
>【Q4】在你的經驗裡,找到兩個「一連串伯努利變數」的例子?
>【Q5】假如$n = 2$,我們可能會看到哪一些觀察值?
>【Q6】假如$n = 3$,我們可能會看到哪一些觀察值?
>【Q7】假如$n = 4$,我們可能會看到哪一些觀察值?
>>【提示】有一種叫做「樹狀圖」的工具可以幫你快速得到答案。
----
【課後練習題】
>【第一題】假如$n = 5$,我們可能會看到哪一些觀察值?
>>【提示】有一種叫做「直交表」的工具可以幫你快速得到答案。
----
如果$p = 0.20, n = 2$,請問數據$00$被你觀察到的機率是多少?++++[答案]
$$
(1 - 0.20) \times (1 - 0.20) = ?
$$
===

>【複習題四】你觀察到數據$10$的機率是多少?+++[答案]
$$
0.20 \times (1 - 0.20) = ?
$$
===

>【複習題五】你觀察到數據$01$的機率是多少?+++[答案]
$$
(1 - 0.20) \times 0.20 = ?
$$
===

>【複習題六】你觀察到數據$11$的機率是多少?+++[答案]
$$
0.20 \times 0.20 = ?
$$
===

今天假如$n$變大(數字$n$本質上代表幾個「獨立同分配的伯努利隨機變數」,也代表所謂伯努利試驗的次數),我們有可能看到
$$
101010000010000010000000100000001111000000110000001000
$$
【動動腦】
>你覺得統計學家如何解析上述那一長串的0跟1?
>>【提示一】想像「1」代表「保險業務員成功地拉到一張保單」、
>>【提示二】用「0」表示「保險業務員未能成功地拉到一張保單」。
現在定義所謂的「二項隨機變數$y$(符號的意義已經改變了!)」
$$
y = y_1 + y_2 + \cdots + y_n
$$
所以本質上隨機變數$y$的意義是什麼?+++[答案]
{{{

}}}
===
經由觀察二項隨機變數得到的數據,它們被叫做「二項數據」。
----
接著下來,我們必須發現二項隨機變數$y$的機率分配。現在假設$n = 4$、$p$未知,請完成下表:
| $\sum_{i=1}^4 y_i$ | +++[數字]0=== | +++[數字]1=== | +++[數字]2=== | +++[數字]3=== | +++[數字]4=== |
| $Pr(\sum_{i=1}^4 y_i)$ | +++[答案]$(1 - p)^4$=== | +++[答案]$4p(1 - p)^3$=== | +++[答案]$6p^2(1 - p)^2$=== | +++[答案]$4p^3(1 - p)$=== | +++[答案]$p^4$=== |
【提示】
>【一】有多少個數據會得到成功次數(一種總和的概念)等於0,把那些情況的機率加起來就是$Pr(y = 0)$的答案。
>【二】有多少個數據會得到成功次數(一種總和的概念)等於1,把那些情況的機率加起來就是$Pr(y = 1)$的答案。
>【三】有多少個數據會得到成功次數(一種總和的概念)等於2,把那些情況的機率加起來就是$Pr(y = 2)$的答案。
>【四】有多少個數據會得到成功次數(一種總和的概念)等於3,把那些情況的機率加起來就是$Pr(y = 3)$的答案。
>【五】有多少個數據會得到成功次數(一種總和的概念)等於4,把那些情況的機率加起來就是$Pr(y = 4)$的答案。
上述的這一個表格,官話叫做「二項分配」。記作$Binom(n=4, p)$。
----
對於一般的試驗次數$n$跟任何介於0跟1之間的數字$p$,二項分配用以下的函數型式表達
$$
Pr(y) = \frac{n!}{y!(n - y)!} p^y (1 - p)^{n - y}, y = 0, 1, 2, \cdots, n,
$$
記得其中符號$y = \sum_{i=1}^4 y_i$,已經不再是一開始的伯努利隨機變數了。$Pr(y)$叫做二項公式。
>【複習題七】隨機變數$y$的期望值等於多少?
>【複習題八】隨機變數$y$的變異數等於多少?
>【複習題九】隨機變數$y$的標準差等於多少?
----
!累加二項分配
$$
F(y) = \sum_{x = 0}^y Pr(x)
$$
----
<<tabs "" [[二項分配]] "" [[二項分配檔案夾版本]][[累加二項分配]] "" [[累加二項分配]]>>
接下來,我們即將進入「不只一個伯努利變數(也就是一連串的伯努利變數)」的世界。假設有$n$個$y$,記作
$$
y_1, y_2, \dots, y_n
$$
並且進一步假設它們都是來自上述的伯努利機率分配,而且彼此之間互不影響(比如說,$y_1 = 1$不會影響其他任何一個$y$的觀察值會是1還是0)。在這個世界裡,我們可能看到數據
$$
0001, 10111, 001010, \cdots
$$
----
【課堂練習】
>【Q4】在你的經驗裡,找到兩個「一連串伯努利變數」的例子?
>【Q5】假如$n = 2$,我們可能會看到哪一些觀察值?
>【Q6】假如$n = 3$,我們可能會看到哪一些觀察值?
>【Q7】假如$n = 4$,我們可能會看到哪一些觀察值?
>>【提示】有一種叫做「樹狀圖」的工具可以幫你快速得到答案。
----
【課後練習題】
>【第一題】假如$n = 5$,我們可能會看到哪一些觀察值?
>>【提示】有一種叫做「直交表」的工具可以幫你快速得到答案。
----
如果$p = 0.20, n = 2$,請問數據$00$被你觀察到的機率是多少?++++[答案]
$$
(1 - 0.20) \times (1 - 0.20) = ?
$$
===

>【複習題四】你觀察到數據$10$的機率是多少?+++[答案]
$$
0.20 \times (1 - 0.20) = ?
$$
===

>【複習題五】你觀察到數據$01$的機率是多少?+++[答案]
$$
(1 - 0.20) \times 0.20 = ?
$$
===

>【複習題六】你觀察到數據$11$的機率是多少?+++[答案]
$$
0.20 \times 0.20 = ?
$$
===

今天假如$n$變大(數字$n$本質上代表幾個「獨立同分配的伯努利隨機變數」,也代表所謂伯努利試驗的次數),我們有可能看到
$$
101010000010000010000000100000001111000000110000001000
$$
【動動腦】
>你覺得統計學家如何解析上述那一長串的0跟1?
>>【提示一】想像「1」代表「保險業務員成功地拉到一張保單」、
>>【提示二】用「0」表示「保險業務員未能成功地拉到一張保單」。
現在定義所謂的「二項隨機變數$y$(符號的意義已經改變了!)」
$$
y = y_1 + y_2 + \cdots + y_n
$$
所以本質上隨機變數$y$的意義是什麼?+++[答案]
{{{

}}}
===
經由觀察二項隨機變數得到的數據,它們被叫做「二項數據」。
----
接著下來,我們必須發現二項隨機變數$y$的機率分配。現在假設$n = 4$、$p$未知,請完成下表:
| $\sum_{i=1}^4 y_i$ | +++[數字]0=== | +++[數字]1=== | +++[數字]2=== | +++[數字]3=== | +++[數字]4=== |
| $Pr(\sum_{i=1}^4 y_i)$ | +++[答案]$(1 - p)^4$=== | +++[答案]$4p(1 - p)^3$=== | +++[答案]$6p^2(1 - p)^2$=== | +++[答案]$4p^3(1 - p)$=== | +++[答案]$p^4$=== |
【提示】
>【一】有多少個數據會得到成功次數(一種總和的概念)等於0,把那些情況的機率加起來就是$Pr(y = 0)$的答案。
>【二】有多少個數據會得到成功次數(一種總和的概念)等於1,把那些情況的機率加起來就是$Pr(y = 1)$的答案。
>【三】有多少個數據會得到成功次數(一種總和的概念)等於2,把那些情況的機率加起來就是$Pr(y = 2)$的答案。
>【四】有多少個數據會得到成功次數(一種總和的概念)等於3,把那些情況的機率加起來就是$Pr(y = 3)$的答案。
>【五】有多少個數據會得到成功次數(一種總和的概念)等於4,把那些情況的機率加起來就是$Pr(y = 4)$的答案。
上述的這一個表格,官話叫做「二項分配」。記作$Binom(n=4, p)$。
----
對於一般的試驗次數$n$跟任何介於0跟1之間的數字$p$,二項分配用以下的函數型式表達
$$
Pr(y) = \frac{n!}{y!(n - y)!} p^y (1 - p)^{n - y}, y = 0, 1, 2, \cdots, n,
$$
記得其中符號$y = \sum_{i=1}^4 y_i$,已經不再是一開始的伯努利隨機變數了。$Pr(y)$叫做二項公式。
>【複習題七】隨機變數$y$的期望值等於多少?
>【複習題八】隨機變數$y$的變異數等於多少?
>【複習題九】隨機變數$y$的標準差等於多少?
----
現在假設$n = 4$、$p$未知,請完成下表:
| $\sum_{i=1}^4 y_i$ | +++[數字]0=== | +++[數字]1=== | +++[數字]2=== | +++[數字]3=== | +++[數字]4=== |
| $Pr(\sum_{i=1}^4 y_i)$ | +++[答案]$(1 - p)^4$=== | +++[答案]$4p(1 - p)^3$=== | +++[答案]$6p^2(1 - p)^2$=== | +++[答案]$4p^3(1 - p)$=== | +++[答案]$p^4$=== |
【提示】
>【一】有多少個數據會得到成功次數(一種總和的概念)等於0,把那些情況的機率加起來就是$Pr(y = 0)$的答案。
$$
Pr(y = 0) = Pr(0000) = (1 - p)^4
$$
>【二】有多少個數據會得到成功次數(一種總和的概念)等於1,把那些情況的機率加起來就是$Pr(y = 1)$的答案。
$$
\begin{eqnarray}
Pr(y = 1) & = & Pr(1000) + Pr(0100) + Pr(0010) + Pr(0001) \\
 & = & p \times (1 - p)^3 + p \times (1 - p)^3 + p \times (1 - p)^3 + p \times (1 - p)^3 \\
 & = & 4 p \times (1 - p)^3 \\
\end{eqnarray}
$$
>【三】有多少個數據會得到成功次數(一種總和的概念)等於2,把那些情況的機率加起來就是$Pr(y = 2)$的答案。
{{{
自行作答
}}}
>【四】有多少個數據會得到成功次數(一種總和的概念)等於3,把那些情況的機率加起來就是$Pr(y = 3)$的答案。
{{{
自行作答
}}}
>【五】有多少個數據會得到成功次數(一種總和的概念)等於4,把那些情況的機率加起來就是$Pr(y = 4)$的答案。
{{{
自行作答
}}}
<<tabs "" [[二項比例的大樣本信賴區間]] "" [[二項比例的大樣本信賴區間]][[二項比例大樣本信賴區間的缺點]] "" [[論述二項比例大樣本信賴區間的缺點]]>>
<<tabs "" [[挑一個]] "" [[]][[瓦得檢定]] "" [[利用瓦得檢定統計量反轉信賴區間]][[分數檢定]] "" [[利用分數檢定統計量反轉信賴區間]][[概似比檢定]] "" [[利用概似比檢定統計量反轉信賴區間]][[綜合討論]] "" [[綜合討論二項比例的假設檢定]]>>
<<tabs "" [[挑一個]] "" [[]][[瓦得檢定]] "" [[瓦得檢定]][[概似比檢定]] "" [[概似比檢定]][[分數檢定]] "" [[分數檢定]][[綜合討論]] "" [[綜合討論二項比例的假設檢定]]>>
!!!定理:$\hat p \hat q/(n - 1)$是$pq/n$的不偏估計。
!!!大樣本...

<html><font size="3" color="#00f">也就是說,「樣本數」乘以「樣本比例」以及「樣本數」乘以「1.0減去樣本比例」都至少是5,或者是10。</font></html>

既然是「大樣本」,我們就可以根據[[中央極限定理]]得到[[樣本比例]]的抽樣分配:
{{{

}}}
+++[答案]
$$
\hat p \sim \mbox{N}(p, pq/\sqrt{n})
$$
===
----
我們可以利用以下幾種途徑得到「母體比例的大樣本信賴區間」:
* 途徑一:循我們推導「母體平均的大樣本信賴區間」的過程,
* 途徑二:觀察「母體平均的大樣本信賴區間」的構成要件:
<<tabs "" [[途徑一]] "" [[得到母體比例大樣本信賴區間的途徑一]][[途徑二]] "" [[得到母體比例大樣本信賴區間的途徑二]]>>
!步驟如下:
# +++[步驟一:根據問題寫下研究假設;]
[img[http://www.stat.wmich.edu/s216/htests/Curves/p2a.gif]]
!!!關於「母體比例(成功機率)」的假設
* 單尾(研究)假設
** 右尾(研究)假設:$H_1: p > p_0$
** 左尾(研究)假設:$H_1: p < p_0$
* 雙尾(研究)假設:$H_1: p \ne p_0$
其中
* 「$p$」是母體比例,也就是二項分配的成功機率。
*「$H_1$」叫做「研究假設」或是「對立假設」(@@是一種主張,只有說服人的樣本證據支持它是正確的,我們才會接受它。@@)「H」是「Hypothesis」的縮寫。
** 叫「研究假設」的原因是,「研究目標」擺在「:」之後。
** 叫「對立假設」的原因是,與「虛無假設(@@通常它是一種「描述現狀」的陳述。除非有說服人的證據支持對立假設是正確的,否則我們不會拒絕它。@@)」是「對立」的,「完全相反的」。
*** 所以,「對立假設」的下標用「1」;而「虛無假設」的下標用「0」。
*** 一般而言,我們先寫「研究假設」再寫「虛無假設」。
*** 所以,對應上述研究假設的@@虛無假設@@如下:
**** $H_0: p \le p_0$
**** $H_0: p \ge p_0$
**** $H_0: p \ne p_0$
*「$p_0$」叫做「虛無值」。
* 「單尾」意味著最後檢定的結果不是
** 右尾假設:「拒絕左邊(的虛無假設)」就是「不拒絕左邊(的虛無假設),也就是說,接受右邊(的研究假設)」。
** 左尾假設:「拒絕右邊(的虛無假設)」就是「不拒絕右邊(的虛無假設),也就是說,接受左邊(的研究假設)」。
* 「雙尾」意味著最後檢定的結果不是
** 雙尾假設:「拒絕等號(的虛無假設)」就是「不拒絕等號(的虛無假設),也就是說,接受左右兩邊(的研究假設)」。
----
===

# +++[步驟二:根據抽樣計畫收集數據;]===

# +++[步驟三:使用數據計算檢定統計量;]
$$
\frac{\hat p - p}{\sqrt{p(1 - p)/n}}
$$
選擇它當作檢定二項比例的大樣本檢定統計量的原因是,根據[[中央極限定理]]樣本比例(二項比例的最大概似估計)的大樣本[[抽樣分配]]如下
$$
\hat p \approx N(p, p(1 - p)/n)
$$
換言之
$$
\frac{\hat p - p}{\sqrt{p(1 - p)/n}} \approx Z
$$
===

# +++[步驟四:在虛無假設成立的條件下得知檢定統計量的抽樣分配,並且根據該機率分配計算檢定統計量的證據力,$p$值;]
計算$p$[[值|p值]]之前,請確定幾件事
# 虛無假設(的等號)成立的條件下得知檢定統計量的抽樣分配,現在++++[是]
$$
\frac{\hat p - p}{\sqrt{p(1 - p)/n}}|H_0 = \frac{\hat p - p_0}{\sqrt{p_0(1 - p_0)/n}} \approx Z
$$
===

# 檢定的方向,也就是研究假設的方向,是左尾、右尾、還是雙尾?
# 不利虛無假設的方向,也就是檢定的方向,是左尾、右尾、還是雙尾?
根據上述的答案,我們可以定義各種方向之假設檢定的$p$[[值|p值]]
## +++[左尾]$p\mbox{值} = Pr(Z \le \frac{\hat p - p_0}{\sqrt{p_0(1 - p_0)/n}})$===

## +++[右尾]$p\mbox{值} = Pr(Z \ge \frac{\hat p - p_0}{\sqrt{p_0(1 - p_0)/n}})$===

## +++[雙尾]$p\mbox{值} = 2 \times Pr(Z \ge |\frac{\hat p - p_0}{\sqrt{p_0(1 - p_0)/n}}|)$===

===

# +++[步驟五:根據$p$值與$\alpha$的大小關係,決定「拒絕」或是「不拒絕」虛無假設;]
* 如果$p$值小於$\alpha$,「拒絕虛無假設」,認為研究假設是對的。
* 如果$p$值大於$\alpha$,「不拒絕虛無假設」,認為虛無假設是對的。
----
詳細內容,請詳見[[p值的決策法則]]。
===

# 根據結論,實施「二選一的行動方案」?

假設
$$
y_1, y_2, \cdots, y_n \buildrel {iid} \over \sim BER(p)
$$
試著發現$p$的最大概似估計式。
----
最大概似法的基本步驟如下:
# 根據隨機樣本的機率分配假設,找到該分配的函數型式。
# 定義已知隨機樣本下,分配參數的概似函數。
# 取概似函數對分配參數的偏微分,並且令結果等於0。
# 解上述步驟得到的方程組。答案就是最大概似估計。
【步驟一】
$$
f(y) = 
$$
【步驟二】
$$
\begin{eqnarray}
L(p | y_1, y_2, \cdots, y_n) & = & \\
\end{eqnarray}
$$
【步驟三】
$$
\frac{\partial \log L}{\partial p} = 
$$
【步驟四】
解上述步驟得到的方程式,我們發現平均$p$的最大概似估計是
$$
\hat p = 
$$
!成功機率的最大概似估計式
$$
\hat p = \frac{\sum_{i=1}^n y_i}{n}
$$
評論其他組員在這一次合作學習過程中的表現。
!遊戲
[[找尋兩張圖1-1的相異之處:一種仿蘋果日報]]
!Q&A
# 最左邊的小圓圈跟左邊第二個小圓圈一不一樣?
# +++[2]最左邊的小圓圈對不對?===

# +++[3]最左邊的小圓圈也可以是什麼形狀?===

# +++[4]如果[[母體]]是[[逢甲大學統計系的所有學生]],哪麼[[樣本]]可能是什麼樣的學生?===

# +++[5]哪一種黑板上的[[樣本]],可以一下子被圈出來?===

# +++[6]根據上述問題的答案,你覺得最左邊的小圓圈是[[意念的]](抽象的),還是[[實體的]]圓圈?===

# +++[7]寫出12個(種)[[高雄人]]的資料(不論是[[文字型]]的或是[[數值型]]的)?===

# +++[8]寫出12個(種)[[高雄人]]的數值型的資料?===

# +++[9]為你上述的數值型資料,寫出各式各樣統計推論問題?比如說,[[平均體重大於60公斤]]?===

# +++[10]第三個圓圈可以有很多很多個,對還是錯?照說它應該是一個表格!===

# +++[11]最左邊的小圓圈應該是挖空包住它的大圓圈?===

# +++[12]改劃圖1-1。===

!說明
除了確定[[研究主題]]與[[統計推論問題]],以及根據主題設計出來的[[問卷]]外,還要一步一步執行下述的各項工作:
# 確定[[母體]]。
# 決定抽樣方法並且取得[[樣本]]。
# 收集樣本帶出來的資料。
# 決定適用資料與先前決定的統計推論問題的[[統計推論方法]]。
# 利用[[R]]執行統計推論相關的[[統計計算]]與[[數據分析]]。
# 分析統計推論的結論。
----
!抽樣的目標
{{{
母體真的有樣本出現的現象?
}}}
!指定參考
[[數據]]
最簡單的數據叫做「伯努利數據」。它們來自一種名目尺度,我們看得到的觀察值不是「成功」就是「失敗」。如果用$y$代表某一種「伯努利變數(一種會產生伯努利數據的變數)」,並且用「1」表示所謂的「成功」、用「0」表示所謂的「失敗」,那麼$y$可能等於1,也可能等於0。習慣上用數字$p$表示$y$等於1的可能性。也就是說
$$
Pr(y = 1) = p,
$$
其中$Pr$代表機率(Probability)的縮寫。

習慣上,觀察一次伯努利變數,也會被說成「作一次伯努利試驗」。
----
【課堂練習】
>【Q1】代表「成功」的「1」跟「1隻母老虎」的「1」一樣?還是不一樣?
>【Q2】用$p$表示$y$等於0的可能性?
>【Q3】在你的經驗裡,找到幾個伯努利變數的例子?
>【複習題一】隨機變數$y$的期望值等於多少?
>【複習題二】隨機變數$y$的變異數等於多少?
>【複習題三】隨機變數$y$的標準差等於多少?
----
有了上述課堂練習的經驗之後,我們可以用以下的表格表示隨機變數$y$的+++[機率分配。]
| $y$ | 1 | 0 |
| $Pr(y)$ | $p$ | $1 - p$ |
===
這個表格的正式名稱叫做「伯努利(機率)分配」。
----
!基本知識
$$
E(y) = \sum_{i=1}^k y_i \times Pr(y_i)
$$
【課堂練習】
>【複習題一】伯努利隨機變數$y$的期望值等於多少?
$$
\begin{eqnarray}
E(y) & = & 1 \times p + 0 \times (1 - p) \\
 & = & p \\
\end{eqnarray}
$$
>【複習題二】伯努利隨機變數$y$的變異數等於多少?
$$
\begin{eqnarray}
V(y) & = & E(y - p)^2 \\
 & = & (1 - p)^2 \times p + (0 - p)^2 \times (1 - p) \\
 & = & p(1 - p)^2 + p^2 (1 - p) \\
 & = & p(1 - p)[(1 - p) + p] \\
 & = & p(1 - p) \\
\end{eqnarray}
$$
>【複習題三】伯努利隨機變數$y$的標準差等於多少?
$$
SD(y) = \sqrt{V(y)} = \sqrt{p(1 - p)}
$$
!用【樣本總和】估計【母體總和】
# $S_1 = \{\mbox{__1__, __2__}\}$
# $S_2 = \{\mbox{__1__, __3__}\}$
# $S_3 = \{\mbox{__1__, __4__}\}$
# $S_4 = \{\mbox{__2__, __3__}\}$
# $S_5 = \{\mbox{__2__, __4__}\}$
# $S_6 = \{\mbox{__3__, __4__}\}$
----
{{{
寫下每一項樣本的樣本總和?
}}}
!樣本總和的定義
+++[我要看答案!]
$$
\hat t = (\frac{\sum_{k \in S_i} y_k}{n}) \times N
$$
===
++++[你來給理由...]
$$
\begin{array}{rcl}
Pr(|\bar X - \mu| \le x_{\alpha}) & = & Pr(\frac{|\bar X - \mu|}{\sigma/\sqrt{n}} \le \frac{x_{\alpha}}{\sigma/\sqrt{n}}) \\
 & \approx & Pr(|Z| \le \frac{x_{\alpha}}{\sigma/\sqrt{n}}) \\
 & = & 2 \times \mbox{TA}(\frac{x_{\alpha}}{\sigma/\sqrt{n}}) \\
\end{array}
$$
!!!
$$
\begin{array}{rcl}
Pr(|\bar X - \mu| \le x_{\alpha}) & \approx & 2 \times \mbox{TA}(\frac{x_{\alpha}}{\sigma/\sqrt{n}}) \\
\end{array}
$$
===
-----
+++[老師的講解...]
| 目標(符號) | $Pr(|\bar X - \mu| \le x_{\alpha})$ |
| 目標(口語) | 發現(+++[冤有頭債有主]樣本平均估計母體平均(的)===)估計誤差小於某個正數的機率 |
| 目標的本質 | (發現某事件的)機率 |
| 發現「完成目標需要的預備知識」第一問 | +++[計算機率需要什麼?]機率分配=== |
| 發現「完成目標需要的預備知識」第二問 | +++[第一問的答案是誰的?]樣本平均估計母體平均的估計誤差(的機率分配)=== |
| 發現「完成目標需要的預備知識」第三問 | +++[第二問答案的正確型式(在哪裡)?]$(\bar X - \mu) \approx N(0, (\sigma/\sqrt{n})^2)$(pp. ???)=== |
| 發現「完成目標需要的預備知識」第四問 | +++[第三問的答案打哪來(在哪裡)?]$\bar X \approx N(\mu, (\sigma/\sqrt{n})^2)$(中央極限定理,pp.???)=== |
| (最後)預備知識一 | +++[一]$\bar X$的[[中央極限定理]]=== |
| 預備知識二 | +++[二]常態分配與標準常態分配的[[關係|常態分配與標準常態分配的關係]](因為一般常態分配無表可查)=== |
| 預備知識三 | +++[三]查(標準)[[常態表|查常態表]]=== |
| 預備知識四 | +++[四]用$\mbox{TA}(\cdot)$表達查表的[[結果|TA函數]]=== |
| 注意 | 這不是唯一的答案 |
$$
\begin{array}{rcl}
Pr(|\bar X - \mu| \le x_{\alpha}) & = & Pr(\frac{|\bar X - \mu|}{\sigma/\sqrt{n}} \le \frac{x_{\alpha}}{\sigma/\sqrt{n}}) & \mbox{理由:} \\
 & \approx & Pr(|Z| \le \frac{x_{\alpha}}{\sigma/\sqrt{n}}) & \mbox{理由:} \\
 & = & 2 \times \mbox{TA}(\frac{x_{\alpha}}{\sigma/\sqrt{n}}) & \mbox{理由:} \\
\end{array}
$$
!!!
$$
\begin{array}{rcl}
Pr(|\bar X - \mu| \le x_{\alpha}) & \approx & 2 \times \mbox{TA}(\frac{x_{\alpha}}{\sigma/\sqrt{n}}) \\
\end{array}
$$
===
!困境
<<tabs "" [[挑一個開始]] "" [[]][[最大概似估計法]] "" [[最大概似估計法]][[二項比例的最大概似估計$\hat p$]] "" [[二項比例的最大概似估計$\hat p$]]>>
!!!為什麼要研究研究?
> 廠商希望在某家主要電視頻道廣告這種新袋子。除了低價促銷外,該公司同時希望主張新袋子對環保是有利的且比其他的袋子堅固。科學上,電視公司被說服這種袋子確實對環境有好處,但是電視公司質疑袋子的強度,認為需要統計證據支持這項主張。
!!!研究計畫...
> 雖然有各式各樣垃圾袋的強度測度,廠商與電視公司同意使用一種「撕裂強度」。懸空一只袋子,袋子的撕裂強度等於裝進多少磅數的混合垃圾會撕裂袋子。檢驗顯示現階段通用的袋子,平均撕裂強度非常接近但不會超過50磅。新袋子的平均撕裂強度$\mu$未知且討論中。對立假設$H_1$是我們希望找到證據支持的陳述。因為我們希望新袋子比現在通用的袋子堅固,所以主張$\mu$大於50。
+++[研究假設與虛無假設]
$$
\begin{array}{rcl}
H_0 : \mu \le 50 &vs& H_1 (H_a) : \mu > 50
\end{array} 
$$
{{{
這是一種母體平均的右尾(研究)假設檢定。
}}}
!!!!研究假設、對立假設:是一種主張,只有說服人的樣本證據支持它是正確的,我們才會接受它。
!!!!虛無假設:通常它是一種「描述現狀」的陳述。除非有說服人的證據支持對立假設是正確的,否則我們不會拒絕它。
===
!!!估計誤差
$$
| \hat \theta - \theta |
$$
!!!以「樣本平均估計母體平均」為例...
* 母體平均($\mu$)
* 樣本平均($\bar X$)
<<tabs "" [[母體平均的估計誤差]] "" [[母體平均的估計誤差]][[估計誤差上限的機率]] "" [[估計誤差上限的機率]][[某信心水準下估計誤差的上限]] "" [[某信心水準下估計誤差的上限]][[母體平均的信賴區間]] "" [[母體平均的信賴區間簡版]]>>
>信賴區間提供估計誤差的資訊。
信賴區間被認為包含真正的參數,意思就是說我們有興趣的參數,比如說,班上的平均體重落在某個閉區間內,雖然信心不是百分百。請記得我們在[[信賴區間的誕生]]清楚交代過,信賴區間來自翻轉
$$
\mbox{(一號等式)} Pr(|\bar X - \mu| \le z_{\alpha/2} \times \frac{\sigma}{\sqrt{n}}) = (1 - \alpha) \times 100\%
$$
括號內的區間,
$$
|\bar X - \mu| \le z_{\alpha/2} \times \frac{\sigma}{\sqrt{n}}
$$
其中信賴係數$(1 - \alpha)$是研究者指定的(一般是0.95),而母體的標準差$SD(X) = \sigma$事先是知道的,加上樣本數$n$滿足大樣本的條件。記得這一件事加上
>計算上述機率陳述(probability statement)需要知道$\bar X$的機率分配(抽樣分配)。
你會發現
# 如果懂那一些數學,你可以發展其他狀況下的信賴區間。
# 如果不懂那些數學,你可以用一張圖呈現上述的機率陳述,進而了解信賴區間的各種性質。因為括號內以$\mu$為中心的區間,翻轉後以$\bar X$為中心的區間就是我們要的信賴區間。

如果暫時不懂[[信賴區間的誕生]]想要傳達的意思,也不想花時間試著理解推演信賴區間背後的原理,那根據老師在[[開講了]]揭示的現實,只好強記書上提過的任何一條公式。

如果暫時不懂、想要懂的你,有沒有什麼特效藥、捷徑之類的,可以讓你快速上手?
【步驟一】
>在一號公式駐足,跟它談一段戀情,即便是一夜情。
【步驟二】
>回憶一下:你曾經學過如何發現式子$Pr(|X| \le ?) = 1 - \alpha$中的問號。如果$X$服從常態分配,找答案要用第四章的反查表。
【步驟三】
>如果題目的$X$不是服從常態分配,而是其他機率分配,統計學家依舊有辦法發現步驟二的問號。
【步驟四】
>關於$Pr(|\bar X - \mu| \le ?) = 1 - \alpha$這個問題,是初學統計學讀者的新問題。一般初等統計學的範圍會分辨所謂的【[[大樣本]]】跟【[[小樣本]]】,然後【大樣本搭配中央極限定理】,而【小樣本搭配常態分配】。如果是
>>【大樣本搭配中央極限定理】,那連續數據的【樣本平均】跟伯努利數據的【樣本比例】的抽樣分配,就看[[中央極限定理]]怎麼說?不熟悉[[中央極限定理]]或者是忘記的讀者,必須經常回到左邊【[[主選單|MainMenu]]】點選重要題材的[[中央極限定理]]。記得:想到[[中央極限定理]]就要想到[[常態分配]]。
>>
>>【小樣本搭配常態分配】,這時候我們手邊的數據是連續型的,它們來自[[區間尺度]]或者是[[比例尺度]],並且被認為來自[[常態分配]]的母體。如果加上
>>>【母體標準差已知】,【樣本平均】的抽樣分配是某種[[常態分配]]。
>>>
>>>【母體標準差未知】,【樣本平均】的抽樣分配依舊是[[常態分配]],但是(一號等式)無解(+++[為什麼?]===)。
----
這時候,統計學家把(一號公式)改寫為以下的(二號等式)
$$
\mbox{(二號等式)} Pr(|\bar X - \mu| \le t_{n - 1, \alpha/2} \times \frac{s}{\sqrt{n}}) = (1 - \alpha) \times 100\%
$$
其中$t_{n - 1, \alpha/2}$是$t$分配的分割點,樣本標準差$s$是母體標準差的估計。可以這樣改寫的原因是
$$
\frac{\bar X - \mu}{s/\sqrt{n}} \sim t_{n - 1}
$$
加上(二號等式)實際上來自
$$
\mbox{(三號等式)} Pr(\frac{|\bar X - \mu|}{s/\sqrt{n}} \le t_{n - 1, \alpha/2}) = (1 - \alpha) \times 100\%
$$
----
總結以上的四個步驟,記住以下這四個結果(這些是統計學基本結果!)
# 【大樣本、母體標準差已知】$\frac{\bar X - \mu}{\sigma/\sqrt{n}} \sim Z$
# 【大樣本、母體標準差未知】$\frac{\bar X - \mu}{s/\sqrt{n}} \sim Z$
# 【小樣本、母體標準差已知、數據來自常態分配】$\frac{\bar X - \mu}{\sigma/\sqrt{n}} \sim Z$
# 【小樣本、母體標準差未知、數據來自常態分配】$\frac{\bar X - \mu}{s/\sqrt{n}} \sim t_{n - 1}$
最後一定要記得:
{{{
統計公式一定是「可計算的」。
}}}
比如說,狀況【小樣本、母體標準差未知、數據不是來自常態分配】$\frac{\bar X - \mu}{s/\sqrt{n}} \sim ?$或是$\frac{\bar X - \mu}{\sigma/\sqrt{n}}$都是「不可計算的」。
----
>上述那四項有樣本平均($\bar X$)、有母體平均($\mu$)、又有$\sigma/\sqrt{n}$或是$s/\sqrt{n}$的式子,實際上都是以下【標準化式子】
$$
\mbox{(四號等式)} \frac{\hat \theta - E(\hat \theta)}{\sqrt{V(\hat \theta)}}
$$
>或是
$$
\mbox{(五號等式)} \frac{\hat \theta - E(\hat \theta)}{\hat{\sqrt{V(\hat \theta)}}}
$$
>在各種情況下的結果。
# 如果我們的目標($\theta$)是參數$\mu$,一般用樣本平均$\bar X$估計母體平均,加上用符號$\sigma^2$代表母體變異數,可以得知樣本平均的變異數$V(\bar X)$等於$\sigma^2/n$(這會帶出樣本平均的標準差$\sqrt{V(\bar X)}$等於$\sigma/\sqrt{n}$)。
## 如果$\sigma^2$已知,$\sigma^2/n$不需要估計(即可計算的),所以用(四號公式)論斷分配結果與推演$\mu$的信賴區間。
## 如果$\sigma^2$未知,$\sigma^2/n$需要估計(即不可計算的),所以用(五號公式)論斷分配結果與推演$\mu$的信賴區間。
# 如果我們的目標($\theta$)是參數$p$,一般用樣本比例$\hat p$(實際上是伯努利數據的樣本平均)估計母體比例。因為樣本比例的變異數$V(\hat p)$等於$pq/n$(這會帶出樣本比例的標準差$\sqrt{V(\hat p)}$等於$\sqrt{pq/n}$),加上母體比例($p$)未知,所以樣本比例的標準差是不可計算的。在這樣的情形下,我們用(五號公式)論斷分配結果與推演$p$的信賴區間。
# $\hat{\sqrt{V(\hat \theta)}}$這個量叫做【標準誤】。換言之,標準誤是標準差的估計。
----
以下是一些習慣上的約定俗成:
# 常用的信賴係數$(1 - \alpha)$分別是0.90, 0.95, 0.99。信心水準是信賴係數乘以百分之一百。
# $Pr(Z \ge z_{\alpha}) = \alpha$,其中$Z$代表標準常態分配。
# $Pr(t_{n - 1} \ge t_{n - 1, \alpha}) = \alpha$,其中$t_{n - 1}$代表自由度是$n - 1$的$t$分配。
!!!估計誤差
$$
| \hat \theta - \theta |
$$
!!!以「樣本平均估計母體平均」為例...
* 母體平均($\mu$)
* 樣本平均($\bar X$)
<<tabs "" [[母體平均的估計誤差]] "" [[母體平均的估計誤差]][[估計誤差上限的機率]] "" [[估計誤差上限的機率]][[某信心水準下估計誤差的上限]] "" [[某信心水準下估計誤差的上限]][[母體平均的信賴區間]] "" [[母體平均的信賴區間簡版]]>>
[img[http://i299.photobucket.com/albums/mm318/jungpinwu/rat_cartoon.jpg]]
!!!假設檢定
* 法律之前,人人平等。
* 只有當證據超乎合理的懷疑,司法才會拒絕「被告是無罪的」。
* 如果證據不足造成無罪的判決,並不表示被告是清白的。
<<tabs "" [[二選一的難題]] "" [[]][[假設檢定的一般過程]] "" [[假設檢定的一般過程]]>>
<<tabs "" [[播不播廣告]] "" [[]][[我是電視台老闆]] "" [[我是電視台老闆]][[你家的垃圾袋最強]] "" [[你家的垃圾袋最強]][[沒有永遠正確的決策]] "" [[沒有永遠正確的決策]][[行話]] "" [[行話]]>>
!科學研究的邏輯
+++[一張流程圖:]
[img[http://www.proteinpower.com/drmike/wp-content/uploads/2007/04/science.PNG]]
===
!一般步驟的@@先後順序@@如下:
# +++[根據問題寫下研究假設;]
# 母體平均($\mu$)的問題?母體比例($p$)的問題?母體變異數($\sigma^2$)的問題?
# 虛無值($\mu_0, p_0, \sigma_0^2$)?
# 研究者希望數據支持關於參數的陳述?左尾?右尾?還是雙尾?
$$
H_1: \mbox{(母體平均、母體比例、母體變異數)} \mbox{(小於、大於、不等於)} \mbox{虛無值}
$$
===

# +++[根據抽樣計畫收集數據;]
@@如果你只負責分析數據,這時候收集數據的伙伴可能會給你一張大表,裡面滿滿的數字。@@===

# +++[使用數據計算檢定統計量;]
#「[[母體平均的檢定統計量]]」、
#「[[母體比例的檢定統計量]]」、
#「[[母體變異數的檢定統計量]]」。
===

# +++[在虛無假設成立的條件下得知檢定統計量的抽樣分配,並且根據該機率分配計算檢定統計量的證據力,$p$值;]
你需要
# 知道檢定統計量的「抽樣分配」(它是檢定統計量的「機率分配」);
# $p$[[值|p值]]是「不利虛無假設的機率」。
===

# +++[根據$p$值與$\alpha$的大小關係,決定「拒絕」或是「不拒絕」虛無假設;]
{{{
一般人使用的$\alpha$是$0.05$。
}}}
===

# 根據「不拒絕虛無假設」結論「虛無假設」;「拒絕虛無假設」結論「研究假設」。
# 根據結論,實施「二選一的行動方案」?
這整個流程的關鍵步驟是「第四階段」:「計算檢定統計量觀察值的$p$值」。為了得到答案,除了需要各種檢定下$p$值的定義,還需要知道檢定統計量在虛無假設之下的抽樣分配(它的機率分配)。以下這一段,網頁作者試圖把[[商用統計學]]的圖8.15放在這裡,不是直接掛圖,而是設計「互動的YES/NO」,請耐心記住你點了「YES」還是點了「NO」。
!挑選適當機率表的「if...then...else...」
+++[起點]
+++[YES, 大樣本(樣本數至少是30)]
$$
\mbox{知道}\sigma
$$
+++[YES]計算$\frac{\bar x - \mu_0}{\sigma/\sqrt{n}}$,然後查「標準常態表」。===+++[NO]計算$\frac{\bar x - \mu_0}{s/\sqrt{n}}$,然後查「標準常態表」。===
===
$$
n = ?
$$
+++[NO, 小樣本(樣本數低於30)]
+++[YES]
$$
\mbox{知道}\sigma
$$
+++[YES]計算$\frac{\bar x - \mu_0}{\sigma/\sqrt{n}}$,然後查「標準常態表」。===+++[NO]計算$\frac{\bar x - \mu_0}{s/\sqrt{n}}$,然後查「t表」。===
===
{{{
樣本來自常態母體嗎?
}}}
+++[NO]
+++[YES]計算$\frac{\bar x - \mu_0}{s/\sqrt{n}}$,然後查「t表」。===
{{{
單峰山型母體而且沒有太偏。
}}}
+++[NO]???===
===
===
===
[img[http://i299.photobucket.com/albums/mm318/jungpinwu/rat_cartoon.jpg]]
!!!假設檢定
* 法律之前,人人平等。
* 只有當證據超乎合理的懷疑,司法才會拒絕「被告是無罪的」。
* 如果證據不足造成無罪的判決,並不表示被告是清白的。
<<tabs "" [[二選一的難題]] "" [[]][[假設檢定的一般過程]] "" [[假設檢定的一般過程]]>>
<<tabs "" [[播不播廣告]] "" [[]][[我是電視台老闆]] "" [[我是電視台老闆]][[你家的垃圾袋最強]] "" [[你家的垃圾袋最強]][[沒有永遠正確的決策]] "" [[沒有永遠正確的決策]]>>
<<tabs "" [[理論]] "" [[]][[p值的決策法則]] "" [[p值的決策法則]][[型I錯誤]] "" [[型I錯誤]][[型II錯誤]] "" [[型II錯誤]][[這一切的一切都是那一邊?]] "" [[這一切的一切都是那一邊?]][[行話]] "" [[行話]]>>
一般步驟的@@先後順序@@如下:
# 根據問題寫下[[研究假設]];
# 根據[[抽樣計畫|抽樣設計]]收集[[數據]];
# 使用[[數據]]計算[[檢定統計量]];
# 在[[虛無假設]]成立的條件下得[[檢定統計量]]的[[抽樣分配]],並且根據該機率分配計算[[檢定統計量]]的[[證據力]],//p//[[值|p值]];
# 根據//p//[[值|p值]]與&alpha;的大小關係,決定「[[拒絕|拒絕虛無假設]]」或是「[[不拒絕|不拒絕虛無假設]]」虛無假設;
{{{
另外一個樣本集合;或是...
}}}
{{{
寫下你腦子裡的統計學英文單字。
}}}
!有幾個?
+++[甲班的調查結果]
{{{
words = c(8,3,4,5,5,0,5,11,6,7,5,9,10,5,5,9,5,8,8,8,6,5,6,9,6,7,9,8,7,9,6,9,5,7,6)
}}}
===
+++[乙班的調查結果]
{{{
words = c()
}}}
===
$$
|\bar y - \bar y_U| \le e = z_{\alpha/2} \sqrt{1 - \frac{n}{N}} \frac{S}{\sqrt{n}}
$$
其中
# $e$
# $\bar y$
# $\bar y_U$
# $z$
# $\alpha$
# $n$
# $N$
# $S$
!參考公式
$$
P(|\bar y - \bar y_U| \le e) = 1 - \alpha
$$
!其實應該這麼寫...
$$
\begin{eqnarray}
|\bar y - \bar y_U| & \le & e \\
 & = & (z_{\alpha/2}) \times (\sqrt{1 - \frac{n}{N}} \frac{S}{\sqrt{n}}) \\
 & = & \mbox{幾倍估計的標準差(標準誤)} \\
 & = & \mbox{幾倍怎麼訂?} \times \mbox{誰的標準誤?} \\
 & = & \mbox{根據參考公式所需要的機率分配訂定之} \times (\bar y \mbox{在有限母體下的標準誤}) \\
\end{eqnarray}
$$
其中
$$
1 - \frac{n}{N}
$$
叫做【有限母體修正項】;$S$是母體標準差的估計。【注意:既然$S$是估計,表示它占有的那個位置可以代入@@其他@@合理的數值。】
!mean
{{{
這個字是【平均】的英文字。
}}}
!給我幾個數字
{{{

}}}
!!它們的平均是多少?
!!!手算
!!!掌上型計算機
!!!R
!!!自己寫程式
!!!一個難題
{{{
去頭去尾平均
}}}
!!!你喜歡哪一種方式?
!符號
!目標
$$
H_0: \beta = \beta_0
$$
!分數檢定之檢定統計量的一般型式
$$
z = \frac{\hat \beta - \beta_0}{SE(\beta_0)}
$$
其中$\hat \beta$是$\beta$的最大概似估計。
!關於二項比例
!!虛無假設
$$
H_0: p = p_0
$$
!!對立假設
!!!左尾
$$
H_1: p < p_0
$$
!!!右尾
$$
H_1: p > p_0
$$
!!!雙尾
$$
H_1: p \ne p_0
$$
!!!檢定二項比例之分數檢定統計量
$$
z = \frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0)/n}}
$$
!!!計算檢定的p值
+++[開始找答案...]
# 發現[[檢定統計量]]的抽樣分配?
# 確定假設(檢定)的方向?也就是,研究假設的方向?也就是,不利虛無假設的方向?
# 根據上述問題的答案,計算檢定的p值:
## +++[左尾]
$$
Pr(Z \le z) = 0.5 - TA(z), z < 0; = 0.5 + TA(z), z > 0.
$$
===

## +++[右尾]
{{{

}}}
===

## +++[雙尾]
{{{

}}}
===

===
{{{
library(ISwR)

# 呼叫數據集【juul】
data(juul)

# 編輯修改數據
juul = edit(juul)

# 把數字變成【因子的水準(變成符號不再是數字)】並且加註標簽
juul$sex = factor(juul$sex, labels = c("M", "F"))
juul$menarche = factor(juul$menarche, labels = c("No", "Yes"))
juul$tanner = factor(juul$tanner, labels = c("I","II","III","IV","V"))

# 摘要這一份數據集
summary(juul)

# 摘要【性別(sex)】的頻率表
table(juul$sex)

# 製作變數【sex】跟變數【menarche】的列聯表
table(juul$sex, juul$menarche)

# 製作變數【menarche】跟變數【tanner】的列聯表
table(juul$menarche, juul$tanner)

# 製作變數【sex】跟變數【tanner】的列聯表
sex.tanner = table(juul$sex, juul$tanner)
sex.tanner

      I  II III  IV   V
  M 291  55  34  41 124
  F 224  48  38  40 204

tanner.sex = table(juul$tanner, juul$sex)
tanner.sex

        M   F
  I   291 224
  II   55  48
  III  34  38
  IV   41  40
  V   124 204

# 摘要邊際表
margin.table(tanner.sex)
margin.table(tanner.sex, 1)
margin.table(tanner.sex, 2)

# 摘要邊際比例
prop.table(tanner.sex)
prop.table(tanner.sex, 1)
prop.table(tanner.sex, 2)

# 一樣的效果
tanner.sex / sum(tanner.sex)

# 數據
caff.marital = matrix(c(652,1537,598,242,36,46,38,21,218,327,106,67), nrow = 3, byrow = TRUE)
# 看長相
caff.marital
# 加註【行標簽】跟【列標簽】
dim(caff.marital)
colnames(caff.marital) = c("0","1-150","151-300",">300")
rownames(caff.marital) = c("Married","Prev. Married","Single")
# 再看一次長相
caff.marital

# 直條圖【barplot()】
total.caff = margin.table(caff.marital, 2)
total.caff

# 畫圖了
require(grDevices)
barplot(total.caff)

## 把畫面切割成四等分 
par(mfrow=c(2,2))

barplot(caff.marital, col = "white")

barplot(t(caff.marital), col = "white")

barplot(t(caff.marital), col = "white", beside = TRUE)

barplot(prop.table(t(caff.marital), 2), col = "white", beside = TRUE)

# 更多色彩
barplot(caff.marital, col = rainbow(20))
barplot(caff.marital, col = rainbow(10))

## 恢復不切割的畫面
par(mfrow=c(1,1))

# 卡方檢定
## 獨立性檢定
chisq.test(caff.marital)

## 適合度檢定
chisq.test(caff.marital[1,])

## 同質性檢定
chisq.test(rbind(caff.marital[1,], caff.marital[2,]))

# 其他分析辦法
## 利用R的套件
## 自行開發R的程式碼
}}}
!表2.1
| 性別 |>| 死後的信仰 |
|~| YES | NO or Undecided |
| 女性 | 509 | 116 |
| 男性 | 398 | 104 |
!!整理一張列聯表的基本步驟
# 【步驟一】挑選兩個有興趣的變數
# 【步驟二】
# 【步驟三】
# 【步驟四】
!!列聯表的摘要統計量
# [[列總和]]
# [[行總和]]
# [[總和]]
| 性別 |>| 死後的信仰 | 列總和 |
|~| YES | NO or Undecided |~|
| 女性 | 509 | 116 ||
| 男性 | 398 | 104 ||
| 行總和 ||||
!!三種列聯表
| $X$ |>|>|>| $Y$ |
|~| $Y_1$ | $Y_2$ | ... | $Y_c$ |
| $X_1$ | 509 | 116 | ... ||
| $X_2$ | 398 | 104 | ... ||
|||| ... ||
| $X_r$ ||| ... ||
# 列總和固定的列聯表 
# 行總和固定的列聯表
# 總和固定的列聯表
++++[總和固定的列聯表]
!!統計模型
| 性別 |>| 死後信仰 |
|~| YES | NO or Undecided |
| 女性 | 509 | 116 |
| 男性 | 398 | 104 |

| 性別 |>|>| 死後信仰 | 性別的邊際分配 |
|~| YES | NO | Undecided |~|
| 女性 | $p_{11}$ | $p_{12}$ | $p_{13}$ | $p_{11} + p_{12} + p_{13} = p_{1.}$ |
| 男性 | $p_{21}$ | $p_{22}$ | $p_{23}$ | $p_{21} + p_{22} + p_{23} = p_{2.}$ |
| 死後信仰的邊際分配 | +++[答案]=== | +++[答案]=== | +++[答案]=== | 1 |
!!模型的最大概似估計
數據(隨機樣本):
| 性別 |>|>| 死後信仰 | 性別的總和(列總和)|
|~| YES | NO | Undecided |~|
| 女性 | $n_{11}$ | $n_{12}$ | $n_{13}$ | $n_{11} + n_{12} + n_{13} = n_{1.}$ |
| 男性 | $n_{21}$ | $n_{22}$ | $n_{23}$ | $n_{21} + n_{22} + n_{23} = n_{2.}$ |
| 死後信仰的總和(行總和) | +++[答案]=== | +++[答案]=== | +++[答案]=== | $n_{..}$ |
----
!!!$p_{1.}$的最大概似估計
【猜一猜】
# 【了解問題】$p_{1.}$是隨機挑到女性的機率。+++[...]===

# 【舊知識】了解問題之後,你有什麼[[舊知識|二項分配的最大概似估計]]可以幫你解題嗎?
# 【解題】+++[...]===

# 【新問題的答案】+++[...]$\frac{n_{1.}}{n_{..}}$===

!!!$p_{.1}$的最大概似估計
【猜一猜】
# 【了解問題】$p_{.1}$是隨機挑到【YES】的機率。+++[...]===

# 【舊知識】了解問題之後,你有什麼[[舊知識|多項分配的最大概似估計]]可以幫你解題嗎?
# 【解題】+++[...]===

# 【新問題的答案】+++[...]$\frac{n_{.1}}{n_{..}}$===

!!!$p_{11}$的最大概似估計
【猜一猜】
# 【了解問題】$p_{11}$是隨機挑到【女性且回答YES】的機率。+++[...]===

# 【舊知識】了解問題之後,你有什麼[[舊知識|多項分配的最大概似估計]]可以幫你解題嗎?
# 【解題】+++[...]===

# 【新問題的答案】+++[...]$\frac{n_{11}}{n_{..}}$===

----
===
+++[列總和固定的列聯表]
!!統計模型
+++[答案]===

!!模型的最大概似估計
+++[答案]===

----
===
+++[行總和固定的列聯表]
!!統計模型
+++[答案]===

!!模型的最大概似估計
+++[答案]===

===
[img[http://www.gifted.uconn.edu/siegle/research/Samples/RANTBLE.JPG]]
!目標
$$
H_0: \beta = \beta_0
$$
!分數檢定之檢定統計量的一般型式
$$
z = \frac{\hat \beta - \beta_0}{SE(\beta_0)}
$$
其中$\hat \beta$是$\beta$的最大概似估計。
!關於二項比例
!!虛無假設
$$
H_0: p = p_0
$$
!!對立假設
!!!雙尾
$$
H_1: p \ne p_0
$$
!!!檢定二項比例之分數檢定統計量
$$
z = \frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0)/n}}
$$
!!!利用分數檢定統計量反轉95%信賴區間
+++[開始找答案...]
發現[[檢定統計量]]的抽樣分配?
$$
z = \frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0)/n}} \sim Z
$$
所以
$$
z_{0.975} \le \frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0)/n}} \le z_{0.025}
$$
也就是說,我們要的二項比例95%信賴區間是
{{{

}}}
+++[提示]
# $z_{0.975} = -1 \times z_{0.025}$
# $p_0$現在是未知的。現在的(信賴區間)問題就是【哪些$p_0$滿足上面那個式子?】
所以
$$
\left( \frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0)/n}} \right)^2 \le z_{0.025}^2
$$
$$
...
$$
$$
Ap_0^2 + Bp_0 + C \le 0
$$
其中
$$
A = ?
$$
$$
B = ?
$$
$$
C = ?
$$
接著解這個一元二次不等式,會得到$p_0$落在範圍(閉區間)
$$
p_0 \in \frac{-B \pm \sqrt{B^2 - 4AC}}{2A}
$$
所以利用分數檢定反轉得到$p$的信賴區間如下
$$
\frac{-B \pm \sqrt{B^2 - 4AC}}{2A}
$$
===

===
!目標
$$
H_0: \beta = \beta_0
$$
!概似比檢定之檢定統計量的一般型式
$$
\chi^2 = -2\log(l_0/l_1)
$$
其中$l_0$是虛無假設下概似函數的最大值,而$l_1$則是概似函數的全域最大值。如果只有一個參數,比如說$\beta$,那麼$l_0 = l(\beta_0)$而且$l_0 = l(\hat \beta)$,$\hat \beta$是$\beta$的最大概似估計。
!關於二項比例
!!虛無假設
$$
H_0: p = p_0
$$
!!對立假設
!!!雙尾
$$
H_1: p \ne p_0
$$
!!!檢定二項比例之概似比檢定統計量
$$
\chi^2 = -2\log(l(p_0)/l(\hat p))
$$
!!!利用概似比檢定統計量反轉95%信賴區間
+++[開始找答案...]
發現[[檢定統計量]]的抽樣分配?
$$
\chi^2 = -2\log(l(p_0)/l(\hat p)) \sim \chi_1^2
$$
所以
$$
\chi^2_{1, 0.975} \le -2\log(l(p_0)/l(\hat p)) \le \chi^2_{1, 0.025}
$$
其中
$$
l(p_0) = ?
$$
而且
$$
l(\hat p) = ?
$$
{{{
代入上式,得知不等式的中間部份。
}}}
也就是說,我們要的二項比例95%信賴區間是
{{{

}}}

===
!目標
$$
H_0: \beta = \beta_0
$$
!瓦得檢定之檢定統計量的一般型式
$$
z = \frac{\hat \beta - \beta_0}{SE(\hat \beta)}
$$
其中$\hat \beta$是$\beta$的最大概似估計。
!關於二項比例
!!虛無假設
$$
H_0: p = p_0
$$
!!對立假設
!!!雙尾
$$
H_1: p \ne p_0
$$
!!!檢定二項比例之瓦得檢定統計量
$$
z = \frac{\hat p - p_0}{\sqrt{\hat p (1 - \hat p)/n}}
$$
!!!利用瓦得檢定統計量反轉95%信賴區間
+++[開始找答案...]
發現[[檢定統計量]]的抽樣分配?
$$
z = \frac{\hat p - p_0}{\sqrt{\hat p (1 - \hat p)/n}} \sim Z
$$
所以
$$
z_{0.975} \le \frac{\hat p - p_0}{\sqrt{\hat p (1 - \hat p)/n}} \le z_{0.025}
$$
也就是說,我們要的二項比例95%信賴區間是
$$
\hat p \pm z_{0.025} \times \sqrt{\hat p (1 - \hat p)/n}
$$

===
!!!活用你的第六感:請判斷以下抽樣過程屬於哪一種抽樣?
# 前120個到校的學生。++++[猜一猜...]
{{{

}}}
===

# 從男女學生分別挑60個學生。+++[猜一猜...]
{{{

}}}
===

# 從各年級分別挑出40個學生。+++[猜一猜...]
{{{

}}}
===

# 挑出2個班級。+++[猜一猜...]
{{{

}}}
===

# 每個班級學號是1,2,3,4的學生。+++[猜一猜...]
{{{

}}}
===

# 二年一班跟三年一班所有學生。+++[猜一猜...]
{{{

}}}
===

# 二年一班的學生。+++[猜一猜...]
{{{

}}}
===
[[常態分配]]之
$$
2 \times N(100, 5^2) = N(100, (2 \times 5)^2)
$$
修正為
$$
2 \times N(100, 5^2) = N(2 \times 100, (2 \times 5)^2)
$$
!勝算(odds)
{{{
勝算 = 成功的機率 / 失敗的機率
}}}
!!勝算比
$$
\theta = \frac{odds_1}{odds_2}
$$
【課堂練習】用$p_1$跟$p_2$定義勝算比
{{{

}}}
+++[答案]
$$
\theta = \frac{\frac{p_1}{1 - p_1}}{\frac{p_2}{1 - p_2}} = \frac{p_{11} p_{22}}{p_{12} p_{21}}
$$
===
----
【定理一】
>如果$\theta$等於$1$,$p_1 = p_2$。
>如果$\theta$小於$1$,$p_1 < p_2$。
>如果$\theta$大於$1$,$p_1 > p_2$。
+++[證明]===
!!定義[[2乘2表格]]的勝算比
$$
\frac{p_{11} \times p_{22}}{p_{12} \times p_{21}}
$$
【定理二】等不等?
$$
\theta = \frac{\frac{p_1}{1 - p_1}}{\frac{p_2}{1 - p_2}} = \frac{\frac{p_{11}}{1 - p_{11}}}{\frac{p_{21}}{1 - p_{21}}} = \frac{\frac{p_{11}}{p_{21}}}{\frac{p_{12}}{p_{22}}} = \frac{p_{11} p_{22}}{p_{12} p_{21}}
$$
----
【定理三】
>如果隨機變數$X$跟$Y$是獨立的,若且唯若$\theta$等於$1$。
+++[證明]
如果隨機變數$X$跟$Y$是獨立的,則以下的關係會成立:
$$
p_{11} = p_1 p_2, p_{12} = p_1 (1 - p_2), p_{21} = p_2 (1 - p_1), p_{22} = (1 - p_1)(1 - p_2)
$$
所以
$$
\theta = \frac{p_{11} \times p_{22}}{p_{12} \times p_{21}} = \frac{\frac{p_1 p_2}{(1 - p_1)(1 - p_2)}}{\frac{p_1(1 - p_2)}{(1 - p_1)p_2}} = 1
$$
===
!勝算比的統計推論
!!估計勝算比
勝算比的最大概似估計是
$$
\hat \theta = \frac{\hat p_{11} \hat p_{22}}{\hat p_{12} \hat p_{21}} = \frac{(n_{11}/n_{..}) \times (n_{22}/n_{..})}{(n_{12}/n_{..}) \times (n_{21}/n_{..})} = \frac{n_{11} n_{22}}{n_{12} n_{21}}
$$
除非樣本數非常大,勝算比的最大概似估計之抽樣分配非常偏向某一邊。好消息是
$$
\log(\hat \theta) = \log(n_{11}) + \log(n_{22}) - \log(n_{12}) - \log(n_{21})
$$
的抽樣分配很接近常態分配。統計學家給我們一個參考答案。$\log(\theta)$的大樣本信賴區間等於
$$
\log(\hat \theta) \pm z_{\alpha/2} \times \sqrt{\frac{1}{n_{11}} + \frac{1}{n_{12}} + \frac{1}{n_{21}} + \frac{1}{n_{22}}}
$$
----
帶出$\theta$的大樣本信賴區間
$$
\left[\exp\left(\log(\hat \theta) - z_{\alpha/2} \times \sqrt{\frac{1}{n_{11}} + \frac{1}{n_{12}} + \frac{1}{n_{21}} + \frac{1}{n_{22}}}\right), \exp\left(\log(\hat \theta) + z_{\alpha/2} \times \sqrt{\frac{1}{n_{11}} + \frac{1}{n_{12}} + \frac{1}{n_{21}} + \frac{1}{n_{22}}}\right)\right]
$$
//Name// = @@function@@(//~INPUTs//)
{

}
!發展過程:
# 準備相關的數學公式
# 圈出公式內所有不一樣的符號
# 為公式的每一個符號取名字
# 公式先寫
# 準備工作
# 計算左端點
# 計算右端點
# 輸出結果
----
{{{
把三種檢定放在一起。輸出拒絕?還是不拒絕?的結果。
}}}
//Name// = @@function@@(//~INPUTs//)
{

}
!發展過程:
# 定義函示的功能
# 根據功能以及方法的需求定義函示的輸入與輸出
## 輸入
## 輸出
# 為函示命名
# 準備工作
# 利用R的@@chisq.test()@@
# 取得檢定統計量的觀察值
# 取得檢定的p值
# 拒絕?還是不拒絕?
----
# +++[定義函示的功能]
{{{
三選一。
}}}
===

# +++[根據功能以及方法的需求定義函示的輸入與輸出]
# 輸入:三選一。
# 輸出:檢定統計量的觀察值、p值、拒絕?不拒絕?
===

# +++[為函示命名]
{{{
CHISQ.test
}}}
===

# +++[準備工作]
{{{
chisq.test()需要哪一些資訊?
}}}
# 適合度檢定:一個觀察值向量、一個機率向量。
# 同質性檢定:兩個觀察值向量。
# 獨立性檢定:一個矩陣。
===

# +++[利用R的chisq.test()]
{{{
把chisq.test()的結果利用等號(=)存起來。
}}}
===

# +++[取得檢定統計量的觀察值]
//Name//\$statistic
===

# +++[取得檢定的p值]
//Name//\$p.value
===

# +++[拒絕?還是不拒絕?]
{{{
決策法則:
}}}
* 全寫在一行
{{{

}}}
===

{{{
GoodHomoInd = function(x, y = NULL, p = rep(1/length(x), length(x)), ...)
{
if (is.matrix(x)) myTest = chisq.test(x)
else if (!is.null(y)) myTest = chisq.test(rbind(x, y)) else myTest = chisq.test(x, , p)
#
list(stat=myTest$statistic,p.value=myTest$p.value,df=myTest$parameter,reject=ifelse(myTest$p.value<0.05,TRUE,FALSE))
}
}}}
> 區間尺度是一種數值間比例不具意義且沒有定義數字0的測量尺度。華式溫度是一種用區間尺度測量的變數。實務上,除了溫度、時間與商數(比如說,智商)外很少有區間變數。幾乎所有屬量變數都是比例的。
++++[問題一]
>華式0度是什麼意思?
+++[答案]華式0度並不代表「一點溫度也沒有」,只是「非常冷」。因此華式溫度並不具有定義的0。
===
===
++++[問題二]
>華式60度比華式30度 = 華式20度比華式10度?
+++[答案]再者,華式溫度間的比例是沒有意義的。比如說,華式60度比華式30度來得兩倍暖和是沒有意義的。
===
===
+++[更多例子]
{{{
時間、智商
}}}
===
!!!(單變量)適合度檢定
$$
H_0: p_1 = 0.2, p_2 = 0.5, p_3 = 0.3
$$
!!!(雙變量)獨立性檢定
$$
H_0: p_{男,不同意} = p_{男} \times p_{不同意}, \cdots
$$
!!!(雙變量)同質性檢定
$$
H_0: p_{男,不同意} = p_{女,不同意}; p_{男,沒意見} = p_{女,沒意見}; p_{男,同意} = p_{女,同意}
$$
!!!檢定統計量
$$
\sum \frac{(O - E)^2}{E}
$$
其中$O$是觀察值(Observation),而$E$是虛無假設成立之下的期望值(Expectation)。
!!!檢定統計量的抽樣分配
* 單變量
$$
\sum \frac{(O - E)^2}{E} \approx \chi^2_{c - 1}
$$
* 雙變量
$$
\sum \frac{(O - E)^2}{E} \approx \chi^2_{(r - 1) \times (c - 1)}
$$
!!!決策法則
* 單變量
如果
$$
\sum \frac{(O - E)^2}{E} \ge \chi^2_{c - 1, 0.05}
$$
拒絕虛無假設。
* 雙變量
如果
$$
\sum \frac{(O - E)^2}{E} \ge \chi^2_{(r - 1) \times (c - 1), 0.05}
$$
拒絕虛無假設。
----
!!!關鍵技術
{{{
虛無假設成立下的期望值怎麼算?
}}}
> 用名目尺度觀察的變數是一種類別變數,而且尺度的分類(categories)之間不具有意義的順序或者是排名。人的性別、車子的顏色、員工的住宿資格等都是名目變數。
++++[問題一]
>女 < 男?
===
++++[問題二]
>(男 + 女)/2 = ?
===
+++[更多例子]
{{{

}}}
===
逢甲大學統計系副教授
設計一份問卷到校園收集支持與反對研究假設的證據。
# 請根據上學期設計問卷的步驟完成問卷設計。
# 問卷必須包含
## 說帖(爭取支持研究假設的前言)
## 題目
## 填答者基本資料
!抽樣
{{{
sample()
set.seed()
}}}
!!參考例子
[[在課堂上曾經發生過關於sample()的例子]]
!數據存放型態
{{{
vector()
matrix()
data.frame()
cbind()
rbind()
}}}
!初等統計學
!!數值型
{{{
table()
length()
sum()
mean()
var()
sd()
median()
min()
max()
range()
quantile()
summary()
}}}
!!繪圖
{{{
hist()
boxplot()
par()
}}}
!排列與組合
{{{
sort()
subsets()
}}}
!讀取與寫出數據
!!讀取
{{{
scan()
edit()
read.table()
}}}
!!寫出
{{{
write.table()
}}}
!套件
{{{
base
stats
BHH2
epiR
}}}
!輔助工具
{{{
help()
help.search()
library()
class()
args()
dim()
apply()
}}}
!系統
{{{
q()
}}}
{{{
sample(10,2)
sample(1:10,2)
sample(x=1:10,2)
sample(2,x=1:10)
sample(2, x=1:10, F)
sample(F, 2, x=1:10)
sample(2, F, x=1:10)
sample(table2.1, 2)
sample(t(table2.1), 2)
sample(31, 2)
table2.1[sample(31, 2),]
table2.1[sample(31, 10),]
table2.1[sort(sample(31, 10)),]
sample(1:5, 5, replace=F)
sample(1:5, 5, replace=T)
sample(1,5,7,replace=F)
sample(1,5,7,replace=T)
sample(c(1,5,7),3,replace=F)
sample(c(1,5,7),3,F)
sample(x=x, size=size, F, prob=prob)
}}}
[img[http://www.westgard.com/images/ls39f5.gif]]
!什麼是「型II錯誤」?
{{{
不拒絕錯誤的虛無假設。
}}}
!什麼時候發生型II錯誤?
{{{
只有不拒絕虛無假設才會發生型II錯誤。
}}}
!什麼時候不拒絕虛無假設?
>$p$值大於$\alpha$。
[img[http://www.westgard.com/images/ls39f5.gif]]
!什麼是「型I錯誤」?
{{{
拒絕正確的虛無假設。
}}}
!什麼時候發生型I錯誤?
{{{
只有拒絕虛無假設才會發生型I錯誤。
}}}
!什麼時候拒絕虛無假設?
>$p$值小於$\alpha$。
| !12 | !12/21, 22 | !各組5分鐘第一次上台報告【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的分析結果 | !第二次實習考核 |
| 12+ | 12/21~12/25 | 上傳【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的分析結果到BB的討論區【我們這一組】 | 請參考大家的創意製作第二次的報導文稿。 |
| !12+ | !12/28, 29 | !各組5分鐘第二次上台報告【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的分析結果 | !第三次實習考核(邀請圖書館張簡組長參與考核)、各班選出四組準備上逢甲電視台報導。一樣請利用MS Excel的直方圖工具分析,並且撰寫一段簡短【五分鐘】的評論。 |
二項分配想要模擬黑白的世界。你同意嗎?看到黑、你成功了;看到白、你失敗了。俗話說「世事無絕對」,有時候你看到黑的、有時候你看到白的。黑白兩者之間存在著某種默契,統計學家嘗試用一個0跟1之間的數字$p$模擬那一份無法捉摸的默契。努力過後,造就了「伯努利分配」。

丟銅板一次的過程就是一個最典型的例子。人們也因為追求「銅板是否公平」這個問題的答案,發展出一套又一套的統計理論。

丟銅板一次定輸贏,輸的人總是不服,人們進而發展「三戰兩勝制」、「五戰三勝制」等等激勵戰鬥意志的遊戲規則。因為這樣,聰明的人們再度發明另一套模擬機制:「二項分配」。

這一段我們要進入多元的世界。一個不只兩種選項的境地。

假設我們有$c$種選項(category)
$$
A_1, A_2, \cdots, A_c
$$
並且進一步假設每一種選項被觀察到的機會(一種機率)分別是
$$
p_1, p_2, \cdots, p_c
$$
注意:$\sum_{i=1}^c p_i = 1.0$

今天我們觀察到一筆數據,一筆我們叫做「多項數據」的數據
$$
(n_1, n_2, \cdots, n_c)
$$
統計學家想知道這一筆數據被看到的機率。經過努力之後,統計學家發現以下的函數就是答案
$$
Pr(n_1, n_2, \cdots, n_c) = \frac{n!}{n_1!n_2! \cdots n_c!}p_1^{n_1}p_2^{n_2} \cdots p_c^{n_c}
$$
其中$\sum_{i=1}^c n_i = n$。上述函數定義所謂的「多項分配」。
----
【動動腦】
>【一】多項分配適用哪種測量尺度的數據?
>【二】多項分配與二項分配的關係?+++[答案]===

----
【課堂練習】
>【Q1】$E(n_1) = ?$
>【Q2】$V(n_1) = ?$
>【Q3】$SD(n_1) = ?$
二項分配想要模擬黑白的世界。你同意嗎?看到黑、你成功了;看到白、你失敗了。俗話說「世事無絕對」,有時候你看到黑的、有時候你看到白的。黑白兩者之間存在著某種默契,統計學家嘗試用一個0跟1之間的數字$p$模擬那一份無法捉摸的默契。努力過後,造就了「伯努利分配」。

丟銅板一次的過程就是一個最典型的例子。人們也因為追求「銅板是否公平」這個問題的答案,發展出一套又一套的統計理論。

丟銅板一次定輸贏,輸的人總是不服,人們進而發展「三戰兩勝制」、「五戰三勝制」等等激勵戰鬥意志的遊戲規則。因為這樣,聰明的人們再度發明另一套模擬機制:「二項分配」。

這一段我們要進入多元的世界。一個不只兩種選項的境地。

假設我們有$c$種選項(category)
$$
A_1, A_2, \cdots, A_c
$$
並且進一步假設每一種選項被觀察到的機會(一種機率)分別是
$$
p_1, p_2, \cdots, p_c
$$
注意:$\sum_{i=1}^c p_i = 1.0$

今天我們觀察到一筆數據,一筆我們叫做「多項數據」的數據
$$
(n_1, n_2, \cdots, n_c)
$$
統計學家想知道這一筆數據被看到的機率。經過努力之後,統計學家發現以下的函數就是答案
$$
Pr(n_1, n_2, \cdots, n_c) = \frac{n!}{n_1!n_2! \cdots n_c!}p_1^{n_1}p_2^{n_2} \cdots p_c^{n_c}
$$
其中$\sum_{i=1}^c n_i = n$。上述函數定義所謂的「多項分配」。
----
【動動腦】
>【多項分配與二項分配的關係】+++[答案]===

----
【課堂練習】
>【Q1】$E(n_1) = ?$
>【Q2】$V(n_1) = ?$
>【Q3】$SD(n_1) = ?$
| 5 | 12/01, 02, 03 | 到校園某處調查【大學生的隨身包包有幾兩重?】 | 請準備好你的道具與紀錄表。分三天、每天數份。@@至於受訪同學的個人基本資料,請跟【大學生閱讀行為調查】的問卷一樣。@@ |
| 6 | 12/01, 02, 03 | 每日上傳【大學生的隨身包包有幾兩重?】的調查證據 | 請上傳你的照片或是錄影到BB的討論區【我們這一組】 |
| 7 | 12/04 | 上傳【大學生的隨身包包有幾兩重?】的調查結果 | 根據【大學生閱讀行為調查】的實習經驗上傳各組的調查結果到BB的討論區【我們這一組】 |
| 11 | 12/12~12/17 | 合併並且分析大家【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的調查結果 | 請利用MS Excel的直方圖工具分析,並且撰寫一段簡短的評論。 |
| !12 | !12/21, 22 | !各組5分鐘第一次上台報告【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的分析結果 | !第二次實習考核 |
| 12+ | 12/21~12/25 | 上傳【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的分析結果到BB的討論區【我們這一組】 | 請參考大家的創意製作第二次的報導文稿。 |
| !12+ | !12/28, 29 | !各組5分鐘第二次上台報告【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的分析結果 | !第三次實習考核(邀請圖書館張簡組長參與考核)、各班選出四組準備上逢甲電視台報導。一樣請利用MS Excel的直方圖工具分析,並且撰寫一段簡短【五分鐘】的評論。 |
| 8 | 12/08, 09, 10 | 到校園某處調查【大學生的隨身包包有幾本教科書?】 | 請準備好你的紀錄表。分三天、每天數份。@@至於受訪同學的個人基本資料,請跟【大學生閱讀行為調查】的問卷一樣。@@ |
| 9 | 12/08, 09, 10 | 每日上傳【大學生的隨身包包有幾本教科書?】的調查證據 | 請上傳你的照片或是錄影到BB的討論區【我們這一組】 |
| 10 | 12/11 | 上傳【大學生的隨身包包有幾本教科書?】的調查結果 | 一樣上傳至BB的討論區【我們這一組】 |
| 11 | 12/12~12/17 | 合併並且分析大家【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的調查結果 | 請利用MS Excel的直方圖工具分析,並且撰寫一段簡短的評論。 |
| !12 | !12/21, 22 | !各組5分鐘第一次上台報告【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的分析結果 | !第二次實習考核 |
| 12+ | 12/21~12/25 | 上傳【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的分析結果到BB的討論區【我們這一組】 | 請參考大家的創意製作第二次的報導文稿。 |
| !12+ | !12/28, 29 | !各組5分鐘第二次上台報告【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的分析結果 | !第三次實習考核(邀請圖書館張簡組長參與考核)、各班選出四組準備上逢甲電視台報導。一樣請利用MS Excel的直方圖工具分析,並且撰寫一段簡短【五分鐘】的評論。 |
[[2008大學生閱讀行為調查]]
----
[[2010大學生閱讀行為調查]]
連續數據的樣本數如果超過30;伯努利數據如果滿足$np \ge 5 (10)$且$n(1 - p) \ge 5 (10)$,都是所謂的大樣本數據。
$E(X)$代表隨機變數的期望值,這個數字代表「長遠來看,樣本(完全隨機抽樣的結果)的算術平均會是那一個數字,一個我們可以期待的數字」。這一個數字,不見得是$X$的某一個可能值。如果$E(X)$不是$X$的某一個可能值,也就是說$E(X)$是一個每一次我們抽樣都不可能看到的數字。

「它是一個可以期待的『平均』,但不是我們可以期待的數字。」

關於如何計算$E(X)$?基本上,有幾個辦法:

# 根據$E(X)$的公式。
# 如果隨機變數$X$的機率分配(用來計算$E(X)$的那一個$Pr(x)$函數)是對稱的,那麼我們可以直接讀出答案(答案就是分配的重心)。

雖然就是這麼簡單,但為了應付考試以及更複雜的情況,課本建議一種「表格」的方式計算$E(X)$。這個方式跟「畫個機率分配」、「標示$x$」、「標示高度(機率值)」、「$x$乘以高度」、最後把結果通通加起來的方式有著異曲同工之妙。這種表格輔助計算的方式,還有一個好處,就是方便你檢查答案。【想一想為什麼會有這樣的好處?】

{{{
數一數你的字典有幾個字?
}}}
這裡的字定義為@@term@@。
----
{{{
逢甲大學有幾棵榕樹?
}}}
這會是一種空間議題有關的抽樣設計。
----
我們將利用四種這學期會學到的技術估計以上兩個問題的答案:
# [[簡單隨機抽樣]]
# [[分層抽樣]]
# [[群集抽樣]]
# [[系統抽樣]]
----
[[簡單隨機抽樣]]的解答:
{{{










}}}
----
我是黃士育,不知道大家還記不記得,延畢一年到91年才畢業吧!剛剛看完系上的網站,一時間好想說說我這幾年來的感受喔!同時想謝謝統計系,讓我有不一樣的人生、不一樣的轉折,逆境不一定是逆境,全看自己怎麼想。
 
跟各位說說我這幾年的生活吧:
 
畢業後,我順利入伍,當空軍少爺兵,卻因為心律不整免役退伍,退伍後,先到市公所當財政課臨時人員,再來無業了一陣子,一直報考金融證照,卻都差兩分三分的一張也沒拿到,
 
萬念俱灰的同時,親友推薦家樂福新開的店要招募,本來已經去到家樂福繳證件預備要當家電課人員,沒想到104功能的利害。剛拿到家樂福識別證,就接到了日月光電話,過兩天南下面試,面試當天馬上錄取,請我快租房子,10天後上班。
 
到了高雄日月光當製程工程師(學妹育玟也進去品管部門)專職作製程統計分析,很奇怪吧!延畢生還可以當世界第一大封裝廠講師教統計咧!第一年還有得到最佳講師獎,那時候還擔任JMP(SAS的套裝軟體)的第一指定講師,我的感覺就是越討厭統計,統計越離不開你。

教了三年,在日月光組了統計team,甚至到上海替陸籍工程師上課,認識了日本廠、韓國廠、大陸廠的同事,風評也還不錯,連總經理都指名要我去教,甚至還跟JMP中國區總裁一起到蘇州旅遊,intel等國際大廠稽核也是我們統計小組出面參與,自己除了教學,也考了CQE、CRE兩張品質證照,在老闆的推薦下,去念了國立高雄大學電機碩士班,拿到碩士學歷,原本還想繼續念理工科博士,但是年紀也太大了,英文又不夠好,有報考台科大化工博士,但未錄取,不過這也是轉折,讓我的想法有很大的轉變。
 
經過這些磨練,我去年轉換跑道進到台達電子的子公司-旺能光電,在RD部門擔任資深技術工程師,做太陽能電池的擴散製程,以過去對JMP統計分析的經驗,來做一些DOE與分析(業界很愛田口跟品質管制)。當然還有很多要學的...真的會統統忘計。
 
看到過去我的學生生活,覺得也還好有留下來一年,碩士班也沒考上才可能發現我有心律不整免役、才可能進日月光重念統計、拿到碩士、牌照。博士班沒上,才可能繼續找工作變成資深工程師,進了火紅的行業。
 
對學弟妹建議的是,除了學校給你的要認真學以外,跟產業的結合真的很重要,風險、保險、精算方面若是不行或不感興趣,那就提早走生物、工程、品質方面的統計,學校沒開就自己念吧!證照很重要,金融證照很好考就先考起來放(我是都沒考上過^^)。在時機不對時,真的要儲存自己的實力,有實力你就是老大。

謝謝助教、老師們的指導,雖然延畢很痛苦,但是學生時代沒經歷過這些,我想我去公司也沒這麼快可以承受那些壓力,我想我那時學到的不僅是課業上的經驗,還有生活上的經驗,嗯~有空的話,我會回去看看您們的,最近胖很多,過陣子吧!
{{{
請看實際操作。
}}}
[img[http://i299.photobucket.com/albums/mm318/jungpinwu/rat_cartoon.jpg]]
!!!假設檢定
* 法律之前,人人平等。
* 只有當證據超乎合理的懷疑,司法才會拒絕「被告是無罪的」。
* 如果證據不足造成無罪的判決,並不表示被告是清白的。
<<tabs "" [[二選一的難題]] "" [[]][[假設檢定的一般過程]] "" [[假設檢定的一般過程]]>>
<<tabs "" [[播不播廣告]] "" [[]][[我是電視台老闆]] "" [[我是電視台老闆]][[你家的垃圾袋最強]] "" [[你家的垃圾袋最強]][[沒有永遠正確的決策]] "" [[沒有永遠正確的決策]][[行話]] "" [[行話]]>>
//Name// = c(, , ..., )
----
# ++++[數字]
{{{
c(1, 2, 3)
}}}
===

# ++++[文字]
{{{
c("1", "2", "3")
}}}
===

# ++++[真假]
{{{
c(TRUE, TRUE, FALSE)
}}}
===
{{{
R規定用向量定義矩陣。
}}}
----
{{{
matrix(c(, , ..., ), //number of rows//, //number of columns//)
}}}
----
# ++++[數字]
{{{
matrix(c(1, 2, 3, 4), 2, 2)
}}}
===

# ++++[文字]
{{{
matrix(c("1", "2", "3"), 1, 3)
}}}
===

# ++++[真假]
{{{
matrix(c(TRUE, TRUE, FALSE), 3, 1)
}}}
===
----
{{{
> matrix(c(3,4,5,2),2,2)
     [,1] [,2]
[1,]    3    5
[2,]    4    2
> matrix(c(3,4,5,2),2,2,byrow=FALSE)
     [,1] [,2]
[1,]    3    5
[2,]    4    2
> matrix(c(3,4,5,2),2,2,byrow=TRUE)
     [,1] [,2]
[1,]    3    4
[2,]    5    2
> 
}}}
----
【課堂練習】把以下的2乘2表格以矩陣的方式放進R。
| 3 | 4 |
| 5 | 2 |
{{{
電話簿、點名單、...
}}}
{{{
A = function()
{
library(BHH2)
N = 4
n = 2
Cases = subsets(N, n)

prob = c(1/3,1/6,0,0,0,1/2)

y = c(1,2,4,4)

Sample = matrix(y[t(Cases)],choose(N,n),n,byrow=T)
SampleTotal = apply(Sample, 1, sum) / n * N
Sample = cbind(Sample, SampleTotal, prob)

EVtotal = sum(Sample[,3]*Sample[,4])
EBtotal = EVtotal - sum(y)
VARtotal = sum((Sample[,3] - EVtotal)^2*Sample[,4])
MSEtotal = VARtotal + EBtotal^2

c(EVtotal, EBtotal, VARtotal, MSEtotal)
}
}}}
{{{
A()
}}}
----
+++[這個程式有什麼缺點?]
{{{

}}}
===
!!實驗單元、因子、水準、處理、變數、母體、樣本、數據、單位、數字
我有一群老鼠(全世界的老鼠都在我家!!!)。我餵「『一號食譜』跟『台灣啤酒』」給其中幾隻老鼠,餵「『二號食譜』跟『麒麟啤酒』」給另外幾隻老鼠,最後餵「『三號食譜』跟『青島啤酒』」給剩下沒吃到飯跟喝到啤酒的老鼠。一個月後,我測量這些(所有)老鼠的「性別」、「心跳」、「體溫」、「體重」。我得到四個母體。因為我沒有時間「餵所有老鼠」跟「測量所有老鼠」,所以你只會看到「部分老鼠」的「性別」、「心跳」、「體溫」、「體重」的「樣本」。
----
【師生對話】
>師問:上頭哪一句話是錯的?
>生回:全世界的老鼠都在我家!!!
>師問:為什麼?
>生回:因為我家也有老鼠!
----
【關於上述老鼠實驗,請問下述專有名詞指的是內容的哪部份?】

++++[實驗單元]
>老鼠
===
+++[因子]
>食譜、啤酒
===
+++[水準]
>一號、二號、三號食譜是食譜的水準;台灣啤酒、麒麟啤酒、青島啤酒是啤酒的水準
===
+++[處理]
>『一號食譜』跟『台灣啤酒』、『二號食譜』跟『麒麟啤酒』、『三號食譜』跟『青島啤酒』
===
+++[變數]
>「性別」、「心跳」、「體溫」、「體重」
===
+++[母體]
>「全世界老鼠的性別」、「全世界老鼠的心跳」、「全世界老鼠的體溫」、「全世界老鼠的體重」
===
+++[樣本]
>「部分老鼠的性別」、「部分老鼠的心跳」、「部分老鼠的體溫」、「部分老鼠的體重」
===
+++[數據]
>「性別的觀察值」、「心跳的觀察值」、「體溫的觀察值」、「體重的觀察值」
===
+++[單位]
>「性別的單位?」、「心跳的單位?」、「體溫的單位?」、「體重的單位?」
===
+++[數字]
>「性別的數字?」、「心跳的數字?」、「體溫的數字?」、「體重的數字?」
===
你現在看到的畫面植基在[[TiddlyWiki|http://www.tiddlywiki.com/]]。一種個人部落格。選擇它的最大原因有兩項
* free.
* 容易編輯數學公式。
如果你有興趣使用Wiki紀錄學習過程,管理知識,請參考這個[[網站|http://www.lifehack.org/articles/technology/advice-for-students-use-a-wiki-for-better-note-taking.html]]。或許你也有興趣閱讀[[老師的網站|http://exp.tiddlyspot.com/]]。
----
# 點選網頁左邊的【MainMenu】的【預定進度表】。
# 點選讀者有興趣的單元。這些單元的撰寫方式接近讀者的閱讀習慣。網頁作者盡可能讓頁面的版形(書上某一頁給人的印象)被最多人所接受。
# 也可以點選【97學年度實際進度】。原則上還是點選讀者有興趣的單元。此頁面呈現的內容會最接近上課期間真正講授的內容,還有在課堂上發生並且可以公諸於世的學習材料。--值得一提的是,本人引用【microcontent】的概念編輯這一段的網頁,盡量讓內容的篇幅不超過一頁。--
# 【提醒】網站內呈現的內容是網頁作者對學生的最低要求。
# 其他網頁提供的素材,請自行參考。
{{{
輕鬆讀、歡喜收。
}}}
不是[[大樣本]]的數據,都是所謂小樣本的數據。
!我如何得到以下這一些問題的答案:
# ++++[Q1]
{{{
如果我們班每一個人都是19歲,那麼統計系的每一個人也都是19歲?
}}}
一般人都會說【NO】這樣的答案。但統計系的學生除了回答【NO】,還要有能力用數據驗證【NO】這個答案。為了驗證,二乙提供以下四個驗證答案的辦法:
# 對每班10個人作年齡調查
# 找認識的學長姐或學弟妹問他們的年齡
# 要求不是大二的統計系學生拿出身份證驗證年齡
# 隨機抽樣每個年級10個人
看起來,每一位都言之有理,但並不是每一種辦法都可行。接下來,請挑出絕對可行的辦法。
===

# +++[Q2]我的學長19歲?===

## +++[甲班學生的參考答案]用問的?看基本資料?===

## +++[乙班學生的參考答案]===

# +++[Q3]吳老師的年齡?===

## +++[甲班學生的參考答案]47,43,50,49,45,48,46,53,30===

## +++[乙班學生的參考答案]38 39 41 42 43 44 40 38===

# +++[Q4]統二甲有58人,全統計系有多少人的(有根據的猜測)估計?===

## +++[練習題]每一個人根據58這一個數字猜測統計系有多少人?(寫在筆記裡,每一個數字都要有理由?)===

## +++[練習題]每一個人上台來把剛剛猜測的數字利用scan()輸入R。===

### +++[甲班的過程]
@@過程中出現過兩次錯誤,老師利用其他名字的變數暫存錯誤前已經輸入的數字,並且利用c(=combine)把新舊數據接合起來。@@
===

### +++[乙班的過程]===

## +++[練習題]計算所有人答案的平均?(開始使用計算機)===

## +++[練習題]計算所有人答案的標準差?===

## +++[練習題]這一堆數字是母體還是樣本???===

### +++[甲班的真相]
{{{
> stats
 [1] 450 464 488 464 460 464 486 468 464 509 500 464 476 470 464 464
[17] 464 400 500 480 490 472 478 464 464 464 461 464 480 520 464 480
[33] 480 464 464 464 480 464 470 452 452 480 440 464 464 458 476 464
[49] 480 440 464 480 480 456 472 460 466 480 464 474 512 464 400 446
[65] 448 464 480 464 440 416 479 472 464 480 484 499
}}}
===

### +++[乙班的真相]===

## +++[練習題]利用亂數表挑到9個數字。===

## +++[練習題]計算這9個數字的平均?===

## +++[練習題]計算這9個數字的標準差?(要會使用計算機內提供標準差的功能!)===

## +++[練習題]自己挑5個數字,並且計算它們的平均以及標準差?===

## +++[練習題]除了平均與標準差,你還想知道什麼?===

### +++[甲班學生的答案]sum, range, 眾數, 中位數, var, c(min, $Q_1$, median, mean, $Q_3$, max)===

### +++[跟這一件事有關的R過程]
+++[甲班的R]
{{{
stats = scan()
stats
stat=stats
stats = scan()
464
480
464
480
480
464
464
stat=c(stat, stats)
stats = scan()
length(stats)
stat
length(stat)
stats = c(stat, stats).
stats = c(stat, stats)
length(stats)
table(stats)
hist(stats)
mean(stats)
var(stats)
sd(stats)
max(stats)
min(stats)
range(stats)
stats
stats
stats[c(10,48,01,50,11,53,60,20,64)]
mean(stats[c(10,48,01,50,11,53,60,20,64)])
sd(stats[c(10,48,01,50,11,53,60,20,64)])
stats[c(12,65,22,59,57)]
mean(stats[c(12,65,22,59,57)])
sd(stats[c(12,65,22,59,57)])
stats[c(56,61,47,76,71)]
mean(stats[c(56,61,47,76,71)])
sd(stats[c(56,61,47,76,71)])
sort(stats[c(56,61,47,76,71)])
stats[sort(c(56,61,47,76,71))]
stats[c(1,2)]
stats[c(2,1)]
sample(1:76, 9, replace=FALSE)
sample(1:76, 9, replace=FALSE)
set.seed(123)
sample(1:76, 9, replace=FALSE)
set.seed(123)
sample(1:76, 9, replace=FALSE)
set.seed(0)
sample(1:76, 9, replace=FALSE)
set.seed(0)
sample(1:76, 9, replace=FALSE)
sample(1:76, 5, replace=FALSE)
secondFirst = sample(1:76, 5, replace=FALSE)
secondFirst
stats[secondFirst]
mean(stats[secondFirst])
sd(stats[secondFirst])
sum(stats[secondFirst])
range(stats[secondFirst])
median(stats[secondFirst])
mode(stats[secondFirst])
var(stats[secondFirst])
fivenumber(stats[secondFirst])
summary(stats[secondFirst])
}}}
===
+++[乙班的R]
{{{
stats = scan()
472
464
480
stats
stats = c(stats, 472,464,480)
stats
table(stats)
mean(stats)
var(stats)
sd(stats)
median(stats)
max(stats)
min(stats)
box
boxplot
boxplot(stats)
stats
boxplot(stats[-45])
table(stats)
hist(stats)
hist(stats[-45])
par(mfrow=c(2,2))
boxplot(stats)
boxplot(stats[-45])
hist(stats)
hist(stats[-45])
stats
sample(stats, 9)
sample(stats, 10)
length(stats)
sample(1:58, 9)
sample(1:60, 9)
sample(1:60, 9)
sample(1:60, 9)
sample(1:60, 9)
set.seed(123)
sample(1:60, 9)
set.seed(123)
sample(1:60, 9)
set.seed(1234)
sample(1:60, 9)
1:60
1:10
sample(stats, 9)
sample(1:2, 10)
sample(1:2, 10, replace=T)
sample(1:2, 10, replace=F)
help(sample)
sample(1:2, 1)
sample(1:2, 1)
sample(1:2, 1)
sample(size=1,1:2)
sample(size=2,1:2)
sample(size=3,1:2)
sample(replace=T,size=3,1:2)
sample(1:2, 1, TRUE)
sample(1:2, 3, F)
sample(1:2, 3, T)
set.seed(123)
sample(1:2, 3, T)
set.seed(123)
sample(1:2, size=3, T)
stats
stats[c(37,57,03,56,06,12,19,17,46)]
mean(stats[c(37,57,03,56,06,12,19,17,46)])
var(stats[c(37,57,03,56,06,12,19,17,46)])
sd(stats[c(37,57,03,56,06,12,19,17,46)])
hist(stats[c(37,57,03,56,06,12,19,17,46)])
hist(stats[c(37,57,03,56,06,12,19,17,46)])
hist(stats)
hist(stats[-45])
new.device()
par(mfrow=c(2,2))
hist(stats[-45])
par(mfrow=c(2,2))
hist(stats[-45])
hist(stats[c(37,57,03,56,06,12,19,17,46)])
hist(stats[sample(1:58,9)])
hist(stats[sample(1:58,9)])
hist(stats[-45])
hist(stats[sample(1:58,9)])
hist(stats[sample(1:58,9)])
hist(stats[sample(1:58,9)])
stats
mode(stats)
range(stats)
min(stats)
max(stats)
}}}
===

===
>常態分配(normal distribution)是一種重要的連續分配,因為實務上有不少隨機變數的(機率)分配與它相近。如果許多獨立的原因影響某一個隨機變數,而且其中任何一項原因的效果不會遠遠高於其他原因的效果,那麼該隨機變數大概會服從某一種常態分配。
>
>例如,自動機器生產的針的長度、組裝工人完成指定工作的時間、棒球的重量、某一批棒子的張力,跟某一種品牌罐裝肥皂的體積,這些都是常態隨機變數的好例子。
>
>這些變數都被許多個別效果不大而且彼此獨立的原因所影響。例如針的長度會受到震動、溫度、機器磨損以及原料性質等獨立原因所影響。
>
>過去許多年來,不少數學家研究常態分配背後的數學,並且獨立發現不少事。常態密度函數(normal density function)的發現歸功於Carl Friedrich Gauss (1777-1855),他為這個公式做了不少事。在科學的書籍裡,這分配通常被叫做高斯分配。但是實際上這個公式最先被英裔法國人Abraham De Moivre (1667-1754)發現。但不幸的是,他的發現直到1924年才為人所知。
!常態分配的定義
$$
f(x) = \frac{1}{\sqrt{2 \pi}\sigma}e^{-\frac{1}{2}(\frac{x - \mu}{\sigma})^2}, -\infty < \mu < \infty, 0 < \sigma < \infty, -\infty < x < \infty
$$
定義常態隨機變數的(機率)分配函數。記作$X \sim N(\mu, \sigma^2)$。
----
【課堂練習】
>【Q1】如果某隨機變數之分配函數的定義為$f(x) = 1/(3\sqrt{2 \pi})e^{-1/2[(x - 1)/3]^2}$,請問我們會怎麼記載這件事?
>【Q2】請寫下$X \sim N(0, 5^2)$的分配函數。
!常態隨機變數的期望值與標準差
平均等於
$$
E(X) = \int_{-\infty}^{\infty} x \times f(x) dx = \int_{-\infty}^{\infty} x \frac{1}{\sqrt{2 \pi}\sigma}e^{-\frac{1}{2}(\frac{x - \mu}{\sigma})^2} = ?
$$
變異數等於
$$
V(X) = \int_{-\infty}^{\infty} (x - E(X))^2 \times f(x) dx = ?
$$
標準差等於
$$
SD(X) = \sqrt{V(X)}
$$
----
【課堂練習】
>【Q3】如果$X \sim N(10, 15^2)$,那麼$X$的平均是多少?
>【Q4】如果$X \sim N(10, 15^2)$,那麼$X$的變異數是多少?
>【Q5】如果$X \sim N(10, 15^2)$,那麼$X$的標準差是多少?
!標準常態分配
$$
N(0, 1^2)
$$
----
【課堂練習】
>【Q6】標準常態分配(標準常態隨機變數)的平均是多少?
>【Q7】標準常態分配(標準常態隨機變數)的變異數是多少?
>【Q8】標準常態分配(標準常態隨機變數)的標準差是多少?
!常態分配的基本性質
$$
N(100, 5^2) + 100 = N(200, 5^2)
$$
+++[記憶口訣]===
----
$$
2 \times N(100, 5^2) = N(2 \times 100, (2 \times 5)^2)
$$
+++[記憶口訣]===
----
$$
N(100, 5^2) + N(100, 12^2) = N(200, 13^2)
$$
+++[記憶口訣]===
----
$$
N(100, 5^2) + N(100, 12^2) + N(100, 13^2) = ?
$$
+++[記憶口訣]===
----
$$
\frac{N(100, 5^2) - 100}{5} = N(0, 1^2)
$$
+++[記憶口訣]===
----
$$
5 \times N(0, 1^2) + 100 = N(100, 5^2)
$$
+++[記憶口訣]===
----
【課堂練習】
>【Q9】$3 \times N(100, 10^2) - 10 \times N(10, 30^2) = ?$
>【Q10】請用一般的符號表示上述所有性質。+++[答案]===

!計算常態機率
$$
F(a) = Pr(X \le a) = \int_{-\infty}^a f(x) dx
$$
所以
$$
Pr(a \le X \le b) = \int_a^b f(x) dx = \int_{-\infty}^b f(x) dx - \int_{-\infty}^a f(x) dx = F(b) - F(a)
$$
基本上這兩個積分只有神仙才會。數學家在計算機發明之後,發展一套數值積分理論,可以用來得到積分的正確答案或是近似的答案。於是乎,統計學家利用數值積分的電腦程式算出部份標準常態分配的積分(也就是,符合某些條件的機率)並且製成表格。然後利用上述最後兩項性質計算任何常態分配的機率。比如說,
$$
Pr(100 \le N(100, 5^2) \le 105) = Pr(\frac{100 - 100}{5} \le \frac{N(100, 5^2) - 100}{5} \le \frac{105 - 100}{5}) = Pr(0 \le N(0, 1^2) \le 1) = Pr(0 \le Z \le 1)
$$
+++[查標準常態表]===
----
【課堂練習】
>【Q11】已知$Pr(0 \le Z \le 1) = p_1, Pr(0 \le Z \le 2) = p_2$,試著找出以下情況的答案
>>【1】$Pr(1 \le Z \le 2)$
>>【2】$Pr(-1 \le Z \le 0)$
>>【3】$Pr(-2 \le Z \le -1)$
>>【4】$Pr(-1 \le Z \le 2)$
>>【5】$Pr(-2 \le Z \le 2)$
!常態分配是二項分配的極限分配
----
【課堂練習】
>【】
++++[小序]
>常態分配(normal distribution)是一種重要的連續分配,因為實務上有不少隨機變數的(機率)分配與它相近。如果許多獨立的原因影響某一個隨機變數,而且其中任何一項原因的效果不會遠遠高於其他原因的效果,那麼該隨機變數大概會服從某一種常態分配。
>
>例如,自動機器生產的針的長度、組裝工人完成指定工作的時間、棒球的重量、某一批棒子的張力,跟某一種品牌罐裝肥皂的體積,這些都是常態隨機變數的好例子。
>
>這些變數都被許多個別效果不大而且彼此獨立的原因所影響。例如針的長度會受到震動、溫度、機器磨損以及原料性質等獨立原因所影響。
>
>過去許多年來,不少數學家研究常態分配背後的數學,並且獨立發現不少事。常態密度函數(normal density function)的發現歸功於Carl Friedrich Gauss (1777-1855),他為這個公式做了不少事。在科學的書籍裡,這分配通常被叫做高斯分配。但是實際上這個公式最先被英裔法國人Abraham De Moivre (1667-1754)發現。但不幸的是,他的發現直到1924年才為人所知。
===
<<tabs "" [[請選擇]] "" [[]][[常態分配的定義]] "" [[常態分配的定義]][[常態隨機變數的期望值與標準差]] "" [[常態隨機變數的期望值與標準差]][[標準常態分配]] "" [[標準常態分配]][[常態分配的基本性質]] "" [[常態分配的基本性質]][[計算常態機率]] "" [[計算常態機率]]>>
<<tabs "" [[請選擇]] "" [[]][[常態分配是二項分配的極限分配]] "" [[常態分配是二項分配的極限分配]]>>
【課堂練習】
>【】
$$
N(100, 5^2) + 100 = N(200, 5^2)
$$
+++[記憶口訣]===
----
$$
2 \times N(100, 5^2) = N(100, (2 \times 5)^2)
$$
+++[記憶口訣]===
----
$$
N(100, 5^2) + N(100, 12^2) = N(200, 13^2)
$$
+++[記憶口訣]===
----
$$
N(100, 5^2) + N(100, 12^2) + N(100, 13^2) = ?
$$
+++[記憶口訣]===
----
$$
\frac{N(100, 5^2) - 100}{5} = N(0, 1^2)
$$
+++[記憶口訣]===
----
$$
5 \times N(0, 1^2) + 100 = N(100, 5^2)
$$
+++[記憶口訣]===
----
【課堂練習】
>【Q9】$3 \times N(100, 10^2) - 10 \times N(10, 30^2) = ?$
>【Q10】請用一般的符號表示上述所有性質。+++[答案]===
$$
f(x) = \frac{1}{\sqrt{2 \pi}\sigma}e^{-\frac{1}{2}(\frac{x - \mu}{\sigma})^2}, -\infty < \mu < \infty, 0 < \sigma < \infty, -\infty < x < \infty
$$
定義常態隨機變數的(機率)分配函數。記作$X \sim N(\mu, \sigma^2)$。
----
【課堂練習】
>【Q1】如果某隨機變數之分配函數的定義為$f(x) = 1/(3\sqrt{2 \pi})e^{-1/2[(x - 1)/3]^2}$,請問我們會怎麼記載這件事?
>【Q2】請寫下$X \sim N(0, 5^2)$的分配函數。
平均等於
$$
E(X) = \int_{-\infty}^{\infty} x \times f(x) dx = \int_{-\infty}^{\infty} x \frac{1}{\sqrt{2 \pi}\sigma}e^{-\frac{1}{2}(\frac{x - \mu}{\sigma})^2} = ?
$$
變異數等於
$$
V(X) = \int_{-\infty}^{\infty} (x - E(X))^2 \times f(x) dx = ?
$$
標準差等於
$$
SD(X) = \sqrt{V(X)}
$$
----
【課堂練習】
>【Q3】如果$X \sim N(10, 15^2)$,那麼$X$的平均是多少?
>【Q4】如果$X \sim N(10, 15^2)$,那麼$X$的變異數是多少?
>【Q5】如果$X \sim N(10, 15^2)$,那麼$X$的標準差是多少?
!!!活用你的新知識:請判斷以下抽樣過程屬於哪一種抽樣?
# 前120個到校的學生。++++[討論您的答案...]
{{{

}}}
===

# 從男女學生分別挑60個學生。+++[討論您的答案...]
{{{

}}}
===

# 從各年級分別挑出40個學生。+++[討論您的答案...]
{{{

}}}
===

# 挑出2個班級。+++[討論您的答案...]
{{{

}}}
===

# 每個班級學號是1,2,3,4的學生。+++[討論您的答案...]
{{{

}}}
===

# 二年一班跟三年一班所有學生。+++[討論您的答案...]
{{{

}}}
===

# 二年一班的學生。+++[討論您的答案...]
{{{

}}}
===
@@color:red;步驟一:@@定義「[[樣本比例估計母體比例的估計誤差]]」。
@@color:red;步驟二:@@給定某個信賴係數(從習慣、約定俗成的0.90, 0.95, 0.99, 0.999挑一個),計算估計誤差的上限。(__注意:這時候你需要估計「樣本比例的標準差」跟知道樣本比例的抽樣分配。__)
@@color:red;步驟三:@@利用代數運算把步驟二的答案,改寫為一種「母體比例的區間」。

@@請作答...@@
{{{

}}}
+++[答案]===
「母體平均的大樣本信賴區間」的構成要件

@@color:green;要件一:@@[[樣本平均]]。
@@color:green;要件二:@@[[標準常態隨機變數Z的分隔點]]。
@@color:green;要件三:@@[[樣本平均的標準差]]的估計。

@@所以@@

針對母體比例的大樣本信賴區間,我們需要以下的要件

@@color:green;要件一:@@[[樣本比例]]。
@@color:green;要件二:@@[[標準常態隨機變數Z的分隔點]]。
@@color:green;要件三:@@[[樣本比例的標準差]]的估計。

有了這些要件之後,利用以下方程式
{{{
信賴區間的右端點 = 「樣本比例」+「標準常態隨機變數Z的分隔點」*「樣本比例的標準差」的估計。
}}}
+++[答案]
$$
\hat p + z_{\alpha/2} \times \sqrt{\hat p \hat q/(n - 1)}
$$
===
以及
{{{
信賴區間的左端點 = 「樣本比例」-「標準常態隨機變數Z的分隔點」*「樣本比例的標準差」的估計。
}}}
+++[答案]
$$
\hat p - z_{\alpha/2} \times \sqrt{\hat p \hat q/(n - 1)}
$$
===
得到答案。
!步驟
# 準備好你的名冊($N$)。【[[實體名冊]]】、【[[理論名冊]]】。
# 根據已知條件,計算需要的樣本數($n$)。
# 根據名冊以及樣本數,準備你的【[[樣本集合]]$S$】。
# 根據經驗或是理論,定義【[[樣本集合]]$S$】的機率分配。
# 利用sample()取得某一個【[[樣本集合]]$S$】。
# 根據【[[樣本集合]]$S$】所提示的名單(通常是一組【編號】或是【電話號碼】),找到對應的【[[物件]]】加以調查。
# 紀錄每一【[[物件]]】的【[[觀察值]]】。
# 萬一,有些【[[物件]]】無法提供【[[觀察值]]】,你必須準備一份【[[備用名單]]】。
| 展場組別 | 其中一位成員 | 最後票數 |
| 1 | 陳建佑 | 5 |
| 2 | 趙玉婷 | 9 |
| 3 | 紀旻秀 | 9 |
| 4 | 王宇汶 | 15 |
| 5 | 張政傑 | 15 |
| 6 | 薛怡汎 | 37 |
| 7 | 鄭佳淇 | 29 |
| 8 | 史怡璿 | 26 |
| 9 | 蔡汶諺 | 26 |
| 10 | 賴炤君 | 4 |
| 11 | 劉憲學 | 22 |
| 12 | 侯佩瑢 | 26 |
| 13 | 林君亭 | 20 |
| 14 | 劉宏均 | 16 |
| 15 | 林予婷 | 5 |
| 16 | 黃思云 | 10 |
| 17 | 塗鈞勇 | 6 |
| 18 | 黃昱誠 | 2 |
| 19 | 吳懿倢 | 5 |
| 20 | 陳昱成 | 3 |
| 21 | 楊玉慈 | 20 |
| 22 | 陳威屹 | 14 |
| 23 | 王典倫 | 3 |
| 24 | 郭士嶧 | 29 |
| 25 | 黃俊霖 | 6 |
| 26 | 李銘峻 | 12 |
| 27 | 吳彥璋 | 9 |
| 28 | 吳忠諺 | 4 |
| 29 | 許閔傑 | 7 |
| 30 | 許世杰 | 16 |
{{{
把初等統計學那一些基礎的統計量整合在一個函示內!
}}}
以下這個故事不是「憑空捏造」,是作者學生的親身經歷。
>
一家垃圾袋的領導品牌生產一種市面上最強而有力的垃圾袋。該公司用一種更強更容易生物分解的塑膠,生產一種新的30加侖垃圾袋。這種塑膠增加的強度可以降低垃圾袋的厚度,而且節省下來的成本可以讓價格降低25%。該公司同時相信新袋子比任何現階段30加侖的袋子都要堅固。

廠商希望在某家主要電視頻道廣告這種新袋子。除了低價促銷外,該公司同時希望主張新袋子對環保是有利的且比其他的袋子堅固。科學上,電視公司被說服這種袋子確實對環境有好處,但是電視公司質疑袋子的強度,認為需要統計證據支持這項主張。雖然有各式各樣垃圾袋的強度測度,廠商與電視公司同意使用一種「撕裂強度」。懸空一只袋子,袋子的撕裂強度等於裝進多少磅數的混合垃圾會撕裂袋子。檢驗顯示現階段通用的袋子,平均撕裂強度非常接近但不會超過50磅。新袋子的平均撕裂強度$\mu$未知且討論中。對立假設$H_1$是我們希望找到證據支持的陳述。因為我們希望新袋子比現在通用的袋子堅固,所以主張$\mu$大於50。利用「陳述」描述正要檢驗的,我們摘要這些假設,
$$
\begin{array}{rcl}
H_0 : \mu \le 50 &vs& H_1 : \mu > 50
\end{array} 
$$
假如某組$n$個袋子的樣本提供充分的證據拒絕$H_0 : \mu \le 50$而偏愛$H_1 : \mu > 50$,那麼電視公司就播出廠商的廣告。
>
+++[語意分析]
!!!背景說明
> 一家垃圾袋的領導品牌生產一種市面上最強而有力的垃圾袋。該公司用一種更強更容易生物分解的塑膠,生產一種新的30加侖垃圾袋。這種塑膠增加的強度可以降低垃圾袋的厚度,而且節省下來的成本可以讓價格降低25%。該公司同時相信新袋子比任何現階段30加侖的袋子都要堅固。
!!!為什麼要研究研究?
> 廠商希望在某家主要電視頻道廣告這種新袋子。除了低價促銷外,該公司同時希望主張新袋子對環保是有利的且比其他的袋子堅固。科學上,電視公司被說服這種袋子確實對環境有好處,但是電視公司質疑袋子的強度,認為需要統計證據支持這項主張。
!!!研究計畫...
> 雖然有各式各樣垃圾袋的強度測度,廠商與電視公司同意使用一種「撕裂強度」。懸空一只袋子,袋子的撕裂強度等於裝進多少磅數的混合垃圾會撕裂袋子。檢驗顯示現階段通用的袋子,平均撕裂強度非常接近但不會超過50磅。新袋子的平均撕裂強度$\mu$未知且討論中。對立假設$H_1$是我們希望找到證據支持的陳述。因為我們希望新袋子比現在通用的袋子堅固,所以主張$\mu$大於50。
!!!一言以蔽之
> 利用「陳述」描述正要檢驗的,我們摘要這些假設,
$$
\begin{array}{rcl}
H_0 : \mu \le 50 &vs& H_1 : \mu > 50
\end{array} 
$$
!!!電視台老闆與垃圾袋公司的合同
> 假如某組$n$個袋子的樣本提供充分的證據拒絕$H_0 : \mu \le 50$而偏愛$H_1 : \mu > 50$,那麼電視公司就播出廠商的廣告。
===
!前言
[[回顧老師第一、二、三次課堂體驗]]
!一段老師完成答案的歷程
+++[打開這一段歷程]
{{{

R version 2.9.0 (2009-04-17)
Copyright (C) 2009 The R Foundation for Statistical Computing
ISBN 3-900051-07-0

R 是免費軟體,不提供任何擔保。
在某些條件下您可以將其自由散布。
用 'license()' 或 'licence()' 來獲得散布的詳細條件。

R 是個合作計劃,有許多人為之做出了貢獻。
用 'contributors()' 來看詳細的情況並且
用 'citation()' 會告訴您如何在出版品中正確地參照 R 或 R 套件。

用 'demo()' 來看一些示範程式,用 'help()' 來檢視線上輔助檔案,或
用 'help.start()' 透過 HTML 瀏覽器來看輔助檔案。
用 'q()' 離開 R。

[R.app GUI 1.28 (5395) i386-apple-darwin8.11.1]

[Workspace restored from /Users/wujungpin/.RData]

> help.search("combination")
> library(BHH2)
> help(subsets)
> subsets(5,3)
      [,1] [,2] [,3]
 [1,]    1    2    3
 [2,]    1    2    4
 [3,]    1    2    5
 [4,]    1    3    4
 [5,]    1    3    5
 [6,]    1    4    5
 [7,]    2    3    4
 [8,]    2    3    5
 [9,]    2    4    5
[10,]    3    4    5
> class(subsets(5,3))
[1] "matrix"
> subsets(5,3,leeters)
錯誤在cbind(v[1], Recall(n - 1, r - 1, v[-1])) : 
  找不到目的物件 'leeters'
> subsets(5,3,leters)
錯誤在cbind(v[1], Recall(n - 1, r - 1, v[-1])) : 
  找不到目的物件 'leters'
> subsets(5,3,letters)
      [,1] [,2] [,3]
 [1,] "a"  "b"  "c" 
 [2,] "a"  "b"  "d" 
 [3,] "a"  "b"  "e" 
 [4,] "a"  "c"  "d" 
 [5,] "a"  "c"  "e" 
 [6,] "a"  "d"  "e" 
 [7,] "b"  "c"  "d" 
 [8,] "b"  "c"  "e" 
 [9,] "b"  "d"  "e" 
[10,] "c"  "d"  "e" 
> N = 4
> 
> n
[1] 100 200
> n = 2
> Cases = subsets(N,n)
> y = c(1,2,4,4)
> y[Cases]
 [1] 1 1 1 2 2 4 2 4 4 4 4 4
> Cases
     [,1] [,2]
[1,]    1    2
[2,]    1    3
[3,]    1    4
[4,]    2    3
[5,]    2    4
[6,]    3    4
> y[t(Cases)]
 [1] 1 2 1 4 1 4 2 4 2 4 4 4
> matrix(y[t(Cases)],6,2)
     [,1] [,2]
[1,]    1    2
[2,]    2    4
[3,]    1    2
[4,]    4    4
[5,]    1    4
[6,]    4    4
> matrix(y[t(Cases)],6,2,byrow=T)
     [,1] [,2]
[1,]    1    2
[2,]    1    4
[3,]    1    4
[4,]    2    4
[5,]    2    4
[6,]    4    4
> 
> 
> 
> SDistTotal = apply(Sample, 1, sum)
錯誤在apply(Sample, 1, sum) : 找不到目的物件 'Sample'
> Sample=matrix(y[t(Cases)],6,2,byrow=T)
> SDistTotal = apply(Sample, 1, sum)
> SDistTotal
[1] 3 5 5 6 6 8
> 
> Frame = cbind(Cases, c(1/3,1/6,0,0,0,1/2))
> Frame
     [,1] [,2]      [,3]
[1,]    1    2 0.3333333
[2,]    1    3 0.1666667
[3,]    1    4 0.0000000
[4,]    2    3 0.0000000
[5,]    2    4 0.0000000
[6,]    3    4 0.5000000
> Frame = cbind(Frame, c(1/2,1/3,2/3,1/2))
Warning message:
In cbind(Frame, c(1/2, 1/3, 2/3, 1/2)) :
  number of rows of result is not a multiple of vector length (arg 2)
> Sample = cbind(Sample, SDistTotal)
> Sample
         SDistTotal
[1,] 1 2          3
[2,] 1 4          5
[3,] 1 4          5
[4,] 2 4          6
[5,] 2 4          6
[6,] 4 4          8
> Sample = matrix(y[t(Cases)],6,2,byrow=T)
> SDistTotal = apply(Sample, 1, sum)
> Sample = cbind(Sample, SDistTotal, c(1/3,1/6,0,0,0,1/2))
> Sample
         SDistTotal          
[1,] 1 2          3 0.3333333
[2,] 1 4          5 0.1666667
[3,] 1 4          5 0.0000000
[4,] 2 4          6 0.0000000
[5,] 2 4          6 0.0000000
[6,] 4 4          8 0.5000000
> 
> Sample = matrix(y[t(Cases)],6,2,byrow=T)
> SDistTotal = apply(Sample, 1, sum) / n * N
> Sample = cbind(Sample, SDistTotal, c(1/3,1/6,0,0,0,1/2))
> 
> Sample
         SDistTotal          
[1,] 1 2          6 0.3333333
[2,] 1 4         10 0.1666667
[3,] 1 4         10 0.0000000
[4,] 2 4         12 0.0000000
[5,] 2 4         12 0.0000000
[6,] 4 4         16 0.5000000
> Sample[,3]*Sample[,4]
[1] 2.000000 1.666667 0.000000 0.000000 0.000000 8.000000
> sum(Sample[,3]*Sample[,4])
[1] 11.66667
> 
> 
> 
> choose(4,2)
[1] 6
> 
> choose(N,n)
[1] 6
> 
> 
> EVtotal = sum(Sample[,3]*Sample[,4])
> EBtotal = EVtotal - sum(y)
> VARtotal = sum((Sample[,3] - EVtotal)^2*Sample[,4])
> MSEtotal = VARtotal + EBtotal^2
> 
> 
> 
> EVtotal
[1] 11.66667
> EBtotal
[1] 0.6666667
> VARtotal
[1] 20.55556
> MSEtotal
[1] 21
> VARtotal + EBtotal^2
[1] 21
> 
> 
> 
> N = 8
> n = 4
> Cases = subsets(N, n)
> 
> prob = rep(1/70, 70)
> 
> y = c(1,2,4,4,7,7,7,8)
> 
> Sample = matrix(y[t(Cases)],choose(N,n),n,byrow=T)
> SDistTotal = apply(Sample, 1, sum) / n * N
> Sample = cbind(Sample, SDistTotal, prob)
> 
> 
> Sample
              SDistTotal       prob
 [1,] 1 2 4 4         22 0.01428571
 [2,] 1 2 4 7         28 0.01428571
 [3,] 1 2 4 7         28 0.01428571
 [4,] 1 2 4 7         28 0.01428571
 [5,] 1 2 4 8         30 0.01428571
 [6,] 1 2 4 7         28 0.01428571
 [7,] 1 2 4 7         28 0.01428571
 [8,] 1 2 4 7         28 0.01428571
 [9,] 1 2 4 8         30 0.01428571
[10,] 1 2 7 7         34 0.01428571
[11,] 1 2 7 7         34 0.01428571
[12,] 1 2 7 8         36 0.01428571
[13,] 1 2 7 7         34 0.01428571
[14,] 1 2 7 8         36 0.01428571
[15,] 1 2 7 8         36 0.01428571
[16,] 1 4 4 7         32 0.01428571
[17,] 1 4 4 7         32 0.01428571
[18,] 1 4 4 7         32 0.01428571
[19,] 1 4 4 8         34 0.01428571
[20,] 1 4 7 7         38 0.01428571
[21,] 1 4 7 7         38 0.01428571
[22,] 1 4 7 8         40 0.01428571
[23,] 1 4 7 7         38 0.01428571
[24,] 1 4 7 8         40 0.01428571
[25,] 1 4 7 8         40 0.01428571
[26,] 1 4 7 7         38 0.01428571
[27,] 1 4 7 7         38 0.01428571
[28,] 1 4 7 8         40 0.01428571
[29,] 1 4 7 7         38 0.01428571
[30,] 1 4 7 8         40 0.01428571
[31,] 1 4 7 8         40 0.01428571
[32,] 1 7 7 7         44 0.01428571
[33,] 1 7 7 8         46 0.01428571
[34,] 1 7 7 8         46 0.01428571
[35,] 1 7 7 8         46 0.01428571
[36,] 2 4 4 7         34 0.01428571
[37,] 2 4 4 7         34 0.01428571
[38,] 2 4 4 7         34 0.01428571
[39,] 2 4 4 8         36 0.01428571
[40,] 2 4 7 7         40 0.01428571
[41,] 2 4 7 7         40 0.01428571
[42,] 2 4 7 8         42 0.01428571
[43,] 2 4 7 7         40 0.01428571
[44,] 2 4 7 8         42 0.01428571
[45,] 2 4 7 8         42 0.01428571
[46,] 2 4 7 7         40 0.01428571
[47,] 2 4 7 7         40 0.01428571
[48,] 2 4 7 8         42 0.01428571
[49,] 2 4 7 7         40 0.01428571
[50,] 2 4 7 8         42 0.01428571
[51,] 2 4 7 8         42 0.01428571
[52,] 2 7 7 7         46 0.01428571
[53,] 2 7 7 8         48 0.01428571
[54,] 2 7 7 8         48 0.01428571
[55,] 2 7 7 8         48 0.01428571
[56,] 4 4 7 7         44 0.01428571
[57,] 4 4 7 7         44 0.01428571
[58,] 4 4 7 8         46 0.01428571
[59,] 4 4 7 7         44 0.01428571
[60,] 4 4 7 8         46 0.01428571
[61,] 4 4 7 8         46 0.01428571
[62,] 4 7 7 7         50 0.01428571
[63,] 4 7 7 8         52 0.01428571
[64,] 4 7 7 8         52 0.01428571
[65,] 4 7 7 8         52 0.01428571
[66,] 4 7 7 7         50 0.01428571
[67,] 4 7 7 8         52 0.01428571
[68,] 4 7 7 8         52 0.01428571
[69,] 4 7 7 8         52 0.01428571
[70,] 7 7 7 8         58 0.01428571
> table(Sample[,3])

 4  7 
17 53 
> table(Sample[,5])

22 28 30 32 34 36 38 40 42 44 46 48 50 52 58 
 1  6  2  3  7  4  6 12  6  4  7  3  2  6  1 
> table(Sample[,5])*1/70

        22         28         30         32         34         36         38         40         42 
0.01428571 0.08571429 0.02857143 0.04285714 0.10000000 0.05714286 0.08571429 0.17142857 0.08571429 
        44         46         48         50         52         58 
0.05714286 0.10000000 0.04285714 0.02857143 0.08571429 0.01428571 
> 
> 
> 
> EVtotal = sum(Sample[,5]*Sample[,6])
> EBtotal = EVtotal - sum(y)
> VARtotal = sum((Sample[,5] - EVtotal)^2*Sample[,6])
> MSEtotal = VARtotal + EBtotal^2
> 
> EVtotal
[1] 40
> VARtotal
[1] 54.85714
> library(epiR)
Package epiR 0.9-15 is loaded
Type help(epi.about) for summary information
> library(help=epiR)
> help(epi.simplesize)
> 
> epi.simplesize(1251, 1/2, 0.03, 0.95)
錯誤在epi.simplesize(1251, 1/2, 0.03, 0.95) : 找不到目的物件 'rval'
> epi.simplesize(1251, 1/2, 0.03, "proportion", 0.95)
[1] 576
> 
}}}
===

!段
{{{
這是第一次整合性介紹。
}}}
!一版
# [[安裝R平台以及所有套件]]。
# [[掌上型計算機可以做的事,R也都可以做得到]]。
# [[R的統計功能無人能比]]。
# [[R的繪圖功能無人能比]]。
# [[函示、函示,我愛你]]。
# [[我想把各種想要的計算工作整合在一個我自己命名的函示]]。
# [[寫個R程式研究樣本平均的統計性質]]。
!二版
# [[先來幾個基本的英文字]]
# [[掌上型計算機可以做的事,R也都可以做得到]]
# [[輸入波士頓公寓數據]]([[波士頓公寓數據]])
# [[隨機抽樣]]
# [[我要算某一個統計量]]
# [[某一個統計量的抽樣分配:以樣本總和為例]]
# [[函示、函示,我愛你]]
!一個關於隨機抽樣的函示
{{{
我的第一個函示!
}}}
!!把以下的程式碼包裝起來...
{{{
library(BHH2)
N = 4
n = 2
Cases = subsets(N, n)

prob = c(1/3,1/6,0,0,0,1/2)

y = c(1,2,4,4)

Sample = matrix(y[t(Cases)],choose(N,n),n,byrow=T)
SampleTotal = apply(Sample, 1, sum) / n * N
Sample = cbind(Sample, SampleTotal, prob)

EVtotal = sum(Sample[,3]*Sample[,4])
EBtotal = EVtotal - sum(y)
VARtotal = sum((Sample[,3] - EVtotal)^2*Sample[,4])
MSEtotal = VARtotal + EBtotal^2
}}}
{{{
# 要R幫你一定要給數字!!!
# 計算母體總和(不可能!!!)
y1+y2+y3
y1=60
y2=50
y1+y2+y3

words
mean(words)

# 按公式計算平均
sum(words)/legth(words)
sum(words)/length(words)

# 按公式計算變異數
sum((words - mean(words))^2)/(length(words) - 1)
}}}
{{{
為什麼挑R?
}}}
理由很簡單:它是免費的。就像老師挑~TiddlyWiki一樣的理由。R是全世界統計專家給這個世界的一份禮物。善用這一份禮物為自己加分,不論你要繼續留在「統計界」,還是你要轉進其他與數據有關的「XX界」。榮彬爸爸盡我最大的腦力與體力,透過這一份~TiddlyWiki跟各位同學、讀者諸君、網友討論R、認識R、使用R、改進R、貢獻R。努力成為R達人。

以下幾個頁面個人覺得你應該會常用到:
<<tabs "" [[挑一個]] "" [[]][[老師開的店]] "" [[老師開的店]][[本店]] "" [[本店]][[維基百科]] "" [[維基百科]][[第一枚搜尋引擎]] "" [[搜尋引擎]][[一位英文R家教]] "" [[一位英文R家教]][[R書不是A書]] "" [[R書]]>>
!指
的是【[[樣本統計量]]】或者是【[[檢定統計量]]】的機率分配。
!為什麼
需要抽樣分配?
!需求...
!!【信賴區間】需要反查表發現
$$
Pr(|\bar X - \mu| \le ?) = 0.95
$$
{{{
一定要知道樣本平均的抽樣分配(機率分配),上述方程式才有解。
}}}
!!【假設檢定】需要查表計算
$$
Pr(\frac{|\bar X - \mu_0|}{S/\sqrt{n}} \ge \frac{|\bar x - \mu_0|}{s/\sqrt{n}}) = ?
$$
{{{
一定要知道檢定統計量的抽樣分配(機率分配),上述方程式才有解。
}}}
!!統計學基本結果
# 【大樣本、母體標準差已知】$\frac{\bar X - \mu}{\sigma/\sqrt{n}} \sim Z$
# 【大樣本、母體標準差未知】$\frac{\bar X - \mu}{S/\sqrt{n}} \sim Z$
# 【小樣本、母體標準差已知、數據來自常態分配】$\frac{\bar X - \mu}{\sigma/\sqrt{n}} \sim Z$
# 【小樣本、母體標準差未知、數據來自常態分配】$\frac{\bar X - \mu}{S/\sqrt{n}} \sim t_{n - 1}$
!!!機率抽樣法
# +++[簡單隨機抽樣]@@color:blue;母體內每一個元素被抽到的機率都是一樣的抽樣方式。@@===

# +++[分層隨機抽樣]@@color:red;根據某些因素把母體分成若干層,然後在每一層進行某一種簡單隨機抽樣。@@===

# +++[群集隨機抽樣]@@color:brown;首先把母體分成若干群集,以簡單隨機抽樣挑選數個群集,然後每一個被選中之群集的元素都是我們的樣本。@@===

# +++[系統隨機抽樣]@@color:green;隨機挑選第一個樣本之後,然後每隔$k$個元素都是樣本。@@===

!!!非機率抽樣法
# +++[方便抽樣]===

# +++[判斷抽樣]===

# +++[自願樣本]===
!!!機率抽樣法
# 簡單隨機抽樣
# 分層隨機抽樣
# 群集隨機抽樣
# 系統隨機抽樣
!!!非機率抽樣法
# 方便抽樣
# 判斷抽樣
# 自願樣本
<<tabs "" [[前測]] "" [[前測]][[抽樣方法]] "" [[抽樣方法]][[例子]] "" [[抽樣設計的例子]][[利用亂數表進行簡單隨機抽樣]] "" [[利用亂數表進行簡單隨機抽樣]][[後測]] "" [[後測]]>>
忠孝國中有1800名學生,其中男女各佔一半。忠孝國中共有三個年級,各個年級都有10個班,而且每一班都60位學生。校方擬抽出120名學生研究該校學生的平均身高。請設計
# 簡單隨機抽樣
# 分層隨機抽樣
# 群集隨機抽樣
# 系統隨機抽樣
# 方便抽樣
# 判斷抽樣
{{{
答案欄(你的答案一定要寫在這裡,否則不計分。)
}}}
|(1)$\mbox{a,d}$ |(2)$\mbox{b}$ |(3)$\mbox{b}$ |(4)$\mbox{b,c}$ |(5)$\mbox{a,b,c}$ |
|(6)$\mbox{a,b,c}$ |(7)$\mbox{a,b,c,d}$ |(8)$\mbox{c}$ |(9)$\mbox{a}$ |(10)$\mbox{c}$ |
|(11)$\mbox{b}$ |(12)$\mbox{a,b,c}$ |(13)$\mbox{a}$ |(14)$\mbox{b}$ |(15)$\mbox{c}$ |
|(16)$\mbox{b}$ |(17)$\mbox{c}$ |(18)$\mbox{a}$ |(19)$\mbox{a,b,c}$ |(20)$\mbox{b,d}$ |
|(21)$\mbox{a,c}$ |(22)$\mbox{d}$ |(23)$\mbox{a}$ |(24)$\mbox{a}$ |(25)$\mbox{c}$ |
----
# (4%)【sample(5)】可能會得到什麼樣的答案:
## @@[1] 3 5 1 4 2@@
## [1] 3 5 1 4 4
## [1] 3 5 3 4 2
## @@[1] 5 4 3 2 1@@
# (4%)【sample(10, 3, T)】會得到幾個樣本?
## 10
## @@3@@
## 以上皆是
## 以上皆非
# (4%)【sample(c(3,7,9), 3, T, prob=c(0,0,1))】會抽到【3】嗎?
## 會
## @@不會@@
## 以上皆是
## 以上皆非
# (4%)假如【B】是一個【3乘5】的【data.frame】,【sample(B, 3)】會抽到?
## 三筆觀察值
## @@三個變數@@
## @@三行@@
## 三列
# (4%)【sample(3, 3, 0)】會得到什麼樣的答案:
## @@[1] 3 2 1@@
## @@[1] 1 3 2@@
## @@以上皆是@@
## 以上皆非
# (4%)【sample(3, 3, 1)】會得到什麼樣的答案:
## @@[1] 3 3 3@@
## @@[1] 1 2 3@@
## @@以上皆是@@
## 以上皆非
# (4%)【$N = 5, n = 2$】,總共有幾個【樣本集合$S$】?
## @@choose(5,2)@@
## @@$C^5_2$@@
## @@$10$@@
## @@以上皆是@@
# (4%)函示【subsets()】來自哪一個套件?
## base
## stat
## @@~BHH2@@
## epiR
# (4%)【subsets(10, 5)】對應哪一個大寫的$N$】?
## @@10@@
## 5
## 以上皆非
## 以上皆是
# (4%)我問了班上兩個人的體重【一個答53公斤、一個答68公斤】,請++++[估計]
$$
\mbox{班上同學體重超過60公斤的機率}
$$
===

## $0.0$
## $1.0$
## @@$0.5$@@
## $0.3$
# (4%)「繼續上一題」。你如何改進上述問題的答案?
## 問更多人
## @@問更多班上的同學@@
## 以上皆是
## 以上皆非
# (4%)【如果我們班每一個人都是19歲,那麼統計系的每一個人也都是19歲?】如何驗證上述命題的真偽?
## @@對統計系每一班10個人作年齡調查@@
## @@找認識的統計系學長姐或學弟妹問他們的年齡@@
## @@要求不是大二的統計系學生拿出身份證驗證年齡@@
## 以上皆非
# (4%)【subsets(10, 5)】會得到哪一個矩陣】?
## @@$252 \times 5$@@
## $5 \times 252$
## 以上皆非
## 以上皆是
# (4%)假設母體是$y = \{2, 2, 4, 4\}$。用【c(1/3,1/6,0,0,0,1/2)】定義樣本集合($S$)的機率分配。請問發生樣本總和$\hat t = 12$的機率是多少?
## $1/3$
## @@$1/6$@@
## $1/2$
## $1/5$
# (4%)「繼續上一題」。請問它的名冊是哪一個集合?
## $\{2, 2, 4, 4\}$
## $\{2, 4\}$
## @@$\{1, 2, 3, 4\}$@@
## 以上皆是
# (4%)「繼續上一題」。樣本總和的平均是多少?
## $12.56667$
## @@$12.66667$@@
## $12.76667$
## $12.86667$
# (4%)「繼續上一題」。樣本總和的$MSE$等於多少?
## $11.33333$
## $12.33333$
## @@$13.33333$@@
## $14.33333$
# (4%)「繼續上一題」。【y[subsets(4,3)]】得到哪一個向量?
## @@[1] 2 2 2 2 2 2 4 4 4 4 4 4@@
## [1] 2 2 4 2 2 4 2 4 4 2 4 4
## 以上皆是
## 以上皆非
# (4%)R語法中的中刮號([])裡面可以放入?
## @@$1.0$@@
## @@$1$@@
## @@以上皆是@@
## 以上皆非
# (4%)「$y_1$」($y$代表某一個我們有興趣的變數)的$1$可能來自哪一個集合?
## 樣本
## @@樣本集合@@
## 母體
## @@名冊@@
# (4%)哪一些主張是正確的?
## @@樣本來自母體。@@
## 樣本集合來自母體。
## @@樣本集合來自名冊。@@
## 名冊來自母體。
# (4%)函示【epi.simplesize()】來自哪一個套件?
## base
## stat
## ~BHH2
## @@epiR@@
# (4%)關於語法【epi.simplesize(N = 1E+06, sd, Py, epsilon, method = "mean", conf.level = 0.95)】,哪一些是正確的?
## @@N跟我們上課慣用的N是同一個。@@
## sd輸入關於母體比例的估計。
## 信心水準只能等於95%。
## 只能針對母體平均計算所需要的樣本數。
# (4%)【epi.simplesize()】適用哪一種母體?
## @@有限母體@@
## 無限母體
## 以上皆是
## 以上皆非
# (4%)【epi.simplesize(N = 278, sd = 30, Py = NA, epsilon = 10, method = "mean", conf.level = 0.95)】的答案是多少?
## [1] 29
## [1] 30
## @@[1] 31@@
## [1] 32
# 課本的第一章
# 課本的第二章
# 課本的第三章
# 隨機抽樣的基本架構
# 樣本總和的相關內容(理論與R)
# 老師的網站內容(尤其是R的部份)
{{{
答案欄(你的答案一定要寫在這裡,否則不計分。)
}}}
|(1)$\mbox{b}$ |(2)$\mbox{a}$ |(3)$\mbox{a}$ |(4)$\mbox{d}$ |(5)$\mbox{d}$ |
|(6)$\mbox{c}$ |(7)$\mbox{a}$ |(8)$\mbox{b,c,d}$ |(9)$\mbox{a,b,c}$ |(10)$\mbox{b}$ |
|(11)$\mbox{c}$ |(12)$\mbox{b}$ |(13)$\mbox{c}$ |(14)$\mbox{a,b,c}$ |(15)$\mbox{b}$ |
|(16)$\mbox{a,b,c}$ |(17)$\mbox{a,b,c,d}$ |(18)$\mbox{a}$ |(19)$\mbox{c}$ |(20)$\mbox{b,d}$ |
|(21)$\mbox{a,b,c}$ |(22)$\mbox{a,c,d}$ |(23)$\mbox{a,c}$ |(24)$\mbox{a,b,c}$ |(25)$\mbox{a,c}$ |
----
# (4%)根據++++[數據]
{{{
2, 3, 5, 7, 11, 13, 17, 19
}}}
===
以及你的計算機,計算它們的「平均」
## 9.525
## @@9.625@@
## 9.725
## 9.825
# (4%)「繼續上一題」。計算它們的「標準差」
## @@6.390562@@
## 6.390563
## 6.390564
## 6.390565
# (4%)「繼續上一題」。這些數據可以放入一個「5乘2」的矩陣嗎?
## @@可以@@
## 不可以
## 以上皆是
## 以上皆非
# (4%)「繼續上一題」。把這一些數據以向量的方式丟給「summary()」,會得到幾個摘要的數字?
## 3
## 4
## 5
## @@6@@
# (4%)「繼續上一題」。同樣地「max()」會得到哪一個數字?
## 2.000
## 9.000
## 14.000
## @@19.000@@
# (4%)「繼續上一題」。如果把這一些數據以向量的方式呈現,請問這一個向量的長度是多少?
## 6
## 7
## @@8@@
## 9
# (4%)「繼續上一題」。如果把這一些數據按順序以向量的方式呈現,並且取名為「x」,請問「x[3]」是哪一個數字?
## @@5@@
## 7
## 11
## 13
# (4%)「繼續上一題」。如果把這一些數據以向量的方式呈現,並且取名為「x」,請問「x[-3]」包含哪一些數字?
## 5
## @@7@@
## @@11@@
## @@13@@
# (4%)「sample()」可以作哪一些事情?
## @@抽樣(sampling)@@
## @@重排(permutation)@@
## @@以上皆是@@
## 以上皆非
# (4%)「sample(3)」是「重排」還是「抽樣」?
## 抽樣(sampling)
## @@重排(permutation)@@
## 以上皆是
## 以上皆非
# (4%)「sample(c(1,2,3), 1, prob=c(1/6, 1/3, 1/2))」,哪一個數字被抽到的機會最大?
## 1
## 2
## @@3@@
## 一樣大
# (4%)「繼續上一題」。是一種「取後放回」還是「取後不放回」抽樣?
## 取後放回
## @@取後不放回@@
## 以上皆是
## 以上皆非
# (4%)「繼續上一題」。如果向量「prob」改成「c(2,3,4)」,那麼抽到數字「1」的機會是多少?
## 2.0
## 1.0
## @@2/9@@
## 3/9
# (4%)把數據讀入R,可以用哪一個函示?
## @@scan()@@
## @@edit()@@
## @@read.table()@@
## write.table()
# (4%)函示「read.table()」得到哪一種物件?
## 矩陣
## @@data.frame@@
## 向量
## 純量
# (4%)以下那些指令可以確定每一回第一次的「sample()」都會得到一樣的答案?
## @@set.seed(123)@@
## @@set.seed(-1)@@
## @@以上皆是@@
## 以上皆非
# (4%)離開R,可以用哪一道指令?
## @@q()@@
## @@quit()@@
## @@quit("yes")@@
## @@quit("no")@@
# (4%)「如果我們班每一個人都是19歲,那麼統計系的每一個人也都是19歲?」哪一句話是樣本得到的結果?
## @@「如果我們班每一個人都是19歲」@@
## 「那麼統計系的每一個人也都是19歲」
## 以上皆是
## 以上皆非
# (4%)什麼是統計學的「估計」?
## 無頭無腦的猜測
## 腦筋急轉彎
## @@有根據的猜測@@
## 科學家的猜測
# (4%)以下哪一些主張是錯誤的?
## @@樣本來自母體。@@
## 樣本來自名冊。
## @@樣本集合只是一堆編號。@@
## 同一次抽樣調查,可以使用好幾份不一樣的名冊。
# (4%)關於函示「sample()」,哪一些論述是正確的?
## @@可以重排一群數字。@@
## @@可以取後放回式抽樣。@@
## @@可以幫你進行隨機抽樣。@@
## 使用時可以設定樣本數等於無限大。
# (4%)關於函示「sd()」,哪一些論述是錯誤的?
## @@計算變異數@@
## 計算標準差
## @@計算中位數@@
## @@以上皆是@@
# (4%)關於「如果我們班每一個人都是19歲,那麼統計系的每一個人也都是19歲?」一般人都會說【NO】這樣的答案。但統計系的學生除了回答【NO】,還要有能力用數據驗證【NO】這個答案。為了驗證,二乙提供以下四個驗證答案的++++[辦法:]
## 對統計系每班10個人作年齡調查
## 找認識的統計系學長姐或學弟妹問他們的年齡
## 要求不是大二的統計系學生拿出身份證驗證年齡
===
哪一些論述是正確的?
## @@第二個答案的辦法一定可行。@@
## 為了得到第二個辦法的答案,我們需要一份統計系完整的名冊。
## @@為了得到第一個辦法的答案,我們需要一份統計系完整的名冊。@@
## 以上皆非
# (4%)以下哪一些答案是「有根據的猜測」?
## @@用樣本平均估計母體平均。@@
## @@用樣本比例估計母體比例。@@
##@@ 用樣本變異數估計母體變異數。@@
## 以上皆非
# (4%)關於這一句話「母體真的有樣本出現的現象嗎?」,哪一些論述是正確的?
## @@這一句話乃說明【統計推論的目的】。@@
## 上面這一句話應該改為「樣本真的有母體出現的現象嗎?」。
## @@「相似」某種程度反應「樣本真的有母體出現的現象」。@@
## 以上皆非
你們那一組準備如何在校園內收集數據的一項滿足統計要求的抽樣計畫。
# [[訪員訓練]](10%):
## [[第一次訪員訓練(5%)|大學生的隨身包包有幾兩重?]]:大學生的隨身包包有幾兩重?
## [[第二次訪員訓練(5%)|大學生的隨身包包有幾本教科書?]]:大學生的隨身包包有幾本教科書?
## 參與訓練的各組(按照[[訪員訓練時間表]]完成所有步驟者屬之)會得到基本分5%。上台報告的表現採加分方式,最高分5%。
## 助教會上BB檢查各組是否完成所有要求的步驟。
# [[第一次小考|2009第一次平常考]](10%)
# [[期中考|2009期中考]](25%)
# [[第二次小考|2009年第二次小考]](25%)
# [[期末考|2009年期末考]](30%):@@上述這四次考試的比例越來越高,除了表示它們彼此之間的重要性,也希望你慢慢上手,分數可以越來越高!@@
# [[期末調查|2009年期末報告]](10%):[[大學生閱讀行為調查]]。參與調查的各組(按照[[訪員訓練時間表]]完成所有步驟者屬之)會得到基本分10%。助教會上BB檢查各組是否完成所有要求的步驟。
----
# @@加分項目:獲選上逢甲電視台報導的各班前四組。加5%。@@
!考試題目可能來自
# 課程用書
# 課程網頁
# R在家實習
# 老師的創意
如果//p//[[值|p值]]小於&alpha;,我們就拒絕虛無假設。
[[指定英文參考書(I)|指定英文參考書(限圖書館內閱讀)]]
[[指定英文參考書(II)|指定英文參考書(不限圖書館內閱讀)]]
[[指定中文參考書]]
# [[A First Course in Statistical Programming With R]]
# [[Data analysis and graphics using R : an example-based approach]]
# [[Bayesian computation with R]]
# [[R graphics]]
# [[A handbook of statistical analyses using R]]
# [[Extending the linear model with R : generalized linear, mixed effects and nonparametric regression models]]
# [[Robust statistical methods with R]]
# [[Linear models with R]]
# [[Using R for introductory statistics]]
# [[An R and ~S-PLUS companion to multivariate analysis]]
# [[Bioinformatics and computational biology solutions using R and Bioconductor]]
# [[Introductory statistics with R]]
# [[Questionnaire design: how to plan, structure, and write survey material for effective market research]]
# [[Software for Data Analysis: Programming with R]]
# [[Applied Spatial Data Analysis with R]]
# [[Data Manipulation with R]]
# [[Probability and Statistics with R]]
# [[Introduction to Probability with R]]
# [[Modern Multivariate Statistical Techniques]]
# [[Statistical Learning from a Regression Perspective]]
# [[Bioconductor Case Studies]]
{{{
一個考一個。
}}}
<html><div align="center"><iframe src ="http://www.dangoldstein.com/search_r.html" width="100%" align="center" height=400"></iframe></div></html>
[img[http://serc.carleton.edu/images/sp/cause/conjecture/examples/mallards2.jpg]]
!!!@@前言@@
基本上,小女孩想知道當母鴨面對這兩種不同顏色的麵包的時候,選擇上沒差別;還是母鴨偏愛綠麵包。因此,我們的研究問題可以轉換成兩種互相排斥的想法:
{{{
虛無假設:母鴨對兩種顏色麵包的偏愛無差別。
}}}
{{{
研究假設:母鴨偏愛綠麵包。
}}}
!!@@Q&A@@
!!!!怎麼寫「研究假設」?
+++[(1)]
當母鴨面對一綠一白麵包的時候,牠選擇撲向綠麵包的機率記做//p//。用//p//這個符號分別改寫研究假設。
+++[答案]===

===
+++[(2)]
我們稱這些必須面對的想法叫做「統計假設」。這一種想法稱為「虛無假設」,因為它代表一種「沒差別」的想法;而第二種想法因為代表一種與虛無假設不一樣的想法:母鴨偏愛綠麵包,所以我們稱它為「對立假設」。請描述為什麼「想法二」與「想法一」並不是完全相反的(一般教科書的說法)?
+++[答案]===

===
!!!!設計實驗收集數據...
+++[(3)]
小女孩隨意在鴨園裡找來十隻母鴨進行實驗。每一隻母鴨都會被安排面對兩塊顏色不一樣的麵包:一塊綠的、一塊白的。小女孩記錄每一隻母鴨先撲向哪一種顏色的麵包。你覺得小女孩這時候應該注意哪一些事項,免得實驗誤差過大?
+++[答案]===

===
!!!!「設計」檢定統計量(一種用來呈現證據的方式),也就是,用什麼方式呈現證據?
+++[(4)]
假設//X//表示最後有幾隻母鴨一開始就撲向綠麵包。假如所有母鴨對綠麵包並沒有偏好,那麼//X//這個隨機變數服從什麼樣的機率分配?
+++[答案]===

===
!!!!!瞭解檢定統計量...
+++[(5)]
相關這分配的機率表,在我們課堂用書的哪幾頁?
+++[答案]===

===
+++[(6)]
假如母鴨不偏愛兩顏色麵包的任何一種,那麼在這種情況下,我們期待會看到幾隻母鴨一開始就撲向綠色的麵包?
+++[答案]===

===
+++[(7)]
觀察到上一題答案的機率是多少?
+++[答案]===

===
+++[(8)]
為什麼上一題的答案不是1.0?
+++[答案]===

===
!!!!數據到手了
+++[(9)]
假設小女孩記錄到有9隻母鴨一開始就撲向綠麵包。如果母鴨並不偏愛哪一種顏色的麵包,那麼觀察到9隻母鴨一開始就撲向綠麵包的機率等於多少?
+++[答案]===

===
!!!!!透過Q&A瞭解數據...
+++[(10)]
你覺得10隻母鴨有9隻先撲向綠麵包,是否讓你有信心認為母鴨喜愛綠色的麵包?請用0到1之間的數字簡述你的信心程度?
+++[答案]===

===
+++[(11)]
如果小女孩觀察到更多隻,你對虛無假設成立的信心是增加還是降低?
+++[答案]===

===
!!!!計算檢定統計量的//p//值
+++[(12)]
那麼如果母鴨不偏愛綠麵包,小女孩觀察到9 隻或超過9隻母鴨一開始撲向綠麵包的機率是多少?
+++[答案]===

===
+++[(13)]
我們用//p//值表示前一小題答案的機率。這一項機率告訴我們證據有多麼不利虛無假設。你認為越大越不利嗎?
+++[答案]===

===
!!!!做決定的時候到了!學習判斷//p//值的大小...
+++[(14)]
你認為小女孩實驗結果的//p//值是大的還是小的呢?
+++[答案]===

===
+++[(15)]
考慮這項機率,你認為虛無假設正確嗎?
+++[答案]===

===
!!!!!假想你是那個「天真可愛的小女孩」...
+++[(16)]
你偏愛那一項假設?
+++[答案]===

===
!!!!!假想你是那個「滿腦子科學思維的小女孩」...
+++[(17)]
根據上述問題的答案,你拒絕還是不拒絕虛無假設?
+++[答案]===

===
+++[(18)]
根據前述這整個流程,寫下這一項研究的結論。
+++[答案]===

===
!!!!檢討時間到了...
+++[(19)]
這樣的研究結果可以解答小女孩心中的疑惑:「公鴨的頭越綠色越漂亮,越有求偶優勢」嗎?如果你覺得有什麼樣的地方不妥,請為小女孩重新設計實驗。
+++[答案]===

===
!!!摘要
@@建構中@@
[img[http://www.sarkisian.net/sc704/data.jpg]]

!!實驗單元、因子、水準、處理、變數、母體、樣本、數據、單位、數字
我有一群老鼠(全世界的老鼠都在我家!!!)。我餵「『一號食譜』跟『台灣啤酒』」給其中幾隻老鼠,餵「『二號食譜』跟『麒麟啤酒』」給另外幾隻老鼠,最後餵「『三號食譜』跟『青島啤酒』」給剩下沒吃到飯跟喝到啤酒的老鼠。一個月後,我測量這些(所有)老鼠的「性別」、「心跳」、「體溫」、「體重」。我得到四個母體。因為我沒有時間「餵所有老鼠」跟「測量所有老鼠」,所以你只會看到「部分老鼠」的「性別」、「心跳」、「體溫」、「體重」的「樣本」。
----
【師生對話】
>師問:上頭哪一句話是錯的?
>生回:全世界的老鼠都在我家!!!
>師問:為什麼?
>生回:因為我家也有老鼠!
----
【關於上述老鼠實驗,請問下述專有名詞指的是內容的哪部份?】

++++[實驗單元]
>老鼠
===
+++[因子]
>食譜、啤酒
===
+++[水準]
>一號、二號、三號食譜是食譜的水準;台灣啤酒、麒麟啤酒、青島啤酒是啤酒的水準
===
+++[處理]
>『一號食譜』跟『台灣啤酒』、『二號食譜』跟『麒麟啤酒』、『三號食譜』跟『青島啤酒』
===
+++[變數]
>「性別」、「心跳」、「體溫」、「體重」
===
+++[母體]
>「全世界老鼠的性別」、「全世界老鼠的心跳」、「全世界老鼠的體溫」、「全世界老鼠的體重」
===
+++[樣本]
>「部分老鼠的性別」、「部分老鼠的心跳」、「部分老鼠的體溫」、「部分老鼠的體重」
===
+++[數據]
>「性別的觀察值」、「心跳的觀察值」、「體溫的觀察值」、「體重的觀察值」
===
+++[單位]
>「性別的單位?」、「心跳的單位?」、「體溫的單位?」、「體重的單位?」
===
+++[數字]
>「性別的數字?」、「心跳的數字?」、「體溫的數字?」、「體重的數字?」
===
!!用「測量尺度」觀察「數據(即所謂的『觀察值』)」
為了得到數據,我們需要一把有刻度(即單位)的尺。這樣的一把尺,統計學的專有名詞叫做「測量尺度」。基本上,有四種測量尺度可以用來測量(measure)觀察值:
# 名目尺度(nominal scale)
# 順序尺度(ordinal scale)
# 區間尺度(interval scale)
# 比例尺度(ratio scale)
我們說某個變數是屬量的(quantitative),假如它的所有可能值是表示數量的數字(即可數「多少」,或是不可數「多少」)。一般而言,用一種數值間有著固定單位的刻度測量屬量變數(quantitative variable)。比如說,假如我們以「一美元計」測量員工的薪資,則一美元是不同員工薪資間的固定測量單位。屬量變數來自兩種類型的測量尺度:比例尺度(ratio scale)與區間尺度(interval scale)。

假如我們只是單純地紀錄某個母體(或樣本)成員落入某些分類中的那一個,那麼該變數是屬性的(qualitative)或者說是類別的(categorical)。有兩種屬性的測量尺度:順序尺度(ordinal scale)與名目尺度(nominal scale)。
----
!!!名目尺度
> 用名目尺度觀察的變數是一種類別變數,而且尺度的分類(categories)之間不具有意義的順序或者是排名。人的性別、車子的顏色、員工的住宿資格等都是名目變數。
++++[問題一]
>女 < 男?
===
++++[問題二]
>(男 + 女)/2 = ?
===
+++[更多例子]
{{{

}}}
===
!!!順序尺度
> 順序尺度的分類間具有意義的順序(ordering)。一種順序尺度的觀察值(有時候也叫做「測量值」)可以是非數值的(nonnumerical),也可以是數值的(numerical)。
>
>比如說,學生被要求用「非常滿意」、「滿意」、「一般」、「不滿意」、「非常不滿意」等五種分類評等某位教授的教學成效。這時候,某項分類是高過下一項分類的,也就是說,「非常滿意」的評價比起「滿意」高;「滿意」的評價比起「一般」高;等等。因此,教學成效是一種非數值型的順序變數。
>
>另外,假如我們用數字4、3、2、1、0分別代表「非常滿意」、「滿意」、「一般」、「不滿意」、「非常不滿意」,那麼教學成效就是一種數值型的順序變數(通常會這麼作)。
++++[問題一]
>滿意 > 不滿意?
===
++++[問題二]
>(滿意 + 不滿意)/2 = 一般(通常是指說「沒意見」)?
===
+++[更多例子]
{{{

}}}
===
++++[實務上的觀點]
> 實務上,通常數字與相對的文字都會提供給被要求評等某人或某物品的應答者(被調查者)。當使用數字的時候,統計學家們爭論順序變數是不是有「那麼一點點屬量」呢?
>>認為4、3、2、1或0不是有那麼一點屬量的統計學家,主張4(非常滿意)跟3(滿意)之間的差距,與3(滿意)跟2(一般)之間的差距並不一樣。
>
>>其他統計學家則主張,當被調查者(學生)看到等距離的數字,他們的反應會被影響到足以使得變數(比如說,教學成效)有那麼一點屬量,即使有文字描述這些數字。
>
>一般而言,跟著數字的具體文字很有可能影響順序變數是否可以被認為有那麼一點屬量。
>
>但是,注意到在實務上,數值型的順序評比通常用屬量的方式分析。比如說,計算某個教授的平均教學成效,與學生的平均成績(注意:美國人的成績用A、B、C、D、F等符號評比)。
===
!!!區間尺度
> 區間尺度是一種數值間比例不具意義且沒有定義數字0的測量尺度。華式溫度是一種用區間尺度測量的變數。實務上,除了溫度、時間與商數(比如說,智商)外很少有區間變數。幾乎所有屬量變數都是比例的。
++++[問題一]
>華式0度是什麼意思?
+++[答案]華式0度並不代表「一點溫度也沒有」,只是「非常冷」。因此華式溫度並不具有定義的0。
===
===
++++[問題二]
>華式60度比華式30度 = 華式20度比華式10度?
+++[答案]再者,華式溫度間的比例是沒有意義的。比如說,華式60度比華式30度來得兩倍暖和是沒有意義的。
===
===
+++[更多例子]
{{{
時間、智商
}}}
===
!!!比例尺度
> 比例尺度的數值間的可以帶出有意義的比例,而且數字0是有定義的。諸如,薪資、身高、體重、與距離都是比例變數。比如說,距離0公里表示「一點距離也沒有」,而一個30哩遠的城鎮比起一個15公里遠的城鎮是兩倍遠。
++++[問題一]
>薪資單上頭印個「0」是什麼意思?
===
++++[問題二]
>30元 / 15元 = 60元 / 30元?
===
+++[更多例子]
{{{

}}}
===
!!!例子一:波士頓公寓數據
| 編號 | 要價 | 房間數 | 朝向 | 洗衣機/乾衣機 | 暖氣 |
| 1 | 168,000 | 2 | E | Y | Y |
| 2 | 152,000 | 2 | N | N | Y |
| 3 | 187,000 | 3 | N | Y | Y |
| 4 | 142,500 | 1 | W | N | N |
| 5 | 166,800 | 2 | W | Y | N |
請問:
# 有哪些變數?
# 這些變數都是「可量測的」嗎?
# 有哪些屬量變數?
# 有哪些屬性變數?
# 哪些變數是連續的?
# 哪些變數是離散的?
# 有哪些名目尺度的變數?
# 有哪些順序尺度的變數?
# 有哪些區間尺度的變數?
# 有哪些比例尺度的變數?
# 「朝向」這個變數有哪些選項?
# 「要價」這個變數有哪些選項?
>【課堂活動】
>>請用眼睛採礦(挖覺)【波士頓公寓數據】,找出這些數據之間的關係。
----
[img[http://www.sarkisian.net/sc704/data.jpg]]
<<tabs "" [[一定要懂的專有名詞]] "" [[專有名詞親屬圖]][[波士頓公寓數據]] "" [[波士頓公寓數據]][[測量尺度]] "" [[測量尺度]][[名目尺度]] "" [[名目尺度]][[順序尺度]] "" [[順序尺度]][[區間尺度]] "" [[區間尺度]][[比例尺度]] "" [[比例尺度]]>>
1.圖書館咖啡廳
2.資電管外榕樹&燈(或者EZCAFE)
3.忠勤樓地下一樓

晚上科航館前的小徑(賣鬆餅前面那條小路)

體育館的外觀

逢甲—學思園

學思園水池裡的『睡蓮』

學思園

鷹揚廣場

桌椅

逢甲大學體育設施

第一個為"商店"(EX:學校的餐廳、學校的咖啡廳....等等)。
第二個為"樓梯"(即各大樓的樓梯類型比較)。

第一招待所 附近的杜鵑花

涼亭

不為人知的歷史:地攤後面的石版畫

松鼠

工學館內的露天造景

學校教室課桌椅

1.招待所2.夜市像口石版畫3.水舞池

消防栓

逢甲飲水機

航太館

福星女宿

逢甲大學的燈

課桌椅

教室的課桌椅

街景
!紙本報告(投稿逢甲大學ePaper)
*  篇名頁(插入浮水印的位置)
* 中(英)文摘要與關鍵字
* 目錄
* (圖目錄)
* (表目錄)
* 報告本文(依章節順序)
## [[研究假設]]:報告各組發展研究假設的過程。
## [[研究工具]]、必須包含
### 問卷設計:提供問卷設計的完整流程,與最後的成果:問卷。
### 抽樣計畫:提供取得數據的抽樣計畫,含樣本數細節。有效問卷與無效問卷的份數。為什麼問卷是無效的?收集數據的工具。提供各組實地取得數據的證據。
### 分析方法:提供分析數據的細節。必須舉例說明。
### 軟體工具:提供各組分析用的R程式
## [[統計結論]]
### 提供R程式的輸出結果。
### 根據R的輸出,論述統計結論。
## [[評論]]
* 參考文獻
* (附錄 )
什麼是最大概似估計法?
{{{

}}}
最大概似法的基本步驟如下:
# 根據隨機樣本的機率分配假設,找到該分配的函數型式。
# 定義已知隨機樣本下,分配參數的概似函數。
# 取概似函數對分配參數的偏微分,並且令結果等於0。
# 解上述步驟得到的方程組。答案就是最大概似估計。
!!!例子一
假設一組隨機樣本$y_1, y_2, \cdots, y_n$來自平均$\mu$且變異數$\sigma^2$的常態母體,發現平均跟變異數的最大概似估計。
【步驟一】
$$
f(x) = \frac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{(x - \mu)^2}{2 \sigma^2}}
$$
【步驟二】
$$
\begin{eqnarray}
L(\mu, \sigma^2 | y_1, y_2, \cdots, y_n) & = & \Pi_{i=1}^n f(y_i) \\
& = & \Pi_{i=1}^n \frac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{(y_i - \mu)^2}{2 \sigma^2}} \\
& = & (2 \pi \sigma^2)^{-\frac{n}{2}} e^{-\frac{\sum_{i=1}^n (y_i - \mu)^2}{2 \sigma^2}} \\
\end{eqnarray}
$$
找上述這一個函數的最大值發生在哪裡,比較困難。通常我們會在等號的左右兩邊取自然對數,因為自然對數是一種單調遞增函數,所以對結果不會有影響。取完自然對數的結果記作
$$
\begin{eqnarray}
l(\mu, \sigma^2 | y_1, y_2, \cdots, y_n) & = & -\frac{n}{2} \times \ln{(2 \pi \sigma^2)} - \frac{\sum_{i=1}^n (y_i - \mu)^2}{2 \sigma^2} \\
\end{eqnarray}
$$
【步驟三】
$$
\frac{\partial l}{\partial \mu} = - \frac{1}{2 \sigma^2} \times 2 \times \sum_{i=1}^n (y_i - \mu) \times (-1)
$$
$$
\frac{\partial l}{\partial \sigma^2} = -\frac{n}{2} \times \frac{2 \pi}{2 \pi \sigma^2} - \frac{1}{2} \times \sum_{i=1}^n (y_i - \mu)^2 \times (-1) \times \frac{1}{(\sigma^2)^2}
$$
所以解最大概似估計所需的方程組如下:
$$
\begin{eqnarray}
\sum_{i=1}^n (y_i - \hat \mu) & = & 0 \\
n - \frac{\sum_{i=1}^n (y_i - \hat \mu)^2}{\hat \sigma^2} & = & 0 \\
\end{eqnarray}
$$
【步驟四】
解上述步驟得到的方程組,我們發現平均$\mu$的最大概似估計是
$$
\hat \mu = \bar y
$$
而變異數$\sigma^2$的最大概似估計是
$$
\hat \sigma^2 = \frac{\sum_{i=1}^n (y_i - \bar y)^2}{n}
$$
----
!!!本段結語
{{{
很明顯讀者需要微積分基本定理跟耐心。
}}}
# [[第二次小考|2009抽樣調查第二次小考]]的答案已經公布。
# ++++[補課消息]
{{{
甲班1/11號考試前補課10分鐘。請09:00入場。
}}}
===

# ++++[符號更正]
除了
$\hat S^2 = s^2$
增加
$\hat S_t^2 = s_t^2$
----
===

# ++++[甲班口頭報告前四名]
{{{
18, 19 , 21, 22
}}}
===

# ++++[乙班口頭報告前四名]
{{{
10, 14, 17, 19
}}}
===

# ++++[關於報導文稿]
{{{
各位

報導文稿
其實
就是你前言與三段結論的總和
也就是
前言
加上
二段小結論
再加上
一段總結

所以不需要最後再來一段報導文稿!

}}}
===

# ++++[01/04, 05]
{{{
要帶英漢字典來上課
}}}
===

# ++++[各分組的討論區]
{{{
各位

即日起
請各分組把你們那一組各項關於實習的要求和訓練成果
通通放在自己的組別內
以利評分
開放時間直到學期結束
但是
關於課堂口頭報告的相關規定不變
}}}
===

# [[抽樣調查評比計畫]]已更新。
# [[訪員訓練時間表|訪員訓練時間表]]初版已經上線。請事先參考,若有疑義,請上課討論。
# @@期中考的助教時間:週一、二、三的下午一點到四點;小考助教的時間:週一中午12點到下午兩點、週二下午一點到兩點。@@
# 【[[第一次小考|第一次小考的範圍]]】要改++++[時間。]
{{{
時間定在11/07早上09:00 ~ 11:00。
}}}
===

# 第一次小考與期中考範圍已經公佈。請由預定進度表進入。
# 統二甲這個禮拜(10/05~10/09)的功課
## 完成BB的各項討論。
## 用課堂上教過的直方圖函示hist()以及盒形圖函示boxplot(),利用課本第26頁的數據自行體驗【相似】的真義。
# 統二乙這個禮拜(10/05~10/09)的功課
## 完成BB的各項討論。
## 眾數的R名稱。
## 用課堂上教過的直方圖函示hist()以及盒形圖函示boxplot(),利用課本第26頁的數據自行體驗【相似】的真義。
# 統二乙下週上課要帶計算機。
# 統二甲這個禮拜(09/28~10/02)的功課
## 把[[大家來找碴]]的答案鍵入BB。
## 眾數的R名稱。
## 把[[序]]、[[目錄]]、[[作者簡介]]內不知道的部份圈起來。
# [[抽樣調查評比計畫]]已更新。
# 請各位修二甲抽樣調查的同學在一週內上學校BB的討論區完成電影觀賞感言。
* [[成果展投票結果]]已經上線,請參考。
* 成果展的投票活動將在週五(06/19)下午四點結束。請各位把握時間。
* [[2009期末考]]的答案--即將--已經上線。
* 週五09:00到10:00以及12:00到13:00接受繳交報告。
* --週五10:30開始接受繳交報告。--
* 週五繳交的報告電子檔,請把它燒在CD,照片的也一併燒入。另外,必須附上你們那一組的原始資料檔。如果你在R內直接鍵入你的數據,請用write.table把原始資料寫入某一個檔案,再燒錄至CD。最後,各組報告要完整呈現你們的故事,也就是完成這一份偉大報告的整個過程,加上賺人熱淚的小故事。
* 請手邊有統資期末審查照片的同學,利用週五早上交報告的時間,把相片檔案燒成光碟交給我,謝謝。
* 所有我同意補考的學生,請於06/24早上十點到商1035找我補考。
* 請第二次審查未過的各組前往圖書館觀摩已經通過二次審查各組的成果。
* 書面報告一定要當面交給我。
* 06/12/2009是紙本報告繳交日(最後一天)。關於「自評」跟「互評」部分請放在紙本的最後面。電子檔案不需要「自評」跟「互評」的部分。請各位善用「自評」跟「互評」論斷自己以及其他組員在這一次期末報告的表現。
* 第二次審查沒過的組別,請利用週四早上0900到0930之間,商1035找我複審。
* 期末考主要內容:
** 第二次小考之後的講義內容。
** 以及相關的R。
** 題目以R串連。
** 原卷作答。如果在答案欄找不到答案不計分。
** 作答時,請詳細閱讀考卷的注意事項。
** 這一回不准看講義或是任何其他資料。
* 請參考這一組
[img[http://i299.photobucket.com/albums/mm318/jungpinwu/template.jpg]]
* [[分析數據的樣板]]已經上線。請參考。
* 請用R的【//Name// = data.frame(); //Name// = edit(//Name//)】輸入你的數據。
{{{
第二次小考要帶講義、英漢漢英字典跟計算機。
}}}
* [[第二次小考|2009第二次小考]]的考試地點是資電學院102, 103, 107, 108。
* 【任海峽】與【楊美婷】助教的時間:每週三下午1:00到5:00。地點:商學院七樓研究室(或者對面電腦室)
* [[第二次小考|2009第二次小考]]的考試題型至少包含
** 程式填充題
** 用程式還原數據
** 用CASIO計算機發現R程式碼的答案
** 包裝R程式碼的樣板
* [[期中考|2009期中考]]的參考答案已經公佈。
* 關於逢甲大學的【小而美】
>【長廊】、【水】、【麻雀】、【松鼠】、【榕樹】、...
* 關於期末報告的問卷設計
>這一回問卷是為了收集支持各組研究假設的數據。上學期我們不管數據分析(這部份是其他學長姐的工作),但是這學期各組必須有能力分析收回來的數據,加上因為不一樣的分析方法需要不一樣型態的數據,所以設計問卷的時候必須同時考慮你準備採用什麼分析工具(譬如說,二項比例的假設檢定、常態平均的假設檢定、連續數據母體平均的假設檢定、...、$t$檢定、卡方檢定、變異數分析以及後變異數分析技巧、無母數分析技巧、...)。
* 再一次關於期末報告
>老師期待各位利用這一次報告的機會發現【逢甲大學的美(景)】。有些景可能早上比較美、有些景可能沒人穿梭期間的時候比較美、有些景說不定下雨天比較美、...。老師建議各組多花一點時間細心發現【逢甲大學的美】。
* 關於期末報告
>雖然我訂定的報告名稱叫做【逢甲大學十大小而美大調查】,但是我無意決定【十大】是哪十大!各組自行決定自己【關愛的眼神】。透過對選定主題的了解與認識,自行訂定各組的研究假設。各位關愛的焦點是逢甲大學【小而美】的主體。要【小】要【美】。請注意:人永遠是逢甲大學的客體。
* [[期中考|2009期中考]]的範圍如下:
** 瓦得檢定
** 概似比檢定
** 分數檢定
** 利用反轉技巧發現信賴區間
** 最大概似估計法、最大概似估計式、最大概似估計、最大概似估計式的性質
** binom.test()、prop.test()
** 二項比例小樣本檢定
** [[2009第一次平常考]]考過的R 
* [[2009第一次平常考]]的參考答案已經公佈了。
* 主選單【MainMenu】已經改版。
* 預計3/21號早上9點到11點,甲班在商學院302跟304教室、乙班在商學院308跟309教室舉行第一次平常考。考試範圍擇日另行通知。
* 3/10開始直到3/20,任何正當理由都可以跟吳老師為第一次平常考請假,只有請假的修課學生才能參加第一次平常考的補考。補考時間擇日另行通知。
* 個人化的最新消息
{{{
注意網頁右手邊的日期跟該日的最新內容。
}}}
<html><div align="center"><br><a href="http://www.maploco.com/view.php?id=3218468"><img border=0 src="http://www.maploco.com/vmap/3218468.png" alt="Visitor Map"></a><br><a href="http://www.maploco.com/">Create your own visitor map!</a><br></div></html>
[[一篇廣告詞]]
[[波士頓公寓數據]]
[[綠頭鴨的實驗]]
<<tabs "" [[符號的意義]] "" [[期望值符號的意義]][[如何計算E(X)?]] "" [[如何計算E(X)?]][[如何計算E(h(X))?]] "" [[如何計算E(h(X))?]][[為什麼E(aX+b)=aE(X)+b?]] "" [[為什麼E(aX+b)=aE(X)+b?]][[關於E(aX+b)的a跟b]] "" [[關於E(aX+b)的a跟b]][[關於E(aX+b)=aE(X)+b的用途]] "" [[關於E(aX+b)=aE(X)+b的用途]]>>

<<tabs "" [[挑一個]] "" [[]][[E(aX+b)=aE(X)+b還是aE(X)+b=E(aX+b)?]] "" [[E(aX+b)=aE(X)+b還是aE(X)+b=E(aX+b)?]][[E(X)跟X的關係是什麼?]] "" [[E(X)跟X的關係是什麼?]]>>
# $E(X)$:隨機變數$X$的期望值。這時候根據定義,隨機變數$X$的期望值就是隨機變數$X$的機率分配的平均。
# $E(h(X))$:隨機變數$h(X)$的期望值。
# $E(X^2)$:隨機變數$X^2$的期望值。
# $E(e^X)$:隨機變數$e^X$的期望值,其中$e$代表自然對數函數的底數。
# $E(aX+b)$:隨機變數$aX+b$的期望值,其中$a$跟$b$分別是某個固定的數字。
<html><div align="center"><iframe src ="http://www.r-project.org/" width="100%" align="center" height=400"></iframe></div></html>
{{{
目標:樣本總和的抽樣分配。
}}}
!解決這一個問題,你需要什麼?
{{{

}}}
+++[Q1]
!!計算這一項機率需要什麼?
$$
P(y > 60) = ?
$$
其中$y$是體重。
!!!答案一
因為我問到一個人答50,一個人答60,所以答案是0。
!!!答案二
根據以下這一個分配:
| $y$ | 40 | 50 | 60 | 70 |
| $p$ | 1/4 | 1/4 | 1/4 | 1/4 |
所以答案是1/4。
!!哪一個答案是母體的答案?
!!哪一個答案是樣本的答案?
!!你覺得哪一個答案才是【某一個統計量的抽樣分配】這一個議題下的答案。
===
+++[Q2]
!假設
# Index Set = {1, 2, 3} (意味著$N = 3$)
# $n = 2$
!可能的樣本集合
# $S_1 = \{1, 2\}$
# $S_2 = \{1, 3\}$
# $S_3 = \{2, 3\}$
!進一步假設$S$的機率分配
# $P(S_1) = 1/3$
# $P(S_2) = 1/6$
# $P(S_3) = 1/2$
!帶出名冊內每一個單元(比如說,人、豬、樹、...)
# $\pi_1 = 1/3 + 1/6 = ?$
# $\pi_2 = 1/3 + 1/2 = ?$
# $\pi_3 = 1/6 + 1/2 = ?$
!再假設
# 我們有興趣【人的體重】,並且用$y$表示之
# 所以母體是$\{y_1, y_2, y_3\}$
!樣本總和的各種可能
# $\frac{y_1+y_2}{2} \times 3$(有這個可能是因為我們抽到$S_1$)
# $\frac{y_1+y_3}{2} \times 3$(有這個可能是因為我們抽到$S_2$)
# $\frac{y_2+y_3}{2} \times 3$(有這個可能是因為我們抽到$S_3$)
!寫下【樣本總和的抽樣分配】
| $\hat t$ | $\frac{y_1+y_2}{2} \times 3$ | $\frac{y_1+y_3}{2} \times 3$ | $\frac{y_2+y_3}{2} \times 3$ |
| $p(\hat t)$ | +++[A]1/3=== | +++[A]1/6=== | +++[A]1/2=== |
!計算樣本總和的四大性質
# $E(\hat t) = ???$
# $Bias(\hat t) = ???$
# $V(\hat t) = ???$
# $MSE(\hat t) = ???$
===
++++[你來給理由...]
$$
\begin{array}{rcl}
0.95 & = & Pr(|\bar X - \mu| \le x_{\alpha}) \\
 & = & Pr(\frac{|\bar X - \mu|}{\sigma/\sqrt{n}} \le \frac{x_{\alpha}}{\sigma/\sqrt{n}}) \\
 & \approx & Pr(|Z| \le \frac{x_{\alpha}}{\sigma/\sqrt{n}}) \\
\end{array}
$$
$$
\begin{array}{rcl}
\frac{x_{\alpha}}{\sigma/\sqrt{n}} & = & z_{(1 - 0.95)/2} \\
x_{\alpha} & = & z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \\
\end{array}
$$
!!!
$$
\begin{array}{rcl}
|\bar X - \mu| & \le & z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \\
\end{array}
$$
===
----
+++[老師的講解...]
$$
\begin{array}{rcl}
0.95 & = & Pr(|\bar X - \mu| \le x_{\alpha}) \\
 & = & Pr(\frac{|\bar X - \mu|}{\sigma/\sqrt{n}} \le \frac{x_{\alpha}}{\sigma/\sqrt{n}}) \\
 & \approx & Pr(|Z| \le \frac{x_{\alpha}}{\sigma/\sqrt{n}}) \\
\end{array}
$$
$$
\begin{array}{rcl}
\frac{x_{\alpha}}{\sigma/\sqrt{n}} & = & z_{(1 - 0.95)/2} \\
x_{\alpha} & = & z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \\
\end{array}
$$
!!!
$$
\begin{array}{rcl}
|\bar X - \mu| & \le & z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \\
\end{array}
$$
===
!困境
!目標
$$
H_0: \beta = \beta_0
$$
!概似比檢定之檢定統計量的一般型式
$$
\chi^2 = -2\log(l_0/l_1)
$$
其中$l_0$是虛無假設下概似函數的最大值,而$l_1$則是概似函數的全域最大值。如果只有一個參數,比如說$\beta$,那麼$l_0 = l(\beta_0)$而且$l_0 = l(\hat \beta)$,$\hat \beta$是$\beta$的最大概似估計。
!關於二項比例
!!虛無假設
$$
H_0: p = p_0
$$
!!對立假設
!!!左尾
$$
H_1: p < p_0
$$
!!!右尾
$$
H_1: p > p_0
$$
!!!雙尾
$$
H_1: p \ne p_0
$$
!!!檢定二項比例之概似比檢定統計量
$$
\chi^2 = -2\log(l(p_0)/l(\hat p))
$$
!!!計算檢定的p值
+++[開始找答案...]
# 發現[[檢定統計量]]的抽樣分配?
# 確定假設(檢定)的方向?也就是,研究假設的方向?也就是,不利虛無假設的方向?
# 根據上述問題的答案,計算檢定的p值:
## +++[左尾]
$$
Pr(\chi^2_1 \le \chi^2).
$$
===

## +++[右尾]
{{{

}}}
===

## +++[雙尾]
{{{

}}}
===

===
$$
\frac{n_{ij} - \frac{n_{i.} \times n_{.j}}{n_{..}}}{\sqrt{(\frac{n_{i.} \times n_{.j}}{n_{..}})(1 - \frac{n_{i.}}{n_{..}})(1 - \frac{n_{.j}}{n_{..}})}} \approx Z
$$
$$
N(0, 1^2)
$$
----
【課堂練習】
>【Q6】標準常態分配(標準常態隨機變數)的平均是多少?
>【Q7】標準常態分配(標準常態隨機變數)的變異數是多少?
>【Q8】標準常態分配(標準常態隨機變數)的標準差是多少?
!簡單隨機抽樣的數學代號
# (物件總數)$N$
# (名冊)$\{1, 2, 3, \dots, N\}$
# (樣本數)$n$
# (樣本集合)$S_i, i = 1, 2, \cdots, C^N_n$
# (有興趣的變數)$y$
# (母體)$\{y_1, y_2, \cdots, y_N\}$
# (樣本)$\{y_j | j \in S_i\}$
# (樣本平均)$\bar y$
# (樣本總和)$\hat t = N \times \bar y$
# $E(\bar y)$
# $V(\bar y)$
# $E(\hat t)$
# $V(\hat t)$
----
$$
V(\bar y) = ?
$$
----
# $\bar y$的表示法。
# $E(\bar y)$
# $E(Z_i)$
# $V(Z_i)$
# $E(Z_i Z_j)$
# $Cov(Z_i, Z_j)$
# $V(\bar y)$
如果(一組伯努利隨機樣本)
$$
X_1, X_2, \cdots, X_n \sim^{iid} BER(p)
$$
那麼統計量
$$
\hat p = \frac{X_1 + X_2 + \cdots + X_n}{n}
$$
叫做樣本比例。
$$
\hat p - p
$$
!樣本比例的小樣本與大樣本的抽樣分配
<<tabs "" [[挑一個開始]] "" [[]][[$\hat p$的抽樣分配]] "" [[$\hat p$的抽樣分配]][[中央極限定理]] "" [[中央極限定理]]>>
!R命令
<<tabs "" [[挑一個開始]] "" [[]][[R跟抽樣分配]] "" [[R topics related to sampling distributions]]>>
純粹樣本(含樣本數)的函數。比如說樣本平均
$$
\frac{x_1 + x_2 + \cdots + x_n}{n}
$$
只要把隨機樣本內的數字加上樣本數代入上述的公式就可以有答案(某一個數字)。
!如何得到下述的機率?
$$
P(\hat t < 60) = ?
$$
----
我們需要【樣本總和$\hat t$的抽樣分配】,因為這是一個機率問題,加上問題的主角是【樣本總和】。
!樣本總和之抽樣分配的定義
各種【樣本集合$S$】都會帶出一項【樣本總和】(樣本總和用來估計母體總和),把所有$S$的$\hat t$以及發生的機率列表,就會得到【樣本總和的抽樣分配】。
# +++[平均(expected value)]
$$
E(\hat t) = \sum \hat t \times P(\hat t)
$$
===

# +++[偏離(estimation bias)]
$$
Bias = E(\hat t) - t
$$
===

# +++[變異數(variance)]
$$
V(\hat t) = E[(\hat t - E(\hat t))^2] = E(\hat t^2) - (E(\hat t))^2
$$
===

# +++[均方差(mean squared error)]
$$
MSE = V(\hat t) + Bias^2
$$
===

----
# unbiased (偏離等於0)
# precise (變異數夠小)
# accurate (均方差夠小)
{{{
名冊的部份集合。
}}}
//Name// = @@function@@(//~INPUTs//)
{

}
!例子:比例差距的大樣本檢定
//Name// = @@function@@(//n11//, //n12//, //n21//, //n22//, //~NULLvalue//)
{

}
!發展過程:
# 準備相關的數學公式
# 圈出公式內所有不一樣的符號
# 為公式的每一個符號取名字
# 公式先寫
# 準備工作
# 計算p值
# 拒絕?還是不拒絕?
----
# +++[準備相關的數學公式]
===

# +++[圈出公式內所有不一樣的符號]
===

# +++[為公式的每一個符號取名字]
# (符號:)
# (符號:)
# (符號:)
# (符號:)
# (符號:)
===

# +++[公式先寫]
* 全寫在一行
{{{

}}}
* 分段寫
{{{

}}}
===

# +++[準備工作]
{{{
計算公式的答案需要哪一些資訊?
}}}
#
#
#
#
#
===

# +++[計算p值]
{{{
準備公式
}}}
* 分段寫
{{{

}}}
* 全寫在一行
{{{

}}}
===

# +++[拒絕?還是不拒絕?]
{{{
決策法則:
}}}
* 分段寫
{{{

}}}
* 全寫在一行
{{{

}}}
===
檢定統計量跟樣本統計量不一樣。回憶我們曾經見過的四項統計學基本結果
# 【大樣本、母體標準差已知】$\frac{\bar X - \mu}{\sigma/\sqrt{n}} \sim Z$
# 【大樣本、母體標準差未知】$\frac{\bar X - \mu}{S/\sqrt{n}} \sim Z$
# 【小樣本、母體標準差已知、數據來自常態分配】$\frac{\bar X - \mu}{\sigma/\sqrt{n}} \sim Z$
# 【小樣本、母體標準差未知、數據來自常態分配】$\frac{\bar X - \mu}{S/\sqrt{n}} \sim t_{n - 1}$
這些結果的左邊公式就可以拿來當作是檢定統計量。它們的特徵是
# 有樣本統計量;
# 有目標參數,比如說,上述結果中的$\mu$;
# 是可計算的,也就是說,左邊公式本身可以帶出某個數字;而且它的抽樣分配也是清楚知道的(簡單說,就是有表可以查!)。
$$
|\bar X - \mu|
$$
!困境
$|\bar X - \mu|$是「樣本平均估計母體平均的估計誤差」。它是「不可計算的」,因為沒有人知道母體平均$\mu$的真正大小。
++++[你來給理由...]
$$
\begin{array}{rcl}
|\bar X - \mu| & \le & z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \\
|\mu - \bar X| & \le & z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \\
\end{array}
$$
$$
\begin{array}{c}
- z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \le \mu - \bar X \le z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \\
\bar X - z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \le \mu \le  \bar X + z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \\
\end{array}
$$
!!!
$$
\begin{array}{c}
\mu \in  \bar X \pm z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \\
\end{array}
$$
===
----
+++[老師的講解...]
$$
\begin{array}{rcl}
|\bar X - \mu| & \le & z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \\
|\mu - \bar X| & \le & z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \\
\end{array}
$$
$$
\begin{array}{c}
- z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \le \mu - \bar X \le z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \\
\bar X - z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \le \mu \le  \bar X + z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \\
\end{array}
$$
!!!
$$
\begin{array}{c}
\mu \in  \bar X \pm z_{(1 - 0.95)/2} \times \sigma/\sqrt{n} \\
\end{array}
$$
===
<<tabs "" [[挑一個]] "" [[]][[母體比例的大樣本信賴區間]] "" [[母體比例的大樣本信賴區間]][[母體比例的小樣本信賴區間]] "" [[母體比例的小樣本信賴區間]]>>
<<tabs "" [[假設]] "" [[關於母體比例的研究假設]][[檢定統計量]] "" [[母體比例的檢定統計量]][[計算p值]] "" [[計算母體比例假設檢定的p值]]>>
!!!大樣本...
關於這個問題,我們先處理比較簡單的情形:

<html><font size="3" color="#00f">樣本是某一種大樣本。也就是說,「樣本數」乘以「樣本比例」以及「樣本數」乘以「1.0減去樣本比例」都至少是5,或者是10。</font></html>

既然是「大樣本」,我們就可以根據[[中央極限定理]]得到[[樣本比例]]的抽樣分配:
{{{

}}}
+++[答案]
$$
\hat P \sim \mbox{N}(p, pq/\sqrt{n})
$$
===
我們可以利用以下幾種途徑得到「母體比例的大樣本信賴區間」:
* 途徑一:循我們推導「母體平均的大樣本信賴區間」的過程,
* 途徑二:觀察「母體平均的大樣本信賴區間」的構成要件:
<<tabs "" [[途徑一]] "" [[得到母體比例大樣本信賴區間的途徑一]][[途徑二]] "" [[得到母體比例大樣本信賴區間的途徑二]]>>
!!!定理:$\sqrt{\hat p \hat q/(n - 1)}$是$\sqrt{pq/n}$的估計。
!!!小樣本...(進階內容)
我們曾經在上學期學過,不論樣本數//n//的多寡,[[樣本比例]]的抽樣分配都是某一種二項分配
{{{

}}}
原因是「樣本比例的分子,『樣本總和』與『樣本比例』的關係是一對一的」,所以「『樣本比例』與『樣本總和』有著同樣的抽樣分配,二項分配」。有了樣本比例的抽樣分配這一項資訊之後,我們可以依循以下的步驟得到「母體比例的小樣本信賴區間」:

@@color:red;步驟一:@@計算「樣本比例」。
@@color:red;步驟二:@@因為不是所有的二項分配都是「對稱的」,所以「誤差機率,&alpha;」不一定要均分給分配的左尾跟右尾。加上二項分配是離散的(機率分配),並不是說要怎麼分配&alpha;就可以怎麼分配!因此這時候你必須搭配「二項機率表」尋求合理合適的方式均分誤差機率,&alpha;。然後「反查表」得到「二項分配的分割點」
@@color:red;步驟三:@@計算「樣本比例的標準差」的估計。
@@color:red;步驟四:@@把前述三個步驟得到的答案,利用

{{{
信賴區間的右端點 = 「樣本比例」+「二項分配的右尾分隔點」*「樣本比例的標準差」的估計。
}}}
以及
{{{
信賴區間的左端點 = 「樣本比例」-「二項分配的左尾分隔點」*「樣本比例的標準差」的估計。
}}}
得到答案。
如果滿足大樣本
$$
\frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0)/n}} \sim Z
$$
$$
t = \sum_{i=1}^N y_i
$$
!範例
| 1 | 2 | 3 | 4 |
| $y_1$ | $y_2$ | $y_3$ | $y_4$ |
因此
$$
t = y_1 + y_2 + y_3 + y_4
$$
| 週次 | 時間 | 實錄 | 備註 |
| 09 | 11/16, 17 |三人一組、各組找到上逢甲電視台的人選、數你的字典有幾個字(term)、用剛剛算的每一頁得到數字估計你的字典有幾個字、甲班分工合作到各個學院大樓調查大二班級活動上課時間與地點(71個班)、發小考考卷並且討論答案、發期中考考卷並且討論答案、說明訪員訓練的科目:【大學生的隨身包包幾兩重】;【大學生的隨身包包有幾本教科書】;【大學生閱讀行為調查】、說明本課程預定介紹的抽樣設計有四種:【簡單隨機抽樣】;【分層抽樣, 99-100】;【群集抽樣, 134-135】;【系統抽樣】、用簡單隨機抽樣估計課本第171頁有多少中文字(610)、寫下關於「閱讀」的20個關鍵字並且把結果PO在BB上、介紹讀書力、你認為【如何知道一本字典有幾個字?】、你認為【如何知道逢甲大學有幾棵榕樹?】、再論【簡單隨機抽樣】、預告下次上課的理論重點$V(\bar y)$跟$V(\hat t)$ ||
| 10 | 11/23, 24 |發放訪員訓練時間表、確定分組名單、解釋訪員訓練時間表、發放大學生閱讀行為調查問卷、填寫大學生閱讀行為調查問卷、討論如何編碼一份問卷的單選題與複選題(課堂練習)、討論大學生閱讀行為調查問卷之編碼以及第一次練習的要求、進入講義的第44、45頁、為$V(\bar y)$樣本平均變異數的八個等號加理由(課堂練習)、先解釋第一個跟第二個等號的理由、給$Cov(a+b+c, a+b+c)$、調查全班的進度(已經會了幾個等號?)、詳細講授這八個等號的理由以及板書、進入中國醫藥大學提供的投影片資料並且稍加說明與統計系可能的相異之處、進入研究流程、針對大學生閱讀行為調查問卷模擬研究流程(課堂練習)、根據大學生閱讀行為調查問卷規劃的問題練習寫假說(每一組都上台表演寫一段假說)、討論大家寫在黑板上的假說並且給予某種程度的指導、要求所有人把各組的假說抄回家(各組的假說列入考試範圍)。 ||
| 11 | 11/30, 12/01 |發還第一次小考考卷、用三張大學生閱讀行為問卷換一張大學生閱讀行為問卷的影印版(要求兩位同學協助紀錄繳交狀況)、檢核第一次合併資料的練習成果(一組一組來、紀錄各組可能出現的問題,並且要求更正再次上傳)、要求各組把第一次合併(我的大學生閱讀行為調查結果三筆或是四筆)結果上傳、繼續討論【大學生閱讀行為調查問卷】可以探討的假說、製作一個大表紀錄全班各組的假說、嘗試把中文書寫的假說換成統計符號書寫的假說、要求乙班的高福聰告訴我哪一題假說改寫起來最簡單(第14組的假說:超過五成的大學生最常到圖書館閱讀。單選的第12題可以支撐這一項假說的正確性)?、把乙班第14組的假說改寫成:$H_1: p > 0.5$、告訴學生【大學生閱讀行為調查】的問卷列入考試範圍、改寫假說也是必考題項、書寫假說的注意事項:(1)不必要寫【假設】這個詞,(2)【影響】這個詞不過明確,無法轉譯為統計假說、【超過五成】是比例、【相關】是rho, $\rho$、【為主】代表超過五成、【越來越怎樣】代表斜率、書寫比例的時候用下標表示第幾個選項、【比較】帶出兩個參數的假設檢定、【平常人】、【多元的】、【逢甲】、【宅男】、【購買慾望】、@@假說不要出現問卷以外的字眼@@、@@時間到開始照相就不能再改了@@、$H_1$不能有等號、各組成果照相存證並且列入考試範圍、@@【合併全班的大學生閱讀行為調查結果】@@、開始討論企劃一份問卷的前置作業(第一章到第十章)、何謂問卷調查、徵集受訪者是什麼意思?、5W1H的思考模式、問卷的種類、指定自行閱讀的章節(第三章到第十章)、訂定調查區塊、用R隨機指定調查區塊(可以互換)、確定各組調查區塊(存檔)。 ||
| 12 | 12/07, 08|更動訪員訓練時間表的大學生閱讀行為調查時間以及吃飯時間、檢查合併數據的成果(大學生閱讀行為以及隨身包包的重量)、圖示簡單隨機抽樣、圖示分層抽樣、分層抽樣理論、問卷設計的注意事項、照片並無法確切證明全組參與以及反應實際調查實景、分辨母體參數與樣本統計量、符號、$N_h$, $n_h$, $t_h$, $\bar y_{U,h}$, $S^2_h$, $t$, $\bar y_U$, $S^2$, $\hat t_h$, $\bar y_h$, $\hat S^2_h$, $\hat t$, $\bar y$, $\hat S^2$、$V(\hat t)$, $V(\bar y)$、$\hat{V(\hat t)}$, $\hat{V(\bar y)}$、建構個個參數的公式、建構個個統計量的計算公式、分層抽樣練習題一(Exercise 4.4)、分層抽樣練習題二(EX4.2)、 ||
| 13 | 12/14, 15 |分層抽樣練習題一(Exercise 4.4)、分層抽樣練習題二(EX4.2)、繼續分層抽樣的理論探討、分辨母體參數與樣本統計量、符號、$N_h$, $n_h$, $t_h$, $\bar y_{U,h}$, $S^2_h$, $t$, $\bar y_U$, $S^2$, $\hat t_h$, $\bar y_h$, $\hat S^2_h$, $\hat t$, $\bar y$, $\hat S^2$、$V(\hat t)$, $V(\bar y)$、$\hat{V(\hat t)}$, $\hat{V(\bar y)}$、製表列出所有數量(參數與統計量)的答案、討論練習題的答案、t = total、$\bar{\,\,}$表示平均(不論地球還是月球!)、$\hat{\,\,}$表示估計(不論你在哪裡?)、估計一定要用到樣本、(死)背與(聯)想的不同、表列計算結果的最主要目的:得到$\hat{V(\hat t)}$跟$\hat{V(\bar y)}$、如何決定分層的樣本數?、按$N_h$的比例分配總樣本數、最佳(小)化成本的分配法、最佳化成本分配法的$S_h$問題、分層抽樣可以用來估計英漢字典收錄多少單字嗎?、字典如何被分層?、抽樣字典的抽樣單位是什麼?(頁)、圖示群集抽樣、乙班誤餐費定為5000元(每人75塊)、甲班誤餐費定為6000元(每人75塊)、發下各責任班級的問侯函、交代下週報告的某些注意事項、發公佈欄要求大家各組儘快把數據上傳到BB、發公佈欄提醒【關於下一個階段的數據分析】、發佈【關於報導文稿 】的公佈欄、公佈【閱讀行為調查新聞稿】 ||
| 14 | 12/21, 22 |各組5分鐘第一次上台報告【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的分析結果與報導文稿、[[關於第二次報告有以下的注意事項]]、[[關於報導文稿]]、[[第一次同儕評量表]]、[[沒參與者此段成績給零]] ||
| 15 | 12/28, 29 |全程錄影各組5分鐘第二次上台報告【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的分析結果與報導文稿、[[第二次同儕評量表(含評論)]]、[[沒參與者此段成績給零]] ||
| 16 | 01/04, 05 |問卷題目設計的忌諱(下學期繼續)、[[四種主要抽樣技術的代號]]、ss(sampling unit、抽樣單元)、psu(primary sampling unit、主抽樣單元)、ssu(second sampling unit、副抽樣單元)、再論利用分層抽樣估計字典收錄了多少字?($N_h$)、圖示群集抽樣、群集抽樣理論、[[一個群集抽樣的例子:以統計系八個班為例]]、[[等機率群集抽樣]]、[[不等機率群集抽樣]]、[[一階段群集抽樣]]、[[兩階段群集抽樣]]、群集抽樣的符號系統、$N$、$M_i$、$K$、$S$、$S_i$、$y_{ij}$、$t_i$、$t$、$S_t^2$、$\bar y_U$、$\bar y_{i,U}$、$S^2$、$S_i^2$、$n$、$m_i$、$\bar y_i$、$\hat t_i$、$\hat t$、$s_t^2$、$s_i^2$、[[用統計系為例各個符號的意思]]、[[用字典為例各個符號的意思]]、群集抽樣字典的主抽樣單元是什麼?(字母)、群集抽樣字典的副抽樣單元是什麼?(頁)、實習字典的兩階段群集抽樣、[[我的字典之NMK]]、我會看到什麼樣的觀察值:群集抽樣字典的$y_{ij}$、[[一個觀察字典的例子與它們關於總數的估計]]、[[估計等於零的時候!]]、取三組分享兩階段群集抽樣字典的結果、利用群集抽樣估計字典收錄了多少字、[[第一種估計收錄多少字的辦法:以主抽樣單元為軸的放大估計式]]、[[第二種估計收錄多少字的辦法:以副抽樣單元為軸的放大估計式]]、[[第三種估計收錄多少字的辦法:以主抽樣單元為軸加上總和的放大估計式]]、[[三種變異數的估計]]、$\hat S_t^2$、$\hat S^2$、$\hat S_i^2$、系統抽樣理論、圖解系統抽樣、如何挑第一個?、接著決定跳幾個?、下一個會更好! ||
| 17 | 01/11 |[[公佈各班報告可以加分的前四名]]、第二次平常考、繳交責任包、一起午餐 ||
> 比例尺度的數值間的可以帶出有意義的比例,而且數字0是有定義的。諸如,薪資、身高、體重、與距離都是比例變數。比如說,距離0公里表示「一點距離也沒有」,而一個30哩遠的城鎮比起一個15公里遠的城鎮是兩倍遠。
++++[問題一]
>薪資單上頭印個「0」是什麼意思?
===
++++[問題二]
>30元 / 15元 = 60元 / 30元?
===
+++[更多例子]
{{{

}}}
===
!【步驟一】虛無假設與對立假設
!!虛無假設
$$
H_0: p_1 = p_2
$$
!!對立假設
$$
H_1: p_1 \ne p_2
$$
!!改寫虛無與對立假設
$$
H_0: p_1 - p_2 = 0 \mbox{ vs } H_1: p_1 - p_2 \ne 0
$$
!【步驟二】設計檢定統計量
【開始設計】
>【提示】樣本比例其實是一種特殊的樣本平均。
+++[...]===

!【步驟三】發現虛無假設成立時檢定統計量的抽樣分配
【開始設計】
>【提示】樣本比例其實是一種特殊的樣本平均。
+++[...]
因為
$$
E(\hat p_1 - \hat p_2) = E(\hat p_1) - E(\hat p_2) = p_1 - p_2
$$
以及
$$
V(\hat p_1 - \hat p_2) = V(\hat p_1) + V(\hat p_2) = \frac{p_1(1 - p_1)}{n_1} + \frac{p_2(1 - p_2)}{n_2}
$$
所以
$$
\frac{(\hat p_1 - \hat p_2) - (p_1 - p_2)}{\sqrt{\frac{\hat p_1(1 - \hat p_1)}{n_1} + \frac{\hat p_2(1 - \hat p_2)}{n_2}}} \approx N(0, 1^2)
$$
帶出虛無假設成立下,檢定統計量的抽樣分配
$$
\frac{\hat p_1 - \hat p_2}{\sqrt{\frac{\hat p_1(1 - \hat p_1)}{n_1} + \frac{\hat p_2(1 - \hat p_2)}{n_2}}} \approx N(0, 1^2)
$$
===

!!換成【列總和固定之列聯表】的問題
+++[...]
$$
\frac{\hat p_{11} - \hat p_{21}}{\sqrt{\frac{\hat p_{11}(1 - \hat p_{11})}{n_{1.}} + \frac{\hat p_{21}(1 - \hat p_{21})}{n_{2.}}}} \approx N(0, 1^2)
$$
接著把$p_{11} = n_{11}/n_{1.}$以及$p_{21} = n_{21}/n_{2.}$代入上式得知
$$
\frac{n_{11}/n_{1.} - n_{21}/n_{2.}}{\sqrt{\frac{n_{11}/n_{1.}(1 - n_{11}/n_{1.})}{n_{1.}} + \frac{n_{21}/n_{2.}(1 - n_{21}/n_{2.})}{n_{2.}}}} \approx N(0, 1^2)
$$
----
===

+++[為什麼總和固定之列聯表無法進行上述的分析???]
{{{
因為...所以...
}}}
===

!【步驟四】計算$p$值
+++[...]
$$
2 \times Pr(Z \ge z (=\frac{\hat p_1 - \hat p_2}{\sqrt{\frac{\hat p_1(1 - \hat p_1)}{n_1} + \frac{\hat p_2(1 - \hat p_2)}{n_2}}})) = 2 \times (0.5 - TA(z)), \mbox{假如???}
$$
===

!比例差距的信賴區間
!!瓦得
$$
(\hat p_1 - \hat p_2) \pm z_{0.025} \times \sqrt{\frac{\hat p_1(1 - \hat p_1)}{n_1} + \frac{\hat p_2(1 - \hat p_2)}{n_2}}
$$
!!分數
{{{
無解!!!
}}}
> 除了低價促銷外,該公司同時希望主張新袋子對環保是有利的且比其他的袋子堅固。
根據「電視台老闆與垃圾袋公司的合同」,
> 假如某組$n$個袋子的樣本提供充分的證據拒絕$H_0 : \mu \le 50$而偏愛$H_1 : \mu > 50$,那麼電視公司就播出廠商的廣告。
換言之,只要結論是$\mu > 50$,那麼電視公司就播出廠商的廣告。
!!!「拒絕」還是「不拒絕」?如果某組$n$個袋子的樣本提供以下的樣本平均:
+++[47.6262]===
+++[48.6898]===
+++[49.8280]===
+++[50.6048]===
+++[50.8459]===
+++[53.3593]===
+++[53.3800]===
+++[56.3385]===
!!!!
+++[實際上]
這一些樣本平均來自$N(50, 2^2)$
{{{
> round(sort(rnorm(8)*2+50), 4)
[1] 47.6262 48.6898 49.8280 50.6048 50.8459 53.3593 53.3800 56.3385
>
}}}
===
!!!兩種錯誤
+++[型I錯誤]
> 拒絕正確的$H_0 : \mu \le 50$,偏愛錯誤的$H_1 : \mu > 50$,以致於「播出+++[不實]垃圾袋的強度實際上不是市面上最強===的廣告」。
+++[電視台老闆因為這樣的錯誤要付出什麼樣的代價?]+++[官司纏身]+++[Always]NO===+++[Sometimes]+++[How frequent?]0.20, 0.10, 0.05, 0.01, 0.001============
===
+++[型II錯誤]
> 不拒絕錯誤的$H_0 : \mu \le 50$,以致於「沒播出+++[真實]垃圾袋的強度實際上是市面上最強===的廣告」。
+++[電視台老闆因為這樣的錯誤要付出什麼樣的代價?]公司倒閉===
===
!!!沒有永遠正確的決策
+++[電視台老闆如何避免犯下型I錯誤?]
+++[答案]
{{{
永遠不拒絕虛無假設。
}}}
===

+++[為什麼?]
{{{
因為只有「拒絕虛無假設」才會發生「型I錯誤」。
}}}
===

+++[但是]
{{{
這時候「犯下型II錯誤」的機率是多少?
}}}
+++[答案]===
===
===
+++[電視台老闆如何避免犯下型II錯誤?]
+++[答案]
{{{
永遠拒絕虛無假設。
}}}
===

+++[為什麼?]
{{{
因為只有「不拒絕虛無假設」才會發生「型I錯誤」。
}}}
===

+++[但是]
{{{
但是這時候「犯下型I錯誤」的機率是多少?
}}}
+++[答案]===
===
===
!!!結論
|>||>| 決策 |
|~|~| !不拒絕$H_0$ | !拒絕$H_0$ |
| 真實狀況 | !$\mu \le 50 (H_0)$ | 沒播出一種錯誤主張的廣告 |bgcolor:blue;color:white; +++[播出一種錯誤主張的廣告]型I錯誤=== |
|~| !$\mu > 50 (H_1)$ |bgcolor:orange;color:white; +++[沒播出一種正確主張的廣告]型II錯誤=== | 播出一種正確主張的廣告|
<<tabs "" [[原始數據]] "" [[波士頓公寓數據(I)]][[認識波士頓公寓數據]] "" [[波士頓公寓數據(II)]][[眼睛採礦]] "" [[波士頓公寓數據(III)]]>>
| 編號 | 要價 | 房間數 | 朝向 | 洗衣機/乾衣機 | 暖氣 |
| 1 | 168,000 | 2 | E | Y | Y |
| 2 | 152,000 | 2 | N | N | Y |
| 3 | 187,000 | 3 | N | Y | Y |
| 4 | 142,500 | 1 | W | N | N |
| 5 | 166,800 | 2 | W | Y | N |
| 編號 | 要價 | 房間數 | 朝向 | 洗衣機/乾衣機 | 暖氣 |
| 1 | 168,000 | 2 | E | Y | Y |
| 2 | 152,000 | 2 | N | N | Y |
| 3 | 187,000 | 3 | N | Y | Y |
| 4 | 142,500 | 1 | W | N | N |
| 5 | 166,800 | 2 | W | Y | N |
請問:
# 有哪些變數?
# 這些變數都是「可量測的」嗎?
# 有哪些屬量變數?
# 有哪些屬性變數?
# 哪些變數是連續的?
# 哪些變數是離散的?
# 有哪些名目尺度的變數?
# 有哪些順序尺度的變數?
# 有哪些區間尺度的變數?
# 有哪些比例尺度的變數?
# 「朝向」這個變數有哪些選項?
# 「要價」這個變數有哪些選項?
!!請用眼睛採礦(挖覺)【波士頓公寓數據】,找出這些數據之間的關係。
| 編號 | 要價 | 房間數 | 朝向 | 洗衣機/乾衣機 | 暖氣 |
| 1 | 168,000 | 2 | E | Y | Y |
| 2 | 152,000 | 2 | N | N | Y |
| 3 | 187,000 | 3 | N | Y | Y |
| 4 | 142,500 | 1 | W | N | N |
| 5 | 166,800 | 2 | W | Y | N |
+++[參考答案]
# 公寓的要價隨著房間數的增加而增高
# 有洗\乾衣機的公寓要價都在160,000以上,而且都比沒有洗\乾衣機的公寓高;即表示有無洗\乾衣機會影響公寓的要價
# 公寓的朝向對於要價並無影響
# 朝向西的公寓均無暖氣,因此推論西向的公寓對於暖氣的需求較低
# 有無洗\乾衣機對於公寓要價的影響大於有無暖氣對於公寓要價的影響
===
一張方寸大小的珍珠板(請注意觀摩期間你在展場看到的珍珠板就是你的展示舞台。)將呈現各組近兩個半月的工作與研究成果。製作海報的原則:
{{{
將紙本報告摘要在一張珍珠板上。
}}}
# 必要內容(千萬不要給你的觀眾四張紙!)
## 主題
## 照片(你可以透過排版讓照片跟介紹文字更具廣告效果!)
## 問卷(你可以【柔和】你的寫真照片與文字優美的問卷!)
## 統計結果的【圖】或是【表】(雖然支持研究假設只需要一個數字,但是科學之外,加一點人文或藝術會讓你的報告更有說服力!)
## 結論(請以逢甲大學的觀點,文武兼備地論述努力得到的科學結果。)
# 加分內容(這一部份是配角!如果反客為主,勢必帶來反效果!注意:珍珠板大小並不能放進太多的內容!)
## 創意
## 美編
{{{
matrix(y[t(Cases)],choose(N,n),n,byrow=T)
}}}
!!用「測量尺度」觀察「數據(即所謂的『觀察值』)」
為了得到數據,我們需要一把有刻度(即單位)的尺。這樣的一把尺,統計學的專有名詞叫做「測量尺度」。基本上,有四種測量尺度可以用來測量(measure)觀察值:
# 名目尺度(nominal scale)
# 順序尺度(ordinal scale)
# 區間尺度(interval scale)
# 比例尺度(ratio scale)
我們說某個變數是屬量的(quantitative),假如它的所有可能值是表示數量的數字(即可數「多少」,或是不可數「多少」)。一般而言,用一種數值間有著固定單位的刻度測量屬量變數(quantitative variable)。比如說,假如我們以「一美元計」測量員工的薪資,則一美元是不同員工薪資間的固定測量單位。屬量變數來自兩種類型的測量尺度:比例尺度(ratio scale)與區間尺度(interval scale)。

假如我們只是單純地紀錄某個母體(或樣本)成員落入某些分類中的那一個,那麼該變數是屬性的(qualitative)或者說是類別的(categorical)。有兩種屬性的測量尺度:順序尺度(ordinal scale)與名目尺度(nominal scale)。
----
!背景
>Only the investigators in the study can say how much precision is needed!

> The desired precision is often expressed in absolute terms, as
$$
P(|\bar y - \bar y_U| \le e) = 1 - \alpha
$$
!我們必須想辦法把$e$跟$n$關連起來!
!!最簡單的方式
{{{
信賴區間
}}}
$$
e = z_{\alpha/2} \sqrt{1 - \frac{n}{N}} \frac{S}{\sqrt{n}}
$$
!!但是大一老師教我
$$
e = z_{\alpha/2} \frac{S}{\sqrt{n}}
$$
----
上式得到的結果:
$$
n = \frac{z_{\alpha/2}^2 S^2}{e^2 + \frac{z_{\alpha/2}^2 S^2}{N}} = \frac{n_0}{1 + \frac{n_0}{N}}
$$
下式得到的結果:
$$
n = \frac{z_{\alpha/2}^2 S^2}{e^2} = n_0
$$
!!差別在哪裡?
{{{

}}}
!繼續參考...
[[公式內各種符號的本質]]
我想利用$E(h(X))$的定義計算$E(aX+b)$($E(aX+b)=aE(X)+b$這個式子的左手邊。)
$$
\begin{eqnarray}
E(aX+b) & = & (a \times x_1 + b) \times Pr(x_1) + (a \times x_2 + b) \times Pr(x_2) + \cdots + (a \times x_k + b) \times Pr(x_k) \\
              & = & a \times (x_1 \times Pr(x_1) + x_2 \times Pr(x_2) + \cdots + x_k \times Pr(x_k)) + b \times (Pr(x_1) + Pr(x_2) + \cdots + Pr(x_k)) \\
              & = & a \times E(X) + b \times 1 \\
              & = & aE(X) + b \\
\end{eqnarray}
$$
倒數第二個等號會對的理由,乃根據$E(X)$的定義以及「所有狀況的機率總和等於1.0」等兩項理由。
{{{
請參考課本第二章的公式。
}}}
可以用數位相機取得標的景點的照片。要兼顧寫實與氣氛。
{{{
人、豬、樹、班級、學校、縣市、...
}}}
!檢定統計量
$$
\chi^2 = -2\log(\frac{\mbox{虛無假設下概似函數的最大值}}{\mbox{概似函數的全域最大值}})
$$
經過【努力】,檢定統計量最後被化簡為
$$
G^2 = 2 \sum_{i=1}^r \sum_{j=1}^c O_{ij} \log(\frac{O_{ij}}{E_{ij}})
$$
----
【提醒】
>獨立性的卡方檢定統計量被統計學家取名為$X^2$,也就是說
$$
X^2 = \sum_{i=1}^r \sum_{j=1}^c \frac{(O_{ij} - E_{ij})^2}{E_{ij}} \approx \chi^2_{(r - 1)(c - 1)}
$$
而且它的大樣本抽樣分配接近自由度$(r - 1)(c - 1)$的卡方分配。
----
!檢定統計量的抽樣分配
$$
G^2 = 2 \sum_{i=1}^r \sum_{j=1}^c O_{ij} \log(\frac{O_{ij}}{E_{ij}}) \approx \chi^2_{(r - 1)(c - 1)}
$$
!專有名詞
$$
G^2
$$
叫做【概似比卡方檢定統計量】。
$$
X^2
$$
叫做【皮爾參卡方檢定統計量】。
!獨立抽樣(列總和固定的列聯表)
!!設計一(失衡設計)
$$
y_{11}, y_{12}, \cdots, y_{1, n_1} \sim^{iid} Binom(n = 1, p)
$$
$$
y_{11}, y_{12}, \cdots, y_{1, n_1} \sim^{iid} Binom(n = 1, p)
$$
!!設計二(平衡設計)
$$
y_{\mbox{男},1}, y_{\mbox{女},1}, y_{\mbox{男},2}, y_{\mbox{女},2}, \cdots,y_{\mbox{男},n}, y_{\mbox{女},n} 
$$
!相依設計(總和固定的列聯表)
$$
y_{1}, y_{2}, \cdots, y_{n} \sim^{iid} Binom(n = 1, p)
$$
# 五分鐘總結報告
# 表演收集數據的那一段
# 展示珍珠板
$$
\{1, 2, 3, \dots, N\}
$$
!目標
$$
H_0: \beta = \beta_0
$$
!瓦得檢定之檢定統計量的一般型式
$$
z = \frac{\hat \beta - \beta_0}{SE(\hat \beta)}
$$
其中$\hat \beta$是$\beta$的最大概似估計。
!關於二項比例
!!虛無假設
$$
H_0: p = p_0
$$
!!對立假設
!!!左尾
$$
H_1: p < p_0
$$
!!!右尾
$$
H_1: p > p_0
$$
!!!雙尾
$$
H_1: p \ne p_0
$$
!!!檢定二項比例之瓦得檢定統計量
$$
z = \frac{\hat p - p_0}{\sqrt{\hat p (1 - \hat p)/n}}
$$
!!!計算檢定的p值
+++[開始找答案...]
# 發現[[檢定統計量]]的抽樣分配?
# 確定假設(檢定)的方向?也就是,研究假設的方向?也就是,不利虛無假設的方向?
# 根據上述問題的答案,計算檢定的p值:
## +++[左尾]
$$
Pr(Z \le z) = 0.5 - TA(z), z < 0; = 0.5 + TA(z), z > 0.
$$
===

## +++[右尾]
{{{

}}}
===

## +++[雙尾]
{{{

}}}
===

===
因為二項隨機變數是一連串獨立同分配伯努利隨機變數的總和(sum),所以我們可以用下面這一句R命令(R command)得到一筆二項數據
> sum(sample(x = c(0, 1), size = 4, replace = TRUE, prob = c(0.8, 0.2)))
現在我們令(指定)$n = 4$而且$p = 0.2$。

上面這一句話應該會讓你有點失望。吳老師不是說要降低我的英文負擔嗎?怎麼說話不算話!

以下這一句R命令也可以得到一筆二項數據,
> rbinom(n = 1, size = 4, prob = 0.2)
其中「r」代表「random」,而「binom」就是反應我們的習慣,$Binom(n=4, p)$。「size = 4」代表伯努利試驗的次數等於4,「n = 1」表示我們只想得到一筆二項數據,「prob = 0.2」定義伯努利試驗的成功機率($p$)。
----
【課堂練習題】
>【Q1】用sample()得到一筆成功機率等於0.8的伯努利數據。
>【Q2】用sample()得到十筆成功機率等於0.8的伯努利數據。
>【Q3】用rbinom()得到兩筆試驗次數等於5而且成功機率等於0.8的二項數據。
通常如果手邊沒有真實的數據,我們會用電腦程式幫我們產生「假的數據」。所謂假的數據,其實也不是那麼假!數學家發明一種隨機(randomization)的機制,而統計學家針對某些現實世界的現象提出一套模擬的機制,利用數學家的隨機機制產生滿足某些條件的數據。比如說,一組獨立同分配的伯努利數據必須滿足那些條件呢?
【條件一】每一次觀察不是看到成功(1)就是失敗(0)。不會有第三種可能。
【條件二】每一次看到成功,也就是觀察到1的機會是固定的。
【條件三】下一次觀察到成功還是失敗,不受上一次的影響。
----
想像你有一口袋子,
# 每一次觀察都是從同樣的袋子內撈紙籤,而且知道是成功紙籤還是失敗紙籤之後,會把剛剛撈到的紙籤放回去袋子內(+++[滿足]條件二===)。這樣的撈紙籤方式叫做「取後放回」。其實撈紙籤就是我們已經學過的「抽樣」。
# 裡面放著「成功」與「失敗」的紙籤(+++[滿足]條件一===)。我們可以用0跟1的紙籤,好節省時間。
# 不在紙籤上坐記號、動任何手腳,並且每一次都是不一樣的人撈紙籤;或是前面那個人手感不見後,再繼續撈紙籤(+++[滿足]條件三===)。【你同意老師這樣的說法嗎?】
----
+++[用R產生伯努利數據]
R提供的袋子叫做
{{{
c()
}}}
把成功(1)以及失敗(0)放入袋子,就這麼容易
> c(0, 1)
抽樣的英文,你絕對不能忘記,sample【動】。取後放回,R的講法是
{{{
replace = TRUE
}}}
所以要得到一個伯努利數據,只要告訴R下面這句話
> sample(x = c(0, 1), size = 1, replace = TRUE, prob = c(0.8, 0.2))
「x」是袋子的名字。就像你在袋子外打個叉作記號一樣。「size」是「sample size」,就是抽樣的樣本數。用prob = c(0.8, 0.2)定義伯努利試驗的失敗與成功機率,現在分別是0.8跟0.2(這是講義的例子)。
===
{{{
rnorm(n, mean = 0, sd = 1)
}}}
# 「norm」代表「normal」的前面四個英文字母。
# 「mean」代表「平均」,就是符號$N(\mu, \sigma^2)$的$\mu$。
# 「sd」代表「standard deviation」,標準差,也就是符號$N(\mu, \sigma^2)$的$\sigma$。
----
* 如果你++++[「說(用你的手打一些英文字加鍵盤上的符號,然後按一下「enter (return)鍵」)」]
> rnorm(10)
表示你想取得10個來自標準常態分配的隨機數字(官話叫做「亂數」)。
===

* 如果++++[是]
> rnorm(10, mean = 1)
表示你想取得10個來自常態分配$N(1, 1^2)$的亂數。
===
----
【課堂練習】
>【Q1】取得100個來自$N(1, 10^2)$的亂數。
>【Q2】你認為下面這個R命令是什麼意思?
{{{
rnorm(30, 0, 3)
}}}
>【Q3】以下的命令跟【Q2】的結果一樣嗎?
{{{
rnorm(0, 3, n = 30)
}}}
{{{
stats = scan()
stats
stat=stats
stats = scan()
464
480
464
480
480
464
464
stat=c(stat, stats)
stats = scan()
length(stats)
stat
length(stat)
stats = c(stat, stats).
stats = c(stat, stats)
length(stats)
table(stats)
hist(stats)
mean(stats)
var(stats)
sd(stats)
max(stats)
min(stats)
range(stats)
stats
stats
stats[c(10,48,01,50,11,53,60,20,64)]
mean(stats[c(10,48,01,50,11,53,60,20,64)])
sd(stats[c(10,48,01,50,11,53,60,20,64)])
stats[c(12,65,22,59,57)]
mean(stats[c(12,65,22,59,57)])
sd(stats[c(12,65,22,59,57)])
stats[c(56,61,47,76,71)]
mean(stats[c(56,61,47,76,71)])
sd(stats[c(56,61,47,76,71)])
sort(stats[c(56,61,47,76,71)])
stats[sort(c(56,61,47,76,71))]
stats[c(1,2)]
stats[c(2,1)]
sample(1:76, 9, replace=FALSE)
sample(1:76, 9, replace=FALSE)
set.seed(123)
sample(1:76, 9, replace=FALSE)
set.seed(123)
sample(1:76, 9, replace=FALSE)
set.seed(0)
sample(1:76, 9, replace=FALSE)
set.seed(0)
sample(1:76, 9, replace=FALSE)
sample(1:76, 5, replace=FALSE)
secondFirst = sample(1:76, 5, replace=FALSE)
secondFirst
stats[secondFirst]
mean(stats[secondFirst])
sd(stats[secondFirst])
sum(stats[secondFirst])
range(stats[secondFirst])
median(stats[secondFirst])
mode(stats[secondFirst])
var(stats[secondFirst])
fivenumber(stats[secondFirst])
summary(stats[secondFirst])
}}}
假如
$$
y = \{1,2,4,4,7,7,7,8\}
$$
利用已經教過的R函示了解母體的各種性質。
# mean
# variance
# standard deviation
# minimum
# maximum
# range
# $Q_1$
# $Q_3$
# coefficient of variation
!提示
試試
{{{
summary()
}}}
給定顯著水準$\alpha$,換言之,給定信賴係數$1 - \alpha$(信心水準$(1 - \alpha)100\%$):以95%為例
!產生數據
{{{
x = rbinom(n = 1, size = 4, prob = 0.2)
n = 4
}}}
!大樣本信賴區間
!!左端點
$$
\hat p - z_{0.025} \times \sqrt{\hat p (1 - \hat p) / n}
$$
{{{
phat = x / n
phat - pnorm(0.975) * sqrt(phat * (1 - phat) / n)
}}}
!!右端點
$$
\hat p + z_{0.025} \times \sqrt{\hat p (1 - \hat p) / n}
$$
{{{
phat + pnorm(0.975) * sqrt(phat * (1 - phat) / n)
}}}
!小樣本信賴區間
!!左端點
$$

$$
{{{

}}}
!!右端點
$$

$$
{{{

}}}
!瓦得檢定反轉之信賴區間
{{{
就是所謂的大樣本信賴區間
}}}
!概似比檢定反轉之信賴區間
$$
\chi_{1, 0.975}^2 \le -2 \times log(l(p_0)/l(\hat p)) \le \chi_{1, 0.025}^2
=
\chi_{1, 0.975}^2 \le -2 \times log(\frac{(\sum y_i) \times log(p_0) + (n - \sum y_i) \times log(1 - p_0)}{(\sum y_i) \times log(\hat p) + (n - \sum y_i) \times log(1 - \hat p)}) \le \chi_{1, 0.025}^2
$$
因為
$$
(\sum y_i) \times log(p_0) + (n - \sum y_i) \times log(1 - p_0) \approx p_0\mbox{的多項式}
$$
以及
$$
(\sum y_i) \times log(\hat p) + (n - \sum y_i) \times log(1 - \hat p) = log(\hat p^{\sum y_i} \times (1 - \hat p)^{n - \sum y_i})
$$
所以
$$
exp(\frac{\chi_{1, 0.025}^2}{-2}) \times log(\hat p^{\sum y_i} \times (1 - \hat p)^{n - \sum y_i})
\le 
p_0\mbox{的多項式}
\le 
exp(\frac{\chi_{1, 0.975}^2}{-2}) \times log(\hat p^{\sum y_i} \times (1 - \hat p)^{n - \sum y_i})
$$
$$
...
$$
!!左端點
{{{

}}}
!!右端點
$$

$$
{{{

}}}
!分數檢定反轉之信賴區間
$$
z_{0.975} \le \frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0) / n}} \le z_{0.025}
$$
因為$z_{0.975} = -z_{0.025}$,所以
$$
\frac{(\hat p - p_0)^2}{p_0 (1 - p_0) / n} \le z_{0.025}^2
$$
整理後上式可以寫成
$$
A p_0^2 + B p_0 + C \le 0
$$
其中
$$
A = ?
$$
$$
B = ?
$$
$$
C = ?
$$
因此
$$
p_0 \in \frac{-B \pm \sqrt{B^2 - 4AC}}{2A}
$$
!!左端點
{{{
請繼續努力!!!
}}}
!!右端點
{{{
請繼續努力!!!
}}}
{{{
把公式包裝成函示。
}}}
<<tabs "" [[挑一個]] "" [[]][[進階版]] "" [[用R實現二項比例的進階版假設檢定]][[小樣本]] "" [[用R實現二項比例的小樣本假設檢定]][[計算p值]] "" [[計算二項比例假設檢定的p值]]>>
!二項比例的小樣本檢定統計量
$$
\mbox{成功次數} \sim Binom(n, p_0)
$$
!只要我們有辦法計算檢定的p值,...
{{{
計算檢定統計量
}}}
!瓦得檢定
$$
z = \frac{\hat p - p_0}{\sqrt{\hat p (1 - \hat p)/n}} \approx Z
$$
!!免洗褲型:用完即丟
{{{
p0 = 0.5
x = rbinom(n = 1, size = 4, prob = 0.2)
n = 4
phat = x / n
z = (phat - p0) / sqrt(phat * (1 - phat) / n)
}}}
!!再利用型:R的函示
!!!基本版型
{{{
waldprop = function()
{

}
}}}
!!!必須給什麼?(輸入)
# $\hat p$
# $p_0$
# $n$
# $p$
# $x$
# $z$
!!!希望R回饋什麼?(輸出)
# $\hat p$
# $p_0$
# $n$
# $p$
# $x$
# $z$
----
+++[waldprop]
{{{
waldprop = function(x, n, p0)
{
phat = x / n
z = (phat - p0) / sqrt(phat * (1 - phat) / n)
}
}}}
===
----
!概似比檢定
+++[開始設計...]
+++[步驟一:定義檢定統計量]
$$
\chi^2 = -2\log(l(p_0)/l(\hat p)) \approx \chi_1^2
$$
===
+++[步驟二:定義函示的基本版型]===
+++[步驟三:定義函示的輸入]===
+++[步驟四:定義函示的輸出]===
===
!分數檢定
+++[開始設計...]
$$
z = \frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0)/n}} \approx Z
$$
!!免洗褲型:用完即丟
{{{
p0 = 0.5
x = rbinom(n = 1, size = 4, prob = 0.2)
n = 4
phat = x / n
z = (phat - p0) / sqrt(p0 * (1 - p0) / n)
}}}
!!再利用型:R的函示
!!!基本版型
{{{
scoreprop = function()
{

}
}}}
!!!必須給什麼?(輸入)
# $\hat p$
# $p_0$
# $n$
# $p$
# $x$
# $z$
!!!希望R回饋什麼?(輸出)
# $\hat p$
# $p_0$
# $n$
# $p$
# $x$
# $z$
----
+++[scoreprop]
{{{
scoreprop = function(x, n, p0)
{
phat = x / n
z = (phat - p0) / sqrt(p0 * (1 - p0) / n)
}
}}}
===
----
===
{{{
library(BHH2)
N = 4
n = 2
Cases = subsets(N, n)

prob = c(1/3,1/6,0,0,0,1/2)

y = c(1,2,4,4)

Sample = matrix(y[t(Cases)],choose(N,n),n,byrow=T)
SampleTotal = apply(Sample, 1, sum) / n * N
Sample = cbind(Sample, SampleTotal, prob)

EVtotal = sum(Sample[,3]*Sample[,4])
EBtotal = EVtotal - sum(y)
VARtotal = sum((Sample[,3] - EVtotal)^2*Sample[,4])
MSEtotal = VARtotal + EBtotal^2
}}}
# ++++[讀取數據。]
* 樣本一
{{{
n11 = 189
n12 = 11845
placebo = c(rep(1, n11), rep(0, n12))
}}}
* 樣本二
{{{
n21 = 104
n22 = 11933
aspirin = c(rep(1, n21), rep(0, n22))
}}}
+++[製作表2.3的data.frame]
{{{
drug = c(rep(0, 11034), rep(1, 11037))
MI = c(rep(1, 189), rep(0, 10845), rep(1, 104), rep(0, 10933))
Table2-3 = data.frame(drug = drug, MI = MI)
}}}
===
----
===

# +++[檢定統計量。]
$$
H_0: p_1 - p_2 = 0 \mbox{ vs } H_1: p_1 - p_2 \ne 0
$$
{{{
p1hat = n12 / (n11+n12)
p2hat = n22 / (n21+n22)
z-diffProp = ((p1hat-p2hat)-0)/(sqrt((p1hat*(1-p1hat))/n1+(p2hat*(1-p2hat))/n2))
}}}
===

# +++[p值。]
* 如果$\hat p_1 > \hat p_2$,
{{{
2 * (1 - pnorm(z-diffProp)) 
}}}
* 如果$\hat p_1 < \hat p_2$,
{{{
2 * pnorm(z-diffProp)
}}}
{{{
p-value = ifelse(p1hat > p2hat, 2 * (1 - pnorm(z-diffProp)), 2 * pnorm(z-diffProp))
}}}
===

# +++[包裝起來!]
{{{
testDiffProp = function(n11, n12, n21, n22, NULLvalue)
{
p1hat = n12 / (n11+n12)
p2hat = n22 / (n21+n22)

z-diffProp = ((p1hat-p2hat)-NULLvalue)/(sqrt((p1hat*(1-p1hat))/(n11+n12)+(p2hat*(1-p2hat))/(n21+n22)))

p-value = ifelse(p1hat > p2hat, 2 * (1 - pnorm(z-diffProp)), 2 * pnorm(z-diffProp))

Reject = ifesle(p-value < 0.05, TRUE, FALSE)
}
}}}
===
{{{
pnorm(q, mean = 0, sd = 1)
}}}
我們已經知道這一道函示給我們$F(\cdot)$的結果,其中的「q」代表[[計算常態機率|計算常態機率]]理論論述的「a」。如果你不改變「mean」跟「sd」的R設定(「mean = 0」跟「sd = 1」),表示你想計算標準常態機率。
----
【課堂練習】
>【Q1】寫出計算以下機率的R命令
>>【1】$Pr(1 \le Z \le 2)$
>>【2】$Pr(-1 \le Z \le 0)$
>>【3】$Pr(-2 \le Z \le -1)$
>>【4】$Pr(-1 \le Z \le 2)$
>>【5】$Pr(-2 \le Z \le 2)$
【步驟一】
>使用課程網站入口頁的右手邊之【download】下載最新版的http://mydiscrete.tiddlyspot.com/。
【步驟二】
>注意:個人電腦或筆電一定要有[[jsMath]]跟[[FireFox]]。如果沒有這兩項必要的工具,前進它們的官網下載最新版的[[jsMath]]跟[[FireFox]]。
【步驟三】
>紀錄自己的筆記,請使用課程網站入口頁的右手邊之【new tiddler】。
【步驟四】
>紀錄自己的日記,請使用課程網站入口頁的右手邊之【new journal】。
【步驟五】
>一定要勾選【options】的【~AutoSave】。如果這樣的話,每一次個人更動什麼樣的內容(【new tiddler】跟【new journal】),或是加入什麼樣的內容,[[FireFox]]跟[[TiddlyWiki]]會主動地為你儲存所有改變與更動。
【結論】
>你可以用隨身碟或是攜帶式硬碟隨身攜帶這一份個人的筆記,自由看、自由改,但是無法公開發佈給別人看。
【與老師的內容同步】
>點選【tiddler】右上方的【more】,再點選其中的【syncing】的第二個選項//應該//可以跟伺服器那一端的最新內容同步。這樣就不會錯過任何最新內容。
# ++++[名冊(index set)]
$$
\{1, 2, \cdots, N\}
$$
# $N = 4$
# 名冊 = ?
===
----
# +++[樣本數(sample size)]
$$
n
$$
# $n = 2$
===
----
# +++[所有可能的樣本]
$$
S_i, i = 1, 2, \cdots, C^N_n
$$
# $S_1 = \{\mbox{____, ____}\}$
# $S_2 = \{\mbox{____, ____}\}$
# $S_3 = \{\mbox{____, ____}\}$
# $S_4 = \{\mbox{____, ____}\}$
# $S_5 = \{\mbox{____, ____}\}$
# $S_6 = \{\mbox{____, ____}\}$
# $S_7 = \{\mbox{____, ____}\}$
===
----
# +++[抽到某一個樣本的機率]
$$
P(S_i) = ?
$$
# +++[1]$P(S_1) = 1/3$===

# +++[2]$P(S_2) = 1/6$===

# +++[3]$P(S_3) = 0$===

# +++[4]$P(S_4) = 0$===

# +++[5]$P(S_5) = 0$===

# +++[6]$P(S_6) = 1/2$===

# +++[7]沒有這一項!===

===
----
# +++[抽到某一個單元的機率]
$$
\pi_i
$$
# +++[1]$\pi_1 = ?$===

# +++[2]$\pi_2 = ?$===

# +++[3]$\pi_3 = ?$===

# +++[4]$\pi_4 = ?$===

# +++[5]$\pi_5 = ?$===

# +++[6]$\pi_6 = ?$===

# +++[7]沒有這一項!===

===

!帶出利用sample()所需的資訊
# 準備對應的x、size、prob。
# 撰寫R指令。sample(x, size, replace = FALSE, prob = NULL)
{{{
x = 
size = 
prob = 
sample(x = x, size = size, replace = , prob = prob)
}}}
!哪一道指令是重排?
{{{
sample(1:5, 5, replace=T)
}}}
{{{
sample(1:5, 5, replace=F)
}}}
----
{{{
寫一道指令重排數字1, 5, 7。
}}}
根據中央極限定理
$$
\frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0)/n}} \approx Z
$$
所以各種檢定的p[[值|p值]]的計算如下所示:
# ++++[左尾]
$$
Pr(Z \le \frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0)/n}})
$$
===

# ++++[右尾]
$$
Pr(Z \ge \frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0)/n}})
$$
===

# ++++[雙尾]
$$
2 \times Pr(Z \ge |\frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0)/n}}|)
$$
===
根據中央極限定理
$$
\frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0)/n}} \approx Z
$$
所以各種檢定的p[[值|p值]]的計算如下所示:
# ++++[左尾]
$$
Pr(Z \le \frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0)/n}})
$$
{{{
z = (phat - p0) / sqrt(p0 * (1 - p0) / n)
pnorm(z)
}}}
===

# +++[右尾]
$$
Pr(Z \ge \frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0)/n}})
$$
{{{
z = (phat - p0) / sqrt(p0 * (1 - p0) / n)
1 - pnorm(z)
}}}
===

# +++[雙尾]
$$
2 \times Pr(Z \ge |\frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0)/n}}|)
$$
{{{
請自行設計!!!
}}}
===
根據
$$
n \hat p = \sum_{i=1}^n y_i | H_0 \sim Binom(n, p_0)
$$
所以各種檢定的p[[值|p值]]的計算如下所示:
# ++++[左尾]
$$
Pr(Binom(n, p_0) \le n \hat p)
$$
===

# ++++[右尾]
$$
Pr(Binom(n, p_0) \ge n \hat p)
$$
===

# ++++[雙尾]
$$
2 \times Pr(Binom(n, p_0) \le n \hat p), n \hat p \le n p_0
$$
或者
$$
2 \times Pr(Binom(n, p_0) \ge n \hat p), n \hat p \ge n p_0
$$
===
根據
$$
\mbox{成功次數} = n \hat p = \sum_{i=1}^n y_i | H_0 \sim Binom(n, p_0)
$$
所以各種檢定的p[[值|p值]]的計算如下所示:
# ++++[左尾]
$$
Pr(Binom(n, p_0) \le n \hat p) = Pr(Binom(n, p_0) \le \mbox{成功次數}) = F(\mbox{成功次數的觀察值})
$$
{{{
pbinom(x, ...)
}}}
===

# +++[右尾]
$$
Pr(Binom(n, p_0) \ge n \hat p) = Pr(Binom(n, p_0) \ge \mbox{成功次數}) = 1 - F(\mbox{成功次數的觀察值-1})
$$
{{{
1 - pbinom(x-1, ...)
}}}
===

# +++[雙尾]
$$
2 \times Pr(Binom(n, p_0) \le n \hat p), n \hat p \le n p_0
$$
{{{

}}}
或者
$$
2 \times Pr(Binom(n, p_0) \ge n \hat p), n \hat p \ge n p_0
$$
{{{

}}}
===
Type the text for 'New Tiddler'
根據
$$
n \hat p = \sum_{i=1}^n y_i | H_0 \approx Poisson(np_0)
$$
所以各種檢定的p[[值|p值]]的計算如下所示:
# ++++[左尾]
$$
Pr(Poisson(np_0) \le n \hat p)
$$
===

# ++++[右尾]
$$
Pr(Poisson(np_0) \ge n \hat p)
$$
===

# ++++[雙尾]
$$
2 \times Pr(Poisson(np_0) \le n \hat p), n \hat p \le n p_0
$$
或者
$$
2 \times Pr(Poisson(np_0) \ge n \hat p), n \hat p \ge n p_0
$$
===
根據
$$
\mbox{成功次數} = n \hat p = \sum_{i=1}^n y_i | H_0 \approx Poisson(np_0)
$$
所以各種檢定的p[[值|p值]]的計算如下所示:
# ++++[左尾]
$$
Pr(Poisson(np_0) \le n \hat p) = Pr(Poisson(n, p_0) \le \mbox{成功次數}) = F(\mbox{成功次數的觀察值})
$$
{{{
help.search("Poisson")
...
}}}
===

# +++[右尾]
$$
Pr(Poisson(np_0) \ge n \hat p)
$$
{{{

}}}
===

# +++[雙尾]
$$
2 \times Pr(Poisson(np_0) \le n \hat p), n \hat p \le n p_0
$$
{{{

}}}
或者
$$
2 \times Pr(Poisson(np_0) \ge n \hat p), n \hat p \ge n p_0
$$
{{{

}}}
===
根據中央極限定理
$$
\frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0)/n}} \approx Z
$$
所以各種檢定的p[[值|p值]]的計算如下所示:
# ++++[左尾]
$$
Pr(Z \le \frac{\hat p - p_0 + 0.5}{\sqrt{p_0 (1 - p_0)/n}})
$$
===

# ++++[右尾]
$$
Pr(Z \ge \frac{\hat p - p_0 - 0.5}{\sqrt{p_0 (1 - p_0)/n}})
$$
===

# ++++[雙尾]
$$
2 \times Pr(Z \ge \frac{|\hat p - p_0| - 0.5}{\sqrt{p_0 (1 - p_0)/n}})
$$
===
根據中央極限定理
$$
\frac{\hat p - p_0}{\sqrt{p_0 (1 - p_0)/n}} \approx Z
$$
所以各種檢定的p[[值|p值]]的計算如下所示:
# ++++[左尾]
$$
Pr(Z \le \frac{\hat p - p_0 + 0.5}{\sqrt{p_0 (1 - p_0)/n}})
$$
{{{
z = (phat - p0 + 0.5) / sqrt(p0 * (1 - p0) / n)
pnorm(z)
}}}
===

# +++[右尾]
$$
Pr(Z \ge \frac{\hat p - p_0 - 0.5}{\sqrt{p_0 (1 - p_0)/n}})
$$
{{{
z = (phat - p0 - 0.5) / sqrt(p0 * (1 - p0) / n)
1 - pnorm(z)
}}}
===

# +++[雙尾]
$$
2 \times Pr(Z \ge \frac{|\hat p - p_0| - 0.5}{\sqrt{p_0 (1 - p_0)/n}})
$$
{{{

}}}
===
{{{
使用時機:列總和固定!
}}}
{{{
Diffprop = function(n11,n12,n21,n22,NULLvalue)
{
n1=n11+n12
n2=n21+n22
p1hat=n11/n1
p2hat=n21/n2
Z=((p1hat-p2hat)-NULLvalue)/sqrt((p1hat*(1-p1hat)/n1)+(p2hat*(1-p2hat)/n2))
pvalue=ifelse(p1hat>p2hat,2*(1-pnorm(Z)),2*pnorm(Z))
reject=ifelse(pvalue<0.05,TRUE,FALSE)
}
> Diffprop(189, 10845, 104, 10933, 0)
> print(Diffprop(189, 10845, 104, 10933, 0))
[1] TRUE
>
}}}
q()
q().
q()3
q()
weight = scan()
weight
weight[1]
weight[14]
weight[15]
mean(weight)
median(weight)
sd(weight)
var(weight)
sd(weight)^2
table26 = data.frame()
table26
table26 = edit(table26)
table26
{{{
stats = scan()
stats
stat=stats
stats = scan()
464
480
464
480
480
464
464
stat=c(stat, stats)
stats = scan()
length(stats)
stat
length(stat)
stats = c(stat, stats).
stats = c(stat, stats)
length(stats)
table(stats)
hist(stats)
mean(stats)
var(stats)
sd(stats)
max(stats)
min(stats)
range(stats)
stats
stats
stats[c(10,48,01,50,11,53,60,20,64)]
mean(stats[c(10,48,01,50,11,53,60,20,64)])
sd(stats[c(10,48,01,50,11,53,60,20,64)])
stats[c(12,65,22,59,57)]
mean(stats[c(12,65,22,59,57)])
sd(stats[c(12,65,22,59,57)])
stats[c(56,61,47,76,71)]
mean(stats[c(56,61,47,76,71)])
sd(stats[c(56,61,47,76,71)])
sort(stats[c(56,61,47,76,71)])
stats[sort(c(56,61,47,76,71))]
stats[c(1,2)]
stats[c(2,1)]
sample(1:76, 9, replace=FALSE)
sample(1:76, 9, replace=FALSE)
set.seed(123)
sample(1:76, 9, replace=FALSE)
set.seed(123)
sample(1:76, 9, replace=FALSE)
set.seed(0)
sample(1:76, 9, replace=FALSE)
set.seed(0)
sample(1:76, 9, replace=FALSE)
sample(1:76, 5, replace=FALSE)
secondFirst = sample(1:76, 5, replace=FALSE)
secondFirst
stats[secondFirst]
mean(stats[secondFirst])
sd(stats[secondFirst])
sum(stats[secondFirst])
range(stats[secondFirst])
median(stats[secondFirst])
mode(stats[secondFirst])
var(stats[secondFirst])
fivenumber(stats[secondFirst])
summary(stats[secondFirst])
}}}
$$
\frac{O - E}{\sqrt{E}} \approx Z
$$
{{{
差距不好用!!!
}}}
----
{{{
【0.010 - 0.001】與【0.410 - 0.401】
}}}
----
!定義[[2乘2表格]]的相對風險
$$
RR = \frac{p_1}{p_2}
$$
----
定義
$$
\hat \phi = \hat p_1 - RR \times \hat p_2
$$
----
計算$\hat \phi$的期望值跟變異數,
$$
E(\hat \phi) = E(\hat p_1 - RR \times \hat p_2) = p_1 - RR \times p_2 = 0
$$
$$
V(\hat \phi) = V(\hat p_1 - RR \times \hat p_2) = \frac{p_1 q_1}{n_1} + RR^2 \times \frac{p_2 q_2}{n_2}
$$
所以
$$
\frac{\hat p_1 - RR \times \hat p_2}{\sqrt{\frac{\hat p_1 \times \hat q_1}{n_1} + RR^2 \times \frac{\hat p_2 \times \hat q_2}{n_2}}} \approx Z
$$
----
上述的結果會帶出以下這項近似不等式
$$
z_{0.975} \le \frac{\hat p_1 - RR \times \hat p_2}{\sqrt{\frac{\hat p_1 \times \hat q_1}{n_1} + RR^2 \times \frac{\hat p_2 \times \hat q_2}{n_2}}} \le z_{0.025}
$$
也就是說
$$
\frac{(\hat p_1 - RR \times \hat p_2)^2}{\frac{\hat p_1 \times \hat q_1}{n_1} + RR^2 \times \frac{\hat p_2 \times \hat q_2}{n_2}} \le \chi_{1,0.05}^2
$$
經過整理之後,發現以下$RR$的一元二次不等式
$$
(\hat p_2^2 - \frac{\hat p_2 \times \hat q_2}{n_2} \times \chi_{1,0.05}^2) RR^2 - 2 \hat p_1 \hat p_2 RR + (\hat p_1^2 - \frac{\hat p_1 \times \hat q_1}{n_1} \times \chi_{1,0.05}^2) \le 0
$$
----
根據上述不等式,我們可以得到相對風險的95%信賴區間如下所示:
$$
RR \in \frac{B \pm \sqrt{B^2 - AC}}{A}
$$
其中
$$
A = \hat p_2^2 - \frac{\hat p_2 \times \hat q_2}{n_2} \times \chi_{1,0.05}^2
$$
$$
B = \hat p_1 \hat p_2
$$
以及
$$
C = \hat p_1^2 - \frac{\hat p_1 \times \hat q_1}{n_1} \times \chi_{1,0.05}^2
$$
----
【例子】表2.3
| 群組 |>| MI | 列總和 |
|~| YES | NO |~|
| 安慰劑 | 189 (189/11034 = 0.0171) | 10845 | 11034 |
| 阿思匹靈 | 104 (104/11037 = 0.0094) | 10933 | 11037 |
----
{{{
RR = ?
}}}
{{{
DP = ?
}}}
----
【有別於課本的95%信賴區間】
$$
\begin{eqnarray}
A = 0.0094^2 - (0.0094 * 0.9906)/11037 * qchisq(0.95,1) \\
B = 0.0171 * 0.0094 \\
C = 0.0171^2 - (0.0171 * 0.9829)/11034 * qchisq(0.95,1) \\
\end{eqnarray}
$$
經過R的協助得到的答案是
{{{
[1.441708, 2.335119]
}}}
----
!課本的答案
$$
\log(RR) \in \log(\frac{\hat p_1}{\hat p_2}) \pm z_{0.025} \times \sqrt{\frac{1}{n_1}\frac{1 - \hat p_1}{\hat p_1} + \frac{1}{n_2}\frac{1 - \hat p_2}{\hat p_2}}
$$
所以相對風險$RR$的95%信賴區間是
$$
\left[\exp\left(\log(\frac{\hat p_1}{\hat p_2}) - z_{0.025} \times \sqrt{\frac{1}{n_1}\frac{1 - \hat p_1}{\hat p_1} + \frac{1}{n_2}\frac{1 - \hat p_2}{\hat p_2}}\right), \exp\left(\log(\frac{\hat p_1}{\hat p_2}) + z_{0.025} \times \sqrt{\frac{1}{n_1}\frac{1 - \hat p_1}{\hat p_1} + \frac{1}{n_2}\frac{1 - \hat p_2}{\hat p_2}}\right)\right]
$$
!!!名目尺度
[img[http://www.shropshire.gov.uk/res.nsf/0D9C5F2151A3747F8025724800558E0A/$file/FoodPieChart.jpg]]
!!!順序尺度
!!!區間尺度
!!!比例尺度
++++[變異係數]
| P | 2 | 4 | 6 | 8 | 10 | 12 | 14 |
| Q | 2002 | 2004 | 2006 | 2008 | 2010 | 2012 | 2014 |
===

+++[直條圖]
[img[http://grass.itc.it/grass60/screenshots/images/d.vect.chart_bar.png]]
===
+++[直方圖]
[img[http://www.rdg.ac.uk/ssc/software/genstat/histogram.jpg]]
===
+++[折線圖]
[img[http://www.nwas.org/ej/2007-EJ1/images/image011.jpg]]
===
+++[直方圖+折線圖]
[img[http://www.cavehill.uwi.edu/FPAS/bcs/courses/Biology/BL20B/20b_images/polygon.gif]]
===

+++[眾數]===
+++[中位數]===
+++[算術平均]===
+++[去頭去尾平均]===

+++[分位數]===
+++[四分位數]===

+++[最小值]===
+++[最大值]===
+++[全距]===

+++[變異數]===
+++[標準差]===
+++[去頭去尾變異數]===

+++[四分位數間距]===

+++[偏度]
[img[http://allpsych.com/researchmethods/images/skew.gif]]
===

+++[扁度]
[img[http://allpsych.com/researchmethods/images/kurtosis.gif]]
===

+++[共變異數]===
+++[相關係數]===
經由內部討論與研究(收集資訊與消化資訊的整個過程)之後決定你們那一組【小而美】的定義與價值,並且根據這一項標準評斷哪一張照片是第一名。
必須包含
# 問卷設計
# 抽樣計畫
# 分析方法
# 軟體工具
| 中文 | 英文 | R | 註記 |
| [[實驗單元]] ||||
| [[因子]] ||||
| [[水準]] ||||
| [[處理]] ||||
| [[變數]] ||||
| [[母體]] ||||
| [[樣本]] ||||
| [[數據]] ||||
| [[單位]] ||||
| [[數字]] ||||
| [[測量尺度]] ||||
| [[名目尺度]] ||||
| [[順序尺度]] ||||
| [[區間尺度]] ||||
| [[比例尺度]] ||||
| [[伯努利分配]] ||||
| [[伯努利試驗]] ||||
| [[伯努利試驗次數]] ||||
| [[成功機率]] ||| 二項比例、母體比例 |
| [[伯努利隨機變數]] ||||
| [[伯努利數據]] ||| 伯努利隨機樣本 |
| [[抽樣]] ||||
| [[取後放回式抽樣]] ||||
| [[取後不放回式抽樣]] ||||
| [[二項分配]] ||||
| [[二項公式]] ||||
| [[試驗次數]] ||| 伯努利試驗次數、二項試驗次數 |
| [[二項比例]] ||| 成功機率、母體比例 |
| [[二項隨機變數]] ||||
| [[二項數據]] ||| 二項隨機樣本 |
| [[多項分配]] ||||
| [[二項機率表]] ||||
| [[多項隨機變數]] ||||
| [[多項數據]] ||| 多項隨機樣本 |
| [[常態分配]] ||||
| [[常態隨機變數]] ||||
| [[常態數據]] ||| 常態隨機樣本 |
| [[標準常態分配]] ||||
| [[常態機率表]] ||||
| [[機率密度函數]] ||| 機率分配函數 |
| [[累加分配函數]] ||||
| [[分位數]] ||||
| [[亂數]] ||||
| [[信賴區間]] ||||
| [[信賴係數]] ||||
| [[信心水準]] ||||
| [[誤差機率]] ||||
| [[母體平均]] ||||
| [[母體比例]] ||||
| [[母體變異數]] ||||
| [[母體標準差]] ||||
| [[樣本平均]] ||||
| [[樣本比例]] ||||
| [[樣本變異數]] ||||
| [[樣本標準差]] ||||
| [[標準誤]] ||| 標準差的估計 |
| [[樣本數]] ||||
| [[大樣本]] ||||
| [[小樣本]] ||||
| [[母體平均的大樣本信賴區間]] ||||
| [[母體平均的小樣本信賴區間]] ||||
| [[母體比例的大樣本信賴區間]] ||||
| [[母體比例的小樣本信賴區間]] ||||
| [[母體變異數的大樣本信賴區間]] ||||
| [[母體變異數的小樣本信賴區間]] ||||
| [[母體標準差的大樣本信賴區間]] ||||
| [[母體標準差的小樣本信賴區間]] ||||
| [[假設檢定]] ||||
| [[研究假設]] ||||
| [[虛無假設]] ||||
| [[對立假設]] ||||
| [[虛無值]] ||||
| [[左尾檢定]] ||||
| [[右尾檢定]] ||||
| [[雙尾檢定]] ||||
| [[p值]] ||||
| [[不利虛無假設的證據]] ||||
| [[拒絕虛無假設]] ||||
| [[不拒絕虛無假設]] ||||
| $\alpha$ ||||
| $\beta$ ||||
| [[檢定力]] ||||
| [[母體平均的大樣本假設檢定]] ||||
| [[母體平均的小樣本假設檢定]] ||||
| [[母體比例的大樣本假設檢定]] ||||
| [[母體比例的小樣本假設檢定]] ||||
| [[母體變異數的大樣本假設檢定]] ||||
| [[母體變異數的小樣本假設檢定]] ||||
| [[母體標準差的大樣本假設檢定]] ||||
| [[母體標準差的小樣本假設檢定]] ||||
| [[瓦得檢定]] ||||
| [[概似比檢定]] ||||
| [[分數檢定]] ||||
<html><div align="center"><iframe src ="http://www.cyclismo.org/tutorial/R/index.html" width="100%" align="center" height=400"></iframe></div></html>
* Downloading and installing R in Windows (下載與安裝)
* The R graphical user interface(R使用者介面)
* Viewing the graphics demo(示範作圖)
* Vectors and basic stats(向量與基礎統計量)
* Simple plotting(簡單作圖)
+++[用了那些對話]
{{{
demo(graphics)
x=c(1,2,3,4,5,6,7)
y=c(10,14,20,18,16,15,10)
x+y
z=c(x,y)
sum(y)
mean(y)
sd(y)
plot(x,y)
barplot(y,col=”lightgreen”)
}}}
===
----
<html><div align="center"><iframe src ="http://www.dangoldstein.com/flash/Rtutorial1/Rtutorial1.html" width="100%" align="center" height=700"></iframe></div></html>
由於上課地點並不是電腦教室,關於R實習的部份只好讓你在家自己作。主動學習的精神決定你的成就,雖然不一定代表你的分數,但享受過程也是一種生活方式。切記R不像以往你曾經學過的SAS或者是SPSS,不是讓你在螢幕上移動滑鼠加上按幾次滑鼠左鍵就可以完成題目的要求。個人認為要把R學好,有幾件事要記得
# [[記憶統計專有名詞的英文拼法|R的記憶術]](比如說,平均叫做mean,變異數叫做variance)。因為有時候R工程師會用全名,像mean,有時候會用縮寫,像var。
# 記住[[語法|R的語法]]的一般原則。(這個要靠你自己筆記,並且【多比較,多觀察】。)

以下的題目是第一次在家實習的題目:
# 把講義第一章【談高中加入統計課程】附錄的三則數據集輸入R。
# 利用R模擬丟一枚公平銅板10次。報告你的R命令跟執行(一段你跟R的對話)的結果。必要時,報告執行過程中發生過的錯誤,以及你克服錯誤的心路歷程。
# 把公式$\sum_{i=1}^{10} y_i$換成R命令,其中$y_i$是你上一題得到的模擬結果。
# 利用第二題得到的數據估計公平銅板的成功機率$p = 1/2$,並且報告估計誤差$|\hat p - 1/2|$。
!參考網站
<<tabs "" [[挑一個]] "" [[]][[老師開的店]] "" [[老師開的店]][[第一位小老師]] "" [[第一位小老師]][[第二位小老師]] "" [[第二位小老師]][[中文小老師]] "" [[中文小老師]]>>
寫出十種不同說法但是抽到同樣一組樣本的R指令。
# 手算各種基本統計量。諸如:平均,變異數,標準差,各種位數,...([[回顧老師第一、二、三次課堂體驗]])
# R與基本統計量
# sample()
# 圖1-1
# 相似
# 用R實現[[2乘2表格]]的[[勝算比]]:
## 讀取數據。
## 計算勝算比。
## 信賴區間。
# 用R實現[[適合度卡方檢定|卡方檢定]]:
## 檢定統計量。
## p值。
# 用R實現[[同質性卡方檢定|卡方檢定]]:
## 檢定統計量。
## p值。
# 用R實現[[獨立性卡方檢定|卡方檢定]]:
## 檢定統計量。
## p值。
利用R找尋[[綠頭鴨的實驗]]提到的、相關的機率計算的答案。
<<tabs "" [[挑一個]] "" [[]][[老師開的店]] "" [[老師開的店]][[第一位小老師]] "" [[第一位小老師]][[第二位小老師]] "" [[第二位小老師]][[中文小老師]] "" [[中文小老師]]>>
用課本第54頁練習題2.8的背景資訊,利用套件[[epiR]]以及它的[[epi.simplesize{epiR}]]為各種
# 標準差($\sigma$)
# 可容忍誤差($d$)
# 信心水準($1 - \alpha$)
計算需要的樣本數。
{{{
提示:自行決定上述三項參數你有興趣的數值。
}}}
----
{{{
library(epiR)
library(help=epiR)

help(epi.simplesize)
}}}
<html><div align="center"><iframe src ="http://mercury.bio.uaf.edu/mercury/R/R.html" width="100%" align="center" height=400"></iframe></div></html>
* Tricking R into starting in your working directory(工作區域)
* Reading in text files(讀入數據)
* Accessing columns in data frames(讀取2維表格的「行」)
* Creating histograms(產生直方圖)
* Side effects and optional parameters of function calls(副作用與選用參數)
* Fitting simple linear models(簡單線性模型)
* Adding least-squares and loess lines to plots(為二維散佈圖補最小平方法跟loess線)
+++[用了那些對話]
{{{
myData=read.table(”pedometer.csv”, header=TRUE, sep=”,”)
x=hist(myData$Steps,col=”lightblue”)
x=hist(myData$Steps,breaks=20,col=”lightblue”)
plot(myData$Steps ~ myData$Observation,col=”blue”)
myModel=lm(myData$Steps ~ myData$Observation)
summary(myModel)
lines(fitted(myModel))
lines(fitted(loess(myModel)),col=”red”)
}}}
===
----
<html><div align="center"><iframe src ="http://www.dangoldstein.com/flash/Rtutorial2/Rtutorial2.html" width="100%" align="center" height=700"></iframe></div></html>
# 【多項試驗】
## 產生10筆機率分別是$(p_1 = 0.1, p_2 = 0.2, p_3 = 0.3, p_4 = 0.4)$、試驗10次的多項數據。
## 計算看到這10筆數據的機率。
## 用上述得到的數據估計$(p_1, p_2, p_3, p_4)$。
## 計算【總估計誤差】$\sum_{i=1}^4 |\hat p_i - p_i|$。
# 【常態數據】
## 利用常態分配基本性質以及R的內建函示提供【兩種】產生$N(10, 2^2)$數據的辦法。
## 拿出你的初等統計學教科書,找一題需要常態分配計算//p//值的假設檢定問題,用R算出該問題的//p//值。
!參考網站
<<tabs "" [[挑一個]] "" [[]][[老師開的店]] "" [[老師開的店]][[第一位小老師]] "" [[第一位小老師]][[第二位小老師]] "" [[第二位小老師]][[中文小老師]] "" [[中文小老師]]>>
!假設
# $N = 8$
# $y = c(1,2,4,4,7,7,7,8)$
!目標
{{{
利用R得知上述情況下,樣本總和的抽樣分配。
}}}
!參考答案
+++[請先不要看!]
{{{
library(BHH2)
N = 8
n = 4
Cases = subsets(N, n)

prob = rep(1/70, 70)

y = c(1,2,4,4,7,7,7,8)

Sample = matrix(y[t(Cases)],choose(N,n),n,byrow=T)
SampleTotal = apply(Sample, 1, sum) / n * N
Sample = cbind(Sample, SampleTotal, prob)

SDistTotal = table(Sample[,5]) * 1/70

EVtotal = sum(Sample[,5]*Sample[,6])
EBtotal = EVtotal - sum(y)
VARtotal = sum((Sample[,5] - EVtotal)^2*Sample[,6])
MSEtotal = VARtotal + EBtotal^2
}}}
===
自己實作一遍瓦得檢定,概似比檢定,跟分數檢定:
# 產生一組伯努利亂數。
# 利用以下進階的檢定手法檢定你得到的亂數是否來自產生亂數的分配?
## [[瓦得檢定]]
## [[概似比檢定]]
## [[分數檢定]]
<<tabs "" [[挑一個]] "" [[]][[老師開的店]] "" [[老師開的店]][[第一位小老師]] "" [[第一位小老師]][[第二位小老師]] "" [[第二位小老師]][[中文小老師]] "" [[中文小老師]]>>
# 用R實現[[相對風險]]的信賴區間:
## 讀取數據。
## 老師提供的辦法。【Fieller's Theorem】
## 講義提供的辦法。【對數轉換】
* 利用以下這兩種函示檢定綠頭鴨實驗的觀察結果。
{{{
binom.test()
prop.test()
}}}
* 把公式換成R命令的方式實現以下四種計算p值的方式:
<<tabs "" [[挑一個]] "" [[]][[二項公式]] "" [[用二項公式計算p值]][[中央極限定理]] "" [[用中央極限定理計算p值]][[連續性校正]] "" [[用連續性校正計算p值]][[布瓦松近似]] "" [[用布瓦松分配計算p值]]>>
----
<<tabs "" [[挑一個]] "" [[]][[老師開的店]] "" [[老師開的店]][[第一位小老師]] "" [[第一位小老師]][[第二位小老師]] "" [[第二位小老師]][[中文小老師]] "" [[中文小老師]]>>
{{{
隨機抽樣架構
}}}
加上
$$
P(S_i) = \frac{1}{C^N_n (NCn)}, \forall i.
$$
!符號
*  篇名頁(插入浮水印的位置)
* 中(英)文摘要與關鍵字
* 目錄
* (圖目錄)
* (表目錄)
* 報告本文(依章節順序)
## [[研究假設]]
## [[研究工具]]
## [[統計結論]]
## [[評論]]
* 參考文獻
* (附錄 )
$$
F(y) = \sum_{x = 0}^y Pr(x)
$$
# 整理收集到的數據
# 檢定研究假設
# 下結論
<html><div align="center"><iframe src ="http://www.microsiris.com/Statistical%20Decision%20Tree/" width="100%" align="center" height=400"></iframe></div></html>
!本質
{{{
統計學的一門科學。
}}}
!統計技巧
# 估計 = 有根據的猜測
# 降低誤差(這門課的主要目標。)
#
根據假設檢定的基本步驟檢定各組的研究假設:
# 根據問題寫下[[研究假設]];
# 根據[[抽樣計畫|抽樣設計]]收集[[數據]];
# 使用[[數據]]計算[[檢定統計量]];
# 在[[虛無假設]]成立的條件下得[[檢定統計量]]的[[抽樣分配]],並且根據該機率分配計算[[檢定統計量]]的[[證據力]],//p//[[值|p值]];
# 根據//p//[[值|p值]]與&alpha;的大小關係,決定「[[拒絕|拒絕虛無假設]]」或是「[[不拒絕|不拒絕虛無假設]]」虛無假設;
各位以上的統計檢定過程是這一份期末報告必要的分析方法。
{{{
逢甲大學十大小而美大調查
}}}
!【小而美】的主題:舉例說明
+++[學校的大門]===
+++[學院大樓的外觀]===
+++[學院大樓的大門]===
+++[...]===
!遊戲規則
各組自由挑選校園內可以被列為【小而美】的景點,採註冊方式於期限內寫一份電郵(email)跟老師登記,每個景點最多4組參與競賽。挑選各組心目中的第一名(研究假設),至校園內利用問卷收集支持研究假設的證據,摘要、分析證據並且利用[[假設檢定]]的科學邏輯下最後的結論。用[[海報]]以及[[逢甲大學ePaper|http://epaper.lib.fcu.edu.tw/]]公開展示成果。
!基本要求
{{{
科學、統計、美學、創意、逢甲大學獨有。
}}}
!時間表
| 階段 | 期限(週次) | 工作項目 | 工作內容 | 備註 |
| 0 | 6, 7, 8 | 觀摩 | 請各組前往圖書館一樓北翼展場觀摩最新的學生成果展示。 | 學習如何在方寸的珍珠板上報告研究成果。 |
| 0-1 | 8 | 確定分組名單 | 請將名單以及工作分配放在BB的討論區。 | 每一組8到10人(如果你找不組別收容你,期末報告以0分計。) |
| 1 | 7, 8, 9 | 註冊 | 各組開會討論決定各組的標的景點(逢甲大學校園內某種【小而美】的景點),並且向吳老師註冊。 | 每種景點只限4組競爭。 |
| 1-1 | 04/17/2009 | 註冊截止日 | 註冊截止日前寫一份電郵(email)跟老師登記。 | 請提早註冊。(注意:每種景點只限4組競爭,另外不要讓老師在辦公室猜你是誰?) |
| 2 | 7, 8, 9, 10, 11, 12 | 提案 | 撰寫一份包含(1) [[照片]]加上[[輔助說明]]的文字、(2) [[研究假設]]、(3) [[問卷]]、(4) [[抽樣調查計畫]]的提案報告。 | 老師可以否決你的提案。 |
| 2-5 | 05/08/2009 | 繳交提案截止日 | 繳交提案截止日前寫一份電郵(email)寄送提案文稿給老師。 | 請提早繳交。(注意:老師可以否決你的提案,另外不要讓老師在辦公室猜你是誰?) |
| 3 | 13 | 調查 | 根據[[抽樣調查計畫]]收集支持研究假設的證據。 | 調查範圍必須局限在逢甲大學的學區內。 |
| 4 | 14, 15 | 分析 | (1) [[統計分析]]、(2) 製作公開展示的[[海報]]、(3) 撰寫[[紙本報告]]。 | 繳交紙本報告截止日前各組仍可以繼續修改[[紙本報告]]。 |
| 5-0 | 16 | 內部評量 | 利用上課時間各班進行一次內部比賽。 | 利用公開投票方式決定各組名次(類似電視冠軍王的方式),但是不計分。 |
| 5-1 | 06/04/2009 | 繳交海報截止日 | 將製作完成的海報繳交至圖書館一樓典藏流通組組長。 | 校內分機2630 |
| 5 | 16, 17 | 評比 | 在圖書館一樓展場公開陳列各組海報兩週,讓全校學生以投票方式進行同儕評比。 | 第16週的週五開始公開展示。 |
| 5-2 | 06/18/2009 | 評比日 || 同儕與專家評量當天完成,隔天現場公佈。 |
| 5-3 | 06/05~06/30 | 公開展示 | 於圖書館一樓北翼展場公開展示。 | 加油別丟臉! |
| 5-4 | 06/12/2009 | 繳交紙本報告截止日 | 格式請參考[[逢甲大學ePaper|http://epaper.lib.fcu.edu.tw/]]。 | 另外包含一份[[自評]]與[[互評]]。06/12當天親自交給任課老師(含可以上傳給學校圖書館的電子檔)。 |
!!研究工具
# 數位相機
# 統計調查手法
## 簡單隨機抽樣
## 分層抽樣
## 分群抽樣
## 系統抽樣
# 統計分析手法
## $Z$檢定
## $t$檢定
## 變異數分析
## 卡方檢定
!!成果報告格式
# +++[海報(在圖書館一樓展場公開展示)]
一張方寸大小的珍珠板(請注意觀摩期間你在展場看到的珍珠板就是你的展示舞台。)將呈現各組近兩個半月的工作與研究成果。製作海報的原則:
{{{
將紙本報告摘要在一張珍珠板上。
}}}
# 必要內容(千萬不要給你的觀眾四張紙!)
## 主題
## 照片(你可以透過排版讓照片跟介紹文字更具廣告效果!)
## 問卷(你可以【柔和】你的寫真照片與文字優美的問卷!)
## 統計結果的【圖】或是【表】(雖然支持研究假設只需要一個數字,但是科學之外,加一點人文或藝術會讓你的報告更有說服力!)
## 結論(請以逢甲大學的觀點,文武兼備地論述努力得到的科學結果。)
# 加分內容(這一部份是配角!如果反客為主,勢必帶來反效果!注意:珍珠板大小並不能放進太多的內容!)
## 創意
## 美編
===

# +++[紙本報告(投稿逢甲大學ePaper)]
*  篇名頁(插入浮水印的位置)
* 中(英)文摘要與關鍵字
* 目錄
* (圖目錄)
* (表目錄)
* 報告本文(依章節順序)
## [[研究假設]]
## [[研究工具]]
## [[統計結論]]
## [[評論]]
* 參考文獻
* (附錄 )
===

!!評量準則
# 同儕評量(20%)
# 專家評量(80%)
!!絕對要參考的參考文獻
+++[開關畫面]
<html><div align="center"><iframe src ="http://epaper.lib.fcu.edu.tw/referencebook_list.htm" width="100%" align="center" height=400"></iframe></div></html>
===
Type the text for 'New Tiddler'
[img[http://img1.eyefetch.com/Thumbs%5Clisef%5C22726mt.jpg]]
!!!前言
這是一個小故事。從前從前有一位可愛的養鴨人女兒,無意中發現公鴨的綠色的頭越漂亮,似乎越有求偶優勢(請注意母鴨的頭是灰色的)。為了解答心中的疑惑,小女孩想先瞭解母鴨是否偏愛綠色。她做了一個小小的實驗:同時餵母鴨綠麵包與白麵包,看母鴨是不是一開始就會撲向綠麵包?

基本上,小女孩想知道當母鴨面對這兩種不同顏色的麵包的時候,選擇上沒差別;還是母鴨偏愛綠麵包。因此,我們的研究問題可以轉換成兩種互相排斥的想法:
{{{
想法一:母鴨對兩種顏色麵包的偏愛無差別。
}}}
{{{
想法二:母鴨偏愛綠麵包。
}}}
!!!問題
+++[(1)]
當母鴨面對一綠一白麵包的時候,牠選擇撲向綠麵包的機率記做$p$。用$p$這個符號分別改寫研究想法。+++[答案]===
===
+++[(2)]
我們稱這些必須面對的想法叫做「統計假設」。這一種想法稱為「虛無假設」,因為它代表一種「沒差別」的想法;而第二種想法因為代表一種與虛無假設不一樣的想法:母鴨偏愛綠麵包,所以我們稱它為「對立假設」。請描述為什麼「想法二」與「想法一」並不是完全相反的(一般教科書的說法)?+++[答案]===
===
+++[(3)]
小女孩隨意在鴨園裡找來十隻母鴨進行實驗。每一隻母鴨都會被安排面對兩塊顏色不一樣的麵包:一塊綠的、一塊白的。小女孩記錄每一隻母鴨先撲向哪一種顏色的麵包。你覺得小女孩這時候應該注意哪一些事項,免得實驗誤差過大?+++[答案]===
===
+++[(4)]
假設$X$表示最後有幾隻母鴨一開始就撲向綠麵包。假如所有母鴨對綠麵包並沒有偏好,那麼$X$這個隨機變數服從什麼樣的機率分配?+++[答案]===
===
+++[(5)]
相關這分配的機率表,在我們課堂用書的哪幾頁?+++[答案]===
===
+++[(6)]
假如母鴨不偏愛兩顏色麵包的任何一種,那麼在這種情況下,我們期待會看到幾隻母鴨一開始就撲向綠色的麵包?+++[答案]===
===
+++[(7)]
觀察上一題答案的機率是多少?+++[答案]===
===
+++[(8)]
為什麼上一題的答案不是1.0?+++[答案]===
===
+++[(9)]
假設小女孩記錄到有9隻母鴨一開始就撲向綠麵包。如果母鴨並不偏愛哪一種顏色的麵包,那麼觀察到9隻母鴨一開始就撲向綠麵包的機率等於多少?+++[答案]===
===
+++[(10)]
你覺得10隻母鴨有9隻先撲向綠麵包,是否讓你有信心認為母鴨喜愛綠色的麵包?請用0到1之間的數字簡述你的信心程度?+++[答案]===
===
+++[(11)]
如果小女孩觀察到更多隻,你對虛無假設成立的信心是增加還是降低?+++[答案]===
===
+++[(12)]
那麼如果母鴨不偏愛綠麵包,小女孩觀察到9 隻或超過9隻母鴨一開始撲向綠麵包的機率是多少?+++[答案]===
===
+++[(13)]
我們用$p$值表示前一小題答案的機率。這一項機率告訴我們證據有多麼不利虛無假設。你認為越大越不利嗎?+++[答案]===
===
+++[(14)]
你認為小女孩實驗結果的$p$值是大的還是小的呢?+++[答案]===
===
+++[(15)]
考慮這項機率,你認為虛無假設正確嗎?+++[答案]===
===
+++[(16)]
你偏愛那一項假設?+++[答案]===
===
+++[(17)]
根據上述問題的答案,你拒絕還是不拒絕虛無假設?+++[答案]===
===
+++[(18)]
根據前述這整個流程,寫下這一項研究的結論。+++[答案]===
===
+++[(19)]
這樣的研究結果可以解答小女孩心中的疑惑:「公鴨的頭越綠色越漂亮,越有求偶優勢」嗎?如果你覺得有什麼樣的地方不妥,請為小女孩重新設計實驗。+++[答案]===
===
<html><div align="center"><iframe src ="http://en.wikipedia.org/wiki/R_(programming_language)" width="100%" align="center" height=400"></iframe></div></html>
!適用的測量尺度
{{{
順序尺度
}}}
!虛無假設
$$
H_0: \mbox{線性不相關(linear association)}
$$
!列變數的順序尺度
$$
u_1 < u_2 < \cdots < u_r
$$
!行變數的順序尺度
$$
v_1 < v_2 < \cdots < v_c
$$
!虛無假設與對立假設
$$
H_0: \rho = 0 \mbox{ vs } H_1: \rho \ne 0
$$
!檢定統計量
$$
M^2 = (n_{..} - 1) \times \frac{\sum_{i=1}^r \sum_{j=1}^c (u_i - \bar u)(v_j - \bar v) \hat p_{ij}}{\sqrt{[\sum_{i=1}^r (u_i - \bar u)^2 \hat p_{i.}][\sum_{j=1}^r (v_j - \bar v)^2 \hat p_{.j}]}}
$$
!檢定統計量的大樣本抽樣分配
$$
M^2 = (n_{..} - 1) \times \frac{\sum_{i=1}^r \sum_{j=1}^c (u_i - \bar u)(v_j - \bar v) \hat p_{ij}}{\sqrt{[\sum_{i=1}^r (u_i - \bar u)^2 \hat p_{i.}][\sum_{j=1}^r (v_j - \bar v)^2 \hat p_{.j}]}} \approx \chi^2_1
$$
!單選題
!複選題
!人口統計
{{{
x = seq(-4, 4, 0.1)
plot(x, dnorm(x), type='l')
}}}
----
{{{
curve(dnorm(x), from = -4, to = 4)
}}}
| 13 | 12/28, 29 | 領走【大學生閱讀行為調查】分組責任問卷包 | 每組一袋。甲班一併領走責任班級。乙班一併領走責任區域。 |
| 13+ | 12/18~12/24 | 請甲班各組利用時間前往責任班級遞交老師的問候函 | 請務必在下週調查前完成遞交。 |
| 14 | 12/25~12/31 | 【大學生閱讀行為調查】分組責任調查 | 請受訪同學直接在問卷上作答。乙班分五天、每天固定份數、調查時間是週五到週四的白天上課時間。甲班利用責任班級的導師時間,帶著問卷前往導師課教室調查。 |
| 15 | 12/25~12/31 | 每日上傳【大學生閱讀行為調查】的調查證據 | 一樣上傳至BB的討論區【我們這一組】 |
| !16 | !12/04, 05 | !繳交【大學生閱讀行為調查】的調查結果 | !課堂上繳回調查前領走的資料袋 |
{{{
改變可以改變的樣本、接受不可以改變的母體。
}}}
{{{
估計是有根有據的猜測。
}}}
{{{
眾人皆睡我獨醒。
}}}
{{{
統計知典型、探勘找特別。
}}}
<html><div align="center"><iframe src ="http://rlab.tiddlyspot.com/" width="100%" align="center" height=400"></iframe></div></html>
評論自己在這一次合作學習過程中的表現。
rmultinom(n, size, prob)
dmultinom(x, size = NULL, prob)
----
【提醒】
* 活用舊知識創造新知識。
* 剪剪貼貼是一種抄襲。
* R運用符號的邏輯跟英文教科書的邏輯是一樣的。
----
問幾個問題,讓自己快速上手
# rmultinom
# r
# multinorm
# d
# n
# size
# prob
# x
----
【課堂練習】
# rmultinom(n = 1, size = 10, prob = c(0.1, 0.2, 0.7)) +++[答案]
{{{
     [,1]
[1,]    0
[2,]    2
[3,]    8
}}}
===

# rmultinom(n = 10, size = 10, prob = c(0.1, 0.2, 0.7)) +++[答案]
{{{
     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
[1,]    0    1    2    2    1    2    0    2    2     0
[2,]    2    0    2    3    4    1    1    0    0     2
[3,]    8    9    6    5    5    7    9    8    8     8
}}}
===

# 你覺得++++[R命令]
{{{
dmultinom(x, size = NULL, prob)
}}}
中的NULL是什麼意思?
===

# dmultinom(x = c(0, 2, 8), prob = c(0.1, 0.2, 0.7))+++[答案]
{{{
[1] 0.1037664
}}}
===
虛無假設:通常它是一種「描述現狀」的陳述。除非有說服人的證據支持對立假設是正確的,否則我們不會拒絕它。通常我們用
$$
H_0: \mbox{一句話}
$$
描述虛無假設。注意:不管那一句話是哪一句(當然是正確的一句話!),它總是【不需舉證、不需反駁的一句話!】
* ''研究假設、對立假設($H_1, H_a$)'':@@是一種主張,只有說服人的樣本證據支持它是正確的,我們才會接受它。@@
* ''虛無假設($H_0$)'':@@通常它是一種「描述現狀」的陳述。除非有說服人的證據支持對立假設是正確的,否則我們不會拒絕它。@@記住,「虛無假設陳述既成的事實,假設『事實沒改變』」,而「研究假設是未知的、需要證據支持的、未來的//事實//,假設『事實已經改變了』」。
* ''檢定統計量(testing statistic)'':通常「母體比例的假設檢定採用樣本比例」、「母體平均的假設檢定採用樣本平均」、「母體變異數的假設檢定採用樣本變異數」。
* ''$p$值($p$ value)'':看到比現在檢定統計量(觀察值)更極端(往不利虛無假設的方向走,也就是往研究假設的方向走)的機率。
* ''拒絕虛無假設(Reject $H_0$)'':以下情形二擇一
** 拒絕正確的虛無假設
** 拒絕錯誤的虛無假設
* ''不拒絕虛無假設(Not reject $H_0$)'':以下情形二擇一
** 不拒絕正確的虛無假設
** 不拒絕錯誤的虛無假設
* ''型I錯誤(Type I error)'':拒絕正確的虛無假設。
* ''型II錯誤(Type II error)'':不拒絕錯誤的虛無假設。
* ''型I錯誤的機率($\alpha$)'':通常是0.10, 0.05, 0.01, 0.001。實際上現況不變,誤認現況已經改變的機率。
* ''型II錯誤的機率($\beta$)'':現況已經改變,誤認現況不變的機率。這一個機率是無法計算的。
* ''顯著水準($\alpha$)'':型I錯誤的機率。
* ''錯誤機率($\alpha$跟$\beta$)'':型I錯誤的機率。
* ''檢定力(power)'':$1 - \beta$。抓住錯誤現況的機率。
[[伯努利隨機變數|伯努利隨機變數的複習題解答]]
[[二項分配|二項分配的複習題解答]]
[[多項分配|多項分配的複習題解答]]
$$
(y_1, y_2, y_3, y_4, \cdots)
$$
解釋@@相似@@之真諦:
{{{
母體真的有樣本出現的現象?
}}}
{{{
學習目標:為什麼p值是這樣算的?
}}}
<<tabs "" [[計算母體比例假設檢定的p值]] "" [[計算母體比例假設檢定的p值]][[計算母體平均假設檢定的p值]] "" [[計算母體平均假設檢定的p值]]>>
{{{
請給任何一個等號一個理由。
}}}
!背後的隨機樣本
$$
y_1, y_2, \cdots, y_n \sim^{iid} Binom(m, p)
$$
!期望值
$$
E(\bar y) = E(\frac{\sum_{i=1}^n y_i}{n}) = E(\frac{y_1 + y_2 + \cdots + y_n}{n}) = \frac{1}{n}(E(y_1) + E(y_2) + \cdots + E(y_n)) = ...
$$
!變異數
$$
V(\bar y) = V(\frac{\sum_{i=1}^n y_i}{n}) = V(\frac{y_1 + y_2 + \cdots + y_n}{n}) = \frac{1}{n^2}(V(y_1) + V(y_2) + \cdots + V(y_n)) = ...
$$
!!用二項公式【把公式換成R命令】
$$
Pr(y) = \frac{n!}{y!(n - y)!} p^y (1 - p)^{n - y}, y = 0, 1, 2, \cdots, n,
$$
【取得試驗次數】
> n = 4
【定義成功機率】
> p = 0.2
【你想計算那一個$y$】
> y = 3
【數學的階乘(factorial)怎麼算?】
> factorial(y)
【把公式換成R命令】
> factorial(n) / (factorial(y) * factorial(n - y)) * p^y * (1 - p)^(n - y)
>> [1] 0.0256
以下這一句話也可以得到同樣的答案,
> choose(n, y) * p^y * (1 - p)^(n - y)
!!用內建函示【尋求R的協助】
> dbinom(x = y, size = n, prob = p)
>> [1] 0.0256
其中「d」代表「density」,「x」帶出某一個可能的二項數據,「size = n」代表伯努利試驗的次數等於n定義的數字,「prob = p」定義伯努利試驗的成功機率等於p定義的數字。
<<tabs "" [[挑一個]] "" [[]][[二項公式]] "" [[用二項公式計算p值的R]][[中央極限定理]] "" [[用中央極限定理計算p值的R]][[連續性校正]] "" [[用連續性校正計算p值的R]][[布瓦松近似]] "" [[用布瓦松分配計算p值的R]]>>
<<tabs "" [[挑一個]] "" [[]][[二項公式]] "" [[用二項公式計算p值]][[中央極限定理]] "" [[用中央極限定理計算p值]][[連續性校正]] "" [[用連續性校正計算p值]][[布瓦松近似]] "" [[用布瓦松分配計算p值]]>>
【步驟四】++++[計算邊際總和]
{{{
> margin.table(FCUtable)
[1] 14
> margin.table(FCUtable,1)
sex
0 1 
7 7 
> margin.table(FCUtable,2)
love
0 1 
6 8 
>
}}}
===

【步驟五】+++[計算比例]
{{{
> prop.table(FCUtable)
   love
sex         0         1
  0 0.1428571 0.3571429
  1 0.2857143 0.2142857
> prop.table(FCUtable,1)
   love
sex         0         1
  0 0.2857143 0.7142857
  1 0.5714286 0.4285714
> prop.table(FCUtable,2)
   love
sex         0         1
  0 0.3333333 0.6250000
  1 0.6666667 0.3750000
>
}}}
===
+++[(單變量)適合度檢定]
$$
H_0: p_1 = 0.2, p_2 = 0.5, p_3 = 0.3
$$
----
【根據上述的虛無假設繪製適當的數據表】
----
根據[[2009第一次平常考]]的第4題
----
【多項分配】假設變數向量$(X_1, X_2, X_3)$服從多項分配
$$
(n = 10, p_1 = 0.2, p_2 = 0.3, p_3 = 0.5) 
$$
發現第一個變數$X_1$的機率分配。
----
【答案】

根據[[多項分配]],假如定義【成功表示試驗的結果是$A_1$】以及【失敗表示試驗的結果不是$A_1$】,那麼$X_1$就是$n = 10$試驗有幾次成功的隨機變數。因為
# 每一次不是成功(看到$A_1$)就是失敗(看到$A_2$或是$A_3$),只有兩種選擇。
# 每一次看到成功的機率都是$p_1 = 0.2$。
# 試驗彼此之間是獨立的(因為多項試驗之間是獨立的)。
所以
$$
X_1 \sim Binom(n = 10, p = 0.2)
$$
----
有了上述的知識之後,既然每一個個別的隨機變數都是二項分配,那麼
$$
E_1 = E(X_1) = n \times p_1 = \mbox{樣本數} \times 0.2
$$
$$
E_2 = E(X_2) = n \times p_2 = \mbox{樣本數} \times 0.5
$$
$$
E_3 = E(X_3) = n \times p_3 = \mbox{樣本數} \times 0.3
$$
所以(單變量)適合度檢定的卡方檢定統計量等於
$$
\begin{eqnarray}
\frac{(O_1 - E_1)^2}{E_1} + \frac{(O_2 - E_2)^2}{E_2} + \frac{(O_3 - E_3)^2}{E_3} & = & \frac{(n_1 - (n_1 + n_2 + n_3)p_1)^2}{(n_1 + n_2 + n_3)p_1} + \frac{(n_2 - (n_1 + n_2 + n_3)p_2)^2}{(n_1 + n_2 + n_3)p_2} + \frac{(n_3 - (n_1 + n_2 + n_3)p_3)^2}{(n_1 + n_2 + n_3)p_3} \\
 & = & \frac{(n_1 - (n_1 + n_2 + n_3) \times 0.2)^2}{(n_1 + n_2 + n_3) \times 0.2} + \frac{(n_2 - (n_1 + n_2 + n_3) \times 0.5)^2}{(n_1 + n_2 + n_3) \times 0.5} + \frac{(n_3 - (n_1 + n_2 + n_3) \times 0.3)^2}{(n_1 + n_2 + n_3) \times 0.3} \\
\end{eqnarray}
$$
===
+++[(雙變量)獨立性檢定]
$$
H_0: p_{男,不同意} = p_{男} \times p_{不同意}, \cdots
$$
----
【根據上述的虛無假設繪製適當的數據表】
----
一般符號
$$
H_0: p_{ij} = p_{i.} \times p_{.j}, \forall i, j
$$
計算$E_{11}$,
$$
E_{11} = n_{..} \times p_{11} = n \times p_{1.} \times p_{.1}
$$
接下來就沒路了!因此我們得想辦法估計$E_{11}$。【注意:最大概似估計滿足取代原則。】
$$
\hat E_{11} = n_{..} \times \hat p_{1.} \times \hat p_{.1} = n_{..} \times \frac{n_{1.}}{n_{..}} \times \frac{n_{.1}}{n_{..}} = \frac{n_{1.} \times n_{.1}}{n_{..}}
$$
所以獨立性檢定的卡方統計量如下
$$
\sum_{i=1}^r \sum_{j=1}^c \frac{(O_{ij} - \hat E_{ij})^2}{\hat E_{ij}} = \sum_{i=1}^r \sum_{j=1}^c \frac{(O_{ij} - \frac{n_{i.} \times n_{.j}}{n_{..}})^2}{\frac{n_{i.} \times n_{.j}}{n_{..}}}
$$
===
+++[(雙變量)同質性檢定]
$$
H_0: p_{男,不同意} = p_{女,不同意}; p_{男,沒意見} = p_{女,沒意見}; p_{男,同意} = p_{女,同意}
$$
----
【根據上述的虛無假設繪製適當的數據表】
----
【哪一種列聯表可以檢定這一類的假設?】
----
因為虛無假設成立的時候,$p_{11} = p_{21} = p_1$,所以
$$
E_{11} = n_{1.} \times p_1
$$
又沒路了!
$$
\hat E_{11} = n_{1.} \times \hat p_1 = n_{1.} \times \frac{n_{11} + n_{21}}{n_{..}} = n_{1.} \times \frac{n_{.1}}{n_{..}} = \frac{n_{1.} \times n_{.1}}{n_{..}}
$$
所以同質性檢定的卡方統計量(跟獨立性檢定的檢定統計量是同一個!!!)如下
$$
\sum_{i=1}^r \sum_{j=1}^c \frac{(O_{ij} - \hat E_{ij})^2}{\hat E_{ij}} = \sum_{i=1}^r \sum_{j=1}^c \frac{(O_{ij} - \frac{n_{i.} \times n_{.j}}{n_{..}})^2}{\frac{n_{i.} \times n_{.j}}{n_{..}}}
$$
===
$$
F(a) = Pr(X \le a) = \int_{-\infty}^a f(x) dx
$$
所以
$$
Pr(a \le X \le b) = \int_a^b f(x) dx = \int_{-\infty}^b f(x) dx - \int_{-\infty}^a f(x) dx = F(b) - F(a)
$$
基本上這兩個積分只有神仙才會。數學家在計算機發明之後,發展一套數值積分理論,可以用來得到積分的正確答案或是近似的答案。於是乎,統計學家利用數值積分的電腦程式算出部份標準常態分配的積分(也就是,符合某些條件的機率)並且製成表格。然後利用上述最後兩項性質計算任何常態分配的機率。比如說,
$$
Pr(100 \le N(100, 5^2) \le 105) = Pr(\frac{100 - 100}{5} \le \frac{N(100, 5^2) - 100}{5} \le \frac{105 - 100}{5}) = Pr(0 \le N(0, 1^2) \le 1) = Pr(0 \le Z \le 1)
$$
+++[查標準常態表]===
----
【課堂練習】
>【Q11】已知$Pr(0 \le Z \le 1) = p_1, Pr(0 \le Z \le 2) = p_2$,試著找出以下情況的答案
>>【1】$Pr(1 \le Z \le 2)$
>>【2】$Pr(-1 \le Z \le 0)$
>>【3】$Pr(-2 \le Z \le -1)$
>>【4】$Pr(-1 \le Z \le 2)$
>>【5】$Pr(-2 \le Z \le 2)$
{{{
請給任何一個等號一個理由。
}}}
!背後的隨機樣本
$$
y_1, y_2, \cdots, y_n \sim^{iid} (E(y) = \mu, V(y) = \sigma^2)
$$
!期望值
$$
E(\bar y) = E(\frac{\sum_{i=1}^n y_i}{n}) = E(\frac{y_1 + y_2 + \cdots + y_n}{n}) = \frac{1}{n}(E(y_1) + E(y_2) + \cdots + E(y_n)) = \frac{1}{n}(\mu + \mu + \cdots + \mu) = \frac{1}{n} (n \times \mu) = \mu
$$
!變異數
$$
V(\bar y) = V(\frac{\sum_{i=1}^n y_i}{n}) = V(\frac{y_1 + y_2 + \cdots + y_n}{n}) = \frac{1}{n^2}(V(y_1) + V(y_2) + \cdots + V(y_n)) = \frac{1}{n^2}(\sigma^2 + \sigma^2 + \cdots + \sigma^2) = \frac{1}{n^2} (n \times \sigma^2) = \frac{\sigma^2}{n}
$$
{{{
請給任何一個等號一個理由。
}}}
!背後的隨機樣本
$$
y_1, y_2, \cdots, y_n \sim^{iid} BER(p)
$$
!期望值
$$
E(\bar y) = E(\frac{\sum_{i=1}^n y_i}{n}) = E(\frac{y_1 + y_2 + \cdots + y_n}{n}) = \frac{1}{n}(E(y_1) + E(y_2) + \cdots + E(y_n)) = ...
$$
!變異數
$$
V(\bar y) = V(\frac{\sum_{i=1}^n y_i}{n}) = V(\frac{y_1 + y_2 + \cdots + y_n}{n}) = \frac{1}{n^2}(V(y_1) + V(y_2) + \cdots + V(y_n)) = ...
$$
{{{
請給任何一個等號一個理由。
}}}
!背後的隨機樣本
$$
y_1, y_2, \cdots, y_n \sim^{iid} (E(y) = \mu, V(y) = \sigma^2)
$$
!隨機樣本的線性組合
$$
a_1 y_1 + a_2 y_2 + \cdots + a_n y_n
$$
!期望值
$$
E(a_1 y_1 + a_2 y_2 + \cdots + a_n y_n) = E(a_1 y_1) + E(a_2 y_2) + \cdots + E(a_n y_n) = (a_1 \mu + a_2 \mu + \cdots + a_n \mu) = (\sum_{i=1}^n a_i) \mu
$$
!變異數
$$
V(a_1 y_1 + a_2 y_2 + \cdots + a_n y_n) = V(a_1 y_1) + V(a_2 y_2) + \cdots + V(a_n y_n) = (a_1^2 \sigma^2 + a_2^2 \sigma^2 + \cdots + a_n^2 \sigma^2) = (\sum_{i=1}^n a_i^2) \sigma^2
$$
!計算母體平均假設檢定的//p//值
!!例子:右尾(研究)假設
+++[第一階段]
$$
H_0: \mu \le \mu_0
$$
vs
$$
H_1: \mu > \mu_0
$$
===
+++[第二階段]
{{{
利用「完全隨機抽樣」等等抽樣計畫收集數據。
}}}
===
+++[第三階段]
# 【大樣本、母體標準差已知】$\frac{\bar X - \mu}{\sigma/\sqrt{n}}$
# 【大樣本、母體標準差未知】$\frac{\bar X - \mu}{S/\sqrt{n}}$
# 【小樣本、母體標準差已知、數據來自常態分配】$\frac{\bar X - \mu}{\sigma/\sqrt{n}}$
# 【小樣本、母體標準差未知、數據來自常態分配】$\frac{\bar X - \mu}{S/\sqrt{n}}$
===
+++[第四階段的第一步]
# 【大樣本、母體標準差已知】$\frac{\bar X - \mu}{\sigma/\sqrt{n}} \sim Z$
# 【大樣本、母體標準差未知】$\frac{\bar X - \mu}{S/\sqrt{n}} \sim Z$
# 【小樣本、母體標準差已知、數據來自常態分配】$\frac{\bar X - \mu}{\sigma/\sqrt{n}} \sim Z$
# 【小樣本、母體標準差未知、數據來自常態分配】$\frac{\bar X - \mu}{S/\sqrt{n}} \sim t_{n - 1}$
===
+++[第四階段的第二步]
因為現在是「右尾假設」的檢定,我們會說是「右尾檢定」,或是更完整地說這是「母體平均的右尾檢定」,所以「不利虛無假設」的方向是「往右邊」,因此//p//值是
* 如果$\bar x \ge \mu_0$,
$$
\begin{array}{rcl}
P(\bar X \ge \bar x) & = & P(\frac{\bar X - \mu_0}{\sigma/\sqrt{n}} \ge \frac{\bar x - \mu_0}{\sigma/\sqrt{n}}) \\
 & = & 0.5 - TA(\frac{\bar x - \mu_0}{\sigma/\sqrt{n}})
\end{array}
$$
* 如果$\bar x \le \mu_0$,
$$
\begin{array}{rcl}
P(\bar X \ge \bar x) & = & P(\frac{\bar X - \mu_0}{\sigma/\sqrt{n}} \ge \frac{\bar x - \mu_0}{\sigma/\sqrt{n}}) \\
 & = & 0.5 + TA(-1 \times \frac{\bar x - \mu_0}{\sigma/\sqrt{n}})
\end{array}
$$
+++[【動動腦】]
>這時候需要計算//p//值嗎?
===
===
+++[第五階段]
一般「型I錯誤」的機率&alpha;取0.05。

<html><div align="center">如果//p//值小於&alpha;,我們「拒絕虛無假設」。</div></html>
===

----

+++[如何計算左尾假設檢定的//p//值?]
{{{

}}}
===
+++[如何計算雙尾假設檢定的//p//值?]
{{{

}}}
===
!計算母體比例假設檢定的//p//值
{{{
學習目標:為什麼p值是這樣算的?
}}}
「母體比例」假設檢定的@@先後順序@@如下所示:
# +++[你記得嗎?]@@color:red;--根據問題寫下研究假設--;
$$
H_1: p > 0.5
$$
@@===

# +++[你記得嗎?]@@color:orange;--根據抽樣計畫收集數據--;
{{{
小女孩記錄到有9隻母鴨一開始就撲向綠麵包。
}}}
@@===

# +++[你記得嗎?]--使用數據計算檢定統計量--;
## ++++[大樣本]
$$
\frac{\hat p - p_0}{\sqrt{p_0(1 - p_0)/n}}
$$
===

## ++++[小樣本]
$$
\hat p, n \times \hat p (= X)
$$
===

===

# +++[你記得嗎?]@@color:green;--在虛無假設成立的條件下得知檢定統計量的抽樣分配--,
因為
$$
H_0: p = 0.5
$$
所以
$$
n \hat p = X = \sum_{i = 1}^n X_i \sim BIN(n = 10, p = 0.5)
$$
另外,因為$10 \times 0.5 = 5$大於等於5,所以也可以運用「樣本比例的大樣本抽樣分配」計算$p$值。也就是說,可以運用以下的大樣本結果
$$
\frac{\hat p - p_0}{\sqrt{p_0(1 - p_0)/n}} \approx Z
$$
--並且根據該機率分配計算檢定統計量的證據力,//p//值--;???
@@===

# +++[你記得嗎?]@@color:blue;--根據$p$值與$\alpha$的大小關係,決定「拒絕」或是「不拒絕」虛無假設--;
一般而言,如果
$$
p-\mbox{值} < \alpha
$$
我們會「拒絕虛無假設」。
@@===

!
我們現在已經到了第四階段,準備計算證據(收集到數據)的證據力,$p$值。先知道一件事:+++[p值到底是什麼?]
# 證據的證據力。「愈小愈有利研究假設」。
# 不利虛無假設的機率。
## 什麼叫「不利虛無假設」?
### 左尾檢定:「檢定統計量觀察值」與虛無假設所陳述之情況,「$H_0 : p \ge 0.5$(意味著「一開始撲向綠麵包的母鴨總數大於5」)」+++[背道而馳]@@觀察到「4, 3, 2, 1, 0」隻母鴨一開始撲向綠麵包@@===。
### 右尾檢定:「檢定統計量觀察值」與虛無假設所陳述之情況,「$H_0 : p \le 0.5$(意味著「一開始撲向綠麵包的母鴨總數小於5」)」+++[背道而馳]@@觀察到「6, 7, 8, 9, 10」隻母鴨一開始撲向綠麵包@@===。
### 雙尾檢定:「檢定統計量觀察值」與虛無假設所陳述之情況,「$H_0 : p = 0.5$(意味著「一開始撲向綠麵包的母鴨總數等於5」)」+++[背道而馳]@@觀察到「6, 7, 8, 9, 10或者是4, 3, 2, 1, 0」隻母鴨一開始撲向綠麵包@@===。
# 看到比現在手邊的證據更不利虛無假設的機率。
# 看到比現在檢定統計量(觀察值)更極端(往不利虛無假設的方向走,也就是往研究假設的方向走)的機率。也就是說,
## +++[左尾檢定]@@$P(X \le 9)$@@===。
## +++[右尾檢定]@@$P(X \ge 9)$@@===。
## +++[雙尾檢定]@@$2 \times P(X \ge 9)$@@===。
===

!再訪綠頭鴨的實驗:一種右尾假設的檢定問題
+++[第一階段]
(想法一)虛無假設:母鴨對兩種顏色麵包的偏愛無差別。+++[符號表示式]H~~0~~: //p// = 0.5===

(想法二)研究假設:母鴨偏愛綠麵包。+++[符號表示式]H~~1~~: //p// > 0.5===

{{{
這是一種「右尾假設」的檢定。
}}}
===
+++[第二階段]
{{{
小女孩觀察到9隻母鴨一開始撲向綠麵包。
}}}
===
+++[第三階段]
{{{
假設X表示最後有幾隻母鴨一開始就撲向綠麵包。
}}}
===
+++[第四階段]
{{{
那麼如果母鴨不偏愛綠麵包,小女孩觀察到9隻或超過9隻母鴨一開始撲向綠麵包的機率是多少?
}}}
@@語意分析@@
根據
# @@在虛無假設成立的條件下得知檢定統計量的抽樣分配@@,所以+++[X的抽樣分配是]BIN(//n//=10, //p//=0.5)===

# @@小女孩觀察到9隻或超過9隻母鴨一開始撲向綠麵包的機率是多少?@@+++[為什麼算這一項機率呢?]因為//p//值是「不利虛無假設」的機率,加上不利虛無假設是在右尾,所以//p//值等於「觀察到9隻或超過9隻母鴨一開始撲向綠麵包的機率」。===

# $p\mbox{值} = P(X = 9) + P(X = 10) = 0.0098 + 0.0010 = 0.0108$

===
+++[第五階段]
@@未決!@@
===

----

+++[如果小女孩要的是左尾假設,檢定的p值等於多少?]
{{{

}}}
===
+++[如果小女孩要的是雙尾假設,檢定的p值等於多少?]
{{{

}}}
===
!!用二項公式【把公式換成R命令】
{{{
課後練習題
}}}
!!用內建函示【尋求R的協助】
> pbinom(q = y, size = n, prob = p)
>> [1] 0.9984
# 用R實現[[相對風險]]的信賴區間:
## +++[讀取數據。]
{{{
關於這一部份,課本怎麼說?
}}}
如果依舊是[[2乘2表格]],你有沒有覺得老是作同樣的事,令人覺得沒效率嗎?如果有,何不把常用的動作包裝起來。方便下一回不再作同樣的事。根據以往的經驗,再度套用以下的樣板可以省去一些麻煩
//Name// = function(//~INPUTs//)
{

}
----
【步驟一】決定輸入?+++[答案]
{{{
c(n11, n12, n21, n22)
}}}
=== 
【步驟二】決定輸出?+++[答案]
{{{
一個data.frame。
}}}
=== 
【步驟三】你要包裝哪一類型的程式碼?+++[答案]=== 
>一、讀取數據
>二、數學公式換成R程式
>三、計算摘要統計量
>四、作圖
>五、其他
【步驟四】其他注意事項?+++[答案]===
----
+++[包裝結果]
{{{
ConTableTOdataframe = function(n11, n12, n21, n22)
{
v1 = c(rep(0, (n11+n12)), rep(1, (n21+n22)))
v2 = c(rep(0, n11), rep(1, n12), rep(0, n21), rep(1, n22))
v1 = as.factor(v1)
v2 = as.factor(v2)
Table = data.frame(v1 = v1, v2 = v2)
Table
}
}}}
===

===

## 老師提供的辦法。+++[課堂討論]
{{{
面對複雜的公式,分段(說許多句話)寫?還是一次(只說一句話)寫完?
}}}
===
+++[【Fieller's Theorem】]
$$
(\hat p_2^2 - \frac{\hat p_2 \times \hat q_2}{n_2} \times \chi_{1,0.05}^2) RR^2 - 2 \hat p_1 \hat p_2 RR + (\hat p_1^2 - \frac{\hat p_1 \times \hat q_1}{n_1} \times \chi_{1,0.05}^2) \le 0
$$
根據上述不等式,我們可以得到相對風險的95%信賴區間如下所示:
$$
RR \in \frac{B \pm \sqrt{B^2 - AC}}{A}
$$
其中
$$
A = \hat p_2^2 - \frac{\hat p_2 \times \hat q_2}{n_2} \times \chi_{1,0.05}^2
$$
$$
B = \hat p_1 \hat p_2
$$
以及
$$
C = \hat p_1^2 - \frac{\hat p_1 \times \hat q_1}{n_1} \times \chi_{1,0.05}^2
$$
----
+++[包裝結果]
{{{
 = function()
{
}
}}}
===

===

## 講義提供的辦法。+++[【對數轉換】]
$$
\left[\exp\left(\log(\frac{\hat p_1}{\hat p_2}) - z_{0.025} \times \sqrt{\frac{1}{n_1}\frac{1 - \hat p_1}{\hat p_1} + \frac{1}{n_2}\frac{1 - \hat p_2}{\hat p_2}}\right), \exp\left(\log(\frac{\hat p_1}{\hat p_2}) + z_{0.025} \times \sqrt{\frac{1}{n_1}\frac{1 - \hat p_1}{\hat p_1} + \frac{1}{n_2}\frac{1 - \hat p_2}{\hat p_2}}\right)\right]
$$
----
+++[包裝結果]
{{{
 = function()
{

}
}}}
===

===

!發展過程:
# 準備相關的數學公式。
# 看著公式,為公式的每一個部分取名字:
# 公式先寫
# 準備工作
# (計算p值)
# (拒絕?還是不拒絕?)
[[抽樣調查評比計畫]]
[[關於第二次報告有以下的注意事項]]
----
{{{

}}}
| 目次 | 時間 | 工作內容 | 備註 |
| 0 | 11/23, 24之前 | 確定分組名單 | 請將確定的分組名單上傳到BB的討論區【我們這一組】 |
| 0+ | 11/23, 24 | 第三堂課協助確定分組名單 ||
| 1 | 11/23, 24 | 我的大學生閱讀行為調查與問卷編碼 | 課堂上自己先做做看。@@該份問卷不要遺失,在【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的實習時用得到。@@下次上課繳回。發放受訪者基本資料影印版。 |
| 2 | 11/23, 24 | 上傳各組11/23, 24在班上自己親自做的【大學生閱讀行為調查】的結果到BB | BB的討論區叫做【我們這一組】 |
| 3 | 11/25, 26, 27 | 合併班上的結果並且回報任何問題 | 這是一次練習。上課時隨機檢查並且上台報告接受老師的檢核。 |
| !4 | !11/30, 12/01 | !檢核第一次合併資料的練習成果 | !利用電腦隨機叫號決定誰上台接受老師檢核。 |
| 5 | 12/01, 02, 03 | 到校園某處調查【大學生的隨身包包有幾兩重?】 | 請準備好你的道具與紀錄表。分三天、每天【10份】。@@至於受訪同學的個人基本資料,請跟【大學生閱讀行為調查】的問卷一樣。@@ |
| 6 | 12/01, 02, 03 | 每日上傳【大學生的隨身包包有幾兩重?】的調查證據 | 請上傳你的照片或是錄影到BB的討論區【我們這一組】。在BB上每一次上傳的標題要清楚,如果助教搞不清楚,就不算上傳成功。 |
| 7 | 12/04 | 上傳【大學生的隨身包包有幾兩重?】的調查結果 | 根據【大學生閱讀行為調查】的實習經驗上傳各組的調查結果到BB的討論區【我們這一組】 |
| 8 | 12/08, 09, 10 | 到校園某處調查【大學生的隨身包包有幾本教科書?】 | 請準備好你的紀錄表。分三天、每天【10份】。@@至於受訪同學的個人基本資料,請跟【大學生閱讀行為調查】的問卷一樣。@@ |
| 9 | 12/08, 09, 10 | 每日上傳【大學生的隨身包包有幾本教科書?】的調查證據 | 請上傳你的照片或是錄影到BB的討論區【我們這一組】。在BB上每一次上傳的標題要清楚,如果助教搞不清楚,就不算上傳成功。 |
| 10 | 12/11 | 上傳【大學生的隨身包包有幾本教科書?】的調查結果 | 一樣上傳至BB的討論區【我們這一組】 |
| 11 | 12/12~12/17 | 合併並且分析大家【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的調查結果 | 請利用MS Excel的直方圖與圓餅圖工具分析,並且撰寫一段簡短的評論。 |
| 12- | !12/20 (下午四點到五點)| 上傳各組第一次5分鐘報告需要的PPT投影片與報導文稿到討論區【我的第一次報導】 | PPT與報導文稿的格式自由發揮。各組未在規定時間上傳,扣一分(1%)。【我的第一次報導】的開放時間下午四點到五點。 |
| !12 | !12/21, 22 | !各組5分鐘第一次上台報告【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的分析結果與報導文稿 | !第二次實習考核 |
| 12+ | 12/21~12/25 | 上傳【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的分析結果到BB的討論區【我們這一組】 | 請參考大家的創意製作第二次的報導文稿。 |
| 12++- | !12/27 (下午四點到五點)| 上傳各組第二次5分鐘報告需要的PPT投影片與報導文稿到討論區【我的第二次報導】 | PPT與報導文稿的格式請參考[[我要報導]]。各組未在規定時間上傳,無法取得第二階段加分資格。【我的第二次報導】的開放時間下午四點到五點。 |
| !12++ | !12/28, 29 | !各組5分鐘第二次上台報告【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的分析結果 | !第三次實習考核(邀請圖書館張簡組長參與考核)、各班選出四組準備上逢甲電視台報導。一樣請利用MS Excel的直方圖工具分析,並且撰寫一段簡短【五分鐘】的評論。全程錄影,當天報告同學請著正式服裝。 |
| 13 | 12/28, 29 | 領走【大學生閱讀行為調查】分組責任問卷包 | 每組一袋。甲班一併領走責任班級。乙班一併領走責任區域。 |
| 13+ | 12/18~12/24 | 請甲班各組利用時間前往責任班級遞交老師的問候函 | 請務必在下週調查前完成遞交。 |
| 14 | 12/28,29~01/08 | 【大學生閱讀行為調查】分組責任調查 | 請受訪同學直接在問卷上作答。乙班分五天、每天固定份數、調查時間是週五到週四的白天上課時間。甲班利用責任班級的導師時間,帶著問卷前往導師課教室調查。 |
| 15 | 12/28,29~01/08 | 每日上傳【大學生閱讀行為調查】的調查證據 | 一樣上傳至BB的討論區【我們這一組】。在BB上每一次上傳的標題要清楚,如果助教搞不清楚,就不算上傳成功。 |
| !16 | !01/11 | !第二次小考前繳交【大學生閱讀行為調查】的調查結果 | !課堂上繳回調查前領走的資料袋 |
| 16+ | 01/11 | 考完第二次小考之後一起吃中飯 | 請班代規劃。一人一個便當的預算。 |
| 17 | 下學期 | 從八組人馬每個題目各挑一組前往逢甲電視台報導或是接受訪問 | 會與張簡組長安排,請拭目以待。 |


{{{
哪一張照片最美?
}}}
!定義
{{{
美:
}}}
{{{
舒適:
}}}
{{{
所有態度量尺的題目都是順序尺度的問卷題目。
}}}
[[態度量尺]]
不論你找到的證據是否支持各組的研究假設,請以
{{{
平常心
}}}
評論整個期末報告的過程。
我的計畫,把這學期的課程切割成
* 離散資料分析
** [[離散數據]]
** [[離散數據的機率分配]]
** [[比例的統計推論]]
** [[更多關於離散數據的統計推論]]
** [[列連表的機率結構]]
** [[比較二乘二列連表的比例]]
** [[勝算比]]
** [[獨立性卡方檢定]]
** [[檢定順序數據的獨立性]]
** [[小樣本的正確推論]]
** [[三向列連表的關連性]]
* 問卷資料分析
** [[問卷編碼]]
** [[合併資料檔]]
** [[抽樣調查的樣本數]]
** [[單選題]]
** [[複選題]]
** [[信度與效度]]
除了它們涵蓋的理論與實務,我們會在這短短的四個月內,學習以下軟體工具的必要部份
* R
* SPSS
為了幫助各位有效率地學習這們課,我會為各位複習以下這兩項基本的統計推論工具
* [[信賴區間]]
* [[假設檢定]]
Type the text for 'New Tiddler'
講義最重要的部份:
# 英文內容的第一章(預備知識)
# 英文內容的第二章(列聯表)
# 最後關於SPSS分析問卷資料的投影片(來自學姊在[[圖書館統計研習營|http://talkstats.tiddlyspot.com/]]的講義)
老師寫的課程網頁試圖
# 努力解釋英文內容的第一章跟第二章
# 提供[[R|R入口]]盡可能詳細的訓練
# 提供個人教授統計學的一些私人技巧
除此
{{{
網頁是一份訓練課程的內容。
}}}
所謂訓練課程,表示它提供訓練,訓練什麼?
# 統計邏輯
# 統計思考方法
# 統計計算能力
# R及R程式設計能力
# 統計解題技巧
# 離散數據的假設檢定技巧
# 問卷數據的基本分析技巧
當我們試圖發現某一種統計方法的缺點,我們應該先找到該方法的關鍵步驟。提醒:
{{{
統計方法包含一連串的步驟。
}}}
基本上,[[二項比例的大樣本信賴區間]]的基本型式
$$
\hat p \pm Z_{\alpha/2} \times SE(\hat p)
$$
!開始找缺點...
!!$Z_{\alpha/2}$為什麼出現在公式裡?
{{{
請作答?
}}}
!!$SE(\hat p)$為什麼出現在公式裡?
【再提醒一遍】
>$SE(\hat p) = \hat SD(\hat p) = \hat{\sqrt{V(\hat p)}}$
大樣本檢定用以下這一種答案:
* $SE(\hat p) = \hat SD(\hat p) = \hat{\sqrt{V(\hat p)}} = \sqrt{\hat p (1 - \hat p)/n}$
>Formula (1.3) is simple. Unless $p$ is close to 0.50, however, it does not work well unless $n$ is very large.

> Consider its actual coverage probability, that is, the probability that the method produces an interval that captures the true parameter value. This may be quite a bit less than the nominal value (such as 95%). It is especially poor when $p$ is near 0 or 1.
----
【老師的觀察】
#
就是//p//[[值|p值]]。
!適用範圍
{{{
2x2表格
}}}
| $n_{11}$ | $n_{12}$ | $n_{1.}$ |
| $n_{21}$ | $n_{22}$ | $n_{2.}$ |
| $n_{.1}$ | $n_{.2}$ | $n_{..}$ |
!獨立性的虛無假設等於...
$$
H_0: \theta = 1
$$
也就是,勝算比等於1。
!$n_{11}$
給定列總和跟行總和,$(n_{11}, n_{12}, n_{21}, n_{22})$服從一種【超幾何分配】。當$\theta = 1$,
$$
Pr(n_{11}) = \frac{C_{n_{11}}^{n_{1.}} \times C_{n_{.1} - n_{11}}^{n_{2.}}}{C_{n_{.1}}^{n_{..}}}
$$
!例子
| 3 | 1 | 4 |
| 1 | 3 | 4 |
| 4 | 4 | 8 |
!!$H_1: \theta > 1$
!!p值
$$
Pr(3) + Pr(4) = 0.229 + 0.014 = 0.243
$$
!三項基本的機率分配
<<tabs "" [[挑一個開始]] "" [[]][[伯努利分配]] "" [[伯努利分配]][[二項分配]] "" [[二項分配教室版]][[多項分配]] "" [[多項分配教室版]]>>
!R命令
<<tabs "" [[挑一個開始]] "" [[]][[伯努利分配跟二項分配]] "" [[Using R to look at distributions (I)]][[多項分配]] "" [[Using R to look at distributions (II)]]>>
請用【美言美語】紀錄你們那一組的照片。這是一次收集資訊的訓練,說不定你會因此發現逢甲大學不為人知的陳年往事。
|>||>| 愛逢甲? |
|~|~| YES | NO |
| 性別 | 男 | 3 | 4 |
|~| 女 | 5 | 2 |
{{{
把這個表格輸入R?
}}}
----
【步驟一】+++[把上述列聯表的原始數據寫出來:]
| 性別 | 愛逢甲? |
| 男 | YES |
| 男 | YES |
| 男 | YES |
| 男 | NO |
| 男 | NO |
| 男 | NO |
| 男 | NO |
| 女 | YES |
| 女 | YES |
| 女 | YES |
| 女 | YES |
| 女 | YES |
| 女 | NO |
| 女 | NO |
----
===

【步驟二】+++[把上述表格輸入R的data.frame]
{{{
sex = c(rep(1, 7), rep(0, 7))
love = c(rep(1, 3), rep(0, 4), rep(1, 5), rep(0, 2))
sex = as.factor(sex)
love = as.factor(love)
FCU = data.frame(sex = sex, love = love)
}}}
===

【步驟三】+++[把data.frame變成列聯表]
{{{
FCUtable = table(FCU)
FCUftable = ftable(FCU)
}}}
+++[結果]
{{{
> table(FCU)
   love
sex 0 1
  0 2 5
  1 4 3
> ftable(FCU)
    love 0 1
sex         
0        2 5
1        4 3
>
}}}
===

===
{{{
Boston = scan(what=list(price=0, rooms=0, at="", WandD="", heater=""))

attach(Boston)
}}}
!改成data.frame
{{{
Btable = data.frame(price=Boston$price)
attach(Boston)
Btable
Btable = data.frame()
Btable
Btable = data.frame(price=price)
Btable
Btable=cbind(Btable, rooms=rooms, at=at, WandD=WandD, heater=heater)
Btable
class(Btable$at)
class(Btable$heater)
summary(Btable)
}}}
!!!這一切的一切都是那一邊?
| 步驟0 | $H_0$ |
| 步驟1 | $H_1$ |
| 步驟2 | 左、右、還是雙尾檢定? |
| 步驟3 | $\alpha$放在左、右、還是雙尾? |
| 步驟4 | 臨界點在虛無值的左、右、還是兩邊? |
| 步驟5 | $p$值往哪一邊遞減?左、右、還是兩邊? |
| 步驟6 | 檢定統計量的觀察值在臨界值的哪一邊,我會拒絕虛無假設?左、右、還是兩邊? |

| 步驟0 | 步驟1 | 步驟2 | 步驟3 | 步驟4 | 步驟5 | 步驟6 |
| $\mu \ge 10$ | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== |
| $p \le 0.5$ | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== |
| $\mu \mbox{至少} 100$ | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== |
| $\mu \le -20$ | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== |
| $p \mbox{剛好} 0.22$ | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== |
| $\mu \mbox{頂多} 50$ | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== |
| $\sigma^2 = 140$ | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== |
| $\mu \le 10$ | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== |
| $\mu = 10$ | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== | +++[答案]=== |
{{{
你發現答案妙在哪裡嗎?
}}}
網路上有一個人自稱「[[剪剪貼貼過日子|http://www.wretch.cc/blog/devika1959]]」。老師是在某個部落格發現有這麼一號人物(你可以經由前一句話提供的連接知道這一號人物的部落格,驗證老師所言不虛。)你可以瀏覽他的部落格發現這一位「網友」的興趣在哪裡?你當然也會看到他如何管理、組織、呈現他的「知識」,雖然我們不確定該部落格的所有內容只是放在「機器」上,還是也放在他的「腦子」裡。另外,我們也不知道他所說的每一句話到底是真是假?

為了「學習判斷別人所言所行之虛虛假假」,你上學校、上圖書館、上網;你打聽、紀錄、討論、研判。最後你有了一個「說服自己的答案」。
{{{
「他/她是愛我的」。
}}}
一次不夠、二次不夠、三次可能也不夠。你找來「可以信任的對象」,請他/她/它/祂幫你背書。最後你不再找尋「他是不是愛我」的答案,決定與他長相思守直到永遠。可能有一天...

老師並不會寫愛情小說,這門課也不是「愛情追追追」。老師只是提醒你,不要忘了「你來學校的目的」:
{{{
學習判斷別人所言所行之虛虛假假
}}}
重點來了。學校(實際上是教育部)要你修習這麼多學分,有必修、有選修、有的你有興趣、有的你沒有興趣、有的營養、有的機車,更慘的是
{{{
每一個學分你都要,因為你要畢業拿文憑。
}}}
為了這件事,以前的前輩用「紙作的筆記本」努力的抄、努力的謄(copy)。「作筆記」這件事現在二十一世紀有個新名詞,「知識管理」。老師認為:「透過知識管理可以加速你內化知識 - 把知識放在腦子而不是機器上 - 的速度。」管理是需要工具的。這學期你看到的課程(輔助)網頁就是植基在一種知識管理工具~TiddlyWiki 。它是一種部落格工具,只要放在隨身碟就可以把老師的補充資料帶著走。更棒的是,不需要網路也可以瀏覽這一份統計資料分析部落格。

祝你成功。
!!「世界閱讀日」發表「大學生閱讀行為調查報告」(2008-4-22,公共關係室 )
許多人憂心現在大學生普遍素質下降,一代不如一代,其中大學生的閱讀狀況,將是受到注意的項目。一項由本校執行,針對大學生所做的閱讀行為問卷調查報告,為響應「世界閱讀日」,本校訂於4月22日(二)下午1時,於本校人言大樓地下一樓啟垣廳,進行調查結果發表,當天舉辦以「閱讀新視界:你用青春碰撞什麼?」為主題的文化沙龍,並發表「2008年大學生閱讀行為調查報告」,同時邀請學者、專家進行評論、對談。

本次調查報告由本校吳榮彬副教授負責規劃執行,此次,受訪者學院比例仍屬平均分佈,文學院23%、商學院20%、工學院17%、理學院10%等所佔比例較高,女性佔62%、男性佔38%,近九成受訪者每月購書費用在1,000元以下。並且受訪者「認為閱讀是一種自由,任何人不應該加以干涉」的比例高達95.7%,顯示絕大多數受訪者認為閱讀自由應該受到尊重。其他統計結果顯示,大學生在閱讀困難項目中,顯示「想讀書時,卻靜不下來」佔了50%,在「如何取得圖書出版訊息」項目中,在「研習教科書、準備考試外,每天花在閱讀時間多寡」的選項中,以「1-2小時」53%的比例為最高。本校圖書館館長黃焜煌表示,希望藉由調查了解目前大學生在閱讀上所遭遇的困難與問題,讓校方與學生能針對問題,做改善,以期提升學生的閱讀能力,鼓勵養成良好閱讀習慣。

接著也將舉辦專家座談、評論,主持人由本校董事會高承恕副董事長擔任,同時邀請多位具有豐富素養、經驗的學者、專家參加與談,分別由出版產業、閱讀教育、閱讀推廣等角度,深入剖析大學生遭遇的各種閱讀課題,以提供具有正面、建設性的意見。
關於這一件事,請參考課本p.131的例子3-3。
$$
E(aX + b)=aE(X) + b
$$
這一項期望值的結果,讓你
# 知道隨機變數$X$的機率分配
# 知道$a$
# 知道$b$
# 不需要知道$aX + b$的機率分配(為什麼我們可能需要知道$aX + b$的機率分配?)
# 不需要計算每一個$X$可能值的$a \times x + b$(為什麼我們可能需要計算每一個$X$可能值的$a \times x + b$?)
可以知道$E(aX + b)$的答案。
$a$跟$b$都是固定的數字,以下這些數字的例子都是所謂的「固定的數字」:
# 1, 2, 3, ...
# -1, -2, -3, ...
# 0
# -1/2, 1/2, ...
# 3.14159, ...
[img[http://i299.photobucket.com/albums/mm318/jungpinwu/Ross.jpg]][img[http://i299.photobucket.com/albums/mm318/jungpinwu/Robert.jpg]]
>R started in the early 1990’s as a project by Ross Ihaka and Robert Gentleman at the University of Auckland, New Zealand, intended to provide a statistical environment in their teaching lab. The lab had Macintosh computers, for which no suitable commercial environment was available.
Ross跟Robert+++[哪一位是Ross教授?]===這兩位教授為了教學,發明、發展了R。到今天,在台灣R已經逐漸成為話題,很多人用它教學、研究、甚至服務。

由於這一門課不是R的專門課程,老師把R「刊入」統計資料分析(= 離散資料分析 + 問卷資料分析),讓R成為課程的一部份,而不是全部;讓R是我們分析數據的工具,而不是我們學習、研究的對象。在這樣的思維下,老師並不會系統式地介紹R,只介紹那些我們需要R的部份。所以,老師強烈建議你
{{{
把你學習R的問題告訴我,...
}}}
!!!R跟統計
* Most packages deal with statistics and data analysis.
* Powerful statistical graphics.
* Well crosstalking with other statistical softwares.
* Most R user are statistical experts. You can learn more modern analysis method from they by email.
* You can do it when you come across a thing no body do it before.
各位

報導文稿
其實
就是你前言與三段結論的總和
也就是
前言
加上
二段小結論
再加上
一段總結
{{{
所以不需要最後再來一段報導文稿!
}}}
[img[http://www.stat.wmich.edu/s216/htests/Curves/p2a.gif]]
!!!關於「母體比例(成功機率)」的假設
* 單尾(研究)假設
** 右尾(研究)假設:H~~1~~: //p// > //p//~~0~~
** 左尾(研究)假設:H~~1~~: //p// < //p//~~0~~
* 雙尾(研究)假設:H~~1~~: //p// &ne; //p//~~0~~
!!!細部說明
+++[(0)]
「//p//」是母體比例,也就是二項分配的成功機率。
===
+++[(1)]
「H~~1~~」叫做+++[「研究假設」或是「對立假設」]@@是一種主張,只有說服人的樣本證據支持它是正確的,我們才會接受它。@@===「H」是「Hypothesis」的縮寫。
# 叫「研究假設」的原因是,「研究目標」擺在「:」之後。
# 叫「對立假設」的原因是,與「+++[虛無假設]@@通常它是一種「描述現狀」的陳述。除非有說服人的證據支持對立假設是正確的,否則我們不會拒絕它。@@===」是「對立」的,「完全相反的」。
# 所以,「對立假設」的下標用「1」;而「虛無假設」的下標用「0」。
# 一般而言,我們先寫「研究假設」再寫「虛無假設」。
# 所以,對應上述研究假設的@@虛無假設@@如下:
+++[答案]
## H~~0~~: //p// &le; //p//~~0~~
## H~~0~~: //p// &ge; //p//~~0~~
## H~~0~~: //p// = //p//~~0~~
===
===
+++[(2)]
「//p//~~0~~」叫做「虛無值」。
===
+++[(3)]
# 「單尾」意味著最後檢定的結果不是
## 右尾假設:「拒絕左邊(的虛無假設)」就是「不拒絕左邊(的虛無假設),也就是說,接受右邊(的研究假設)」。
## 左尾假設:「拒絕右邊(的虛無假設)」就是「不拒絕右邊(的虛無假設),也就是說,接受左邊(的研究假設)」。
# 「雙尾」意味著最後檢定的結果不是
## 雙尾假設:「拒絕等號(的虛無假設)」就是「不拒絕等號(的虛無假設),也就是說,接受左右兩邊(的研究假設)」。
===
{{{
   1. 投影片的第一頁必須按順序包含
         1. 題目(可以自己下,只要能契合我們的調查題目即可)
         2. 組別
         3. 組員
         4. 班級
         5. 指導教授:吳榮彬副教授
   2. 報告內容
         1. 前言(你認為這兩項調查應該是為了什麼樣的理由!)
         2. 數據收集方法的基本描述(各班分工情形以及各組經驗甘苦談。)
         3. 受訪員基本資料分析(請利用圓餅圖或是長條圖,並且利用交叉分析的概念,增加報告的可看性!)
         4. 調查結果的敘述統計量以及圓餅圖與直方圖圖形分析(各位在大一學到的技術。同樣的數據不需要用兩種圖進行說明!請特別注意!)
         5. 每道題目提出兩條假說(總共四條、請各位參考我們在課堂上的練習。)
         6. 針對假說進行驗證分析(這部份由於牽涉下學期的課程,所以現階段只需要進行敘述性分析,用圓餅圖或是直方圖的圖形,以及交叉分析的概念支持或是反對你的假說都可以。)
         7. 本段落的結論(包包重量與幾本教科書要分別下結論。)
         8. 總結(如果可以跟你的前言互相輝映最好!!!)
   3. 扣分項目
         1. 未按時上傳報告用的資料
         2. 未著正式服裝
         3. 5分鐘沒用完
   4. 請各組善用你的創意,增加報告的可看性與現場氣氛。
   5. 請大家活用你已經學過的統計知識與技術強化報告的內容。
   6. 請各組事前練習。
   7. 屆時需要麥克風的報告人請用麥克風。(請兩班班代事先準備好!)
   8. 第二次報告當天不要遲到。(未能全程參與將酌量扣分!)
   9. 報告當天5分鐘按第一次鈴、5分30秒第二次鈴、6分鐘第三鈴(此時一定要下台一鞠躬!)
  10. 第二次報告依舊採用同儕評量作為最後前往逢甲電視台的部份依據。
}}}
{{{
sample(Btable, 2)

Btable[sample(5, 2),]
Btable[sample(5, 2),]
Btable[sample(5, 2),]
}}}
----
{{{
以上這兩招有什麼不一樣?
}}}
----
{{{
第二招可以幫助我們了解波士頓公寓數據嗎?
}}}
{{{
準備你第一次的隨機抽樣。
}}}
# 名冊(index set)$= \{1, 2, \cdots, N\}$。$N$代表母體內總共多少單元。(比如說,統計系總人數、台灣人口總數、...)
# 樣本數($n$)
# 所有可能的樣本($S_i, i = 1, 2, \cdots, C^N_n$)
# 抽到某一個$S_i$的機率。
# 【附帶資訊】抽到某一個單元的機率($\pi_i$)。
!帶出利用sample()所需的資訊
{{{
sample(x, size, replace = FALSE, prob = NULL)
}}}
# 準備對應的x。
# 【size = 1】(挑一個樣本$S$)
# 【replace = FALSE】還是【replace = TRUE】都無所謂。為什麼?
# 【prob = c()】。把抽到$S_i$的機率數值按順序寫入小括號內。
# 撰寫R指令。
{{{
sample(x = x, size = size, replace = FALSE, prob = prob)
}}}
!符號
* [[瞭解分配]]
----
!比例可以玩什麼花樣?
!!首部曲:單變量
# 二項比例的假設檢定
# 二項比例的信賴區間
!!二部曲:雙變量
{{{
交叉分析
}}}
# [[介紹列聯表|列聯表]]
# [[列聯表的最大概似估計]]
!!!大樣本檢定
# [[比例差距的檢定]]
# [[相對風險]]
# [[勝算比]]
# [[適合度卡方檢定|卡方檢定]]
# [[同質性卡方檢定|卡方檢定]]
# [[獨立性卡方檢定|卡方檢定]]
# [[計算卡方檢定需要的期望值]]
# [[獨立性的概似比檢定]]
# 拒絕獨立性卡方檢定之後的[[線性趨勢檢定]]
!!!小樣本檢定
# [[費雪正確檢定]]
!數據通論
<<tabs "" [[挑一個開始]] "" [[]][[一定要懂的專有名詞]] "" [[專有名詞親屬圖]][[波士頓公寓數據]] "" [[波士頓公寓數據]][[測量尺度]] "" [[測量尺度]][[名目尺度]] "" [[名目尺度]][[順序尺度]] "" [[順序尺度]][[區間尺度]] "" [[區間尺度]][[比例尺度]] "" [[比例尺度]]>>
!離散資料來自...
<<tabs "" [[挑一個開始]] "" [[]][[名目尺度]] "" [[名目尺度]][[順序尺度]] "" [[順序尺度]]>>
!連續資料來自...
<<tabs "" [[挑一個開始]] "" [[]][[區間尺度]] "" [[區間尺度]][[比例尺度]] "" [[比例尺度]]>>
!R命令
記得要有兩項重點
# 點出年輕人的元素
# 看到自己的身影
> 順序尺度的分類間具有意義的順序(ordering)。一種順序尺度的觀察值(有時候也叫做「測量值」)可以是非數值的(nonnumerical),也可以是數值的(numerical)。
>
>比如說,學生被要求用「非常滿意」、「滿意」、「一般」、「不滿意」、「非常不滿意」等五種分類評等某位教授的教學成效。這時候,某項分類是高過下一項分類的,也就是說,「非常滿意」的評價比起「滿意」高;「滿意」的評價比起「一般」高;等等。因此,教學成效是一種非數值型的順序變數。
>
>另外,假如我們用數字4、3、2、1、0分別代表「非常滿意」、「滿意」、「一般」、「不滿意」、「非常不滿意」,那麼教學成效就是一種數值型的順序變數(通常會這麼作)。
++++[問題一]
>滿意 > 不滿意?
===
++++[問題二]
>(滿意 + 不滿意)/2 = 一般(通常是指說「沒意見」)?
===
+++[更多例子]
{{{

}}}
===
++++[實務上的觀點]
> 實務上,通常數字與相對的文字都會提供給被要求評等某人或某物品的應答者(被調查者)。當使用數字的時候,統計學家們爭論順序變數是不是有「那麼一點點屬量」呢?
>>認為4、3、2、1或0不是有那麼一點屬量的統計學家,主張4(非常滿意)跟3(滿意)之間的差距,與3(滿意)跟2(一般)之間的差距並不一樣。
>
>>其他統計學家則主張,當被調查者(學生)看到等距離的數字,他們的反應會被影響到足以使得變數(比如說,教學成效)有那麼一點屬量,即使有文字描述這些數字。
>
>一般而言,跟著數字的具體文字很有可能影響順序變數是否可以被認為有那麼一點屬量。
>
>但是,注意到在實務上,數值型的順序評比通常用屬量的方式分析。比如說,計算某個教授的平均教學成效,與學生的平均成績(注意:美國人的成績用A、B、C、D、F等符號評比)。
===
| 週次 |>| 日期 | 內容 | 課堂活動 | R實習 | BB | 考試 | 導讀 |
|~| 乙班 | 甲班 |~|~|~|~|~|~|~|
| 1 | 02/16 | 02/17 | [[課程簡介|課程簡介(逢甲大學97學年度)]] | 深夜加油站遇上蘇格拉底 || 電影觀賞感言 | [[評比計畫]] ||
| 2 | 23 | 24 | [[引言一:數據分析的一般原則|數據分析的一般原則]] | 編輯講義的頁碼 | 下載並安裝最新版的R、[[我要跟R交朋友]] | 眼睛採礦波士頓的公寓數據 |||
|~|~|~| [[數據]] |~| [[觀賞R的第一支指導影片|第一支指導影片]] |~|||
|~|~|~| [[二項分配]] |~| [[Using R to look at distributions (I)]] |~|||
| 3 | 03/02 | 03/03 | [[多項分配]] | 及時投票系統 | [[Using R to look at distributions (II)]] | [[第一次R在家實習]] |||
|~|~|~| [[常態分配]] |~| [[Using R to look at distributions (III)]] |~|||
|~|~|~| [[引言二:數據與分配這一對情侶|數據與分配]] |~| [[第一次R在家實習]] |~|||
| 4 | 09 | 10 | [[引言三:估計的道理|估計的一般理論]] || [[R topics related to sampling distributions]] ||||
|~|~|~| [[最大概似估計法]] ||~||||
|~|~|~| [[二項比例的最大概似估計$\hat p$]] ||~||||
| 5 | 16 | 17 | [[$\hat p$的抽樣分配]] ||~||||
|~|~|~| [[中央極限定理]] ||~||||
|~|~|~| [[引言四:抽樣分配的重要性|抽樣分配的重要性]] || [[第二次R在家實習]] | [[第二次R在家實習]] || [[抽樣分配]] |
|~|~|~| [[綠頭鴨的實驗]] ||||||
| 51/2 | 03/21 | 03/21 |>|>|>|>|>| [[第一次小考|2009第一次平常考]](數據、測量尺度、分配、最大概似估計、R) |
| 6 | 23 | 24 | [[假設檢定的一般理論]] | 及時投票系統 | [[R topics related to hypothesis testing]] || [[2009年期末報告]] | [[摘要綠頭鴨的實驗]] |
|~|~|~| [[二項比例的大樣本假設檢定]] ||~||| [[假設檢定導讀]] |
|~|~|~| [[信賴區間的一般理論]] || [[R topics related to confidence interval]] ||| [[信賴區間導讀]] |
|~|~|~| [[二項比例的大樣本信賴區間]] ||~||| [[二項比例大樣本信賴區間的缺點]] |
|~|~|~| [[引言五:統計推論|統計推論]] || [[第三次R在家實習]] | [[第三次R在家實習]] |||
| 7 | 30 | 31 | [[二項比例的假設檢定:進階篇]] || [[用R實現二項比例的假設檢定]] ||||
|~|~|~| [[二項比例的小樣本假設檢定]] ||~||||
|~|~|~| [[計算二項比例小樣本假設檢定的p值]] || [[第四次R在家實習]] | [[第四次R在家實習]] |||
| 8 | 04/06 | 04/07 | [[二項比例的信賴區間:進階篇]] || [[用R實現二項比例的信賴區間]] ||||
|~|~|~| [[另一種p值:半p值]] || [[第五次R在家實習]] | [[第五次R在家實習]] |||
| 9 | 13 | 14 |>|>|>|>|>| [[期中考|2009期中考]](講義頁碼從第18頁開始的CHAPTER 1 Introduction,含這一章後面的練習題以及它的解答、R。) |
| 10 | 20 | 21 | [[另一種p值:半p值]] | [[離散數據分析法大綱]] |||||
|~|~|~| [[介紹列聯表|列聯表]] | [[瞭解分配]] |||||
|~|~|~| [[列聯表的最大概似估計]] | [[R與列聯表]] |||||
| 11 | 27 | 28 | [[比例差距的檢定]] | [[設計多項試驗的問卷題目]] |||||
|~|~|~| [[獨立與相依的抽樣設計]] | [[設計順序尺度的問卷題目]] |||||
|~|~|~| [[相對風險]] | [[R與列聯表]] | [[第六次R在家實習]] | [[第六次R在家實習]] |||
| 12 | 05/04 | 05/05 || [[輸入列聯表]] | [[包裝R程式碼(一言以蔽之)|樣板]] ||||
|~|~|~|| [[計算列聯表的摘要統計量]] | [[甲班的成果]] ||||
|~|~|~|| [[用R實現比例差距的檢定]] | [[乙班的成果]] ||||
| 13 | 11 | 12 | [[勝算比]] | [[討論第六次R在家實習]] |||||
|~|~|~| [[適合度卡方檢定|卡方檢定]] | [[討論第一次小考|2009第一次平常考]] |||||
|~|~|~| [[同質性卡方檢定|卡方檢定]] | [[討論期中考|2009期中考]] | [[第七次R在家實習]] | [[第七次R在家實習]] |||
| 14 | 18 | 19 | [[獨立性卡方檢定|卡方檢定]] | [[chisq.test()的例子]] | [[R與適合度(goodness-of-fit)卡方檢定]] ||||
|~|~|~| [[SPSS提供的數據分析初論]] | [[包裝勝算比的信賴區間]] | [[R與同質性卡方檢定]] ||||
|~|~|~| [[瞭解分配]] | [[包裝卡方檢定]] | [[R與獨立性卡方檢定]] ||||
|~|~|~| [[編碼問卷的結果]] || [[定義R的向量]] ||||
|~|~|~| [[什麼時候用什麼分析方法?]] || [[定義R的矩陣]] ||||
| 141/2 | 23 | 23 |>|>|>|>|>| [[第二次小考(列聯表、比例差距的檢定、相對風險、勝算比、卡方檢定的R)|2009第二次平常考]] |
| 15 | 25 | 26 | [[獨立性的概似比檢定]] | [[R與同質性卡方檢定]]、[[包裝卡方檢定]] | [[R與獨立性的概似比檢定]] ||||
|~|~|~| [[標準化殘差]] | 拿珍珠板 | [[R與標準化殘差]] ||||
|~|~|~| [[皮爾森殘差]] | [[pie()]] | [[R與皮爾森殘差]] ||||
|~|~|~| [[線性趨勢檢定]] | [[barplot()]] | [[R與線性趨勢檢定]] ||||
|~|~|~| [[費雪正確檢定]] || [[R與費雪正確檢定]] ||||
| 16 | 06/01 | 06/02 | [[內部審查]] | [[現場表演]] | [[檢討第二次小考|2009第二次平常考]] ||||
|~|~|~| [[書面報告基本要求]] ||||||
|~|~|~| [[SPSS(I)]] ||||||
| 17 | 08 | 09 | [[談高中加入統計課程]] | [[講授意見調查]] |||||
|~|~|~| [[第二次內部審查]] ||||||
|~|~|~| [[SPSS(II)]] ||||||
| 18 | 15 | 16 |>|>|>|>|>| [[期末考(第二章後段、期末報告、R)|2009期末考]] |
| 週次 |>| 日期 | 大綱 | 內容 | 課堂活動 | R實習 | BB | 考試 | 家庭作業(問卷調查) |
|~| 甲班 | 乙班 |~|~|~|~|~|~|~|~|
| 1 | 09/15 | 09/21 | 預備知識 | [[課程簡介|課程簡介(逢甲大學97學年度上學期)]] | 認識大家、購書 || [[電影觀賞感言]] | [[評比計畫]] ||
|~|~|~|~|~| 深夜加油站遇上蘇格拉底 |~|~|~|~|
| 2 | 22 | 28 |~| [[介紹圖1-1]] | [[如何開始(第一次接觸)閱讀一本全新的英文教科書]] | [[下載並安裝最新版的R|http://dist.stat.tamu.edu/pub/rvideos/Install2/Install1.html]] | [[甲班的第一次R體驗]]、[[乙班的第一次R體驗]] | [[寫下所有剛剛找到兩張圖1-1的相異之處]] | [[下載並且安裝最新版的R]]、[[把第26頁的數據輸入R]] |
|~|~|~|~|~| [[如何開始(第一次接觸)閱讀一本全新的中文教科書]] | [[R的初體驗]] |~|~|~|
|~|~|~|~|~| [[找尋兩張圖1-1的相異之處:一種仿蘋果日報的遊戲]] | [[觀賞R的第一支指導影片|第一支指導影片]] |~|~|~|
| 3 | 29 | 10/05 |~| [[解釋圖1-2的相似]] | [[帶我了解什麼是相似?]] | [[用R了解常用的統計量]] | [[大家來找碴]]、... | [[統計系學什麼?]] | [[眾數的R名稱]]。把[[序]]、[[目錄]]、[[作者簡介]]內不知道的部份圈起來。用課堂上教過的直方圖函示hist()以及盒形圖函示boxplot(),利用課本第26頁的數據自行體驗【相似】的真義。 |
|~|~|~|~|~|~| [[甲班的第二次R體驗]] |~|~|~|
|~|~|~|~|~|~| [[乙班的第二次R體驗]] |~|~|~|
| 4 | 10/06 | 10/12 | 隨機抽樣 | [[sample()]] | [[用sample()重(新)排(列)一組數字]] | [[第一次R實習]] |  || [[用R了解母體的各種性質]] |
|~|~|~|~| [[隨機抽樣的架構]] | [[用sample()實現隨機抽樣]] | [[第二次R實習]] |~|~|~|
|~|~|~|~| [[母體總和]]、[[估計母體總和]]、[[樣本總和的統計性質]] | [[用R實現樣本總和的抽樣分配以及計算各種期望值]] |~|~|~| 為什麼統計學家需要知道某統計量的[[抽樣分配]]? |
| 5 | 13 | 19 | R || [[我的超級計算機R]] || 眼睛採礦[[波士頓的公寓數據|波士頓公寓數據]] |||
| 6 | 20 | 26 | [[準備多少樣本數?]] | [[樣本總和的抽樣分配]] | [[深入認識一句R對話]]、[[寫一個計算樣本總和之抽樣分配的R函示]] | [[第三次R實習]] ||||
|~|~|~|~| [[怎麼抽?]]、[[無限母體的抽樣樣本數]] | [[epi.simplesize{epiR}]] |~|~|~|~|
| 7 | 27 | 11/02 | 簡單隨機抽樣 | [[簡單隨機抽樣的統計理論]] | [[樣本平均的變異數]] | [[簡單隨機抽樣與R]]、[[epi.simplesize{epiR}]] ||||
| 8 | 11/03 | 11/09 ([[期中考|抽樣調查期中考範圍]]) | 分層抽樣、問卷設計 | [[分層抽樣的統計理論]] | [[字典與榕樹]]、[[帶字典與逢甲地圖]]、[[估計第171頁有幾個中文字?]]、[[估計母體總和]]、[[樣本平均的表示式]]、[[代表某一個人被抽到的隨機變數]]、[[代表某一個人被抽到之隨機變數的期望值、變異數與共變異數]]、[[隨機變數線性組合的變異數]]、[[樣本平均的變異數]] | [[分層抽樣與R]]、[[epi.stratasize{epiR}]] | [[20個關於閱讀的關鍵字]] | 討論[[第一次小考|抽樣調查第一次平常考]]與[[期中考|抽樣調查期中考]] | [[三人一組]]、[[訪員訓練]]、[[出發去調查]]、[[大學生的隨身包包有幾兩重?]]、[[大學生的隨身包包有幾本教科書?]] |
| 9 | 10 ([[期中考|抽樣調查期中考範圍]]) | 16 |~|~|~|~|~|~|~|
| 10 | 17 | 23 | 集體(群集)抽樣、問卷設計 | [[集體抽樣的統計理論]]、[[訪員訓練|訪員訓練時間表]] |~| [[集體抽樣與R]]、[[epi.clustersize{epiR}]] | [[關於閱讀的調查議題]]、[[企劃一份問卷調查]]、[[設計一份問卷]] |~|~|
| 11 | 24 | !30 |~|~|~|~|~| [[這些內容在書上的哪裡?]] |~|
| 12 | !12/01 | 12/07 | 系統抽樣、問卷設計 | [[系統抽樣的統計理論]]、[[訪員訓練|訪員訓練時間表]] |~| [[系統抽樣與R]]、[[epi.clustersize{epiR}]] |~|~|~|
| 13 | 08 | 14 |~|~|~|~|~|~| [[大學生閱讀行為調查]]、[[乙班調查逢甲大學全校的大學生]]、[[甲班調查逢甲大學二年級的大學生]] |
| 14 | 15 | !21 | 問卷設計 | [[大學生閱讀行為調查]] | [[報告【大學生的隨身包包有幾兩重?】跟【大學生的隨身包包有幾本教科書?】的分析結果]]、[[與張簡組長挑選各班前四名]] | [[問卷編碼]]、[[Excel與R]] |~||~|
| 15 | !22 | !28 |~| [[大學生的隨身包包有幾兩重?]] |~|~|~||~|
| 16 | !29 | !01/04 |~| [[大學生的隨身包包有幾本教科書?]] |~|~|~|| [[繳交大學生閱讀行為調查結果]] |
| 17 | !01/05 || 案例分析 |||||||
| 18- | 01/11 (集中考)|>|>|>|>|>|>|>| [[第二次平常考|2009第二次平常考]] |
| 18 |>|>|>|>|>|>|>|>| [[期末考|2009期末考]] |
一位生意人上飛機坐定後,很驚訝地發覺身旁竟坐了一隻衣冠楚楚,繫著安全帶的鸚鵡。

當生意人向空服人員要咖啡喝時,身旁的鸚鵡對著空服員嘎嘎叫道:「小姐,妳怎麼這麼胖啊?妳一定很懶惰。好吧!反正妳要跑一趟,順便幫我弄杯威士忌來喝喝吧,動作快點。」當面受到這種侮辱,空服員儘管心裡氣惱,還是盡責地端來一杯威士忌,不過卻把生意人要的咖啡給忘了。當她要再跑一趟去端咖啡時,鸚鵡已經把剛端來的威士忌一飲而盡,又嘎嘎叫道:「再給老子來一杯,妳這個又賤又醜的女人。」 自顧咬牙切齒的空服員不久後端來第二杯威士忌,但因怒火中燒,又把咖啡給忘了。生意人再也受不了這種劣等服務,決定試試鸚鵡的方法。「喂!小姐」他疾言道,「我跟妳要了兩次咖啡,兩次妳都忘記。妳這個豬頭!現在趕快去給我端來,否則我海扁妳一頓。」幾分鐘後,兩名壯碩的空中少爺走過來,把生意人和鸚鵡從座位上揪起來,打開緊急逃生門,把他們扔出飛機。

正當一人一鳥在空中急速下墜時,鸚鵡忽然展開雙翅,轉頭對生意人說:「以一個不會飛的傢伙而言,你剛才真他媽的有種……」

+++[啟示]不要問「別人可以做,為什麼我做就不行?」@@因為別人有你沒有的優勢! @@===