5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

統計学なんでもスレッド6

1 :132人目の素数さん:2007/01/27(土) 03:31:38
前スレ
統計学なんでもスレッド5
http://science5.2ch.net/test/read.cgi/math/1145362721/
統計学なんでもスレッド4
http://science4.2ch.net/test/read.cgi/math/1123896809/
統計学なんでもスレッド3
http://science3.2ch.net/test/read.cgi/math/1097491056/
統計学なんでもスレッド2
http://science3.2ch.net/test/read.cgi/math/1068288283/
統計学なんでもスレッド
http://science.2ch.net/test/read.cgi/math/1012782106/

関連スレ
= 統計解析フリーソフト R =
http://science3.2ch.net/test/read.cgi/math/1062650510/

2 :にょにょ ◆yxpks8XH5Y :2007/01/27(土) 09:23:35

今だ!2ゲットォォォォ!!
 ̄ ̄∨ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
     ∩ ∩
   〜| ∪ |         (´´
   ヘノ  ノ       (´⌒(´
  ((つ ノ⊃≡≡≡(´⌒;;;≡≡≡
   ̄ ̄ ̄(´⌒(´⌒;;
   ズズズズズ

3 : ◆TuTO3UJe2Y :2007/01/27(土) 14:15:57
新スレでは答えます

4 :132人目の素数さん:2007/01/27(土) 16:28:28
くんまー拡大!

5 :132人目の素数さん:2007/01/27(土) 21:03:43
レポートで回帰分析の結果書くんだけど回帰分析にも帰無仮説ってあるの?
あれば書いた方がいいですか?

6 : ◆TuTO3UJe2Y :2007/01/27(土) 21:53:16
>>5
場合による
あれば勿論書いた方がいいっていうか書かなきゃダメ

7 :132人目の素数さん:2007/01/28(日) 05:47:59
【統計を】理系に多い血液型は何??【取ろう】
http://science5.2ch.net/test/read.cgi/rikei/1094367065/
◆統計学について語るスレ
http://science5.2ch.net/test/read.cgi/sim/1012828891/
【製薬企業】 ☆統計解析スレッド其の壱☆ 【CRO】
http://school6.2ch.net/test/read.cgi/doctor/1039331241/
= 統計解析フリーソフト R 【第2章】 =
http://science5.2ch.net/test/read.cgi/math/1152449095/
【●】 文部科学省 統計数理研究所 part2
http://science5.2ch.net/test/read.cgi/math/1054036747/
統計ソフト統合スレッド−SPSS・SAS以外
http://academy5.2ch.net/test/read.cgi/psycho/1012801769/
心理統計スレッド3
http://academy5.2ch.net/test/read.cgi/psycho/1160242677/
統計学
http://academy5.2ch.net/test/read.cgi/sociology/982489314/


8 :132人目の素数さん:2007/01/28(日) 05:49:05
えらそうな住人〜経済学的統計と解析〜社会学板
http://academy5.2ch.net/test/read.cgi/sociology/1136371390/
なんで統計学者って経済学部出身者が多いの?
http://academy5.2ch.net/test/read.cgi/economics/1139223663/
統計・計量分析で一番使われてるソフトは?
http://academy5.2ch.net/test/read.cgi/economics/1106197885/
経済学で使う統計学スレッド
http://academy5.2ch.net/test/read.cgi/economics/1094012265/
統計・解析ソフトについて
http://pc10.2ch.net/test/read.cgi/bsoft/1012298063/
Data Mining (データマイニング) part 1
http://science5.2ch.net/test/read.cgi/sim/1101296843/
【金鉱脈】データマイニングのスレ【発見】
http://pc10.2ch.net/test/read.cgi/linux/1139645444/
☆統計学が出来ないマーケティング学者☆
http://money5.2ch.net/test/read.cgi/manage/1104337367/


9 :132人目の素数さん:2007/01/29(月) 22:57:45
VARモデルについて、わかりやすく解説してある本などご存知でしたら教えていただけないですか?

10 :132人目の素数さん:2007/02/01(木) 11:17:47
レポートの提出期限が過ぎたからか、静かだな…

11 :132人目の素数さん:2007/02/02(金) 13:57:37
よく文章にでてくる

~ ind

の ind ってどんな意味?

Y(i) ~ ind Poisson(mu(i))みたいな


12 :132人目の素数さん:2007/02/02(金) 15:25:03
independently

independently
identically
distributed

i.i.d.
と略して使うよ。

13 :132人目の素数さん:2007/02/02(金) 15:56:54
independently了解です。助かります。
independent か induction かなーとか勝手におもってました。


14 :132人目の素数さん:2007/02/03(土) 02:29:42
多変量T分布の分散と、
ウィシャート分布(多変量カイ2乗分布)の平均の求め方が載っている参考書か、
サイトしりませんか?
全くできません・・・

15 :132人目の素数さん:2007/02/03(土) 03:19:54
統計学が科目としてある資格を教えてちょんまげ

16 :132人目の素数さん:2007/02/03(土) 10:43:57
アクチュアリーとか統計士とか臭気判定士とかぐらいしか思いつかん。
公認会計士など選択に入っているのはまだまだあるやろな。

17 :132人目の素数さん:2007/02/04(日) 01:11:29
離散型でも連続型でも、どんな分布だろうと、
確率分布関数は存在するけど
確率密度関数はあるとは限らない

これは正しいですか?

18 :132人目の素数さん:2007/02/04(日) 01:31:45
正しいです。

19 :132人目の素数さん:2007/02/04(日) 02:20:21
F分布で、F(m,n,α)=1/F(n,m,α)と本には書いてあるのに、F(m,n,α)=1/F(m,n,α)として例題は解いてます
どちらが正しいんですか?

20 :132人目の素数さん:2007/02/04(日) 06:25:25
>>19
正しいのはF(m,n,α) = 1/F(n,m,1-α)
密度関数を適当に変数変換すれば簡単に証明できるよ


21 :19:2007/02/05(月) 03:16:17
>>20
THANX


22 :132人目の素数さん:2007/02/07(水) 15:28:51
最小二乗法の重みづけの計算方法がどうしてもわかりません
ttp://homepage3.nifty.com/m_nw/dataac3j.htm
上のサイトに詳しく説明が書かれているのですが、計算部分がどうしてもうまくいきません。
ソフトを使った結果と全く違う結果になってしまいます。
問題は単純に(x,y)のデータ群があってこれに対応するy=ax+bの係数を導きたいです。





23 :132人目の素数さん:2007/02/07(水) 21:58:27
丁寧ねえ……。思うとだろうとかはずとかが目立つページですな。

> 全体を通じて乱文となってしまいましたので、不明の点、不適切な表現等
> ございましたら 掲示版又はメールにてお知らせください。

って書いてあるんだから著者に尋ねたら?

24 :132人目の素数さん:2007/02/08(木) 11:37:28
>>22
そのサイトの公式間違ってない?
記号の定義を俺が勘違いしたのかもしれないけど
書いてある通りに計算するとxの3次の項が出てくるんだが…

回帰式を y_{i} = ax_{i}+bとして、二乗誤差
f = \sum_{i=1}^{n} (y_{i} - ax_{i}-b)^{2}
の最小化を考える

これをa,bで偏微分して0とおくと
df/da = \sum_{i=1}^{n} -x_{i} * 2(y_{i} - ax_{i}-b) = 0
df/db = \sum_{i=1}^{n} -2(y_{i} - ax_{i}-b) = 0
となるから、これをa,bについて解く

すると
a = S_{xy} / S_{x}
b = \bar{y} - a\bar{x}
となる。
ただし、\bar{x},\bar{y}はそれぞれx,yの平均
S_{x}はxの分散、S_{xy}はxとyの共分散である。

こんな感じか?TeX使えないと数式書くの面倒だな


25 :132人目の素数さん:2007/02/08(木) 18:40:49
はじめまして。生物板から来ました。

あっちの板でちょっとお祭りになっています。
前スレhttp://science5.2ch.net/test/read.cgi/life/1094584332/179-
今スレhttp://science5.2ch.net/test/read.cgi/life/1170907261/

最近世間をにぎわした灯台工学研究科の捏造事件がありましたが、実は2ちゃんではあの事件と同じぐらいの有名な捏造疑惑が知られていました。
この捏造王子が当時いつお縄になるかとみなワクテカしてたけど、長く海外逃亡していて忘れちゃってました。
ところが最近この捏造王子がテニュアトラック教員として帰国することになり、お祭りになったという次第です。
現在、この捏造王子の過去の仕事のあやしさを住人たちが検証している最中といったところです。

そこでそのあやしいデータのひとつとして以下のページにでてくるグラフが話題になっています。
ttp://www.brain.riken.go.jp/bsi-news/bsinews20/no20/research2.html
培養した細胞に3種類のタンパク質を組み合わせを作って導入しその効果を見たというものです。
ところがこのグラフが我々ナマモノ屋から見てきれい過ぎるのです。
特に5%程度の差が矛盾なく観察されるためには膨大な観察数が必要だと考えます。
ただ生データが示されておらず、簡単な検証方法を思いつきません。
そこでこのスレの専門家の方にひとつご助力を賜りに参りました。
どうかよろしくお願い申し上げます。mOm

参考レスhttp://science5.2ch.net/test/read.cgi/life/1170907261/50

長文陳謝 orz

26 :132人目の素数さん:2007/02/08(木) 21:00:08
この↑問題、なにとぞ統計スレの先生方のお力をお貸しくださいOrz
このままでは日本は捏造大国になってしまいます。

27 :132人目の素数さん:2007/02/08(木) 22:44:25
ローリング相関ってなんですか?

28 :132人目の素数さん:2007/02/08(木) 23:06:07
データの捏造方法
1 べつのサンプルのデータにするかえる
2 自分で数字をいじる
3 統計資料から拝借してラベルを付け替える


29 :132人目の素数さん:2007/02/08(木) 23:23:29
>>28
すいませんがよくわからないのでもう少し具体的に説明していただけませんか?

30 :132人目の素数さん:2007/02/08(木) 23:27:42
>>29
いや>>28さんは質問してるんじゃない?
捏造王子は間違いなく2をやってます。
何とか検証する方法は無いでしょうか?

31 :132人目の素数さん:2007/02/08(木) 23:45:19
出現する数字の分布が正規分布でない

32 :132人目の素数さん:2007/02/08(木) 23:52:12
データの中に自分のサインを残している

33 :132人目の素数さん:2007/02/09(金) 00:00:47
>>25
データ数が分からないことには何とでも言えそう。
回帰分析でそれぞれの効果を推定するときれいに出るが、
それを仮に真値としたとき偶然このデータが得られる確率は
データ数に依存します。最も無理のない結果のための
データ数は各群350ぐらいと出ました。
(そのときの確率は0.11ぐらい。当てはまり過ぎと言われない確率0.05を
超えるのは大体データ数150以上が必要です。)
細胞のデータと言うことですからこのぐらいの数は取っているのでは?


34 :132人目の素数さん:2007/02/09(金) 00:20:21
>>33
ありがとうございます。
データ数を何に相当すると考えるかで少し違いますが、通常は培養皿ごとに計数して、
複数の培養皿からの数値で平均を取って検定します。
つまりデータ数は培養皿数に相当すると考えられます。
そして150も350もほぼ不可能な培養皿の数(通常は多くて10)です!!

35 :132人目の素数さん:2007/02/09(金) 00:51:57
統計量Sn、Tnは漸近的に同値であり、また、Snは分布関数Fに分布収束するとする。
このときTnもFに分布収束する。

という命題を証明したいのですが、糸口がつかめません。
どなたかヒントだけでもいいので教えていただけませんでしょうか?

36 :132人目の素数さん:2007/02/09(金) 00:53:44
>>28,>>31-33
皆様さきほどは急いでいて御礼が不充分で申し訳ありませんでした。本当に感謝しております。m0m
現在、頂いた回答を向こうのスレに貼って、向こうで実験系に詳しい人たちとの議論待ちです。
その結果また何か分からないことや私の事実誤認があったらお手数をおかけして恐縮ですが
再度ご相談に参ります。よろしくお願いいたします。

37 :132人目の素数さん:2007/02/09(金) 01:17:27
>>34
また見に来るだろうから書いておくが、そんなに少ないならこんな感じ。
各群10個:p=0.00005530468
各群20個:p=0.0004044062
各群30個:p=0.001247549
各群40個:p=0.002702961
各群50個:p=0.004825427
もちろん推定された効果通りにきれいな真値であるわけではない可能性も
あるので上記のp値の計算は額面通りには受け取れません。
ただし、交互作用まで分散分析をかけると各効果はp=0.05ぐらいで
効いているのに対して交互作用はどれもp=0.2ぐらいできれいに
効いていないと出るので線形性は抜群なのですけどね。

38 :132人目の素数さん:2007/02/09(金) 01:21:58
>>37
自己レス。
培養皿の効果が0, 1ならその通りなのだが、
それをある程度の細かさで分類しているならデータ数は培養皿数とは
言えないだろう。皿が10個としてその程度が1/15区切りでつけられるのなら
ぎりぎりOKとなるかな。

39 :132人目の素数さん:2007/02/09(金) 05:44:51
>>35

xをTnの連続点とすし、εを任意の整数とする。
Pr{Tn<=x}=Pr{Tn<=x, |Sn-Tn|<ε}+Pr{Tn<=x, |Sn-Tn|>=ε}


40 :35:2007/02/09(金) 08:37:20
>>39
ありがとうございます。
それを参考にして考えてみます。

41 :132人目の素数さん:2007/02/09(金) 21:15:02
>>33,37
自己レス。
計算を間違ってた。_| ̄|○
n=350のときのp値は0.385だった。0.5までいくにはn=400ぐらい必要。
0.05を超えるのはn=150過ぎだが、小さいときの表は次のように修正。
各群10個:p=0.000002530724
各群20個:p=0.00003769463
各群30個:p=0.0001776871
各群40個:p=0.000523022
各群50個:p=0.001189512
結局一つの皿でどのぐらいの精度の結果を得ているか次第です。
10個だとやはり5%刻みぐらいのデータが得られていないと
だめでしょう。

42 :132人目の素数さん:2007/02/09(金) 21:36:35
SPSSやJMPを使った集統計が三度の飯の次くらいに好きなんだが、
こんなオイラを雇ってくれる奇特な研究室はないかな。

43 :132人目の素数さん:2007/02/09(金) 22:03:29
>>42
おしい!三度のメシより、だったら家で雇ったのに。
あとRな。

44 :132人目の素数さん:2007/02/10(土) 22:31:00
集統計屋さん、うちの研究室にはいるよ@年収600マン・ポスドク・野心なしの主婦。
さくさくやってくれるんで、ボス以下全員すごく助かってる。
売り込んでみたら?

45 :132人目の素数さん:2007/02/10(土) 23:22:31
>>41
統計スレの神

本当にありがとうございます。みな深く感謝しています。

ちょっと若干1名場外乱闘で粘着があり、とばっちりで不快な思いをさ
せたかも知れず申し訳ありません。

向こうはダミーで、こちらに書き込みさせてください。

ご指摘の件はもういちど良く考えて見ます。捏造王子たちが適当に
直線を引いた可能性が高くなってきたと思っています。

もひとつ質問なのですが、捏造王子たちはこのグラフの隣り合う区画
同士の平均値の差が統計的に有為である、としているようです。これ
はt検定ですが、この隣り合う二群間での平均値の差の検定に必要な
サンプル数を彼らは満たせているでしょうか?

誤解があったら申し訳ありません。

よろしくお願いします。

46 :132人目の素数さん:2007/02/10(土) 23:23:55
葛西そこそこでヴィドはヴィドったwww

47 :46:2007/02/10(土) 23:24:42
すいません、誤爆しました

48 :132人目の素数さん:2007/02/11(日) 00:34:07
>>45
せっかく作ったのでこちらに載せときます。
乱数で見るデータの例です。
1500個を150個ずつ群にまとめた場合
0.427 0.387 0.367 0.433 0.420 0.380 0.380 0.393 0.360 0.313
300個を30個ずつ群にまとめた場合
0.633 0.500 0.333 0.367 0.567 0.467 0.467 0.300 0.333 0.367
もしデータが入手できて各群300個ぐらいしかないのに挙動が1500個のときと
同じ程度なら(そうでないと棄却はできないはず)
二項分布の方に疑いが行きます。

49 :132人目の素数さん:2007/02/11(日) 05:46:32
国立医学部一年の般教で統計やってます
圧倒的に意味が不明
母比率とか意味不明
なんで偏差平方和をnで割ったら分散じゃないの?

50 :132人目の素数さん:2007/02/11(日) 11:00:42
それじゃ一昔前の高卒にも劣るよ

51 :132人目の素数さん:2007/02/11(日) 12:52:52
>>50
だって授業なんて聞いてないし笑
説明ヨロ☆

52 :132人目の素数さん:2007/02/11(日) 13:35:14
>>51
聞いてなくても本読めばわかるだろ笑

53 :132人目の素数さん:2007/02/11(日) 14:02:02
>>52
大学の過去問しかない…笑


54 :132人目の素数さん:2007/02/11(日) 14:24:29
>>49
授業で使ってる教科書に書いてあるんじゃね?

宿題の答え聞かれてる気がするからあまり詳しく答えたくないけど…
nでなくn-1で割るのは推定値の不偏性(推定値の平均が真の値になるという性質)を満たすため
偏差平方和の平均値出してみな


55 :132人目の素数さん:2007/02/11(日) 14:39:25
http://phi.ypu.jp/oldlec/social_stat_p05.html

56 :132人目の素数さん:2007/02/11(日) 15:12:14
>>54
ありがとう!
教科書はないんだ。
授業中にもらうしょぼいプリントだけ。当然どっかいった笑
宿題じゃなくて後期試験の科目なんだよね
友達からプリント借りて調べてみよう。
統計を勉強する上でコツみたいなの教えてください笑

57 :132人目の素数さん:2007/02/11(日) 20:19:44
平均と期待値の違いってなんですか?

58 :132人目の素数さん:2007/02/11(日) 23:03:43
完備十分統計量は最小十分統計量であるということを証明したいんですが、なかなか証明ができません。
証明の道筋をどなたか教えてください。

59 :質問です。:2007/02/15(木) 19:57:02

>控除率の実際
>以下に主なカジノゲーム、公営ギャンブルなどにおける控除率を挙げる。プレイの方法や技量が影響するゲームにおいては、最大の期待値を得られうるベットを行い、
>ミスのない完全なプレーを行うことを前提とする。

>スロットマシン 3%〜15%
>様々。ここでは一般的と思われる値を挙げた。

http://ja.wikipedia.org/wiki/%E6%8E%A7%E9%99%A4%E7%8E%87)より転載。

ということは、スロットマシンの腕がどんなに良い人でも、控除率を3%〜15%より下げるのは無理だということですか?
また、ヘタクソな人がやれば、控除率は3%〜15%よりかなり上がるということでしょうか?

あと基本的な質問ですが、控除率が2%のギャンブルというのは、簡単に言えば
100円を元手に無限回挑戦し続けると、元手が98円に減るということですか?

60 :132人目の素数さん:2007/02/16(金) 00:30:33
>>59
控除率が正のものを無限回やったら破産しますがな。w

61 :132人目の素数さん:2007/02/16(金) 00:34:01
人が無限回できることって無限小の距離を移動することとかですか

62 :質問です。:2007/02/16(金) 20:45:00
>>60
どうも根本的なところを勘違いしていたようですね。

ではこういうことでしょうか?

控除率が2%のギャンブルを一回やると、当然、元手が増える人も減る人もいるが、
参加した全員の平均をとってみると、元手の98%に減ったという結果になるということですか?

また、控除率が2%のギャンブルというのは、参加した全員の掛けた金の合計の2%が確実に親のポッポに入るということでいいの
でしょうか?

また変な勘違いをしていたら教えてください。


63 :132人目の素数さん:2007/02/16(金) 21:18:32
>>62
手数料という表現からすると概ねそれでよいのでしょう。
ただし、なんらかの必要経費が生じるものだとそれがそのまま利益という
訳ではないのでしょうが。

64 :132人目の素数さん:2007/02/16(金) 21:31:29
文鳥が好きで煙草を吸わない30代独身男性は、
日本国内に何人くらいいると考えられますか?

65 :質問です。:2007/02/18(日) 11:55:27
>>63
レスありがとうございます。
だいたい分かりかけてきました。最後の質問にしたいと思いますが、

>控除率の実際
>以下に主なカジノゲーム、公営ギャンブルなどにおける控除率を挙げる。プレイの方法や技量が影響するゲームにおいては、最大の期待値を得られうるベットを行い、
>ミスのない完全なプレーを行うことを前提とする。

>スロットマシン 3%〜15%
>様々。ここでは一般的と思われる値を挙げた。

http://ja.wikipedia.org/wiki/%E6%8E%A7%E9%99%A4%E7%8E%87)より転載。

”プレイの方法や技量が影響するゲームにおいては、最大の期待値を得られうるベットを行い、
ミスのない完全なプレーを行うことを前提とする。 ”


と、いうことは、スロットの腕がどんなに良い人でも控除率を3%以下に下げるのは不可能であり、
素人がやると、もちろん控除率は腕の良い人より上がるということでしょうか?


66 :132人目の素数さん:2007/02/18(日) 21:17:26
>>65
まだ勘違いしてますよ。
控除率はどのプレーヤーに対しても一律で貸せられる場所代や税金のようなものです。
どんなに上手にプレーをしても、控除率は変わりません。
ただ、上手にプレーすれば、下手くそにプレーするよりも、最終的に手元に残る金額は多くなりますが。しかしこれは控除率とは何ら関係のないものです。

67 :132人目の素数さん:2007/02/20(火) 16:08:47
統計学って

ある確率が1%以下であるなら、それは絶対におかしいと決めるような学問なの?

68 :132人目の素数さん:2007/02/20(火) 16:54:05
ベータ分布のパーセント点を求める近似式をcで作らなきゃいかんのだが
どうやるんだ?

69 :132人目の素数さん:2007/02/20(火) 21:01:57
>>68 数値計算のアルゴリズム本(e.g. 奥村さんのアルゴリズム事典 http://oku.edu.mie-u.ac.jp/~okumura/algo/)を探すか、 フリーの有り物(e.g. dcdflib.c)を使う。

70 :132人目の素数さん:2007/02/20(火) 22:24:04
分らない問題スレで核心にせまるレスが付かなかったため、
統計スレの皆様、お力添えくださいm(_ _)m

■問題
A君とB君は互いに相手よりもテニスが強いと言い張ります。
そこで、10試合をして勝敗によりどちらのほうが強いか決めようということになりました。
統計学的に有意に強いと認められるには、どちらかが何勝すれば良いでしょうか。
ただし、引き分けは無いものとする。

■自分で考えた答え(合っていますか?)
A君とB君の勝敗の組み合わせ数は2^10=1024通り
10試合のうちA君が8勝する組み合わせ数は10!/(8!2!)=45通り
10試合のうちA君が9勝する組み合わせ数は10!/(9!1!)=10通り
10試合のうちA君が10勝する組み合わせ数は10!/(10!0!)=1通り

従ってA君とB君が互角と仮定すると
A君が8勝以上する確率は(45+10+1)/1024≒0.055
A君が9勝以上する確率は(10+1)/1024≒0.011

統計学的に有意に強いと認められるには、互角となりうる危険率を5%以下にする必要があるから 9勝以上しないといけない。

この解答は合っていますか?

71 :132人目の素数さん:2007/02/20(火) 22:36:56
>>69
ありがとう。やっぱり不完全ベータ関数を計算してニュートンで求めるしかないのかな?

72 :132人目の素数さん:2007/02/20(火) 23:08:18
>>71
Handbook of Mathematical functions には近似式載ってる。
けど、精度書いてない。

dcdflib.c の cdfbet() は、逆分布関数も計算できる。


73 :132人目の素数さん:2007/02/20(火) 23:38:15
統計超・超初心者のとっちょです。

ある生産工程の不良率(良品率)を調査するために製品を10個抜き取り、寸法を
測定しました。結果は以下の通りです(単位:mm)。

2,2,2,2,2,3,3,3,4,5 平均:2.8 標準偏差:1.0

製品規格は下限規格のみで1mm以上です。上限規格はありません。
分布の形状は右側(値の大きい)に裾野の広い分布であり、工程の設備能力からも
合点のいくところで、偏ったサンプリングをしているとは考えにくいです。

こんな分布をしている場合の工程不良率を算出しようとした場合、どのように算出
したら良いのでしょうか?当HPのポアソン分布等を拝見したのですが、初心者の私
には、ポアソン分布を使って良いものか否か分からない状況です。

こんな私にご教授頂ければ幸いです。よろしくお願いします。

74 :132人目の素数さん:2007/02/20(火) 23:50:26
>>72
サンクス。これはつかえそう!

75 :132人目の素数さん:2007/02/22(木) 20:59:46
>>73
ポアソン分布はサッカーの得点みたく離散型データの場合。
その場合は、測定精度が粗くて値の種類が少ないから、
データの相対度数分布をそのまま確率分布(の推定値)として使うのが吉。
つまり理論分布なんぞイラネ。

76 :132人目の素数さん:2007/02/22(木) 21:38:27
いきなりすいません。必死で探してるんですが正確度の計算方法が
わかりません。
今まで人の目で数えていたものを機械で数えようとしています。
人の目で数えたものと機械で数えた数字の正確さを表す数値として
正確度というのがあるのことまではこぎつけたのですが、その計算式が
わかりません。
どなたか教えていただけませんか?

77 :132人目の素数さん:2007/02/23(金) 05:01:21
すいません。統計学初学者です。
正規分布の加法性でわからないことがございます。

1.N(u1, σ1^2) + N(u2, σ2^2) → N(u1 + u2, σ1^2+σ2^2)
2.N(u1, σ1^2) - N(u2, σ2^2) → N(u1 - u2, σ1^2+σ2^2)

正規分布を足しても引いても、
平均はそれぞれ、足されるあるいは引かれますが、
なぜ、分散だけはどちらも足されるのでしょうか?
分散は引くことは出来ないものなのでしょうか?

よろしくお願いいたします。


78 :132人目の素数さん:2007/02/23(金) 11:42:23
>>76
統計学全体で通じる「正確度」なんてありません。応用している各分野で
系統誤差を使いやすいように数値化しています。例えば、測定値の平均を
から実際の値を引いたものなどを使います。

関係している工学の人に「正確度」「精密度」についてきいてください。


79 :132人目の素数さん:2007/02/23(金) 11:59:52
>>77
式のイメージではなく、分散とはどういう数かをまず考えてみてください。
2つの正規分布は無相関なので、定義にしたがって分散を計算すると和に
なります。

2つの確率変数の間に相関があれば、分散は和にはなりません。例えば、
極端な場合で u2 = - u1 という関係があるとすると、分散は 0 になっ
てしまいます。この場合でも、分散を引いている訳ではありません。
教科書で「共分散」というのを調べてみてください。


80 :77:2007/02/24(土) 05:20:39
>>79
ありがとうございました。
共分散勉強します。

81 :132人目の素数さん:2007/02/27(火) 18:54:14
院に行って統計勉強する場合どこがおすすめ?学部は早慶です。

82 :132人目の素数さん:2007/02/28(水) 18:15:46
>>81
やりたい専門決めている?
それに合った教員が居るところにすれば…
無ければ、そのまま上に行った方がいいかもね。


83 :132人目の素数さん:2007/03/04(日) 19:27:17
お前ら、Zipの法則について語れ

84 :132人目の素数さん:2007/03/04(日) 20:00:47
zipか、なつかしいなあ。100MBでも文書ファイルだけなら充分大容量だったのだが。

Zipf?
それは語れない。

85 :83:2007/03/05(月) 13:39:43
>>84
細かいこと気にする奴だなwまぁ、いいさ。
で、俺は勉強中なんだけど、世界の人口や日本の人口で試してみた
(計算はExcelね)。

興味深い結果が得られているけど、面倒くさいので報告しない。
まずは計算して見れ〜

86 :132人目の素数さん:2007/03/05(月) 16:07:27
>>85
あれは経験則ではないの?
ビジネス書なんかによくある80-20の法則なんかと同類の話ではないの?

87 :83:2007/03/05(月) 17:04:06
>>86

よくわからん。俺は単にExcelで計算して遊んでいるだけ(笑



88 :よろしく。:2007/03/06(火) 04:34:29
ベイズの定理の重要性について、
できましたら、短文にてご説明願えたらと思います。

89 :132人目の素数さん:2007/03/06(火) 09:56:24
           ,,,--─===─ヽ/へ 
      /iiiiiiiiiiiiii彡≡≡≡|≡ヾ ヽ 
     iiiiiiiiiiiiiiiiiii彡≡≡≡≡|≡ミミヾ丶 
    iiiiiiiiiiiiiiiiiiii/ ̄ ̄ ̄ ̄ ̄ ̄\ミiiiiiヽ 
   iiiiiiiiiiiiiiiiii/             \iiiiiiiゞ 
   iiiiiiiiiiii/                \iiヽ 
  iiiiiiiiiiiiiii《    ━━━'/  ヽ━━━ ヽミヽ 
 ...iiiiiiiiii彡/      __,.::  :: __  ヽiiiii| 
 ..iiiiiiiiiiiii》|             :::      |iiiii| 
 iiiiiiiiiiiiiiii|,                     |iii| 
..iiiiiiiiiiiiiiiiii,         ( ● ● )      .|iiii| 
iiiiiiiiiiiiiiiiiiiiiii       》━━━━《       |iiiii| Bayesなんて、プッ
iiiiiiiiiiiiiii《《《ヽ     》 / ̄ ̄\ 《     |iiiiiiii|  
iiiiiiiii《《《《《《《《    《《 \ ̄ ̄/ 》》   |iiiiiiiiiii| 
iiiiiiiiiiii《《《《《《《《《《《 》》   ̄ ̄  《《 》》》》》iiiii| 
iiiiiiiiii《《《《《《《《《《《《《《《《《《《《》》》》》》》》》》》》》》iii| 
iiiiiiiiiiiiiii巛巛巛巛巛巛巛巛巛》》》》》》》》》》》》》》IIII 
iiiiiiiiiiiiiiiiiiiiii巛巛巛巛巛巛巛巛》》》》》》》》》》》》iiiiiii 


90 :132人目の素数さん:2007/03/06(火) 14:57:51
>>86
ランダムネットワークを仮定すると、ネットワーク上の簡単な値が
Zipf分布に従うことが理論的に証明されている。

ただ、とてもランダムネットワークとは思えないようなものや、
複雑な値についてもZipfの法則が成立するのは興味深いところ。

くりこみみたいな手法でなんか議論できないかなあとは思ってる。

91 :132人目の素数さん:2007/03/06(火) 16:25:48
cross-validation法は、残差を用いた推定より、
どういった点で優れているのでしょうか?


92 :132人目の素数さん:2007/03/07(水) 15:10:54
お願いします!

1、800人の学生のうち、622人がカメラ付き携帯電話を所持していました。
この結果から実際に全学生中75%以上の学生がカメラ付き携帯を所持しているという仮説を
有意水準0.05で検定せよ。
2、次の値は、48年と88年における小1身長のデータから計算されたものである。等分散が仮定できるものとして、
2群の母平均に差があるかいなかを有意水準0.05で検定せよ。
48年→ データ数30、標本平均108、標本分散15
88年→ データ数30、標本平均117、標本分散21
計算途中の結果付きで回答してもらえると嬉しいです。

93 :132人目の素数さん:2007/03/07(水) 15:16:29
>>92はマルチ

だいたい数字が違うだけの同じ練習問題が普通に載ってると思うが。

94 :132人目の素数さん:2007/03/07(水) 15:21:20
今時分にレポート提出の大学もあるんだね。

95 :132人目の素数さん:2007/03/08(木) 15:55:17
今日成績を受け取りに言ったのですが、
 卒業するのに単位がどうしてもあと1教科分2単位必要なのです。
   
  3月中にレポートでもなんでもします。
  単位を取得させてもらえないでしょうか。 
   
  ご検討のほど、どうかよろしくおねがいします。


96 :132人目の素数さん:2007/03/08(木) 16:36:09
最近では、レポートの主要部分をネットからのコピペした場合、
不正行為とみなすところが増えている。不正行為の場合、その
期の全単位消失といった処分が多いはず。

だから、ここに答えを書くと卒業がより遠くなって、かわいそ
うなので、みんな書いちゃだめだよ。

ということで、教科書をよく読んで、自力でがんばってね。


97 :132人目の素数さん ::2007/03/08(木) 17:50:20
基本的な質問かと思いますが、本などに解説がないのでお聞きしたいです。
尺度水準の説明で、名義尺度は名前や職業など任意に割り振られたデータで
和を計算したり平均を出しても意味がないとの説明が多いのですが、
例えば携帯のアンケート調査で、機種を選ぶ際に重視した機能をひとつお選びください
で、1.ディスプレイの大きさ 2.カメラの画素数 3.文字変換機能 4.セキュリティ機能
5.その他 があり、その結果、1が40%、2が25%、3が20%、4が10%、その他が5%
という結果となった場合、選択肢は名義尺度なので、解釈時に
ユーザが機種選びに重視した項目の順位は1位ディスプレイ、2位カメラの画素数といった
表現やディスプレイの大きさは文字変換機能の2倍重視されている、といった
表現が間違いということになるのでしょうか?
どなたかご教授ください

98 :132人目の素数さん:2007/03/08(木) 18:49:31
>>97
平均を求めるとはその例だと
1*0.4+2*0.25+3*0.2+4*0.1+5*0.05=2.15
と計算し、カメラの画素数と文字機能変換の
間辺りを重視していますというようなとんちんかんなことを
することです。
単なる順位付けや比較は名義尺度で行っても全然
問題ありません。

99 :132人目の素数さん:2007/03/08(木) 22:10:43
経済分析のための統計的方法 岩田 暁一



確率・統計入門 小針 あき宏

ってどっちがいいですか?

100 :132人目の素数さん:2007/03/08(木) 22:33:35
>>99
まず、目的を書いてくれ。教科書としてのタイプがちがうから、
答えようがない。

101 :132人目の素数さん:2007/03/08(木) 23:01:18
経済学部です。それを考えると最初のがいいんですけど、
ファイナンスやりたくて数学の勉強もしてるから、下のほうがいいのかぁと

102 :132人目の素数さん:2007/03/09(金) 10:02:39
両方やるってどうだろう。とりあえず最初に少しぐらい 分からなくてもいいやって方針で小針ワールドを味合って から、岩田でゴチゴチと。

103 :132人目の素数さん ::2007/03/09(金) 17:21:51
>>98
ご回答ありがとうございます。
胸のつかえが取れました。


104 :132人目の素数さん:2007/03/11(日) 21:48:04
369

105 :132人目の素数さん:2007/03/12(月) 19:08:45
変数xおよびyが
それぞれ平均値30および20、
標準偏差が10および6、をもつ確率変数である場合、
x=x+2y の標準偏差を求めよ。ただし、xとyの相関係数は0とする。

ってあるんだが、どう解いていけばいいかわからねぇ・・・
解く方向性だけ教えてくれ。

106 :132人目の素数さん:2007/03/13(火) 02:51:57
x,yの相関係数は0ってことはx,yは独立ってこと。
だから、確率変数の和の分散を求めるにはそれぞれの分散を足せば出る。
それぞれの分散は平均値と標準偏差から出る(2yの方は係数が絡むことをお忘れなく)。
x+2yの分散が得られたらあとはそれを元に求める標準偏差を計算すればよい。

107 :132人目の素数さん:2007/03/13(火) 09:58:33
>>106
相関係数0だからって独立とは限らんのだが…。
計算上は独立であることは使わないので同じになるけど。

108 :132人目の素数さん:2007/03/14(水) 02:00:44
>x=x+2y の標準偏差を求めよ。

両辺から x を引き
 0 = 2y
両辺を 2 で割ると
 y = 0
故に、確率変数 y が 0 の時の標準偏差を求めれば良い。
y の値としてゼロのみを考える条件付き分布問題だから、、、

Ans, 標準偏差ゼロ

109 :105:2007/03/14(水) 13:15:43
そう解くだったんだ。教科書見てもわからなかったから悶えてたw
Thanks!

110 :132人目の素数さん:2007/03/14(水) 19:49:31
マジで信じたんかよ。w

111 :132人目の素数さん:2007/03/19(月) 22:13:22
誤差と残差の違いって何ですか?

112 :132人目の素数さん:2007/03/20(火) 12:59:29
残差(residual)は、測定値と推定値の差で、説明できない残り。

誤差(error)は、真の値と推定値や測定値の差が本来なのだけど、
真の値なんか分からないから統計使うので、
(とりあえず値)±(統計誤差)の範囲に真の値が入る確率が95%に
なるように計算した「統計誤差」か、「とりあえずの値の標準
偏差」かどちらかを言うことが多い。


113 :132人目の素数さん:2007/03/24(土) 08:02:50
別スレ
http://science6.2ch.net/test/read.cgi/math/1170218754/
で、
統計学=Kolmogorovの確率論+Fisherの最尤法
と言い切っているんですが、これって普通ですか?
そうでないなら、別の言い方ってありますか?

114 :KingOfUniverse ◇667la1PjK2 ◆OYFsVKEYdw :2007/03/24(土) 08:08:45
ないね。

115 :132人目の素数さん:2007/03/24(土) 09:39:17
>>113
そんな単純でないのは確かだな。多変量解析は別と言っている時点で
今の統計学の半分は捨ててるし。
また、少なくとも「Neyman, Pearsonの基準」がないと検定ができない。


116 :132人目の素数さん:2007/03/24(土) 09:56:13
>>113
無理は承知で一言で答えよ。
と言うことならば、「なるほど」と思う。
対案を言えと言われれば困るので。

117 :132人目の素数さん:2007/03/24(土) 14:20:39
>>115
すまんが、良く分からん。もう少しkwsk。

118 :132人目の素数さん:2007/03/24(土) 17:22:09
>>117
Wikipediaの「ネイマン・ピアソンの補題」を見よ。

119 :132人目の素数さん:2007/03/25(日) 05:19:14
>>115 「Neyman, Pearsonの基準」がないと検定ができない?  最尤比検定

>>113
オレなら
統計学=Fisherの最尤法  + 回帰分析
これなら
ニュートン力学=慣性系 + 「f=ma」 +作用反作用
と比較できる。
統計学に「Kolmogorovの確率論」 を加えるのは、
ニュートン力学に「微分方程式論」を加えるのと同じで、不要。



120 :132人目の素数さん:2007/03/25(日) 11:03:12
>>115
Neyman-Pearson は単なる補題だしこれを統計学の前提条件のように
扱うのはおかしいのでは?Uniformly Most Powerful test(一様最強力
検定)を最良のテストとみなしていること自体は、前提条件と言えない
こともない。もっとも、Decision theoryの一般的な枠組みを統計学の
基礎と考えた方がすっきりするように思う。

Kolmogorovは、統計学の数学的基礎として必要だろう。少なくとも
収束概念を数学的に扱うためには必要。Fisherの最尤法は、確かに
統計学の非常に多くの場所で使われているのは事実だが、あくまで
それは統計学の一部分であって、最尤法なしに統計学が全く成り立
たないわけではないのではない。



121 :132人目の素数さん:2007/03/25(日) 11:05:14
>>14
了解です。


122 :132人目の素数さん:2007/03/25(日) 12:54:52
>>113>>120
今のところ>>119に賛成するが、すこし勉強してから、その理由を言いたい。
「統計学の公理的アプローチ」
というような内容の本があれば、どなたか教えてくれませんか?
(物理のたいていの本は「法則」が最初に宣言されていて、公理的である)
もしそのような統計の本がないなら、その理由を考えたい。
>>113の問題提起は面白い。





123 :132人目の素数さん:2007/03/25(日) 13:03:48
いまのところ>>119に賛成だが、もうすこししっかり考えたい。
どなたか
「統計学の公理的アプローチ」
というような内容の本を知っているなら、教えてくれませんか?
(物理の本はたいていは「法則」が最初に宣言されていて、公理的といえる)
もしそのような統計の本がないなら、その理由を考えたい。
>>113の問題提起は面白いと思う。

124 :132人目の素数さん:2007/03/25(日) 13:05:50
122=123 誤操作で、すみません。

125 :120:2007/03/25(日) 13:34:13
誤>>全く成り立たないわけではないのではない。
正>>全く成り立たないわけではない。

すまそ。

126 :132人目の素数さん:2007/03/25(日) 15:28:36
>>119 最尤比検定 → 尤度比検定  スマソ

127 :132人目の素数さん:2007/03/25(日) 23:00:45
初学者なんですが
回帰分析、分散分析、多変量解析について
理解しやすい本て何かありますか?

128 :132人目の素数さん:2007/03/25(日) 23:58:14
この話題でこんなに盛り上がるとはな。
「Neyman, Pearsonの基準」をあげたのは検定の基礎だからで、
元の>>113の考えが純粋数学のように公理として必要なものを
あげる立場と考えたから。
統計学は記述統計と推測統計に分かれ、推測統計が推定と検定で
成り立っていることに異論はないだろう。その中で記述統計は
データの整理であり、公理といったものとなじまない。
そうすると推定の基礎が最尤法で、検定の基礎がネイマン・ピアソンと
するとなんとなくよさそうに思った。(尤度比検定でも実際棄却域をどう取るかは
それと無縁ではいられない。>>120の言うように広く言えばDecision theoryを
取り入れるべきということだ。)

>>119のような考えは公理としてではなく統計学の中心的な方法は何?
というコンセプトであろう。公理よりこの方がすっきりするように感じるのは
統計学がやはり応用数学だからなんだろうか。

129 :132人目の素数さん:2007/03/26(月) 04:49:12
Decision theoryでは一般的すぎると思うが。
もうすこし具体的に、「Decision theory の中の○○」と言わなければ(ry

130 :132人目の素数さん:2007/03/26(月) 11:02:20
同意
「Decision theoryの一般的な枠組み」=「統計学の一般的な枠組み」
じゃあ意味ないからね。
また、違うとしても
Decision theory= ○○ + △△
と答えないと、言葉のすり替えになってしうのでは?

131 :132人目の素数さん:2007/03/26(月) 11:11:29
○。・。○。・。○。・。○。・。○。・。○。・。○。・。○。・。○○。・。○。・。○。・。○。・。○。・。○。・。○。・。○。・。○
このレスをみたあなたは・・・3日から7日に
ラッキーなことが起きるでしょう。片思いの人と両思いになったり
成績や順位が上ったりetc...でもこのレスをコピペして別々のスレに
5個貼り付けてください。貼り付けなかったら今あなたが1番起きてほしくないことが起きてしまうでしょう。
コピペするかしないかはあなた次第...
○。・。○。・。○。・。○。・。○。・。○。・。○。・。○。・。○

132 :132人目の素数さん:2007/03/26(月) 15:45:06
>>129, >>130
確かにそうだな。それでは、
統計学=Kolmogorovの確率論+リスクの最小化原理
では、どうだろう。

仮説検定に関しては、Neyman-Pearson Lemma がUMP test
がリスク最小化の十分条件であることから必然的に導けるし、
推定に関しては、不偏性、有効性に関しては直接的に定式化できる。
漸近的性質に関しても、リスクのsequenceを考えることでほぼ解決できるように思う。
(自分は、漸近正規性とかに関してそういう枠組みで考えたことはないけど。。。)
最尤法に関しても、推定値の近傍があるリスクを最小化する統計量として
位置づけられるのでは?

思いつきで書いてるので、どこまで正しいか分からん。

133 :132人目の素数さん:2007/03/27(火) 01:04:00
>>132
すごいな。推定も検定も一緒に処理しようというわけか。
それだと多変量解析も範疇に入れられそうだ。
数学的にリスク最小化原理の一般化ができれば
統計学も公理系の上に乗っていると主張できるかな?

134 :132人目の素数さん:2007/03/27(火) 06:01:20
>>132はノーベル賞だね。

135 :132人目の素数さん:2007/03/27(火) 06:30:17
>>132
すげぇ〜。 Fisherの再来だぁ〜。

136 :132人目の素数さん:2007/03/27(火) 08:31:20
統計学のパラダイムシフト

137 :132人目の素数さん:2007/03/27(火) 18:45:36
>>132
統計学最大の問題(統計学の公理化)が2ちゃんねるで解かれるとは・・・

138 :132人目の素数さん:2007/03/28(水) 03:24:33
>>132
リスク関数の決め方に恣意性が・・・

139 :132:2007/03/28(水) 15:48:49
>>138
残るね。
ただ私が思ったのは、もうちょっとDecision Theoryの立場から
様々な統計学の手法をまとめれば、数学的にすっきりするし、
各手法の位置づけや関係が整理できるんじゃないかということ。


140 :132人目の素数さん:2007/03/28(水) 22:49:03
>>139
同意
そんな本があったら買うね。
言いだしっぺの君が書いてよ。

141 :132人目の素数さん:2007/03/29(木) 07:53:41
>>140 書けねーよ

142 :132人目の素数さん:2007/03/29(木) 08:39:02
.                     ,イ/〃        ヾ= 、
         _,,r-‐''"´ ^ `N /l/               `ヽ
        彡  法学部  N! l                   `、
   ,, -‐- ,,-彡       l ヽ         医学部        l` ´ ``‐ 、
 彡´      |    ,,w,,wヽヽ              ,,      | 薬学部  `ヽ
_彡  政経部  |  //レ/ハl/ハ\ヾー        _,, ,,r,,/lヾ    |         }
ハl/   ,/ハlヾヾ,l、 /三f、,,_   _,ヾニ_ ____彡ノノノノノ_ヾヾ   | ,l、 、     l___
/レ  /l,,_/__ヽ lヾ ヽモ-ヽl ´fモチ7ヽ={ r‐ィッヾ ヽ-r'´〒fデF`lェr‐、ハlヽヽヽ   哲学 \_
 l`=l fモチ)_{´ヽl!l     :l     l ll !l  `┴ー/ソl⌒ッ`┴┴' }//l l、 ,,、ァtッヒヽ、rゥ  /  \  
 ヾ}弋_シl弋 ヽl    ヽ-    ヽl lゝ__,ノ |  ゞ___ノl/l / l  `~゙´  lァノ  (●
)  \
  ヾl   `'  `''´lヽ  ──   /l\l        l、,      l_ノ 〈 _     l!ノ_人__)     | 
   }\  ̄ ̄ ,ィl \   ̄  / l  l    ___    /  ──   丿 ⌒´    ,/ 
  ,/\ \__// \ \___/ ,,-''\|\    _       /|\  -   / |、     / ,|、
-‐'   \_,,-‐'\  `ヽ、  ,,r'   /|  \       / .|  \__/  ,,rヽ‐-‐ '' / l`ヽ
   ,,-‐''       \  /\/\  / \.  \____/  /\    ,,-‐''  /\ ,/  l  ヽ
-‐''´         \/  }゙ _,,,‐''\   \        /   /l\‐''    /  `ヽ、_ l

143 :132:2007/03/29(木) 14:23:29
書けないですね。
とりあえず、過去にそんなこと試みた人はいないのかな?
ちょっと、まわりに聞いてみよう。。。

144 :132人目の素数さん:2007/03/29(木) 14:58:29
.                     ,イ/〃        ヾ= 、
         _,,r-‐''"´ ^ `N /l/               `ヽ
        彡  法学部  N! l                   `、
   ,, -‐- ,,-彡       l ヽ         医学部        l` ´ ``‐ 、
 彡´      |    ,,w,,wヽヽ              ,,      | 薬学部  `ヽ
_彡  政経部  |  //レ/ハl/ハ\ヾー        _,, ,,r,,/lヾ    |         }
ハl/   ,/ハlヾヾ,l、 /三f、,,_   _,ヾニ_ ____彡ノノノノノ_ヾヾ   | ,l、 、     l___
/レ  /l,,_/__ヽ lヾ ヽモ-ヽl ´fモチ7ヽ={ r‐ィッヾ ヽ-r'´〒fデF`lェr‐、ハlヽヽヽほっ統計学\_
 l`=l fモチ)_{´ヽl!l     :l     l ll !l  `┴ー/ソl⌒ッ`┴┴' }//l l、 ,,、ァtッヒヽ、rゥ  /  \  
 ヾ}弋_シl弋 ヽl    ヽ-    ヽl lゝ__,ノ |  ゞ___ノl/l / l `~゙´  lァノ  (● )  \
  ヾl   `'  `''´lヽ  ──   /l\l        l、,      l_ノ 〈 _     l!ノ_人__)     | 
   }\  ̄ ̄ ,ィl \   ̄  / l  l    ___    /  ──   丿 ⌒´    ,/ 
  ,/\ \__// \ \___/ ,,-''\|\    _       /|\  -   / |、     / ,|、
-‐'   \_,,-‐'\  `ヽ、  ,,r'   /|  \       / .|  \__/  ,,rヽ‐-‐ '' / l`ヽ
   ,,-‐''       \  /\/\  / \.  \____/  /\    ,,-‐''  /\ ,/  l  ヽ
-‐''´         \/  }゙ _,,,‐''\   \        /   /l\‐''    /  `ヽ、_ l


145 :132人目の素数さん:2007/03/30(金) 08:12:50
>>143
「統計学の公理的構成」が統計学最大の問題であることを、
非専門家たちに知らしめただけでも君の功績は学位論文以上だよ。
この辺りを読んで、君を乗り越える若い才能が出てくることを期待しよう。

146 :132人目の素数さん:2007/03/30(金) 19:50:26
t検定でふたつの集合の平均値が同じかどうか調べる時、
同じだという帰無仮説を危険率5%で棄却されなかった事をもって
「同じだ」と言っていいんでしょうか?なんかやり方が逆のような気が

147 :132人目の素数さん:2007/03/30(金) 22:05:34
>>146
同等性検定でぐぐれ

148 :132人目の素数さん:2007/03/31(土) 05:32:17
>>146
帰無仮説が棄却されないとほんとは何も言えないんだけど、
しばしばそのように解釈されてしまう。


149 :KingOfUniverse ◆667la1PjK2 :2007/03/31(土) 09:56:31
対立仮説が棄却されるかどうか。

150 :132人目の素数さん:2007/03/31(土) 14:14:36
一般には対立仮説は棄却されうるが、>>146のケースでは無理。

151 :132人目の素数さん:2007/03/31(土) 22:49:41
>>112
>誤差(error)は・・「とりあえずの値の標準偏差」かどちらかを言う・・・
「とりあえずの値の標準偏差」って、標準誤差のことですか?

152 :132人目の素数さん:2007/04/01(日) 02:44:49
>>148
Neyman-Pearson Lemma の方の検定なら、パラメータに関する「仮説」と「対立仮説」しかないので
「採択」と「棄却」が明確に成立する。
Neyman-Pearson検定論やWaldのDecision Theory は、「帰無仮説」という考え方を捨てて初めて成立する。
この立場での検定なら >>149が正しい。

帰無仮説を重視するのは Fisher流の有意性検定で、逆にこちらは明確な対立仮説を設定しない。
パラメータだけでなく、検定時の確率モデル全体が「帰無仮説」に含まれているためだ。
例えば、散開星団が「星団」であることを統計的に検証するために、「天空上に星が一様に分布する」
という帰無仮説を立てる。そして有意な違いが検出されれば、採択されるのは「銀河における星団の生成モデル」
であり、このような広いモデル選択は、Neyman-Pearson検定論では記述できない。

いまの統計学のテキストは、この辺の区別が無く、グッチャグチャに書かれているのがほとんど。

153 :152:2007/04/01(日) 03:07:40
>そして有意な違いが検出されれば、採択されるのは「銀河における星団の生成モデル」

このところは「偶然ではない何か」に訂正しといてちょ

154 :132人目の素数さん:2007/04/01(日) 06:29:28
>>152
いや、全ての検定は、対象となる確率変数がとりうる確率測度の族Pを
帰無仮説P_0と対立仮説P_1に分割した上で定義されるべきだろ。
その際、Pが(有限次元)パラメータで記述されるかどうかは関係がない。

確かに、対立仮説が明示されていない検定もあるが、
それは理論的基礎が不完全なだけでは。

155 :146:2007/04/01(日) 10:04:20
よく分からないけど分かりました!ありがとうございます(><)

156 :132人目の素数さん:2007/04/02(月) 02:54:02
刑事裁判は被告が有罪か無罪かを決めるだけだぞ。
>>154によると、被告が無罪になった時には、同時に真犯人がわかっていてそれが
有罪に決まらないような裁判は、理論的基礎が不完全らしいなw


157 :132人目の素数さん:2007/04/02(月) 07:09:21
>>156
>被告が無罪になった時には、同時に真犯人がわかっていてそれが
>有罪に決まらないような裁判は、理論的基礎が不完全らしいなw

1. 被告人が無罪になのにそれより怪しい人は見つかっていない、
っていう状況は論理的に完全だと思う?

2. 「真犯人がわかって」いる必要はないだろ。被告人より怪しい
人が存在する必要はあるだろうけど、特定される必要はない。

っていうか、仮説検定をちゃんと理解してないだろ?

158 :132人目の素数さん:2007/04/06(金) 10:48:07
Kernel SEM ってどんなモデル? ぐぐったけどそれらしきモノがでてこない。
フツーのSEMとどこが違うんでしょか?

159 :132人目の素数さん:2007/04/06(金) 23:22:01
Gini係数の目安、つまり
〜0.1 平準化が仕組まれる人為的な背景がある
0.1〜0.2 相当平等だが向上への努力を阻害する懸念がある
0.2〜0.3 社会で一般にある通常の配分型
0.3〜0.4 少し格差があるが、競争の中での向上には好ましい面もある
0.4〜0.5 格差がきつい
0.5〜 特段の事情がない限り是正を要する
と区分されていますが、これと似た区分を書いてある英文の論文知りませんか?
卒論で必要なもので。
お願いします。

160 :132人目の素数さん:2007/04/06(金) 23:43:53
ググれ

161 :132人目の素数さん:2007/04/07(土) 09:22:01
>>159
こんなのを見つけた。
http://www1.doshisha.ac.jp/~sshinoha/report/2006_china/NigeriaPaperLatest.pdf
英語ではあるが。

162 :132人目の素数さん:2007/04/07(土) 13:56:54
>>161
本人だったりして。

163 :132人目の素数さん:2007/04/07(土) 16:29:29
161さんありがとうございます。
欧米のジャーナルにはありませんか?ぐぐってもなかなかでてきません。


164 :132人目の素数さん:2007/04/07(土) 16:39:36
> 欧米のジャーナルにはありませんか?
それは曹達

165 :132人目の素数さん:2007/04/07(土) 21:33:41
>>159
今時そんな能天気で紋切り型の区分を使ったら笑われるぞ。
まず↓Wikipediaを読め。
http://en.wikipedia.org/wiki/Gini_coefficient
次に世界銀行の↓でどんな問題が専門的に扱われてるか調べてみれ。
http://www.worldbank.org/research/inequality/index.htm

166 :132人目の素数さん:2007/04/07(土) 22:42:55
魔方陣 http://www.u-kan.jp/

167 :132人目の素数さん:2007/04/08(日) 15:00:41
大学の統計の授業でRとJMPとSNなんとかを使う授業があるんですがどれを取れば広く対応できますか?

168 :132人目の素数さん:2007/04/08(日) 18:33:39
SNなんとかだな。
というのは嘘。なんとかではわからない。

あなたの専攻なんかにもよると思う。
統計の先生ではなく、その専門の先生に相談する方が早いだろうね。

それはともかく、そんなに色々あるのか。うらやましい。

169 :132人目の素数さん:2007/04/08(日) 20:27:35
>>168 ありがとう 最初の授業は取るて決めてなくても見てまわれるらしいから話聞いてきます
ちなみに専門はまだ決まってないです

170 :132人目の素数さん:2007/04/08(日) 23:00:49
>>167
まずSNなんとかは勘違いじゃないのかな?
大学でやりそうなのはSPSSとかだと思うけど。
もしそうではないマイナーなソフトだとしたら余り意味がないかもな。

広く対応の意味が分からないな。大学においてというなら
>>168の言うように専門の先生に寄るだろう。
社会に出てからというのならSNなんとかがSPSSなら
一番使う可能性が高いだろう。最近はJMPも広がってるけどね。
広くが自由にという意味ならRはフリーソフトであり、
自宅のPCでも使えるので便利。ただし、コマンド入力による
操作が面倒なら困るかも。

171 :132人目の素数さん:2007/04/11(水) 02:38:19
STATA9がいいよ

172 :132人目の素数さん:2007/04/11(水) 20:13:15
>>170 勘違いでした 調べてみたらSAS でした
JMPとRで迷ってましたがJMPのほうが講義がわかりやすいらしいのでそれにしようかと思っています

173 :132人目の素数さん:2007/04/12(木) 01:00:05
>>172
ほうほう一番高価なSASまで準備しているとはすごいところだな。
SASは製薬会社御用達なのでそれに興味があるなら必須だけど
そうでないならJMPは無難なところ。

174 :132人目の素数さん:2007/04/12(木) 12:53:36
>>173 履修担当に話を伺った所おおまかにわけるとRとSASは主に生物系等の講義取っている学生向けのようでした
文理混合大なのでわかりにくいorz

175 :132人目の素数さん:2007/04/12(木) 20:23:23
でも、JMPって独特だからなあ。
将来、「広く対応」できるかなあ。
最初からJMPなら慣れるもんかなあ。

176 :132人目の素数さん:2007/04/12(木) 21:30:02
すみません。SPSSによる多重比較について質問させてください。
2×3表でχ2乗検定し、有意となりました。
さて、その次に、どの群間に差があるのかを検定したいのですが、
SPSSで検定できるのでしょうか?
数値データなら、多重比較を使うと良いのでしょうが、
カテゴリカルデータ、しかも、順序ではないデータの場合、
どうすればよいのでしょうか?
数値データ同様、分散分析→その後の検定でtukey、dunnett、あたりを
選択してよいのでしょうか?
ノンパラいろいろSPSS本を調べたのですが、載っていませんでした。
ご存知の方がおられましたら、なにとぞご教示のほどお願いいたします。

177 :132人目の素数さん:2007/04/12(木) 22:43:46
>>165
希に見る、親切かつ適切な書き込みだなー。

178 :132人目の素数さん:2007/04/13(金) 00:24:29
>>176
その分散分析は二元配置に対するものですから分割表には使えません。
(データの形が同じなために形式的には使えますが、誤用です。)
そもそも分割表に対する多重比較は書籍ではないでしょう。
ぐぐって探してみた?


179 :132人目の素数さん:2007/04/14(土) 23:57:24
生物系の学生ですが、マルコフ連鎖モンテカルロシミュレーションについて初学者が学習しやすい参考書やWeb上の資料はないでしょうか?

180 :132人目の素数さん:2007/04/15(日) 00:15:20
>>179
ここなんかはすでに見たわけ?
http://www.e.u-tokyo.ac.jp/~omori/MCMC/index.htm

181 :132人目の素数さん:2007/04/15(日) 10:04:57
>>180
素晴らしいサイトを紹介していただきありがとうございます。
もう一つ質問させて下さい。マルコフ連鎖モンテカルロシミュレーションとは、どのような場合に使う手法なのでしょうか?

182 :132人目の素数さん:2007/04/15(日) 13:50:42
>>181
激しくたくさんのパラメータを同時推定したいけど、
joint distribution が分かってないときとか。

183 :132人目の素数さん:2007/04/16(月) 18:54:49
>>182
素人解釈で、間違っていたら申し訳ありません。
仮にjoint distributionが分かれば(仮定できれば)、分散分析のようなモデル
(一般化線形混合モデル?)でパラメータが推定できますよね?
マルコフ連鎖モンテカルロシュミレーションでは、例えば個体の生存率
など、多数の要因が複雑に関わっている現象(そのためにjoint
distributionが仮定できない)について、それぞれの要因の効果(パラメータ)
を推測できるという理解でよいのでしょうか?


184 :132人目の素数さん:2007/04/17(火) 05:05:56
>>183
大体そんな感じ。
あと、joint distribution が分かってても、
複雑すぎて計算が困難な場合にも使われる希ガス。

185 :132人目の素数さん:2007/04/17(火) 23:34:49
フリクションモデルの概要と推計方法をよかったら教えていただけないでしょうか?


186 :132人目の素数さん:2007/04/20(金) 01:22:36
どうしても分からないので質問させてください。
重回帰分析を行うのにExcelでLINEST関数というのがあります。
これの機能に切片を0にして偏回帰係数を求めるという機能がついていますがこれがどのような計算をしているか分かりません。

例えば
z=a+bx+cy (a切片,b,c:偏回帰係数)
という式の切片aを0にしたい場合z,x,yが全て0のサンプルを沢山加えて偏回帰係数求めると
b,cは確かにExcelが求めた切片0の偏回帰係数に一致します。

しかしながら、
Excelで切片を0にしないときのF検定でF分布の自由度をn-2としたとき
Excelで切片を0にしたときのF分布の自由度がn-1になっている所を見ると
0をサンプルにたくさん用いずに偏回帰係数を算出していると思われるのですが
これは一体どのようにして切片0の偏回帰係数を計算しているのでしょうか?

187 :132人目の素数さん:2007/04/20(金) 12:17:09
回帰の計算は単に、
z=a+bx+cy の代わりに、z=bx+cy が使われいるだけです。
先見的に、定数項=0が分かっている場合に使うモデルです。

またF値は、
z=a の残差をRSS0
z=bx+cy の残差をRRS1
としたとき、
F = ((RSS0-RSS1)/2) / (RSS1/(n-2)) 注) 2 は変数の数(x,yの2個)
として計算されているようですが、
そもそも、z=bx+cy は残差の平均がゼロになりませんし、
モデル;z=bx+cyはz=aを含んだモデルではないので、
このF値はF分布に従わず何の意味もないと思います。


188 :132人目の素数さん:2007/04/21(土) 15:06:39
M$のソフトだからな。
ようやくExcelの分散が負にならなくなったのも、2年前くらいだっけ。
ましてや回帰なんつー高度な計算を期待しても、まず永久にムリ。

189 :132人目の素数さん:2007/04/21(土) 15:15:22
沖縄県の方へ(命に関わる注意事項です)

沖縄県での選挙ですが、どうか民主党だけは避けてください。県民の生命に関わる可能性があります。
民主党の最大の公約は一国二制度(※)ですが、一度「一国二制度 沖縄 三千万」等で検索をお願いします。
この際、民主党のHPで調べても良いです。以下の注釈↓と矛盾することは書いてないはずですから…

※一国二制度
 簡単に言えば沖縄を中国と日本の共有物にし、そこに3000万人の中国人を入植させます。
 (つまり沖縄人口の 96% を中国人にして、実質、沖縄を中国人の居住地とします。)
 さらに「自主」の名の下、沖縄で有事が起きても自衛隊は干渉できません。
 3000万人の中国人が、少数派となった130万人の日本人に何をしても、です。
 そして反日教育を受けた中国人の反日感情の強さは、ほとんどの日本人の理解を超えるものです。

今回の選挙で民主党が勝った場合、「自主」「発展」を連呼しつつ段階的に進めていくことになります。
自主と言っても、自主を認めるのが「住人の96%が中国人となった」後だということに気をつけてください。
発展と言っても、新沖縄の少数派となった「少数民族日本人」の発展ではないことに気をつけてください。

190 :なんき:2007/04/21(土) 22:39:31
仕事で金融工学をやってます。GAUSSという統計ソフトのことを
どなたかご存知でしたら教えてもらえますか。株価をジャンプ過程で
表したモデルのパラメータの時系列推定をこれでやっているようなのですが、
もともと専攻は制御工学系で統計ソフトとか苦手なもので、
お力をお借りしたい次第です。よろしくお願いします。

191 :132人目の素数さん:2007/04/21(土) 23:57:13
Gauss っていわゆる行列言語です。
見た目はプログラミング言語に似ていますが、
たくさんの統計関数が組み込まれている統計ソフトです。
行列計算は比較的高速ですが、繰り返し文などは
遅いです。
確か、個人でも購入できますが、値段は高いです。

似た言語:Matlab, R, S-plus, Ox

192 :なんき:2007/04/22(日) 00:12:06
>>191
レスありがとうございます。GAUSS、さっきぐぐったら10万円もするらしく、
使いこなせるのならば会社に買ってもらおうと思うんですが、日本語マニュアル
ないらしく、かなり不安です。他のソフトとの比較感とか、業界での普及状況とか
お教えいただけるとうれしいです。

193 :132人目の素数さん:2007/04/22(日) 10:25:44
普及度合いからすると、Matlab や S-plus, R の方が上ですね。

「株価のジャンプ過程のパラメーター推定」というやつのコードが
Gauss のパッケージに入っているとか、誰かがコードを公開している
ということなのかと思いました。

そうではなくて、一般的に統計ソフトを導入したいということであれば、
無料であるRから始めてみるのがお勧めですが。

194 :132人目の素数さん:2007/04/22(日) 10:28:27
別のところで聞いたけどレス付かないのでお願いします

非線形の最小二乗法について詳しく書いてある本紹介してください。
修正Marquardt法とか、アルゴリズム関係も含めて、お願いします。

195 :132人目の素数さん:2007/04/22(日) 17:52:32
半端な専門書よりも↓が詳しい
http://dl.cybernet.co.jp/matlab/support/manual/r14/toolbox/optim/tutorial.shtml
わからないところがあれば基礎ができてないので、非線形最適化の入門書嫁

196 :195:2007/04/22(日) 17:57:28
リンク間違えた
http://dl.cybernet.co.jp/matlab/support/manual/r14/toolbox/optim/tutoriab.shtml

197 :132人目の素数さん:2007/04/22(日) 18:51:05
収束がわかんなくなっちゃいました。。誰か教えてください。

収束は、無限の世界における数の安定的な性質と理解してよいですか?


198 :132人目の素数さん:2007/04/22(日) 21:47:46
心理測定データに基づく尺度の構成について、サーストンの比較判断の法則を中心に、説明せよ。

199 :132人目の素数さん:2007/04/22(日) 22:35:05
>>197 スレ違い
>>198 板違い

200 :132人目の素数さん:2007/04/23(月) 01:01:55
>>197
統計学にはいろんな収束があるから、もうちょっと詳しく書かないと。


201 :132人目の素数さん:2007/04/23(月) 01:53:36
>>198
尺度の構成は統計分析に大きな影響を与えるので気になるところ。
探してみると
http://www.oak.dti.ne.jp/~xkana/psycho/stat/stat_02/index.html
といった説明が見つかった。一つ勉強になったな。


202 :132人目の素数さん:2007/04/23(月) 02:46:23
人間の知覚感度を5段階評価しただけだろ。楽な分野だな。

203 :132人目の素数さん:2007/04/23(月) 23:59:59
>>195
レスサンクス

非線形最適化の入門書とやらを紹介してくださらんか・・・


204 :132人目の素数さん:2007/04/24(火) 12:58:29
質問させてください.
あるデータ(間隔尺度が3つ)について繰り返しのある二元配置の
分散分析をやろうとしているのですが,これを共分散構造分析でも
やることは可能でしょうか?
また可能であれば注意点とかありますか?
よろしくお願いします.

205 :132人目の素数さん:2007/04/24(火) 23:07:10
>>204
共分散構造分析は統計的方法を広く含んでいてその中には回帰分析もありますから
回帰分析の一種である分散分析はもちろん範疇に含まれます。

ところでデータは間隔尺度が3つとありますが、それをx,y,zとするとx,yで二元表を作り
zを分析するといった感じですか?x,yが元々ごく少数の値しかとらないというならともかく
そうでないなら無理矢理度数分布にせずそのまま解析した方がいいように思います。


206 :204 :2007/04/25(水) 01:14:01
>>205
そのとおりです.
x,yがそれぞれ5水準でzを分析するんですが,
5水準だと多すぎるでしょうか?
共分散構造分析の練習にでもと思ったのですが...


207 :132人目の素数さん:2007/04/25(水) 01:24:34
>>206
5水準なら細かさの点ではいいですが、分散分析だとせっかくの間隔尺度が消えてしまいます。
(順序尺度の間違いではないですよね?)

また、共分散構造分析にかける場合、そのx,yをそのまま変数として間隔尺度を生かした
解析をするなら分散分析とは対応しません。分散分析ではそれぞれの変数を名義尺度
として扱いますから。(回帰分析の一種といったのはあくまでもダミー変数を使うと
した場合。)


208 :204 :2007/04/25(水) 01:48:02
>>207
厳密には x,y は順序尺度です.
ただし質問紙調査で5段階評価を聞いているものなので,
まあ間隔尺度として扱ってもいいんじゃないかなと思ってます.
z はちゃんとした間隔尺度です.
それで x,y の幅がそれぞれ -2 から 2 の5段階だとして,
x,y がどちらも小さいほど z(0 から 100)はちいさくて,
x,y がどちらも大きいと z は大きくなる,というような
ストーリーにしたいのですが.

209 :132人目の素数さん:2007/04/25(水) 10:08:47
>>208
順序尺度を量的に扱うのは文系ではよく見られます。
因子分析にかけているのも見たこともあります。
共分散構造分析をかける人もいるでしょう。

間隔尺度とみなしても妥当かどうかは判断が分かれるところですが、
数量化法などの利用を勧めても統計に詳しい人が回りにいなくて使えないようです。

今回の目的から考えると共分散構造分析という大層なものでなくても
普通に線形回帰で様子を見ればいいのではないでしょうか。
量的に扱う問題点は結局それを報告する相手が納得するかどうかです。

210 :132人目の素数さん:2007/05/01(火) 15:46:10
R以外にもフリーの統計ソフトあるってうわさを聞いたんですけど知ってる人いませんか?
計量経済学の手法がたくさん実装されてるらしいんですが。

211 :132人目の素数さん:2007/05/01(火) 21:35:58
フリーの統計ソフトなんて、MS-DOSの時代から星の数ほどありますがな。
(大型機上のFORTRANなんかは知らないけど。)

212 :132人目の素数さん:2007/05/01(火) 22:55:27
2つの変量の関係を、散布図にしてみると、2次式もしくは、区間を区切った
(例えば、0<x<150°)三角関数に近いと思うのだが、最適な式を得る分析方法
は、ありますか?
直線だったら、最小自乗法で、回帰直線を得るようなものの、2次式版です。

213 :132人目の素数さん:2007/05/01(火) 23:48:01
>>212
y = a0 + a1*x + a2*x^2 を当てはめるということ?
それも線形重回帰分析ですがな。
(x^2を新たな変数として準備しておくだけ。)


214 :132人目の素数さん:2007/05/02(水) 12:58:49
>>212
最小二乗法自体は直線回帰以外にも使える。
f(x;a,b,c) = a + b x + c x^2 として、これを点列 (x[k], y[k]) に
当てはめたときの二乗誤差 E = Σ(y[k] - f(x[k];a,b,c) )^2 を
パラメタ a, b, c で最小化、つまり偏微分して 0 と置いて解く。

215 :132人目の素数さん:2007/05/04(金) 23:41:09
クロスバリデーションについて、詳しく解説している書籍やサイト等(日本語・英語は問いませんが、なるべくなら日本語で)を誰か紹介してくれませんか?

216 :132人目の素数さん:2007/05/06(日) 23:28:05
>>215
とりあえず、ぐぐれ。
そうすれば自分がいかに漠然とした質問をしているかが分かるだろう。

217 :132人目の素数さん:2007/05/08(火) 08:09:35
最近、イデア論と統計学が同じであることに気付いた。
この事実は新発見なのか?またはよく言われていることなのか?
教えてください。

218 :132人目の素数さん:2007/05/09(水) 05:15:15
イデア論と統計学の類似性については昔から言われていることです。
たとえば、 
  http://sociology.jugem.jp/?eid=167
ただ、ここまでで、これ以上の発展はないと思います。
貴方の発見がこれ以上なら非常に面白いので教えてください。

219 :132人目の素数さん:2007/05/10(木) 17:54:20

数学@2ch掲示板用 掲示板での数学記号の書き方例と一般的な記号の使用例 http://members.at.infoseek.co.jp/mathmathmath/




220 :132人目の素数さん:2007/05/15(火) 10:23:02
質問です。

平均の長さがa1,a2,a3,a4,a5 の5つの部品を継ぎ合わせて
組み付ける工程がある。この工程の仕上がり寸法の規格は,
2.020±0.030mmである。各部品寸法の精度(標準偏差)は
同程度で製作できる。仕上がり寸法が正規分布するものとして,
規格を満足しないものが0.3%程度あってもよいとするならば,
各部品精度をどの程度にすればよいか検討しなさい。

という問題です。統計を始めたばかりで全然分からないのですが、
完成品が正規分布N(2.020,x^2)に従うとして、±0.030mmを超えるもの
が0.003程度となるxを調べたところおよそx=8になりました。

この考え方があっているのかもわからない初心者です。
(これだと平均の長さとか、5つに分かれていることなどがまったく
無意味になっているのでおそらく違うのでしょう・・・)
ご教授お願いします。

221 :132人目の素数さん:2007/05/15(火) 14:19:59

おしえてください。

 これから統計など学ばなければならなくなってしまい、
 猿でもわかるような、だれでもわかるような、絵が沢山かいてあって
 わかりやすい、統計学の本さがしています。

 みなさん教えてください。
 主観、客観は問いません
 みなさんに教えて貰った本を買いに行こうと思います。
 宜しくお願いします。



※ ここのスレは 英語が沢山でてきていて、ともてレベルが高いので
  超初心者のスレとかあるんですかね?

222 :132人目の素数さん:2007/05/15(火) 15:11:34
絵が描いてある=わかりやすいってのはよくある誤解の一つだな。
絵やグラフにかいたほうが分かりやすいという物事はあるが、そういうのがあればあるほど分かりやすいってものでもない

223 :132人目の素数さん:2007/05/16(水) 00:14:59
>>221
>猿でもわかるような(中略)絵が沢山かいてあって(中略)統計学の本
マンガでわかる統計学
http://www.amazon.co.jp/dp/4274065707

条件に当てはまり評判が良い本ならこれですね。
この本だけで済むはずないとは思いますが最初の一歩にどうぞ。

224 :132人目の素数さん:2007/05/22(火) 02:35:12
このスレか質問スレのどちらに書いたらよいか迷いましたが、
統計に関することなのでこちらに書きます。

標準正規分布の尖度がなぜ3になるのか分かりません。
そもそも標準化した3次、4次のモーメントがなぜ歪度、尖度を表すのか
という点も完全には理解できていません。
ウィキ等で調べたのですが、いまいちよく分かりませんでした。
厳密には難しい概念なのでしょうか。

225 :132人目の素数さん:2007/05/22(火) 13:29:02
>>223
dクス。いきなり買ってしまった。

1 点 マンガでわかる統計学
販売: Amazon.co.jp
1 点 マンガでわかる統計学 因子分析編
販売: Amazon.co.jp
1 点 マンガでわかる統計学 回帰分析編
販売: Amazon.co.jp


全部買ってしまった。
で、読んでみると、とても分かり易かった。
なんか、『萌え単』みたいだね。
マンガでわかる統計学の最後は『陰からマモル』みたいだったしwwww

初心者には向いている本ですね。

226 :132人目の素数さん:2007/05/22(火) 16:48:37
ここでよいか分りませんが、質問させてもらいます。

ある二次元分布の線形性(直線性)を示す、最適なパラメーターはないでしょうか?

227 :132人目の素数さん:2007/05/23(水) 13:55:03
すいません。助けをお借りしたくて書き込みします。
統計学の「と」の字も分からない私が、大学で統計学の課題を出されてしまいました。
自力でやろうとはしたのですが、やはりわかりません。よければ教えて下さい。

 標本A    標本B
 
16 8
9 2
12 10
12 1
10 4
6 5
という二つの標本のグループがあり、問題は

1)標本A,Bの母平均に差があるかどうかを有意水準5%で検定しなさい。
2) 1)の検定の自由度はいくらか?

です。どうかよろしくお願いします。



228 :132人目の素数さん:2007/05/23(水) 15:54:21
age

229 :132人目の素数さん:2007/05/23(水) 20:50:26
>>227 ワロタ

230 :132人目の素数さん:2007/05/23(水) 22:35:48
本を読め本をw

231 :132人目の素数さん:2007/05/23(水) 22:42:07
統計学の講義をとってる人が何で統計学の「と」の字くらいわからないのよ。
使ってる教科書の題名と目次を挙げてみなよ。誰かが答えてくれるかもよ。

232 :132人目の素数さん:2007/05/24(木) 08:36:07
文系の人間で、いきなり統計学やると難しいな。

233 :132人目の素数さん:2007/05/24(木) 08:47:06
Σがわからんとか、内積がわからんとかなら救いようがあるが、
√がわからんとか、二乗の和がわからんとか、どないせえっちゅうねん、と思うことがある。

234 :132人目の素数さん:2007/05/24(木) 10:39:11
データ数がわからないときの平均ってどうやって出すんですか?
誰か教えてください。
お願いします。

235 :234:2007/05/24(木) 10:40:25
ヒストグラム、相対頻度はわかっています。

236 :234:2007/05/24(木) 11:12:27
貯蓄残高について
貯蓄残高        相対頻度
200万未満        9.99
400           12.85
600       13.54
800       10.54
1000 9.97
1200 7.63
1400 6.18
1600 4.6
1800 4.31
2000 3.02
2200 2.21
2400 1.89
2400以上 13.26

模範解答には「便宜上200万未満は、100万以上200万未満。
       2400万以上は未満として扱うと書いてある2400万以上5000万未満」
と書いてあります。
問題は貯蓄残高の対数をとったものでヒストグラムを書き、平均を求めよ
といった感じです。

237 :132人目の素数さん:2007/05/24(木) 11:14:17
>>234
意味不明

238 :234:2007/05/24(木) 11:17:25
>>237
236の問題でも意味不明ですか?

239 :132人目の素数さん:2007/05/24(木) 16:15:44
誰か教えてください。
問い
「所得分布や資産分布が対数正規分布に従うとする根拠を以下の2つの
 命題をヒントとして述べよ。」
ヒント1:ランダムな要因をいろいろ足したものは、中心極限定理より正規分布に従う。
ヒント2:変数の積の対数を取ると、個別の変数の対数の和となる。

240 :132人目の素数さん:2007/05/24(木) 19:56:28
>>238
ランダムサンプリングしれべよかね?

241 :132人目の素数さん:2007/05/25(金) 00:38:38
>>239
別に根拠とかないと思うんだよね。
出題者に、お前何が言いたいんだよ、と小一時間問い詰めたい。
まあ、「ヒント1」のステートメントの馬鹿さ加減からして、
賢ぶってる経済系の教官かなw

242 :132人目の素数さん:2007/05/25(金) 12:01:26
http://ja.wikipedia.org/wiki/%E6%9C%89%E6%84%8F

243 :132人目の素数さん:2007/05/25(金) 13:27:34
>>242
ひどいね
誰かかきなおせ

同種の検定を繰り返して全体での有意性の有無を判断する場合(多重比較)には、1回の検定に対する有意水準をαとすれば全K回の検定で第1種の過誤の可能性がKαとなる。
具体的にはα=0.05、K=20とするとKα=1となってしまい、これでは検定の意味がない(必ず有意の結論が出る)。そこで簡単な方法として、1回の検定における有意水準をαで
なくα/Kとする方法も採られる(ボンフェローニ補正)。

244 :math太郎:2007/05/25(金) 13:45:51
>236
 統計学というより、簡単な算数の問題ですね。
 対数取ったあとの平均値は1191万円。
 対数とらないときには、1229万円。

 平均所得高いねー・・・。
 おれも平均ぐらい所得欲しいぞ。。。

 多分、高校生ですよね???


245 :132人目の素数さん:2007/05/25(金) 16:27:18
>>244
所得じゃなくて、貯蓄だからこんなもんじゃない?

246 :math太郎:2007/05/26(土) 01:56:24
>245
ううう、貯蓄ですね・・・

2400万以上が13.26%というのは、
所得にしては高すぎると思いました・・・。


247 :132人目の素数さん:2007/05/26(土) 05:25:47
検定の範囲での中間試験あるんだが、練習問題出してくれ

248 :132人目の素数さん:2007/05/26(土) 16:10:44
>>243
書き直しておいてあげたよ。これでOK?

249 :132人目の素数さん:2007/05/26(土) 19:53:29
>>248
GJ。重箱隅だけど、

「k回の試行の従属性に依存する」
        ↓
「k回の試行の独立性に依存する」

統計的(または確率的)独立性の場合、否定形は「独立ではない(not independent)」。
「従属(dependent)」という表現は使わないよ(理解可能ではあるが)。

250 :132人目の素数さん:2007/05/26(土) 23:53:41
>>249
dependentは、普通に使うと思うけど。。。
でも、日本語で書くときは独立性とした方が自然かな。
実は、書くときにもそう思ったので、直しておくか。

251 :132人目の素数さん:2007/05/27(日) 18:41:57
Googleヒット件数

「独立 independence(t)」
名 Results 1 - 10 of about 238,000 for "statistical independence".
形 Results 1 - 10 of about 728,000 for "statistically independent".
否 Results 1 - 10 of about 42,700 for "not statistically independent".

「従属 dependence(t)」
名 Results 1 - 10 of about 94,800 for "statistical dependence".
形 Results 1 - 10 of about 44,500 for "statistically dependent".
否 Results 1 - 10 of about 399 for "not statistically dependent".

よって、
名詞形  Pr{ "独立性" } > Pr{ "従属性" }
否定形1 Pr{ "非独立" } ≒ Pr{ "従属" }
否定形2 Pr{ "独立" } >>> Pr{ "非従属" }

252 :132人目の素数さん:2007/05/27(日) 20:19:27
標準偏差の答えが0ってありえますか?

253 :132人目の素数さん:2007/05/27(日) 20:33:38
データ: 1, 1, 1, 1
の平均は 1、標準偏差はゼロ。

254 :132人目の素数さん:2007/05/28(月) 11:22:04
すみません、1/5の確率の物を100回試行したら成功数が
10以下になるみたいな確率をエクセルの関数で求めるには
なんの関数を使えばいいかわかる方居ますか?
ヒントだけでも教えて頂けるとありがたいです。

255 :132人目の素数さん:2007/05/28(月) 12:24:21
ヒント:それは統計と関係ない

256 :132人目の素数さん:2007/05/28(月) 13:20:42
的確な指摘

257 :132人目の素数さん:2007/05/28(月) 14:01:42
>>251
ご苦労。independence が dependence よりも多いのは、
independenceを前提としているモデルが多いからでは、
という気がする。
"Suppose X1, X2 be statistically independent random
variables" みたいな。


258 :132人目の素数さん:2007/05/28(月) 14:03:17
>>254-255
いや、正規分布で近似をするなら統計と関係あるし。
100くらいの標本数なら、正確な確率を求めるのは難しくない
かも知れないけど。

259 :132人目の素数さん:2007/05/28(月) 14:11:16
>>254に対する回答は
=NORMDIST(10,100*0.2,SQRT(100*0.2*0.8),1)
でいいのかな?

260 :132人目の素数さん:2007/05/28(月) 17:35:55
計算が難しくもないのになぜへんな近似するアルか…

261 :132人目の素数さん:2007/05/29(火) 08:01:00
数値は例ってことじゃ

262 :132人目の素数さん:2007/05/29(火) 19:21:37
シンプソンのパラドックスのプロジェクトするんですけど何書けばわかんない・・・
やった事は、SPの説明、何が原因で起きるか、野球選手の打率の例、テストの男女比較の例、んで結論として、どうすれば
集めたデータをこのパラドックスなしで解析できるか・・
って位なんだけど、なんか付け足せることありますかね?

263 :132人目の素数さん:2007/05/29(火) 20:49:58
適切な層別化が必要という教訓を得れば十分だとおもう

264 :132人目の素数さん:2007/05/30(水) 00:54:13
http://ja.wikipedia.org/wiki/%E5%8C%85%E9%99%A4%E5%8E%9F%E7%90%86
ここにある、包除原理を確率において用いた恒等式の証明がわかりません。

よければ指南してもらえないでしょうか??
お願いします


265 :132人目の素数さん:2007/05/31(木) 08:04:25
大学院入試で統計学の基礎が範囲なんですが、おそらく基礎の基礎だと思うんですが、
分散や尺度や相関関係などに関しての参考書とかないでしょうか?

266 :132人目の素数さん:2007/06/01(金) 08:44:47
>>265
数IIICの大学入試の問題集にもその程度は出てますよ。

267 :132人目の素数さん:2007/06/01(金) 22:46:48
>>266
出てたあなぁ・・・理系なのにわからない・・・

268 :132人目の素数さん:2007/06/04(月) 14:42:25
>>264
これは、帰納法で証明すると簡単だよ。
等式の右辺の最後は正確には±ではなく(-1)^(n+1)なので
このwikiの説明わかりにくいよね。



269 :132人目の素数さん:2007/06/06(水) 10:37:11
統計用語がわからなくて・・・質問です。
どなたか、おしえてください。

ある一定量のリンゴをサンプリングしてその全部を一人が味見してA:おいしい、B:普通、C:まずい
と評価します。
このときにA、B、Cの割合が必ずある値になるように評価するという約束をします。
A:B:C=1:2:1とか、です。
この割合のことを統計用語ではなんというのでしょう?
また、こういう割合を設定する約束のことをなんと表現するのでしょうか?

270 :132人目の素数さん:2007/06/06(水) 22:18:18
エクセル使う問題は大体こなせたのですが課題でひとつわからないのが残ってしまいました。

3つの事象XYZに関する独立性をXYZ上で定められた確率測度Qを利用して
Q(X∩Y∩Z)=Q(X)Q(Y)Q(Z)が成り立つと定義する。
事象のペアXY,YZ、ZXが独立であっても3つの事象の独立がいえるか?
反例があればかきなさい。

という問題なのですが反例はあるんでしょうか?
なかなかできず困ってます。

271 :math太郎:2007/06/06(水) 23:58:40
>269
 正しいのかどうかわからんけど、
 「評価割合の設定」とか聞いたことがありますよ。


272 :132人目の素数さん:2007/06/07(木) 02:10:00
反例:
Ω={w1,w2,w3,w4}
P(w1)=P(w2)=P(w3)=P(w4)=1/4
X={w1, w2}
Y={w1, w3}
Z={w2, w3}
っつーか、宿題は自分でやりましょう。

273 :132人目の素数さん:2007/06/07(木) 12:47:16
>>270
包除原理とド・モルガン

274 :132人目の素数さん:2007/06/08(金) 08:03:25
共分散を求める際の平均は、加重平均でもよいですか?

275 :132人目の素数さん:2007/06/08(金) 22:14:43
院試に統計・確率が必要なんですが、何か良い参考書ありませんかね?
詳細に書くなら、入門的であって、なおかつ詳しいところまで書いてある本です。

276 :132人目の素数さん:2007/06/08(金) 22:46:26
>>275
おまえには無理
あきらめろ

277 :132人目の素数さん:2007/06/12(火) 10:29:44
Academic版 Intercooled Stata 9から10へのアップグレードのお知らせが来た。
$413か、ちょっと悩むな。

278 :132人目の素数さん:2007/06/12(火) 13:57:31
すんません
S:N比 = 100:1のガウシアンノイズって、
誤差は分散いくつのガウス分布に従うんでしょうか。。?

279 :初心者:2007/06/15(金) 07:19:19
初心者の質問ですが、お願いします。
ある測定値の、方法1と、方法2での結果の違いについて、
対応のないt検定をしようと思っているのですが、測定結果に
"10未満"というのがあり、その扱いに困っています。
例えば、方法1の結果は(14,17,10未満,16,10未満)、方法2の
結果は(16,20,19,16,19)といった感じです。
こういった場合はどうすれば良いのでしょう?
そもそも検定の選択が違い、t検定できないのでしょうか?
教えていただければ幸いです。

280 :132人目の素数さん:2007/06/15(金) 16:46:45
>>279
俺なら、conservativeに Wilcoxon テストを使うけどな。
そもそも 正規性を仮定しているt検定を
小標本のそういうデータに適用すること自体に無理がある。

281 :初心者:2007/06/15(金) 17:53:33
>>132人目の素数さん
 ありがとうございます。
 Wilcoxonを調べてみます。

282 :132人目の素数さん:2007/06/15(金) 17:58:14
統計学がんばりましょう。

283 :132人目の素数さん:2007/06/18(月) 12:30:56
じゃんけんで8連勝する確立教えてちょ・v・あいこなしで

284 :132人目の素数さん:2007/06/18(月) 16:40:06
1/256かな。

285 :132人目の素数さん:2007/06/18(月) 22:30:25
どなたか教えてください、ちょっと困ってます。医学論文を読んでいたら、
”A indicated some level of significance if the 95% bracket was used.”
という文章がありました。”95% bracket”は95%信頼区間のことでしょうか?
どなたか回答をお願いします。

286 :132人目の素数さん:2007/06/18(月) 22:36:37
じゃんけんは、グー、チョキ、パー各々の出現確率が 1/3 じゃないぞ。
人によって必ず癖があるから、まず勝敗が五分五分にならない。
おまけに人間は、学習能力によって過去の結果を参考にしながら
次の戦略を立てるから、互いに独立な試行でもない。
よって、1/256 = (1/2)^8 は誤り。

答えは、データを取って研究してみないことにはわからん。

287 :132人目の素数さん:2007/06/18(月) 22:54:50
>>285
その文の中にある統計用語は、「有意水準(level of significance)」だけ。
「95%四角括弧」が何を意味してるのかは、その論文見てみないとわからんちょ。

288 :132人目の素数さん:2007/06/19(火) 04:23:29
はじめまして。
統計の初歩の初歩の部分の質問なんですが…
度数分布表の階級をわけるときは、未満にするのが基本なんですか…?
わからないのは、懸垂の回数の問題なんですが、
階級
1回以上3回未満
3回以上5回未満
5回以上7回未満
または、
1回以上3回以下
4回以上6回以下
7回以上9回以下
どちらの分け方が正しいのですか?
先生曰く、気温問題は小数があるので未満で区切り
試験結果問題は以下で区切るといいました。
なんで違いが出るのかわかりません。
よろしくお願いします。



289 :132人目の素数さん:2007/06/19(火) 11:20:17
>>285
その通りでしょう。ここでの"bracket"は、括弧という意味では使われていないと思う。
limitを持った領域、まさに区間に相当する意味で使っているのでは。英英辞典引いてみてね。

290 :132人目の素数さん:2007/06/19(火) 11:51:34
>>288
細かいこと気にするな、どっちでも同じだ。

ただ「1回以上4回未満」は、結局のところ、{1,2,3} のいずれかだから、
各値になる確率が同様なら、平均は2になる。
そういう意味で、「1回以上3回以下」としておいた方が
1と3を足して2で割ると平均が分かって便利なんだよエッヘン、
と先生は言いたかったのかもしれん。


291 :132人目の素数さん:2007/06/20(水) 19:14:06
>>289
医学論文で 95%信頼区間 を短く言いたければ「95% CI」 が普通。
文学的な表現を使ったりするのは、一般向けニュース記事だな。
論文ならレフリーに怒られる。

292 ::2007/06/20(水) 19:54:44
馬鹿

293 :132人目の素数さん:2007/06/20(水) 22:49:40
>>291
医学論文じゃなくてもそれが普通だっての。そんなこと言ったって、目の前にある論文には役に立たん。
理解することの方が重要。

・・・と>>292の言いたいことを解説してみた。

294 :132人目の素数さん:2007/06/21(木) 00:02:08
授業で疑問点が出たのでお願いします!

xi〜N(μ、σ^2)の時
E(Σ(xi−x bar)^2)=(n−1)σ^2となることを示してください。

295 :132人目の素数さん:2007/06/21(木) 00:05:22
N(μ、σ)のEから計算できない?疑問点じゃなくて宿題じゃねーか。

296 :132人目の素数さん:2007/06/21(木) 00:11:04
そこがわからないので教えていただきたいのです。
自分、まだ統計学をかじり始めたばかりなので(>_<)

297 :132人目の素数さん:2007/06/21(木) 00:15:23
>293
確率論も学ばず統計学とな

298 :293:2007/06/21(木) 05:37:18
え、俺?

299 :132人目の素数さん:2007/06/21(木) 05:39:02
>>289
所得階級の場合は bracket をそんな意味に使うけどね。他には見たことない。
95 percent bracket とかでググってみそ。

>>292-293
基地外?

300 :132人目の素数さん:2007/06/21(木) 05:49:58
A category of people or things that are similar or fall between specified limits : those in a high income bracket.
(Oxford)

非専門的ではあっても、日本人が「括弧」から受ける印象ほど変な表現ではない。
試しに、"percent bracket" でもググって見たら。

念のためだけど、そう言う表現を使うことの是非は論じてないからね。

301 :132人目の素数さん:2007/06/21(木) 11:48:39
     _____
   /::::::::::::::::::::::::::\〜プーン
  /:::::::::::::::::::::::::::::::::::::::\〜プーン
  |:::::::::::::;;;;;;|_|_|_|_|〜プーン
  |;;;;;;;;;;ノ∪  \,) ,,/ ヽ〜     
  |::( 6∪ ー─◎─◎ )〜
  |ノ  (∵∴ ( o o)∴)〜
  | ∪< ∵∵   3 ∵> ムッキー!
  \   >>299 ⌒ ノ_____   
    \_____/ |  | ̄ ̄\ \  基地外?
___/      \   |  |    | ̄ ̄|  
|:::::::/  \___ | \|  |    |__|
|:::::::| \____|つ⊂|__|__/ /   
|:::::/        | ̄ ̄ ̄ ̄|  〔 ̄ ̄〕    
       カタカタカタカタ


302 :132人目の素数さん:2007/06/21(木) 13:19:07
>>301
自画像かよw

まあ英語圏の医療統計の専門家に
”A indicated some level of significance if the 95% bracket was used.”
つー断片的な表現だけ見せて、「この "bracket" は信頼区間の意味か?」と聞けば、
全員が「それだけでは意味不明」と答えるよ。

肝心の情報を持ってる質問者の >>285 は、それ以上説明せんし、議論するだけ無駄だな。

まあ一応、推理だけしておくと、、、
1. その論文には図があって、図の中に |-----| (またはその縦型)のような図形が描かれてる。
2. で、その図形が、例えば、観測値の(95%)中央範囲を表す、とか、どっかに定義されてる。
3. 後の文章で、それを「the 95% bracket (95% H型図形)」と表現。

303 :132人目の素数さん:2007/06/24(日) 22:56:55
ある眼圧下降薬を10人に点眼して、1日後、2日後・・・14日後
と毎日朝9時に眼圧を測定しました。
2日後以降、眼圧が下がらなくなりましたって時は
反復測定のANOVAしてposthocすればいいのでしょうか?
教えてくださいまし。 

304 :132人目の素数さん:2007/06/25(月) 22:47:35
すいません4つほど質問があります
1.標本数Nの標本から得られた平均値の標本分布の標準偏差をなんと呼ぶんでしょうか?
2.1つ1つの標本の分布と、標本抽出分布(標本平均の分布)との違いを教えてほしいです。
3.標本誤差と母集団標準偏差と標本数の関係
4.母集団から標本抽出を行う場合、標本数Nが大きくなると、標本誤差はどうなるか?
すいません。馬鹿な私に教えてくださいまし

305 :132人目の素数さん:2007/06/27(水) 13:32:21
>>304
宿題は自分でやりましょう。
統計の問題というより、本を読んで定義と概念を理解すれば
答えられる問題ばかりですよね。

306 :132人目の素数さん:2007/06/27(水) 13:45:51
>>303
とりあえず2日後から14日後のデータだけを
線形トレンド(と定数項)に回帰して、
線形トレンドの係数が有意かどうか見てみたら?


307 :132人目の素数さん:2007/06/27(水) 18:05:11
303です。
早速やってみます。ありがとうございます。

308 :132人目の素数さん:2007/06/27(水) 20:37:19
今データ学習アルゴリズムって本を読んでて、カルバック擬距離が正であることの証明を読んでたんですが、
どうやらこの証明が間違ってるようです。
そこで自力で証明しようとしたんですが、なかなかうまくいきません。
どなたか証明の糸口を教えていただけないでしょうか?

309 :132人目の素数さん:2007/06/27(水) 23:19:24
確率分布の問題で質問です。
Excelで解答を出したいのですが、正規分布と対数正規分布の関係が理解できません。
どなたかアドバイスをお願いします。

【問題】
ある地域の大雨時の排水量は平均4500[m^3/日]、標準偏差1500[m^3/日]
の対数正規分布であると推定された。この地域に最大排水量は5500[m^3/日]
の排水設備を設けたとき、以下の諸量はいくらになるか。
(1)この地域の洪水確率。
(2)この地域の排水量が2000[m^3/日]と5000[m^3/日]の間になる確率。
(3)この地域の90%確率排水量はいくらか。(累積確率90%に対応する変数の値、
10%の確率で年間降雨量はこの値以上になる)
よろしくお願いします。

310 :132人目の素数さん:2007/06/28(木) 11:49:46
>>309
対数正規分布というのは、対数を取ると正規分布になる分布。
つまりXが正規分布に従うとき、exp(X)が対数分布に従う。
Xの平均、分散が分かってれば、exp(X)の平均・分散も分かる。
っていうか、そんなの教科書に公式載ってるでしょ?

311 :132人目の素数さん:2007/06/28(木) 13:50:36
多変量解析についてご助言お願いします。
変動に周期性のある、ある変数を、他の変数を用いて、
時間的に関係式として記述したいのですが、
関係式に使う変数の絞り方等、この分野に殆ど無知であるために、
googleで調べてみても要領がよくつかめないのです。
この場合用いるべき手法や、おすすめの本、概
要の載っているHPなどありましたら、どうか教えていただけませんでしょうか。

312 :132人目の素数さん:2007/06/28(木) 17:03:10
>>311
やりたいことと合ってるか分からないけど、典型的には「ダミー変数」がキーワードじゃない?
12ヶ月なら11個の変数をぶち込んでregressすればいいんじゃないか。

313 :309:2007/06/28(木) 17:27:47
>>310
丁寧な返答ありがとうございます。
つまり、対数正規分布を平均、分散を元に正規分布へ変換し、正規分布の確率密度関数を出しxについて積分すれば確率が求められるということでしょうか?

教科書を持っていないのでネットで検索してみました。

314 :132人目の素数さん:2007/06/29(金) 07:33:23
>>311
株価とか経済指標など予測が極めて困難な解析とかが目的なの?

315 :311:2007/06/29(金) 10:35:14
>>312>>314
 迅速な返答ありがとうございます。
どうも言葉足らずだったようで、解りにくい事を言って申し訳ありません
私がやろうとしているのは、>>314さんの仰るとおり予測が困難な解析で
一つの変数をコントロールしている要因がそもそも不明な状態です。
なので、1.リストアップしたうちからなるべく少ないパラメーターで、2.かつ正確に、
3.できれば時間経過的に周期を解析する。というのが至上目的です。
何分初めての経験で、2・3についてはそこまで期待していませんので、
こういう方法が良いんじゃないのか、程度のアドバイスを頂けたらと思っております。

316 :132人目の素数さん:2007/06/29(金) 12:50:42
1,2の両立を考えるのは「モデル選択」という問題。
普通は「AIC」とか「Cp統計量」とかいう値を基準にして
最適なパラメーターセットを探すらしいよ。

317 :132人目の素数さん:2007/06/29(金) 16:43:20
1に関しては近似によるあてはめが一番簡単。しかし当てはめ方は言わば任意だから
2がどうしても厳しい。

鍵となるのは摂動やランダムウォークやカオスかな。
ただしカオスに周期性を求めることは出来ない。

1の選択はとても難しい。モデルを作り上げるとすると条件をクリアした媒介変数を
採用するのだろうが、その条件は当然演算者や具現する人の恣意性の介入が予想される。
バタフライ効果と言う言葉があるけど影響が微小であると判断し切り捨ててしまった
パラメータによって演算に多大な影響を及ぼす場合もあるのでパラメータごとに性質
を分析し採用の判断基準とすることが望ましいと思われます。

318 :132人目の素数さん:2007/06/30(土) 04:00:28
>>315

単なるモデル選択の問題なら、
>>316が言うようにAICやC_pなどを使うのが良い。
Rなどのパッケージソフトで簡単にできる。

予測したい変数に先見的な季節性(例えば変数が電力使用量で、毎夏
に値が大きくなるなど)がある場合は、季節調整のためのダミー変数
を入れる方法もあるし、時系列モデルをつかって予め季節要因を取り
除くという便宜的な方法もある(例えばX-12 ARIMA など)。



319 :132人目の素数さん:2007/06/30(土) 04:02:42
>>313
その通りです。余計なお世話かも知れませが、
>>310 からそこまで理解できるのであれば、
あなたが直面している困難は
多分教科書(or公式集)を持っていないことだけです。


320 :132人目の素数さん:2007/06/30(土) 05:08:13
>>315
http://www.ne.jp/asahi/music/marinkyo/komputilo/statistiko.html.ja.sjis

321 :309:2007/06/30(土) 09:13:43
>>319
ということは、
(1)の答えは=1-NORMDIST(ln(5500),ln(4500),ln(1500),1)に100かけたので。
(2)は=NORMDIST(ln(5000),ln(4500),ln(1500),1)-NORMDIST(ln(2000),ln(4500),ln(1500),1)に100かけたので。
(3)は=NORMINV(0.9,ln(4500),ln(1500))*100であっていますでしょうか?


322 :311:2007/06/30(土) 11:19:11
沢山のアドバイスありがとうございました。
取りあえずRの使い方と>>320さんの本でゆるゆる勉強していきたいと思います。

323 :132人目の素数さん:2007/06/30(土) 14:48:19
>>309
青木先生んとこと2ちゃんねるでマルチポストとは度胸あるな。
最悪だ。

324 :132人目の素数さん:2007/06/30(土) 23:30:38
母分散に関する区間推定を自分でデータを探してしなさい
というレポートが出てるのですが、何かいいデータはないですか?

325 :132人目の素数さん:2007/07/01(日) 02:38:56
litchfield-wilcoxon法 とはどのようなものなのでしょうか?
これを用いてレポートを書かなければならないので、
どなたか手順などをご教授いただけないでしょうか?

326 :132人目の素数さん:2007/07/01(日) 05:32:18
>>324
MLB選手の打率

327 :132人目の素数さん:2007/07/01(日) 05:34:33
>>325 wwww
ttp://okwave.jp/qa2244107.html

328 :132人目の素数さん:2007/07/01(日) 15:07:55
標準偏差について教えてください。

母集団の標準偏差を求める式においては、
(各標本と平均との差)の2乗を(標本の個数)で割った値の平方根を
求めますが、
標本の標準偏差を求める式において、は
(各標本と平均との差)の2乗を(標本の個数-1)で割った値の平方根を
求めます。

この際、標本の標準偏差では何故標本の個数から1引くのでしょうか?

よくわからないんで、気になって仕方ありません。

329 :132人目の素数さん:2007/07/01(日) 15:43:49
>>328
その標本の分で(自由度−1)。こう考えとけ。

330 :132人目の素数さん:2007/07/01(日) 15:55:44
>>328
ちゃんと教科書買った方がいい…

331 :132人目の素数さん:2007/07/01(日) 16:45:12
最近統計の勉強が必要になって、ハンバーガー統計学
というサイトを見つけたので、そこで勉強していたのですが、
http://kogolab.jp/elearn/hamburger/chap2/sec3.html

ここでは、区間推定をするために母集団を正規分布と仮定していますが、
正規分布の保証がない場合はどうすればいいのでしょうか?

また、
不偏分散=((データ−平均値)の二乗)の総和÷(個数-1)
と不偏分散を求めていますが、(個数-1)というのは何か根拠のある
値なのですか?

よろしくお願いします。

332 :132人目の素数さん:2007/07/01(日) 17:05:48
>>331
正規分布じゃなくても確率モデルがあればそれに応じて計算すればよい。
何もなければ求められない。

>>328>>331
標本分散=(n-1)/n 母分散
ttp://www.kisc.meiji.ac.jp/~iwabuchi/suuchi/fuhenbunsan.html

333 :331:2007/07/01(日) 18:11:43
ありがとうございます。

正規分布でない場合はやはりほかの事をしなければいけないんですね。
ありがとうございます。

n-1にもちゃんと根拠があったんですね。
ただ、(xの平均値-u)の二乗の期待値が(σの二乗)/nになる
というところが肝心だと思うのですが・・・。

334 :132人目の素数さん:2007/07/01(日) 19:23:05
期待値よりも、tとかχ自乗とかFとかの検定用の分布を使う時に
自由度の重要さを理解させるのが目的。
標準偏差推定値は不偏にならんし。
只の推定だけだったら、観測値の個数で割っとくのが、一番矛盾が少ない。

335 :132人目の素数さん:2007/07/02(月) 01:52:40
>>334
矛盾が少ない、という言い方は抵抗があるなぁ。
確かにnで割る方が最尤推定値ではあるが、最尤推定値が「矛盾が少ない」というのは違うと思うな。

336 :132人目の素数さん:2007/07/02(月) 11:57:44
すみませんが、統計学用語の日本語訳を教えてください。
英語の教科書で”Crest=|max-min|/(2*RMS)"とあります。

最大-最小の差を実効値の2倍(つまりpk-pkの平均振幅)で割っているので、
変動の激しさを表すことはわかるのですが、"Crest"の日本語に対応する
用語がわかりません。このCrestというのは日本語ではなんと言う言葉に
なるのでしょうか。

なにとぞよろしこ。

337 :132人目の素数さん:2007/07/03(火) 12:21:04
教科書に載ってた問題なのですが、教科書の答えとあいません。
私の解答のどこがいけないかよろしければ教えてください。

問、知能指数IQは正規分布N(100,15^2)に従う。IQが150以上の人は全体の何%?

あるIQの値bは一次変換Z=(b-100)/15 より正規分布N(0,1)に従う。
IQの値150は一次変換より(150-100)/15=10/3=3.333・・・
求める割合をaとすると
P(150≦X)=P(3,333・・・≦Z)=a
P(Z<3.333・・・)=1-a
P(0<X<3.333・・・)=0.5-a
正規分布表より
P(0<X<3.333・・・)=0.4996
よってa=0.0004
答え0.04%

教科書の答え 0.12%



338 :132人目の素数さん:2007/07/03(火) 12:43:04
訂正
P(0<X<3.333・・・)=0.5-a
正規分布表より
P(0<X<3.333・・・)=0.4996

のXはZ

339 :132人目の素数さん:2007/07/03(火) 12:43:10
問、が本当にそれであっているのであれば
君の回答が正で、教科書の答えが誤だね。

340 :132人目の素数さん:2007/07/03(火) 13:00:28
>>339
そうですか・・・
返答ありがとうございました


341 :336:2007/07/05(木) 11:08:55
事故解決です。波高率って言うんですね。

342 :132人目の素数さん:2007/07/06(金) 18:32:55
お願いします。
X1=1
X2=9
X3=8
X4=7
X5=1
X6=1
X7=1
X8=3
は時系列のデータとする。n=2 n=3とした移動平均値を求めて図示し、どちらが滑らかか図より判断せよ(n=2の場合は中心化せよ)

という問題がわかりません。どなたか解説していただけないでしょうか?自分なりに教科書に目を通してやってみたのですが全くわかりません。宜しくお願いします。

343 :132人目の素数さん:2007/07/07(土) 06:09:50
>>342
移動平均の式とグラフ付き例題1つさえあれば、小学校3年生でもできる問題。
それを誰かに教わらないとできないようなら、小学校1年生からやり直すしかない。。

344 :132人目の素数さん:2007/07/07(土) 18:56:47
>>327
鬱鬱鬱鬱鬱鬱鬱     鬱鬱鬱鬱                    鬱鬱鬱     鬱鬱鬱
鬱鬱鬱鬱鬱鬱鬱    鬱鬱鬱鬱鬱鬱          鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱
鬱鬱  鬱鬱鬱   鬱鬱鬱   鬱鬱鬱鬱        鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱
鬱鬱  鬱鬱  鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱           鬱鬱鬱     鬱鬱鬱
鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱      鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱
鬱鬱 鬱鬱鬱鬱鬱               鬱鬱       鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱
鬱鬱鬱鬱鬱    鬱鬱鬱鬱鬱鬱鬱鬱鬱                 鬱鬱鬱    鬱鬱鬱鬱鬱
鬱鬱 鬱鬱    鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱                 鬱鬱鬱鬱鬱鬱鬱鬱
鬱鬱  鬱鬱鬱            鬱鬱                    鬱鬱鬱鬱鬱鬱
鬱鬱  鬱鬱鬱  鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱            鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱
鬱鬱   鬱鬱   鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱      鬱鬱鬱鬱鬱鬱鬱鬱鬱     鬱鬱鬱鬱鬱鬱鬱鬱鬱
鬱鬱   鬱鬱                        鬱鬱鬱鬱鬱鬱    鬱鬱鬱      鬱鬱鬱鬱鬱
鬱鬱   鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱       鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱
鬱鬱鬱鬱鬱鬱 鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱        鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱
鬱鬱鬱鬱鬱鬱     鬱鬱鬱    鬱鬱             鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱
鬱鬱 鬱鬱鬱     鬱鬱      鬱鬱鬱                   鬱鬱鬱
鬱鬱      鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱    鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱
鬱鬱       鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱    鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱
鬱鬱       鬱鬱鬱鬱           鬱鬱    鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱鬱


345 :132人目の素数さん:2007/07/07(土) 23:09:59
母集団の分布は、平均μ(未知)、分散σ^2(既知)の正規分布に従っている。
                            _
クラメール・ラオの不等式を用いて、標本平均Xがμの最良推定量であることを示しなさい。
       
という問題なのですが示せません・・・

計算してみたら                      _
{nI(X;μ,σ^2)}^-1 = 2πσ^4 / n という値になり、V(X)=σ^2 / n
と結果が違えてしまいます。 助けてください。


346 :345:2007/07/08(日) 00:10:19
解決しました。すいません。
計算途中のlogの位置が間違えていたようです。

347 :132人目の素数さん:2007/07/08(日) 07:29:57
>>345
ttp://image.blog.livedoor.jp/oooooop/imgs/f/c/fcb45f06.jpg

348 :132人目の素数さん:2007/07/08(日) 07:31:44
ttp://blog73.fc2.com/g/gamansite/file/photo2.jpg

349 :132人目の素数さん:2007/07/08(日) 07:32:37
http://6.dtiblog.com/e/eroero5757/file/32814-7212436-0-23869080-pc.jpg

350 :132人目の素数さん:2007/07/08(日) 07:34:26
ttp://12.dtiblog.com/f/fetimani/file/file_20060724T145615187.jpg

351 :132人目の素数さん:2007/07/08(日) 07:39:23
ttp://blog17.fc2.com/o/oppaideai/file/8999.jpg

352 :132人目の素数さん:2007/07/10(火) 02:10:38
基本的なことかもしれませんが…お願いします><

@仮説検定を用いることによって、どのようなことを明らかにすることができるのか。
 具体例をあげて説明しなさい。

A集団Aと集団Bがあり、それぞれ平均値・分散・標準偏差がわかっている。
 これら3つの情報を用いて、2つの集団の特徴をどのように比較できるか。
 具体例を挙げて説明しなさい。

353 :132人目の素数さん:2007/07/10(火) 03:05:26
何で性懲りもなく基本的な宿題を丸ごとここで聞く訳?
過去ログ見ても、殆ど回答が貰えないのは分かるでしょ。
勉強しろ。クラスメートと話せ。何を勉強していいかすら分からなければ、まずそれを先生に聞け。

354 :132人目の素数さん:2007/07/10(火) 17:06:56
統計学初心者です。以下の問題の意味がわかりません。どうぞご教授ください
偶数目が出る確率が1/9、奇数目が出る確率が2/9といういびつなさいころを五回投げる。4以上の数がnかい出る確率をpとする。そのとき4以上が出る回数の期待値、分散、標準偏差を求めよ
以上のような基本的な問題なのですが、偶数目が出る確率が1/9、奇数目が出る確率が2/9の時点で確率としておかしいのではないか思います。もし解ける方がいらっしゃいましたら教えてくださいお願いします

355 :132人目の素数さん:2007/07/10(火) 17:26:47
3て書いたつもりがへたくそで9に見えてる

356 :132人目の素数さん:2007/07/10(火) 17:28:43
1,3,5がでる確率がそれぞれ1/9
2,4,6がでる確率がそれぞれ2/9
全部あわせて1となる。

357 :132人目の素数さん:2007/07/10(火) 19:07:48
すごく簡単な問題かもしませんがだれか教えください。。。
問題 正規分布N(10、8)に従う確率変数Xに対して、標準偏差分布表を用いて次の問いに答えよ
1.Xが12以上の確率を求めよ
2.Xが6以下の確率を求めよ
3.Xが6以上12以下である確率を求めよ
よろしくお願いします


358 :132人目の素数さん:2007/07/10(火) 19:32:24
幾何分布は
Pr[ X=n+k | X≧k ] = Pr[ X=n ]
となることを示せ

という問題なんですが、Pr[ X=n+k | X≧k ]の意味がわかりません
どうやって求めたらいいんでしょうか

Pr[ X=n+k | X≧k ] = Pr[ X=n+k , X≧k ] / Pr[ X≧k ]

かと思ったんですが、今度は Pr[ X=n+k , X≧k ] を
どうやって求めたらいいのかわからなくなりました

359 :132人目の素数さん:2007/07/10(火) 20:36:12
>>358
Pr[ X=n+k , X≧k ] = Pr[ X=n+k & X≧k]
あとは考えてみれ

360 :358:2007/07/10(火) 22:56:49
>>359
Pr[ X=n+k , X≧k ] = 納x=k,∞] ( p^(n+x) )(1-p)
と計算すればいいのでしょうか
しかしそうすると、右辺は p^(n+k) となってしまい
題意を満たさないと思うのですが
どう計算すればいいのでしょうか

361 :132人目の素数さん:2007/07/11(水) 00:39:36
1/Pr[ X≧k ]

362 :358:2007/07/11(水) 01:05:43
Pr[ X=n+k | X≧k ] = Pr[ X=n+k , X≧k ] / Pr[ X≧k ]
             = Σ[x=k,∞] ( p^(n+x) )(1-p) / Σ[x=k,∞] ( p^(x) )(1-p)
             = p^(n+k) / p^k
             = p^n
となって
Pr[ X=n ] = (p^n)(1-p)
と一致しないんですが、何がいけないんでしょうか

363 :132人目の素数さん:2007/07/11(水) 01:43:00
>>362
Σ[x=k,∞] ( p^(n+x) )(1-p)=Pr[X≧n+k]
になっちゃうなぁ。

たとえば、「x=2 かつ x≧1」は、「x=2」と同値だ。
「X=n+k かつ X≧k」は「X≧n+k」と同値ではないだろう?

364 :132人目の素数さん:2007/07/11(水) 17:24:10
統計学においての四捨五入のルールについての質問です。

問いD
処理温度が250℃の時、プラスチック強度を40得るためには圧力をどう設定しなければなりません
か?
答え:
?式:Yhat=−0.727+0.192X1-1.136X2のX1に250、Yに40を代入する。
40=-0.727+0.192×250-1.136X2
X2=6.402287
つまり、プラスチック強度を40得るためには圧力を6.402287気圧以上に設定しなければならない。


という所まで計算したんですが、?式というのは問4までに回帰分析でもとめたもので、各項目は既に小数点第四位で四捨五入しているんです。
その場合、今回の圧力は小数点何位で四捨五入すべきでしょうか。

悩みどころなのは、どれだけ必要か、を聞いているのだから四で切っちゃまずい気もするし
ここだけ繰り上げにするのもどうかと思う


質問の仕方が稚拙ですみません。よろしくお願いします

365 :132人目の素数さん:2007/07/12(木) 03:03:54
くだらない質問ですいません。

絵の下手なぼくはノートに正規分布の曲線(ベルカーブ)をフリーハンドで書くのが苦痛でしかたありません。
簡単に描けるテンプレート定規みたいなのをご存じないでしょうか?
ついでに、シグマとかパイとかのギリシャ文字もぼくが書くと下手な絵のようになってしまいます。
これもちょうど良いテンプレート定規が無いでしょうか?

よろしくお願いします。

366 :365:2007/07/12(木) 03:08:26
もうひとつついでに質問させてください。

ガウスの正規分布やピアソンのカイ二乗分布、スチューデントのt分布などがどのように発見されたのか、
数学的にもそれなりに詳しく分かりやすく具体的に書かれた書籍って無いでしょうか?


367 :132人目の素数さん:2007/07/12(木) 03:11:30
【参院選】民主党から、在日コリアンの期待背負った金氏(民団幹部)が立候補…在日参政権訴え
http://news22.2ch.net/test/read.cgi/newsplus/1184165873/l50

368 :132人目の素数さん:2007/07/12(木) 21:43:22
最近大学で研究室に入ったのですが、統計的にデータをまとめる際に分からないことがあったのでお尋ねします。
有意に差があるかの検定法は分かるのですが、同じものであることを統計的に出す方法はあるのでしょうか?
統計の本は買ったのですが、数学が苦手で、基本的な所から進めません。

369 :132人目の素数さん:2007/07/13(金) 00:10:06
どれを勉強すれば良いのか分からないので質問お願いします
例えばイチローが9月に30本ヒット打ったとして
その時にある日3本以上ヒット打つ確率は?って問題だと
何を勉強すれば良いのでしょうか??

370 :132人目の素数さん:2007/07/13(金) 05:33:40
>>369
まず、 「順列・組み合わせ」 から勉強しよう。

371 :132人目の素数さん:2007/07/13(金) 08:50:40
>>370
どうも。これって高校のときの確率の話しですか?
マジすか・・・
単純な順列なら出来るんすけど(5人の並べ方)
ちょっとだけ応用も同じで(女子3人と男子5人で女子3人が常に隣り合う場合)
けど、それ以上は分からない・・・何かお勧めのHPないですか??

あと、もう一つ質問なんですが、平均50kg標準偏差10kgでその荷物が70kg以上である確率とかです・・・


372 :132人目の素数さん:2007/07/13(金) 09:27:42
>>371
順列組み合わせなら、高校範囲くらいでじゅうぶんだろ。
ただしそのイチローの場合もうちょっと条件が必要になる。

9月中に何試合あるのか。 一試合で何打席あるのかなんてのも
考えなくちゃならない。
実際は試合毎に打席数はちがうんだろうが、平均何打席ってのでも
いいのかもしれない。


> あと、もう一つ質問なんですが (ry

標準正規分布表(両側確率) の 2.00のとこを見れ。
なぜ2.00のとこかというと、 70kgってのは 平均50kgから標準偏差10kgの2.00倍離れているからだ。
さてじつはそこに書いてある数値は70kg以上だけではなくて30kg以下の場合も含んである。
(30kg以下も同じく平均から20kgはなれてるだろ?)
なもんでその半分が、70kg以上である確率。


373 :132人目の素数さん:2007/07/13(金) 12:08:27
>>372
いろいろ調べてるんですが、みつからないっす・・・
問題は適当に作ったんで、9月30試合、1試合30打席も可ということで
単純に(全部の組み合わせ-1日だけ2本の組み合わせ)/全部の組み合わせ
30!-29!/30!だと間違っていますか?
後半はOKです
なんか計算式で、Z=(70-50)/10=2.00
正規分布で見てってあったんですが、この場合も半分にするんすかね?


374 :132人目の素数さん:2007/07/13(金) 13:25:56
横槍だけど、どえらい勘違いをしてない?
組み合わせというのは、ある日の、例えば5打席中、どれか3打席でヒットを打つということでしょう?
一打席でヒットを打つ確率は、単に打率の問題で、それは月間全打席(例えば5打席20試合=100打席)中、30打席。
この打率に基づいて、一日に3本ヒットを打つ組み合わせを考えるんだと思うけど。

375 :132人目の素数さん:2007/07/14(土) 21:29:47
一次変換する」という言葉が出てきたんですがどういうことをすることを
いうんでしょうか?UBまでしか勉強してないんで分からないのですがおしえてください.


376 :132人目の素数さん:2007/07/15(日) 02:24:50
u=Av (Aは行列、u, vは座標上の点あるいはベクトル)で表される、平面から平面への変換。
二次元ならx'=ax+by, y'=cx+dyと書ける。
これでは分からないだろうから、一次変換、(線形)写像、一対一、等のキーワードでググリれ。

ちなみに、統計分野なら標準化は一次変換にあたるよね。

377 :132人目の素数さん:2007/07/15(日) 18:57:06
あるテストを受けた生徒500人の得点の平均は45点、標準偏差は13点であった。
得点が19点より上で71点より下の生徒は、500人のうち少なくとも何人いると見積もれるか。
この問題がどうしても分からないです・・・

ヒントでもあればぜひヨロシクお願いします。
自分的にはチェビシェフの不等式を利用しようと考えたのですが。

378 :132人目の素数さん:2007/07/15(日) 19:00:18
>>377
標準正規分布表を見てってのじゃあかんの?

379 :132人目の素数さん:2007/07/15(日) 19:44:53
>>378
分布表ついてないです・・・

380 :132人目の素数さん:2007/07/15(日) 20:18:05
±2σで0.954499736


381 :132人目の素数さん:2007/07/15(日) 21:33:03
>>377
もっと勘を働かせないとw
なぜ19点と71点なのか?それは・・・
45-2*13=19
45+2*13=71
だから>>380が使える。

まあ、日本の中学・高校数学らしい問題だね。

382 :132人目の素数さん:2007/07/15(日) 21:45:55
すみません。質問です。
t検定の対応のある検定と、対応のない検定とでは検定結果が
どう違ってくるんでしょうか?
あと、第一種と第二種の過誤の両方の確率を下げるためにはどうすればよいの
でしょうか?
すみません。お願いします。

383 :132人目の素数さん:2007/07/15(日) 21:53:28
後は自分でやり給へ。

384 :132人目の素数さん:2007/07/16(月) 01:44:13
>>381
分布表無しで>>380の値をどうやって手に入れるのですか?

385 :132人目の素数さん:2007/07/16(月) 02:17:04
もしかして2σであることは理解してたのか?
まあ正確には分布表が必要けど、統計を学ぶ人には95%というのは殆ど常識じゃない?

386 :384:2007/07/16(月) 04:48:47
>>385
あ、失礼。 自分は377じゃないです。

2σだというのは気が付いてはいましたし2σだと約95%だとは知ってはいましたが
>>379に 分布表はないとあるので
なにかそれが約95%であるとわかるうまい方法があるのかと思って
便乗質問しました。


387 :132人目の素数さん:2007/07/16(月) 04:58:24
>>386
おまえ分かってないだろほんとは

388 :132人目の素数さん:2007/07/16(月) 04:59:41
>>387
ええ、もちろんわかってないから聞いたんですが。

389 :132人目の素数さん:2007/07/16(月) 05:03:46
平均から2σ以内に95%が入るのは 呪文のように憶えています。
どういう理屈で2σ以内が95%なのかはわかってないという意味です。

390 :132人目の素数さん:2007/07/16(月) 10:22:52
理屈も何も、あの範囲で積分したらそうなるべ

391 :132人目の素数さん:2007/07/16(月) 13:11:41
横からあれだけど、>>377はの答えは475人でおk?

392 :132人目の素数さん:2007/07/16(月) 13:17:12
数学技能検定ってのがあるそうですが、統計学だけに的を絞ったものって無いでしょうか?
職場で統計だけ使うものですから・・・

393 :132人目の素数さん:2007/07/16(月) 13:43:18
テストの点って上下限があるからβ分布じゃねえの

394 :132人目の素数さん:2007/07/16(月) 15:17:41
>>393
じゃねえ

395 :132人目の素数さん:2007/07/16(月) 17:07:18
いやはやなんともお恥ずかしい発言を・・・・ >>393


396 :132人目の素数さん:2007/07/16(月) 19:09:50
すみません。わたくし学部1年生なのですが、統計で行き詰ってしまいました。
どなたか教えてください。
均一分布・ランダム分布・集中分布それぞれの分散と平均の大小。
そしてポアソン分布、二項分布は上の3つのどれに当てはまるか。
この2つを教えてくださいお願いします

397 :132人目の素数さん:2007/07/17(火) 15:24:12
>ランダム分布

そんな分布、ないと思うけど。。。


398 :132人目の素数さん:2007/07/17(火) 15:38:50
すみません382のものなんですが・・・・
第一種と第二種の過誤の両方の確率を下げるためにはどうすればよいの
か解く手ほどきをお願いします。
すごく困っています。しらべてもよくわからないのでどなたか
よろしくお願いします

399 :132人目の素数さん:2007/07/18(水) 01:38:34
>>398
両方を同時に下げる事は出来ないぞ

400 :132人目の素数さん:2007/07/18(水) 02:06:58
両方を同時に下げることはできなくても、最適解は求まるがな。
自分でがんばれ。

401 :398:2007/07/18(水) 02:42:51
>>400
自分でがんばれって、しらべてわからなかったからこの場を借りて質問させてもらっているんですよ。
そこらへん分かってます?なんでもスレに質問してあんたの様なレスを貰うのは非常に心外ですね。
大体、あんたもよく分かってないから答えられないんじゃないのぉ?

402 :132人目の素数さん:2007/07/18(水) 04:50:11
うわ、逆切れきた。皆さん御愁傷様です。
>>401
「なんでも」って書いてあるけど、このスレでは、
教科書読めば数値を求めるのは容易い場合や、
簡単に割り切れる答えはないけど、基本概念を元に何らかの答えを導くことが出来る場合、
紋切り型に答えを教えるまでもない(あるいはそうすべきでない)という了解があると思う。(過去のレスを読め)
そういう場合、何処までは理解しているという努力の痕跡や、
もっと具体的に何が分かっていないかを書かないと、相応の答えは貰えないでしょう。
実社会でもそうだと思うから、こんなのでキレてたらあんた生きて行けないよ。
ゼロからやるにはクラスメートとやんなさい。

403 :132人目の素数さん:2007/07/18(水) 06:43:54
電子・電気板にあったリンク

M女史の遺したもの http://members.at.infoseek.co.jp/ms_mzn/



404 :132人目の素数さん:2007/07/18(水) 07:09:16
うは。その移植したかったVBアプリはこんな程度のものですね。
http://redroses.hp.infoseek.co.jp/game.htm
これがヤバい・・・
http://redroses.hp.infoseek.co.jp/diary.htm

405 :398:2007/07/18(水) 07:38:45
>>402
偉そうに何言ってるのこの人?こういうケチで心の狭い男の人って絶対彼女出来なさそ。最悪〜!


406 :132人目の素数さん:2007/07/18(水) 07:46:11
朝から宿題の回答具合をチェックかな。もうあきらめろ。

407 :132人目の素数さん:2007/07/18(水) 07:54:48
>>404
抱腹絶倒
http://redroses.hp.infoseek.co.jp/Mystery.htm

408 :398:2007/07/18(水) 08:07:28
>>406
こっちは朝じゃありませんよーだwww

409 :132人目の素数さん:2007/07/18(水) 08:12:25
キチガイだな。放置スルー推奨w

410 :132人目の素数さん:2007/07/18(水) 08:15:31
>>408 俺の所も朝じゃないんだけど・・・
>>409 耐性なくってすまん。これで最後にする。

411 :398:2007/07/18(水) 08:17:36
>>410
あなたがどこに居ようが関係なんですけども。
なに朝から宿題の回答具合チェックって?馬鹿じゃないのオジサン。

412 :132人目の素数さん:2007/07/18(水) 08:23:42
>あなたがどこに居ようが関係なんですけども。

>>408

413 :132人目の素数さん:2007/07/18(水) 08:34:52
>>412
分かってないよね〜。>>408では私の居場所の事、>>410はオジサンの居場所。
ちゃんと読んでよ〜

414 :132人目の素数さん:2007/07/18(水) 11:23:53
すれ違いうざ過ぎ
いい加減に消えろ粘着w

415 :132人目の素数さん:2007/07/18(水) 11:41:29
【私の居場所】と【オジサンの居場所】が出会う確率は?

416 :132人目の素数さん:2007/07/18(水) 11:46:20
知るかボケ >>415


417 :132人目の素数さん:2007/07/18(水) 11:53:08
【私の居場所】、【オジサンの居場所】、【ボケの居場所】
この3点を結んで出来る三角形の面積の最大値・最小値を求めよ。

418 :132人目の素数さん:2007/07/18(水) 11:59:33
案外小さかったりw

419 :132人目の素数さん:2007/07/18(水) 12:02:36
三角形の三点が既知なら面積は求まるから、最小値も最大値もナンセンス。

420 :132人目の素数さん:2007/07/18(水) 12:11:10
そのとおり!

421 :132人目の素数さん:2007/07/18(水) 12:33:59
>399、400
やっぱり下げることは不可能ですよね??
なんか、Dプライム?だかっていう計算を行えば良いって聴いたんですけど・・・
どうなんでしょうか??
しつこくてすいません。

422 :132人目の素数さん:2007/07/18(水) 12:43:38
>>421

お前、実はバイオ系のバカだろw

423 :132人目の素数さん:2007/07/18(水) 12:52:48
sageて

424 :132人目の素数さん:2007/07/18(水) 12:53:09
>>421
>>399、400
>やっぱり下げることは不可能ですよね??
>なんか、Dプライム?だかっていう計算を行えば良いって聴いたんですけど・・・

「聴いて」どうするw
ゆとりは師ねw

425 :132人目の素数さん:2007/07/18(水) 13:01:30
つまらない話で盛り上がってる所すみません。質問があります。
以下の様な実験を行いました:
・心理言語関係の実験で、ある2つの条件下での正答率に違いがあるかを検討
・被験者内要因計画を使用し、それぞれの条件 -統制群(ctrl)と実験群(exp)- は20課題ずつ
・実験には50人が参加

回帰分析を [reg <- lm(exp〜ctrl)]の様に行ったのですが、平均への回帰問題がある事に気付きました。
ここで被験者個人の正答率をジャックナイフ又はブートストラップで修正し、平均への回帰分を取り除く事は
可能でしょうか?また可能の場合、過大修正してしまう事も考えられますでしょうか?

意見・アドバイス等ありましたらお願いします


426 :132人目の素数さん:2007/07/18(水) 13:12:18
>つまらない話で盛り上がってる所すみません

さりげなくw

>>421
Dプライムとかういのは知らないけど、両方下げるのは無理でしょう。いろんな本やウェブサイトにも書いてある。
多分いぢわる問題だな。
標本数を増やせばいいと俺は思ったが。まあ「聴いた」人にもう一回聴いてみれ。

427 :132人目の素数さん:2007/07/18(水) 13:32:19
Dぷらいむって d' のことじゃん。Signal detection を習ってるのね。分かってんのかな?分かってねーんだろーな。

428 :132人目の素数さん:2007/07/18(水) 13:53:16
またまた、つまらない話で恐縮です。
偉い先生は、これを無視してください。
手頃な先生、よろしければお答えください。

街中で1人の女性に「あなたより美人を紹介してください」と言い、
次々と女性を辿っていけば、その国一番の美女にたどり着くというTV企画があります。
しかし、この番組を何度見ても、どんどん不細工な女性になっていくのです。
なぜでしょうか?
因みに、この企画には統計学の先生も協力されています。

429 :132人目の素数さん:2007/07/18(水) 13:56:46
・美の基準の問題(問われた女性と視聴者一般間の相違)
・問われた女性が真実を言う確率の問題
・等々

430 :132人目の素数さん:2007/07/18(水) 15:17:45
ありがとうございました。
女性に対して「あなたより美人を紹介してください」というのが問題なのですね。
私は、第三者に「この人より美人を・・・」と尋ねればいいのでは?と思うのですが・・・


431 :132人目の素数さん:2007/07/18(水) 19:05:01
ベイジアンのみなさんこんにちわ。
僕にフィッシャーとの違いをおしえてください。

432 :132人目の素数さん:2007/07/18(水) 19:32:28
分かる方ご教示ください。

@確率変数XとYは独立で、E(X)=3 E(Y)=2V (X)=4V (Y)=5
 Z=2X-4Yとするとき、E(Z)、V(Z)を求めよ。
 解答を見ながら進めていたのですが、V(Z)がよくわかりません。。

 V(Z)=V(2X-4Y)=V(2X)+V(4Y)=2の自乗V(X)+4の自乗V(Y)
 =4x4+16x5=16+80=96 となっていたのですが、途中から+に戻るのと
 自乗になる所が理解できません^^; こうゆう公式なのでしょうか?

A棒の長さはX〜N(25、36)にしたがっているという(単位cm)。
 (1)P(X≦17.8)

 (17.8-25)/6=−7.2/6 =-1.2  
 この式の分母の6は、どのようにして求めたらいいのでしょうか?

433 :ベイジアン:2007/07/18(水) 19:47:26
フィッシャー?それ誰?
いいかい君たち、わかってないみたいだから言うけどね、統計学はベイズの定理から始まったんだ。
前時代的な確率論に汚染された者たちに媚びる必要など無い。
さあ、ベルヌーイ分布と共に僕らの輝かしい事後確率を導こうじゃないか!

434 :ポイズン:2007/07/18(水) 19:59:26
>>432 こりゃまた、大変な質問だな。
@ V(aX+bY)(X, Yは独立とは限らない)の「公式」すら知らないのは何故?
→ まともな教科書があれば分かる。
次に、簡単に「公式」で片付ける根性がいかん。手を動かせば、その裏が簡単に理解できる。
分散の定義 V(X) = E {(X - μ)^2} を展開したり、Yも追加してやれば、@に関する二つの質問は自明だろう。

答えを写してるだけで、何にも根本的な勉強になってないじゃん!Aも同様。

教えてちゃんが現れる頻度は、ポワソン分布に一致するか、識者の見解を求む。

435 :132人目の素数さん:2007/07/18(水) 20:36:16
>>377
「何人いると見積もれるか」だから、多分今まで答えているみなさんが言うとおり
正規分布近似で答える問題なんだと思うけど、正規分布表がついていなければ、
「条件を満たす、19点より上で71点より下の生徒数の最小値」として376人と
いう答えを出すことはできるよ。

チェビシェフを使うという発想は悪くない。けど、そのまま使うよりは、チェビシェフを導くときの
考え方を使う、という方が分かりやすいかな。

|点数-45|≧26を満たす人数がk人いるとすると、
分散 = (1/500)Σ[i=1 to 500](x_i-45)^2 ≧(1/500)*k*(26)^2 = (k/125)*(13^2)
なので、kの満たす条件は...という感じで解いていけばいい。

436 :132人目の素数さん:2007/07/19(木) 11:20:06
>>425 なかなか面白い考えと言うか問題だな。ジャックナイフにしろブートストラップにしろ理論的には可能だが、一筋縄では行かなさそうか。


437 :132人目の素数さん:2007/07/20(金) 03:00:28
すいません。皆さんにとっては凄い初歩的な問題なのかもしれませんが、わからなくて困っています。
誰か教えていただけませんか?
(1)次の資料は、任意に抽出した勤労者100人の習慣労働時間数を小さい順から並べたものである(単位は
時間)。100個のデータの総和は 3398 であり、各データの2乗和は 121792 である。設問に答えなさい。

 10 10 15 16 18 20 22 23 23 23 23 24 25 25 26 26 27 27 27 28
28 28 28 28 28 28 29 29 30 30 30 31 31 31 32 32 32 32 33 33
33 33 33 34 34 34 35 35 35 36 36 36 36 36 36 37 37 37 37 37
38 38 38 38 39 39 39 39 39 39 39 40 40 40 40 40 40 40 40 40
41 41 41 41 41 41 42 42 42 42 43 43 44 44 45 45 45 45 45 52
設問
3.中央値、最頻値、平均値などからみて、習慣労働時間の分布に関して分かる特徴を述べなさい。

抽出した100人の週給のデータ(単位は,万円)からは平均は 10.29、標準偏差は 3.26 が得られた。また、
週間労働時間と週給の共分散の値は、22.47 であった。

7.労働時間についての労働者間の格差と、週給についての労働者間の格差を比較しなさい。
8.週間労働時間と週給との間に何らかの関係がありますか、それとも無関係ですか。もし、関係がある
としたら、どのような、またどの程度の関係がありますか。

一人の勤労者の週間労働時間(X)から週給(Y)を予測するため、Y=α+βX で示す関係式を想定する。

9.関係式 Y=α+βX を計測する方法を説明しなさい。
10.上に与えられたデータから、関係式 Y=α+βX を計測しなさい。

ある一人の勤労者を、at random に取り上げ、その勤労者の週給を予測してみたい。

11.大勢の勤労者の中から一人を抽出したとき、その勤労者の週給はどれほどと予測しますか。理由を
つけて答えなさい。
12.抽出した一人の勤労者の週間労働時間が42時間であると分かったとき、その勤労者の週給はどれほ
どと予測しますか。理由をつけて答えなさい。

438 :132人目の素数さん:2007/07/20(金) 06:07:02
10人の学生から3人を選ぶ際に、完全にランダムに選ぶにはどのようにすれば良いでしょうか?
サイコロを使う?replaceは許さない?

439 :132人目の素数さん:2007/07/20(金) 06:07:50
ついでに、これがランダムであるという検定法はあるでしょうか?

440 :132人目の素数さん:2007/07/20(金) 13:49:41
>>438
>10人の学生から3人を選ぶ際に、完全にランダムに選ぶにはどのようにすれば良いでしょうか?
>サイコロを使う?replaceは許さない?

Rなら

sample(c(0,1,2,3,4,5,6,7,8,9), 3, replace=F)

だけど、サイコロでといわれれば、どうやればいいかな・・・

441 :132人目の素数さん:2007/07/20(金) 18:16:56
20面サイコロ振ってみれば?0−9×2のやつ。
重複サンプリングは同じ目が出たら振りなおし、でよいでしょう。

442 :132人目の素数さん:2007/07/20(金) 21:38:13
質問お願いします。


【問】ある大学の学生のIQは平均100、標準偏差10の正規分布に従うとして次の問に答えよ。
3人の学生をランダムに選んだとき、この3人全員のIQが100以上の確率を求めよ。

443 :132人目の素数さん:2007/07/20(金) 22:09:45
>>442
100±10であることより0.125となる

444 :132人目の素数さん:2007/07/20(金) 22:47:09
>>443
すいません。解答のプロセスもう少し詳しくお願いします。

445 :132人目の素数さん:2007/07/21(土) 04:19:07
>>442
正規分布も標準偏差も関係ない。
ある学生のIQが100以上である確率が1/2で
それを3乗するだけじゃん。

446 :132人目の素数さん:2007/07/21(土) 04:48:18
>>445
正規分布であることは関係があるのでは?
標準偏差は関係ないが。

447 :132人目の素数さん:2007/07/21(土) 05:59:16
>>446
正規分布だから>>445の言ってる様に(1/2)^3になるんだろ

448 :132人目の素数さん:2007/07/21(土) 06:47:39
関係ないのは標準偏差10ということだね。

449 :132人目の素数さん:2007/07/21(土) 06:54:11
ある大学の学生がもし4人しかおらずにN(100,10^2)であるとすると
確率ゼロ

450 :132人目の素数さん:2007/07/21(土) 07:09:20
>>449 学生4人では大学は成立しないのよ! ばかばかばか!

451 :132人目の素数さん:2007/07/21(土) 08:51:09
私立マンツーマン大学

452 :132人目の素数さん:2007/07/21(土) 18:37:04


ある大学の学生のIQは平均100、標準偏差10の正規分布に従うとして
次の問いに答えよ。
答えは四捨五入して小数点以下2桁まで求める。
@IQが90以下の確立を求めよ。
A上位1%以内に入るために最低必要なIQはいくらか。
B3人の学生をランダムに選んだとき、この3人全員のIQが100以上の確立を求めよ。
C25人の学生をランダムに選んだとき、この25人の平均IQが104を超える確立を求めよ。

どなたかご教授お願いします。

453 :132人目の素数さん:2007/07/21(土) 18:49:22
今さらなんだけど累計差の出し方がわかりません…

公式を教えてくださる方いますか?

454 :132人目の素数さん:2007/07/21(土) 19:33:43
相関係数の公式がよくわからないんですが・・・;;;

Σ(xi-X)(yi-Y) / √(Σ(xi-X)^2 ・ Σ(yi-Y)^2)

この公式だと一度2乗したものを√で戻しますよね?
それだと(xi-X)(yi-Y) /(xi-X)(yi-Y) になって絶対1になっちゃいませんか・・・?

数学本気で苦手なので・・・誰か教えてください;;;


455 :132人目の素数さん:2007/07/21(土) 19:35:07
見覚えのある問題がw

456 :132人目の素数さん:2007/07/21(土) 20:04:28
>>454
Σは飾りか!w
root(1^2+2^2) = 1+2か考えてみたら?

457 :132人目の素数さん:2007/07/21(土) 20:07:25
>>456
ぬぬぬ・・・?
Σをどうすればいいんですか・・・?;;;;

458 :454:2007/07/21(土) 20:25:12
sX sYのほかにsXYも求めておかないといけないってことなのかな・・・?


459 :132人目の素数さん:2007/07/21(土) 20:38:37
>>457
本当に飾りだったんだな…。足し算だよ。
x_1=1, x_2=2としたとき、
Σx_i^2 = 1^2+2^2
ということだ。

460 :132人目の素数さん:2007/07/21(土) 20:55:36
>>459
ふむふむ・・・。
一個一個を2乗して、足していくいくってことですよね・・・?
そこまではわかったんですが、式に√ついてますよね?
√ついてると結局Σ(xi-X)(yi-Y)と同じことになりませんか・・・?

461 :132人目の素数さん:2007/07/21(土) 21:33:43
>>460
√Σxi = √(x1+x2+...)
Σ√xi = √x1 +√x2+...

Σxi Σyi = (x1+x2+..)(y1+y2+...)
Σxi yi = x1y1 +x2y2 +x3y3 +...

462 :132人目の素数さん:2007/07/21(土) 22:34:32
>>461
なるほど・・・・。
そういうことだったんですか・・・。俺バカだな・・・orz



463 :132人目の素数さん:2007/07/21(土) 23:41:08
>>452
>
>
>ある大学の学生のIQは平均100、標準偏差10の正規分布に従うとして
>次の問いに答えよ。
>答えは四捨五入して小数点以下2桁まで求める。
>@IQが90以下の確立を求めよ。

0.158655

>A上位1%以内に入るために最低必要なIQはいくらか。

125

>B3人の学生をランダムに選んだとき、この3人全員のIQが100以上の確立を求めよ。

0.125

>C25人の学生をランダムに選んだとき、この25人の平均IQが104を超える確立を求めよ。

?

>どなたかご教授お願いします。

リアル春厨の回答でした

464 :春厨:2007/07/21(土) 23:42:09
×確立
○確率

でしょ?

465 :132人目の素数さん:2007/07/21(土) 23:56:48
俺いつも悩むんだけど、正規分布で平均とかって分布のどちら側に属するんだろ?
平均0の場合

<0に50%、0≦に50%入ってるの?

466 :132人目の素数さん:2007/07/22(日) 00:09:04
正規分布とは左右大将で1ミリずれてもいけない

467 :132人目の素数さん:2007/07/22(日) 00:14:26
平均は両方に属するの?
すると分布は99%しかカバーしないの?
それとも右左両方用に実は平均が二つ並んでいるの?
イメージがつかめない・・・

468 :132人目の素数さん:2007/07/22(日) 00:19:31
>>465
どちらにも属さないんじゃないの。


469 :132人目の素数さん:2007/07/22(日) 00:19:52
そもそも正規分布って連続分布だよね。
IQって離散値じゃなかったっけ?

470 :132人目の素数さん:2007/07/22(日) 00:21:34
>>468
>>>465
>どちらにも属さないんじゃないの。
>

えっ!じゃあ積分の時にどっちにも含めないの?
それで正規分布は事象の100%をカバーするの?
きゃーーー頭が湯気吹いた・・・

471 :132人目の素数さん:2007/07/22(日) 00:28:45
>>470
分布関数勉強しとけよ


472 :132人目の素数さん:2007/07/22(日) 00:42:48
ある本にも書いてあるけど、
確率密度関数が連続型の場合、特定のxが起きる確率はゼロ。

まあ、微分積分を踏まえれば常識になるのでは。面積ゼロだからね。

473 :473:2007/07/22(日) 01:01:43
4=7-3


474 :454:2007/07/22(日) 01:29:47
なんどもすみません・・・。

共分散sxyを求める公式は
sxy= 1/nΣxi・yi - xの平均値・yの平均値

ですよね?

これをつかって相関係数rを求めるための公式の

r= sxy/sx・sy

に当てはめてやってるんですが、
自分のやってる問題の解答と自分の答えが微妙に違います(r=-0.814になるところがr=0.815になったりと・・・)

問題も載せたほうがいいんでしょうか?かれこれ4時間くらい同じ問題に詰まってますorz

475 :132人目の素数さん:2007/07/22(日) 01:46:23
sxy= 1/nΣ(xi - xの平均値)・(yi - yの平均値)

476 :132人目の素数さん:2007/07/22(日) 01:46:40
載せなきゃわかるわけないしお前の解答も載せなきゃ
どこで間違えているのか分かるわけが無い。

477 :132人目の素数さん:2007/07/22(日) 02:39:27
スタージェスの公式って、どうゆう考え方で導かれたんですか。
なぜこの式で、最適な階級の幅が求まることになるのでしょうか。

478 :132人目の素数さん:2007/07/22(日) 02:52:34
経験則と聞いたが。

479 :132人目の素数さん:2007/07/22(日) 20:25:32
基本的なことですみませんが教えてください。

コインを5枚トスして、表が出る枚数をXとする。
次の確立はいくらか[X=3]

これを二項分布にあてはめると

5!/3!(5!-3!) ×0.5の三乗×(-0.5)の(5-3)乗

になりこれを計算すると0.3125になると思うんですが、
回答によると0.03215になっています。(勿論途中式はありません)

どうしても回答の数字にはならないのでどなたか教えていただけないでしょうか?
二項分布を使うところから間違っているのでしょうか?

480 :132人目の素数さん:2007/07/22(日) 20:38:06
>>479
どちらでもなく0.03125

481 :132人目の素数さん:2007/07/22(日) 20:38:09
5!/3!(5-3)!

482 :132人目の素数さん:2007/07/22(日) 20:50:01
479です
早速のレスありがとうございます


5!/3!(5-3)! ×0.5の三乗×(-0.5)の(5-3)乗
を解くと

=120/6×2 ×0.125×0.25
=120/12 ×0.03125
=0.3125

ではないでしょうか?

483 :132人目の素数さん:2007/07/22(日) 22:20:45
コインを5枚投げて、表が3枚出る確率が3%
なんというイカサマ\(^O^)/

484 :132人目の素数さん:2007/07/23(月) 00:13:31
年 消費支出Y 可処分所得X
1993 346.521        393.224
1994 356.914        396.406
マクロ消費関数が
Yhat=0.938462107+0.894589743X
の時
1994年の限界消費性向は、
0.894589743*396.406+0.938462107=355.5592038
0.894589743*393.224+0.938462107=352.7126192

355.5592038-352.7126192=2.846584562
↑がΔC

356.914-346.521=10.393
↑がΔYだとすると、
2.846584562/10.393=0.273894406
で正しいのでしょうか?

485 :132人目の素数さん:2007/07/23(月) 16:32:52
>>473
お前は何を言っているんだ?

486 :132人目の素数さん:2007/07/23(月) 17:12:30
質問させてください。
偏差値は例えばどんな事に活用できますか?学力偏差値以外で教えて下さい。

487 :132人目の素数さん:2007/07/23(月) 18:00:21
>>486
実際に使われている例としては、
子供の発育異常(低身長など)の判断基準になっている。
具体的に「偏差値(平均が50、±標準偏差が±10)」の数字が
使われている訳ではないが、実質的に偏差値30以下または70以上を
「異常」と定義して治療の対象としている。



488 :132人目の素数さん:2007/07/23(月) 18:18:08
>>487
ありがとうございます。レポート課題で偏差値を統計学的に調べなきゃならなくてorz
検索しても学力偏差値ばっかでして。
何か企業がマーケティング等で使われたりしないんですかね?

489 :132人目の素数さん:2007/07/23(月) 18:36:10
偏差値(平均50、標準偏差±10)なんてめんどうなものを使うのは
小数点のついた数字が理解できないアホを相手にするときだけで、
マーケティングに使おうと思ったら生の分布をグラフに出すよ。

490 :132人目の素数さん:2007/07/23(月) 19:23:52
>>489
そうですか。偏差値ってあんまり実用性ないみたいですね。学力偏差値くらいしかちゃんと使ってるの知らないし。とりあえず調べてレポート終わらせました

491 :132人目の素数さん:2007/07/24(火) 07:37:55
X、Yを確率変数とし、λ=1/2 の指数分布に従う。XとYは独立であるとする。
このときX+Yの分布はどうなるか。

という事なのですが、指数分布はガンマ分布の特別な場合なので
X〜Ga(1,2) Y〜Ga(1,2) で
ガンマ分布の再生性より X+Y〜Ga(2,2)
となると思ったのですが、これは正しいのでしょうか

ノートには 2*(X+Y)〜Ga(2,1)
というような事が書いてあるのですが、ガンマ分布の再生性を考えると
前者でいいような気がするのですが

ご教授お願いします

492 :491:2007/07/24(火) 07:42:05
>ノートには 2*(X+Y)〜Ga(2,1)
λ*(X+Y)〜Ga(2,1)
の間違いです

493 :132人目の素数さん:2007/07/24(火) 11:19:36
>>490
「偏差値」という数字自体を使ってるのは学校塾以外で見た事ないな。
大抵は平均値グラフの上下に±標準偏差、±標準偏差×2、…のグラフを書く。
この手のグラフはどの分野でも見かける。
それを見る人が、その意味をどれほど理解しているかは知らないが:-)


494 :132人目の素数さん:2007/07/24(火) 17:55:13
どなたか教えてください。
散布度についてその種類や特徴などを述べなさい
という課題が出たのですが、
さまざまなサイトを回ってきたのですが、
その内容に触れられているものが見つからなくて。
すみませんが誰か教えてください。
お願いいたします。

495 :132人目の素数さん:2007/07/24(火) 18:05:28
>>494
ttp://www.oak.dti.ne.jp/~xkana/psycho/stat/stat_19/index.html

496 :132人目の素数さん:2007/07/24(火) 18:09:40
>>495
お忙しいところすみません。
助かりました。本当にありがとうございます。

497 :132人目の素数さん:2007/07/24(火) 18:26:33
>>452
のCってどうなるんでしょうか。

498 :132人目の素数さん:2007/07/24(火) 20:32:02
>>497
25人の平均値も正規分布に従う。

499 :132人目の素数さん:2007/07/25(水) 00:43:03
適合度検定の話なんですが、
なぜ統計量v=Σ((n-f)^2/f)
(観測度数n、理論度数f)は、χ2乗分布に従うんですか?

500 :132人目の素数さん:2007/07/25(水) 00:54:43
>>499
>適合度検定の話なんですが、
>なぜ統計量v=Σ((n-f)^2/f)
>(観測度数n、理論度数f)は、χ2乗分布に従うんですか?

サンプルの平均が正規分布に従うから。

501 :132人目の素数さん:2007/07/25(水) 01:21:22
統計超初心者です。初歩的な質問で申し訳ありませんが、
どなたか教えてください。
課題の分析をstataソフトでやっておりまして、これまではいつも係数が
数字で出てきていたのですが、今数値を入力したところ
係数がところどころ-6.2e+03のような形で出てしまったのですが
これはどのように解釈したらよろしいのでしょうか。
どうぞ宜しくお願いします。

502 :132人目の素数さん:2007/07/25(水) 01:26:36
-6.2*10^3と読む

503 :132人目の素数さん:2007/07/25(水) 01:30:27
t検定と正規分布の違いって何ですか?
教えてください

504 :132人目の素数さん:2007/07/25(水) 01:35:24
>>503
違いすぎてどう答えたらいいのかわからないです。
○「検定」と△「分布」の違いを聞かれて、
うまく答えられる人はいないかと。

505 :132人目の素数さん:2007/07/25(水) 01:37:45
>502さん
早速のお返事助かります!
-6.2×10の3乗ということなんですね。
生粋の文系なので、分からないことだらけで・・・
本当にありがとうございました!

506 :132人目の素数さん:2007/07/25(水) 01:40:39
>>504
レスありがとうございます。
t検定と正規分布による検定の相違の間違いでした。
でも、検定と分布じゃ違いますよね・・・

507 :132人目の素数さん:2007/07/25(水) 01:40:47
>>503
マルチしまくり

508 :132人目の素数さん:2007/07/25(水) 01:46:53
>>507
マルチですみません。
分からなくて誰かの助けというか手を借りたかっただけなんです;;

509 :132人目の素数さん:2007/07/25(水) 01:54:19
t分布

510 :132人目の素数さん:2007/07/25(水) 01:54:40
相関係数
Σ(x-e[x])*(y-e[y])/n
これって、xとyのサンプル数がじゃないと、求められませんよね?

たとえば国語のテストを受けた人数と数学のテストを受けた人数が異なっていた場合
それに相関係数を求めることはできないよね?

511 :132人目の素数さん:2007/07/25(水) 01:57:03
なんのための相関係数なんだ・・・

512 :132人目の素数さん:2007/07/25(水) 02:45:18
ちょっと宿題の相手をしすぎではないのか

513 :132人目の素数さん:2007/07/25(水) 03:20:00
夏だからかな・・・

514 :132人目の素数さん:2007/07/25(水) 09:27:30
だからといって
>>500
のようにうそを教えちゃいかんな。


515 :132人目の素数さん:2007/07/25(水) 09:37:35
>>514
えっ、うそなんですか?僕、納得しちゃいましたよ。
正規分布するサンプル集団からとられたサンプルの誤差はχ自乗分布に従うって。

516 :499:2007/07/25(水) 10:49:44
>500を見て悩んでいたんですが、やっぱり解りません。
χ^2分布というのは、標本分散が従う確率分布なのではないんですか?

517 :132人目の素数さん:2007/07/25(水) 11:47:25
>>516
>500の話だと自由度の計算が出来なくなる。

518 :132人目の素数さん:2007/07/25(水) 11:51:25
>>499
ttp://www.biwako.shiga-u.ac.jp/sensei/kumazawa/tahenryou/chisq.pdf


519 :132人目の素数さん:2007/07/25(水) 14:43:03
基本問題ですがわかりません^^;だれか解いていただければ幸いです^^
多いので分けてカキコさせていただきます
下記の確率分布それぞれの下側5%と上側5%を求めよ
(1)  平均(3)分散(2)の正規分布
(2)  自由度(13)のt分布
(3)  自由度(23)のx2乗分布
(4)  自由度(4、14)のF分布
 
16個の個のサンプルx1、x2、x3・・・・・、x16は、平均100、
分散9の母集団からランダムに抜き取られたものである
(1) E[{x1+2x2+3x3}÷6] Var[{x1+2x2+3x3}÷6]は
それぞれいくらになるか
(2) 
  E[xバー],Var[xバー]はそれぞれいくらになるか?
  ただしxバーは16個のサンプルの平均である。
(3)上記母集団は正規分布に従うものとする。xバーが
  102以上となる確率を求めよ。



520 :132人目の素数さん:2007/07/25(水) 14:44:16


大手ビデオ・カメラ・メーカーのO社では、ズームモーター
を外注する。A社かB社のいずれかにしたい。そこで実際に
両者からサンプルとして9個ずつズームモーターを納入して
もらい、決め手となるズームスピードを測定した。以下はそ
の測定結果である
  ズームスピード(単位:秒)
A社 3.4 3.1 3.5 3.2 3.3 3.2 3.3 3.4 3.3 3.2
B社 3.2 3.0 3.2 3.0 3.4 3.1 3.3 3.1 3.1 3.3
とする。以下の設問に答えよ
(1) A社とB社のモーターのズーム・スピードの母平均
に差があるかどうかを有意水準5%で検定せよ。
(2) A社とB社のモーターのズーム・スピードの母平均
の差の信頼水準95%の信頼区間を求めよ。ただし、A,B
両社とも、左から9個ずつのデータのみが与えられている
ものとせよ。
 
 以上です。できるだけ今日中に答えていただけると幸いです。
長文失礼いたしました。


521 :132人目の素数さん:2007/07/25(水) 14:52:10
ここはマルチでも丸投げでも答えてもらえると聞いたもので^^;

やはり期限を設けます。
今日の午後5時までに解答(提出できる形で)を書き込んでください。

522 :132人目の素数さん:2007/07/25(水) 15:01:38
誰も5時までに書き込むなよ?

523 :132人目の素数さん:2007/07/25(水) 15:41:53
>>519
(1) 3、5
(2) 0.06、2.35
(3) 13、35
(4) 0.1 3.1


>>520
(1) t(18)=2.11, p=.049
(2) [.017, .272]

524 :132人目の素数さん:2007/07/25(水) 16:02:53
ありがとうございます^^できれば途中過程もお願いできますか?

525 :132人目の素数さん:2007/07/25(水) 16:21:17
丸投げする方も、回答する方も、暇な季節なんだなー。

526 :132人目の素数さん:2007/07/25(水) 17:25:01
密度関数の高さって何を意味してるのでしょうか?
f(x)としたら、xに8とか9とか適当に数字を入れたら、値でますよね。あの値はどういう意味なんでしょうか?

527 :132人目の素数さん:2007/07/25(水) 17:30:42
特に意味はない
積分したときに都合よく面積=確率を表せるように数値取ってるだけ

528 :132人目の素数さん:2007/07/25(水) 17:38:31
>>527
どうも、長年の疑問が解けました。

529 :132人目の素数さん:2007/07/25(水) 17:42:13
>>525
>丸投げする方も、回答する方も、暇な季節なんだなー。
と回答する事の出来ないお兄ちゃんが申してますww

530 :132人目の素数さん:2007/07/25(水) 17:49:10
途中過程まだですか?^^;;イライラ

531 :132人目の素数さん:2007/07/25(水) 18:02:05
うるせえよ。そのまま単位おとして留年して人生終了しとけw

532 :132人目の素数さん:2007/07/25(水) 18:02:21
↓以下、答えや途中経過を書き込まないようにしてください

533 :132人目の素数さん:2007/07/25(水) 18:23:42
途中経過です

>>519
(1)は暗算。
(2)〜(4) 各自由度とp=.05及びp=.95を自作プログラムに入力

>>520
(1)データを入力->Rで t.test(a, b, var.equal=T)
(2)右一個のデータを各社から削除 ->t.test(a, b, var.equal=T)
-> CIを見ました。

534 :132人目の素数さん:2007/07/25(水) 19:51:43
統計学の入門のめじゃーな本は統計学入門(東大出版)ですが
多変量解析(多次元正規分布)の入門としてメジャーな本は何ですか?

535 :132人目の素数さん:2007/07/25(水) 20:12:04
>>534
cohen&cohen

536 :132人目の素数さん:2007/07/25(水) 20:45:48
>>503
                 γ⌒/^^/^-
               ,ゝ`/~ /~ /~  /⌒ 
           _  〈(_|  | |~  |~  /^ )
            (/~ /~ /~ /~ ~ /~ /^\
           ()/)/~ /~ |~    .|~ |~ |~ /)
           へ^〈,|,,、,,|,,、,,,,,|~,,,,、〈~,, 〈~ /⌒|)\
          |:::::::   ゛  ゛          ,,,,;;::'''''ヽ
          |::::::::      ,,,,;;:::::::::::::::       __ ヽ
          |::: "   __    ::::     <'●, |
         ┌―. - '"-ゞ,●>   ::::::...         |  
          | | ̄..          :::::::          |
          ヽ.\{_           ( ○ ,:○)   |  . '・,.、 .
           \\/.                 ,'・, ,'・, . '・,.、、 .
             \_ヽ.        __,-'ニニニ,',ヽ . '・バカはひっこんでろ
..                ヽ.        │    /,'・,.、’、′’、′′′‘‘‘、 .
                \        │   │’、′′,.、 . '・,.、
                 |       ヾニ二ン"|・ '・,.、’、
                 |              /
                 ヽ\             /  
                  l  `ー-::、_       ,,..'|ヽ. 
                 :人      `ー――'''''  / ヽ
              _/  `ー-、          ,.-'"   \ー-、
           ,.-'"  \:      \      .,.-''"     |
         /.     \        ~>、,.-''"      |
    ,,..-‐'''""        ヾ    ,.-''"|    /――――、/

537 :オシムジャパン:2007/07/25(水) 22:13:52
ある大学生のIQは平均100、標準偏差10の正規分布に従うとして次の問に答えよ。
(1)25人の学生をランダムに選んだ時、この25人の平均IQが104を超える確率を求めよ。
この問題お願いします。

538 :132人目の素数さん:2007/07/25(水) 22:17:31
まるち

539 :132人目の素数さん:2007/07/25(水) 22:29:48
>>527
少し誤解を招くかな?
数値自体に意味はないが、比較するときには相対的に意味がある。

540 :132人目の素数さん:2007/07/26(木) 00:48:07
コンピュータサイエンスの大学院で機械学習を道具として使ってるんですけど、
オーソドックスな統計学をガッツリ勉強したくなりました。
よい本を知ってる人が教えてください。
和書洋書は問いません。self-containedでしかもたくさん詰まってる、本格的なのがよいです。


541 :132人目の素数さん:2007/07/26(木) 05:09:30
>>540
「日本女性の外性器」 滋賀医科大学

542 :132人目の素数さん:2007/07/26(木) 16:18:04
>>541
内性器や内分泌系等も含めた包括的なものはありますか?

543 :132人目の素数さん:2007/07/26(木) 16:37:34
>>542
「日本女性の外性器?統計学的形態論 日本性科学体系」
取り敢えずは、これを統計学的に分析し全ての画像を脳裏に焼き付けてから、次に進みたまえ

544 :132人目の素数さん:2007/07/27(金) 04:55:48
stataを使ってデータ分析をしようとしているのですが、
どうしても分からないことがあり、書き込みさせていただきます・・・。
重回帰分析の結果、いくつかの変数の係数部分に(dropped)と出てしまう
のですが、この原因は何なのでしょうか?サンプル数不足でしょうか?
またサンプル数以外にも原因が考えられればぜひ教えてください。
宜しくお願いします。

545 :132人目の素数さん:2007/07/27(金) 06:18:19
>>544
droppedと出るのは、複数の変数が完全にcorrelatedな関係にあるためで、Stataが自動的に重複を排除しています。
例えば、p = 2q で表されるp, q が共にindependent variableになっていれば、Stataはどちらかをdropします。

OLSの原則として、independent variablesは互いに独立でないといけません。

546 :132人目の素数さん:2007/07/27(金) 06:31:05
>>545を見直して自分は馬鹿かと思ったのだけど、
"independent variable"と書いたのは、X (x1,x2, ...) そのものとして読んで下さい。
これらは独立だから、まさに"independent variable"と呼ばれている訳で。

547 :132人目の素数さん:2007/07/27(金) 07:27:34
多重共線性だっけか?

548 :132人目の素数さん:2007/07/27(金) 10:42:38
逆行列が作れなくなるから数値が出ない

549 :132人目の素数さん:2007/07/27(金) 12:43:56
そだね。β-hatが作れないんだよね。
ちなみにStataでも行列計算が簡単に出来るから、やってみると面白いです。

550 :544です:2007/07/27(金) 19:48:53
どうもありがとうございました!
ではcorrelationの高い変数を調節して再度
挑戦してみます。本当に助かりました!

551 :toukei:2007/07/28(土) 02:28:53
統計の基本の問題がわからないのですがわかる人がいたらお願いします。
データについて平均値と分散を求めなさい。
データ・6、4、5、5、7、3、4、6
平均値= 分散=
解いてくれたらホントにありがたいです><

552 :132人目の素数さん:2007/07/28(土) 02:42:15
>>551
http://ja.wikipedia.org/wiki/%E5%B9%B3%E5%9D%87
http://ja.wikipedia.org/wiki/%E5%88%86%E6%95%A3


553 :132人目の素数さん:2007/07/28(土) 02:59:12
分散はともかく、平均がわからないってやばくね?
小学校レベルだぞ・・・

554 :toukei:2007/07/28(土) 03:23:23
続きなのですが、分散わかる人お願いします><

555 :132人目の素数さん:2007/07/28(土) 03:24:59
>>554
http://ja.wikipedia.org/wiki/%E5%88%86%E6%95%A3

標本分散。

556 :toukei:2007/07/28(土) 03:33:17
551番目のやつに書いてある分散の答えの値は
ずばり何になるかわかりませんか?

557 :132人目の素数さん:2007/07/28(土) 04:09:33
あんたヤバいって。答えだけ欲しいってのが小学生だな。

558 :toukei:2007/07/28(土) 04:19:01
オレはわかる人だけに聞いてることであってお前みたいにただ
おちょっくってるやつに聞いてねえよ。
因みにここのスレ統計のことについて何でも質問してもいいみたいだから
ただ利用しただけだよ。

559 :toukei:2007/07/28(土) 04:21:06
とっとと答えろよ低能ども!

560 :toukei:2007/07/28(土) 04:26:32
559のオレと同じ名前使ってるやつ……ほんとABCDだな

561 :toukei:2007/07/28(土) 04:40:39
いいからとっとと答えろよw
もちろん途中計算つきでなw

間違えても間違えんなよw

562 :toukei:2007/07/28(土) 04:55:25
561番 なりすまし、うざっ。

563 :toukei:2007/07/28(土) 05:19:45
うぜえなあ
はやく答え書き込めよ
そろそろママがおきちゃうだろ!

564 :toukei:2007/07/28(土) 05:20:28
>>559>>561>>563とtoukeiちゃんの気持ちを代弁してみました!

565 :toukei:2007/07/28(土) 05:26:09
代弁? 大きなお世話だよ。

566 :132人目の素数さん:2007/07/28(土) 05:41:35
>>551
平均 5
分散 1.71

567 :132人目の素数さん:2007/07/28(土) 08:22:28
>>566
分散 1.67

568 :132人目の素数さん:2007/07/28(土) 08:23:53
1.80

569 :132人目の素数さん:2007/07/28(土) 10:06:46
>>567
>>568

計算し直せ。1.71が正解

570 :132人目の素数さん:2007/07/28(土) 10:34:58
>>569
>>556が空気を読まずに答え書くから、みんなカモフラージュに嘘書いてんの。それぐらい分かれ。
勉強する気のない奴の糞質問がいっぱい来たらうざいし、こたえること自体馬鹿らしいから。

571 :132人目の素数さん:2007/07/28(土) 11:00:28
それにしても1.71にはならんような

572 :132人目の素数さん:2007/07/28(土) 11:13:15
ああそうだ、1.71は電卓でやったんだろ。自由度が考慮されてて、標本分散とは違う。しかも、細かいと言うなら分散じゃなくて標準偏差だ。

573 :132人目の素数さん:2007/07/28(土) 11:16:20
>>570
腐った香具師ばっかなんだな。わざわざ嘘書くのかよwww
それぐらい分かれじゃねーんだよボケが

574 :132人目の素数さん:2007/07/28(土) 11:18:37
>>572  標準偏差は1.31だよ

575 :132人目の素数さん:2007/07/28(土) 11:57:50
てゆうかみんな嘘書いてんだろ。

576 :132人目の素数さん:2007/07/28(土) 12:17:40
世論調査の仕組みについて是非教えてください

577 :132人目の素数さん:2007/07/28(土) 12:29:23
>>575
計算も何もしてないで好き勝手な子と言うな

578 :toukei:2007/07/28(土) 13:57:12
やっぱり分散1.71ではなく1.31ですよね。
12/8人−1=1.71… ルートで1.309…
少数第3位を四捨五入して1.31

579 :132人目の素数さん:2007/07/28(土) 14:21:40
>12/8人−1

ゆとり乙

580 :132人目の素数さん:2007/07/28(土) 18:06:19
ある集団の上位25%の所得は一律1800万円、
下位75%の所得は一律200万円であるという。
この集団についてのジニ係数G1を求めよ。

これを教えてください。

581 :132人目の素数さん:2007/07/28(土) 18:21:31
ジニ係数って何かわかってるか?
横1(100%)縦1(100%)としたときの所得分率面積の二倍だぞ

582 :132人目の素数さん:2007/07/28(土) 18:40:58
今年履修したばかりなので何も分からないんです。
具体的な解き方を教えてほしいんですけど。

583 :132人目の素数さん:2007/07/28(土) 18:46:36
ここのところのやり取りを見れば、教えてもらえるかどうかくらいわかるだろ。
自分の先生に尋ねた方が早いよ。プリンの一つも手土産にしなされ

584 :132人目の素数さん:2007/07/28(土) 18:50:12
月曜に私権なんで聴いている暇ないんですよ。

585 :132人目の素数さん:2007/07/28(土) 19:01:00
>582
>具体的な求め方
581に書いてるだろ
お前は三角形や台形面積の求め方もしらんのか。
もう手遅れだな。小学生レベルのこともわからんのじゃ話にならない

586 :132人目の素数さん:2007/07/28(土) 19:22:16
データ S=(1,4,4,7.8,9,10,11,12,20)が与えられている。範囲、第1四分位点、第3四分位点を求めよ。

範囲ってどうやって求めるんでしょうか・・。第1四分位点が(7+8)/2=7.5、第3四分位点が(10+11)/2=10.5となった
んですが合ってますでしょうか?よろしくお願いします。

587 :132人目の素数さん:2007/07/28(土) 19:24:45
いや、三角形や台形の面積は分かりますが、
それがどう関係あるのでしょうか?
具体的な式などを教えて頂きたいのですが・・・

588 :132人目の素数さん:2007/07/28(土) 19:30:23
>>586
4番目のデータは7.8でオケーなの?それとも7と8か。

範囲は(最大値−最小値)、すなわち20-1=19

589 :132人目の素数さん:2007/07/28(土) 19:37:13
>>588
すいません、7と8です・・。申し訳ありません。第1四分点と第3四分位点は、上記の計算で合ってますでしょうか?

範囲ですが、ありがとうございます。理解しました。

590 :132人目の素数さん:2007/07/28(土) 19:40:09
>>587
ローレンツ曲線と三角形の面積を差し引いて二倍しろって言ってるだろ。
具体的な式は教えた。
それでわからないならお前はその程度の人間だから単位落として留年してろ。

591 :132人目の素数さん:2007/07/28(土) 20:14:59
事前に問題の分かってる試験なのか。それだけで大ボーナスなのに・・・

592 :132人目の素数さん:2007/07/28(土) 20:19:52
>>584はなんでそんなに切羽詰る状況になる前に訊きに行かなかったんだろうねw

593 :132人目の素数さん:2007/07/28(土) 20:23:26
質問です。
1.さいころを1回投げたときに
(1)標本空間を作成しなさい。
(2)事象の総和が64通りになる事を確認しなさい。

2.色の異なる2個のサイコロを1回投げる。事象Aを「目の和が4」、事象Bを「2個のサイコロの目が等しい」
(1)全標本空間Sを作成しなさい。
(2)Sの中で事象A、事象Bに相当する部分を指摘しなさい。

この1なんですけど、問題おかしくないですか。(1)って、標本空間は1,2,3,4,5,6ですよね?でも、(2)で64通りなんて
ならなくないですか?あと、2なんですけど、この全標本空間って(1,1),(1,2)・・・・・(6,6)の36通りですよね?

594 :132人目の素数さん:2007/07/28(土) 22:36:08
どこをどうひねれば64て数字が出てくるか良く考えるんだ。

595 :132人目の素数さん:2007/07/28(土) 23:10:33
>>594
考えてみます。標本空間の部分はおkですか?

596 :132人目の素数さん:2007/07/28(土) 23:21:02
明らかに変だろ。何の問題?

597 :132人目の素数さん:2007/07/28(土) 23:29:10
>>596
変ですよね・・・。学校でもらった問題です。
一応、64通り出してみました。コンビネーションでやると63通りで、それに空集合加えれば64通りになりました。

598 :sd:2007/07/28(土) 23:36:14
身長170pの人の体重は、平均60.5s、標準偏差5.9sで分布している。
170pの人の体重が58s以下である確率はいくらか。
58sがカバーする範囲が58.5s未満として計算しなさい。(小数点第3位まで)

どこから手をつけていいのかわかりません。
ご教授よろしくお願いいたしますm(__)m

599 :132人目の素数さん:2007/07/28(土) 23:45:51
今所得格差についての統計分析をしているのですが、
行き詰ってしまいました。どなたかお答えいただけると助かります。
グループA(サンプル数 20000超)
グループB(サンプル数 1000ほど)
グループC(サンプル数 700ほど)
グループD(サンプル数 500ほど)
統計モデルでは所得を被説明変数にして、
グループを説明変数にしようと思っています。
グループAは米国の白人層で、他のいくつもの資料が
示すとおり、このグループの所得が一番高くなるはずなのですが、
なぜかグループBCDといった移民グループの所得中央値の方が高く
なってしまいます。
この食い違いはデータが悪いのでしょうか(ちなみにデータは統計局のものです。)
もしくはサンプル数のスケールが違いすぎるからなのでしょうか。
重みづけなどをすれば解消されるのではと思い、
いろいろ教科書やネットで調べてみたのですが、
中々思うようなものにたどり着けませんでした・・・。
お分かりになる方、どうぞよろしくご教授願います!


600 :132人目の素数さん:2007/07/28(土) 23:53:53
すいません。どなたか>>586の四分位点についてお願いします。

601 :132人目の素数さん:2007/07/29(日) 00:14:18
>>598
法政大学経営学部乙
月曜の試験頑張ろうな
といっても俺も>>598の問題がさっぱり計算できないんで誰か教えてくだしあ><

602 :名無しさん@そうだ選挙に行こう:2007/07/29(日) 00:53:15
>>598
平均より2kg以上少ない確率だな。
標準偏差5.9kgだから、正規分布で(2/5.9)*σ以下である確率だ。
後は正規分布表か、その値が出る関数電卓かを使わないと答えられん。
統計の教科書に載ってるだろ<正規分布表


603 :名無しさん@そうだ選挙に行こう:2007/07/29(日) 09:35:58
どう解けばいいのかわかりません・・。お願いします。

基準点0からc(0より大きいある定数)の間で鉛筆を転がす。止まったところまでの距離を確率変数Xとする。
ただし鉛筆は空間上の全ての点で同じ確かさで止まるとする。
(1)確率密度関数を求めよ。
(2)Xの平均(期待値)を求めよ。
(3)Xの分散を求めよ。

604 :名無しさん@そうだ選挙に行こう:2007/07/29(日) 09:56:36
>603
>ただし鉛筆は空間上の全ての点で同じ確かさで止まるとする。

これが答えのすべてを握っている。
これから確率分布(もちろん [0, c] の範囲に全て収まる)のグラフを書けるか?簡単だけど、これが出来なければThe End.

605 :名無しさん@そうだ選挙に行こう:2007/07/29(日) 10:34:36
いちよー分布は書けました。

606 :名無しさん@そうだ選挙に行こう:2007/07/29(日) 10:59:25
>>605
それが出来れば答えは公式レベルで分かる。

607 :名無しさん@そうだ選挙に行こう:2007/07/29(日) 11:06:24
>>604
同じ確かさで止まるとする・・・。ってことは、確率変数は0〜C?で、確率は1/cってことですか?



608 :名無しさん@そうだ選挙に行こう:2007/07/29(日) 11:31:40
そうとも言えるが、
確率密度関数っていったら、離散型じゃなくて連続型じゃないの?
だったら、1/cではないから、ここでは確率は問われてないでしょう?
グラフが書ける=関数が分かる=後は計算で何でもござれ、回答終わり、となるはずだ。

609 :名無しさん@そうだ選挙に行こう:2007/07/29(日) 11:41:16
>>608
ってことは、関数はX/Cになるんでしょうか。

610 :名無しさん@そうだ選挙に行こう:2007/07/29(日) 11:51:13
ちがう。多分直感的には1/cでいいのだが、連続する場合は・・・ってもうヤダ。
こんなスレだった?

611 :名無しさん@そうだ選挙に行こう:2007/07/29(日) 11:55:35
あ、1/cはもちろん関数でなく確率の話。最後のおせっかい。

612 :名無しさん@そうだ選挙に行こう:2007/07/29(日) 12:47:39
なんでこんな簡単な問題が議論してんだよ。
(1) f(x)=1/c (0 <= x <= c), (2) c/2, (3) c^2/12
以上。はい次。


613 :名無しさん@そうだ選挙に行こう:2007/07/29(日) 12:55:17
>>612
適当な答え書くなwww

614 :toukei:2007/07/29(日) 14:27:21
あるテストで行った結果その得点分布は平均45点、標準偏差10点の
正規分布となった。
〔3〕得点が62点以上の人は全体の何パーセントであるか?
 この答え46%ではないですか?わかる人教えてください。

615 :名無しさん@そうだ選挙に行こう:2007/07/29(日) 17:01:03
初めて書かせていただきます。
私の学校で、特異性と感受性について統計学的な見解を述べるという試験が
出されるようなのですが、私自身が、統計学を選考していないため、どのよ
うに書くべきなのかわかりません。
もしわかる方が、いらっしゃれば教えていただけると幸いです。
参考になりそうなHPとか教えていただけるだけでも結構です。
よろしくお願いします。

616 :名無しさん@そうだ選挙に行こう:2007/07/29(日) 17:03:17
おい誰か>>615の「異性と感度についての統計学的な見解」について答えてやれ


617 :名無しさん@そうだ選挙に行こう:2007/07/29(日) 17:54:52
自分が男性、すなわち異性が女性である場合、統計学的には首5%耳10%胸30%陰部50%その他5%の確率で性感帯がある
その他にはアナルやひざの裏なども含まれるので要注意だ

自分が女性、すなわち異性が男性である場合、ちんこ120%の確率で性感帯がある
自信を持って触ってやれ

618 :名無しさん@そうだ選挙に行こう:2007/07/29(日) 18:02:25
手元に-1と書かれているカードが1枚、0と書かれているカードが2枚、1と書かれているカードが1枚ある。この4枚
のカードを母集団として以下の問に答えなさい。

(1)カードを1枚無作為に抽出する。取り出した標本が-1である確率、0である確立、1である確率を計算せよ。
(2)この母集団から大きさ2の標本を復元抽出したときの取り出されたカードの組み合わせを(Xa,Xb)とする。とりう
る組を全て書け。
(3)それぞれの組み合わせに対して、標本平均Xc=(Xa+Xb)/2を計算してXcの確率関数を書け。
(4)Xcの平均と分散および母集団の平均と分散を計算せよ。

(1)-1:1/4 0:1/2 1:1/4
(2)(Xa,Xb)=(-1,0),(-1,1),(0,-1),(0,0),(0,1),(1,0),(1,-1)
(3)それぞれXc=-1/2 , 0 , -1/2 , 0 , 1/2 , 1/2 , 0
(4)平均=(-1/2+ 0+(-1/2)+0+1/2+1/2+0)/7=0
分散=1/7
母集団の平均=平均の計算方法と同じ  よって0
 母集団の分散=平均の分散の計算方法と同じ よって1/7

一応、自分で解いてみたんですが、これで合ってますか?お願いします。

619 :132人目の素数さん:2007/07/29(日) 21:30:10
単純回帰分析をしなくてはならないのですが、
なにか良いネタは思い付きませんか?
データを見ててもひらめきません。

620 :132人目の素数さん:2007/07/31(火) 19:09:37
2ちゃん使用時間と月収

621 :132人目の素数さん:2007/07/31(火) 19:18:28
>>618
>大きさ2の標本を復元抽出したときの

調べようね


622 :132人目の素数さん:2007/08/03(金) 23:01:15
等分散性ではないときは回帰分析は駄目だとよく書籍にかかれていますが、
ならどうすればいいのでしょうか?
他の解析方法、解決策等があるのでしょうか?
よろしくお願いいたします。

623 :132人目の素数さん:2007/08/03(金) 23:05:30
どんな対象についてどんな分析をしようとしているのかわからないとなんとも

624 :132人目の素数さん:2007/08/03(金) 23:08:40
>>623
製造工程の分析です。回帰分析をしていたら、
残差とすごい相関があったため、調べていくと等分散性にいきつきました。
しかし、ならどうすればよいのかがわからず止まってしまいました。


625 :132人目の素数さん:2007/08/04(土) 04:51:10
1対3でじゃんけんをした場合、3人のうち誰か一人でも勝てる確率は何%ですか?
引き分けた場合はその人だけ勝負がつくまで行う。
また、3人同時ではなくそれぞれ順番にじゃんけんをした場合、誰か一人でも勝てる確率は上記の場合と同じですか?

626 :132人目の素数さん:2007/08/04(土) 06:10:42
>>624
heteroscedasticityの話か。GLSは?

627 :132人目の素数さん:2007/08/04(土) 15:41:25
>>624
意味分からん。残差と何の相関が高かったの?
データには単なる独立なサンプル?それと時系列とかの構造が入ってる?

628 :132人目の素数さん:2007/08/04(土) 17:04:44
>>624
残差(residual)と回帰後の y の相関でしょう。
理論では、residualは 独立かつランダムな散らばりでなければならないのに、yと相関が高かったと。

独立変数で平方根をとるなどいじってもダメかな。
俺も勉強中だが、計量経済のスレに行った方がいい気がする。しかし、この先は理論づくしかと。

629 :628:2007/08/04(土) 17:05:15
アンカー間違えた、>>627

630 :132人目の素数さん:2007/08/04(土) 17:24:27
>>628
「決定係数」と「非決定係数」についてお勉強しようね

631 :628:2007/08/04(土) 17:47:00
>>630
見当違いも甚だしいww

632 :132人目の素数さん:2007/08/04(土) 17:55:20
ヒントもわからないほど無知な 628 哀れ

633 :132人目の素数さん:2007/08/04(土) 18:07:56
>>631
俺を偽装する意図は何だ??俺は626=628=629だけだ。

>>630
それってまさに俺が626と628で説明したheteroscedasticityに行き着く話なんだけど。

>>624
xの選び方も、余地があるなら考えた方がいいかも。

634 :132人目の素数さん:2007/08/04(土) 18:21:12
>>633
GLMでいいだろ

635 :132人目の素数さん:2007/08/04(土) 18:24:47
>>634
???なんだそれ???wwwwww

GMMとGLSなら知ってるけど。

636 :132人目の素数さん:2007/08/04(土) 18:25:33
>>634開発の新たな推定方法GLMについて、以下続く。

637 :132人目の素数さん:2007/08/04(土) 19:31:16
>>636
本気でGLM推定とか言ってんの?
OLS推定が主に使われるGneral Linear Modelっつーフレームワーク知らねーんだ?


638 :132人目の素数さん:2007/08/04(土) 19:52:37
今度は新しい単語を開発w

639 :132人目の素数さん:2007/08/04(土) 20:06:46
まあ >>624 が言ってることを、意味が通じるように解釈すると、
 『「残差の二乗」と「説明変数群」との「重相関係数 R」または「決定係数 R^2」が大きい』
でないの?検定だとブルーシュ・ペイガンとかホワイトね。

何も考えずに回帰すると、普通に起きるけど、
散布図を参考にしながら適当な非線形変換を考えてやれば良いだけ。

基本的には、数量関係の良い近似式を探す問題で、統計学はその補助的ツール。
補助的ツールが答えを見つけてくれるわけじゃない。見つけるのは自分。

640 :638:2007/08/04(土) 20:38:48
>>639
意味が通じてないよw

641 :639:2007/08/04(土) 20:53:15
>>640
俺は、夏厨スレになってるから、そもそもの >>624 に話を戻しただけ。
意味も知らずに GLM とか喚いてる厨とは別の厨w

642 :638:2007/08/04(土) 21:06:09
>>641
>意味が通じる様に解釈すると

って言ってるけど、キミの解釈ははちゃめちゃだよって言ってるんだけどwww

643 :639:2007/08/04(土) 21:15:23
夏真っ盛りのようで・・・さて秘所に行くとするか

644 :132人目の素数さん:2007/08/04(土) 21:29:57
>>643  消えろボケ

645 :624です。:2007/08/05(日) 00:45:37
これ、残差を逆に利用できませんか?
yの値が増加すれば、残差の二乗が均一ではなく、増加傾向なんです。
だから、残差の値からyを推定するという考え方は間違っているでしょうか?

>>627
1.データは製造条件(○○寸法、○○電圧等)です。
2.時系列データは入っていませんが、○月○日に作った製品の製造条件という意味では入っています。

>>628
はいその通りです。

>>633
xの選び方についての工夫とは、
残差と相関ができる原因の変数を除去するということでしょうか?

>>639
>散布図を参考にしながら適当な非線形変換を考えてやれば良いだけ。
なるほど、一つ一つ散布図を確認して、
残差とyが無相関になるように工夫するという意味ですね。

646 :624です。:2007/08/05(日) 01:03:18
>>645
>これ、残差を逆に利用できませんか?
>yの値が増加すれば、残差の二乗が均一ではなく、増加傾向なんです。
>だから、残差の値からyを推定するという考え方は間違っているでしょうか?

その分誤差が大きいことに気づきました。無理ですね。自己解決。

647 :132人目の素数さん:2007/08/05(日) 02:42:29
>>645
1.実際値 y と、この回帰式との誤差は、標準偏差で 2cm です。
  でも y の値が大きくなると誤差の絶対値も大きくなる傾向が・・・
2.実際値 y と、この回帰式との相対誤差は、標準偏差で約 1% です。
  回帰式の値が大きくなると誤差の絶対値も大きくなる傾向がありますが、
  相対誤差の程度(標準偏差)はほぼ一定です。

上の2のような結果が得られる線形回帰モデルを式で表せ。

648 :132人目の素数さん:2007/08/05(日) 10:00:24
主成分分析で質問です。

相関係数行列で固有ベクトル、固有値を求めました。
因子負荷量を
1、λの平方根と係数の積から求める
2、相関係数を直接求めていく
の二通りでやったのですが、値が一致しません。

はっきり言って、説明不足で何を言ってるのかわからないとは思います。
もし、言ってる事が分かる方がいれば、何か助言を下さい。

649 :132人目の素数さん:2007/08/05(日) 10:51:39
>>648
どうして一致すると思うのか説明してみ。
ヒント 相関係数行列の固有ベクトルと固有値の関係


650 :624です:2007/08/05(日) 13:46:17
製造分野のデータには、動特性
(0点比例関係、ばらつきも、値が大きくなるにつれて大きくなる)
ものが大半です。
ばらつきの指標SN比=log10(m/σ)^2が使われます。

このようなデータを回帰分析で扱う場合はどのような変換をかければよいのでしょうか?

651 :132人目の素数さん:2007/08/05(日) 15:03:41
>>650
私物化する気か?
しつけーんだよ。

652 :132人目の素数さん:2007/08/05(日) 16:10:26
>>649
わからないっす・・・
出直してきます(>_<)

653 :132人目の素数さん:2007/08/05(日) 17:17:19
いや気長に待て。
やさしい人が答えてくれるよ。

654 :132人目の素数さん:2007/08/05(日) 19:57:17
答えがわかってたら、とっくに教えてるよ。
恥ずかしながら、わからないんだよ。
許してくれ。

655 :132人目の素数さん:2007/08/05(日) 22:15:55
教えてください。
Excelで,マン・ホイットニーのU検定や,ウィルコクソンの符号付順位和検定をする方法はあるのでしょうか?
標準では入っていないアドインを入れないと出来ないでしょうか?


656 :132人目の素数さん:2007/08/06(月) 00:16:56
どなたかSTATAに詳しい方いらっしゃいますか?
CLARIFYについてお聞きしたいのですが・・・。
期待値を求める場合
ロジットモデルlogit y x1 x2...の前にestsimpと打つと書いて
あるのですが、logitの頭にxi:がついている場合はこれは
外すと考えてよいのでしょうか。
宜しくご教授ください。



657 :132人目の素数さん:2007/08/06(月) 08:59:52
estsimpは私の使ってる Stata 9には入ってないのでわかりません。
期待値を求める?ためのコマンドではないような。ヘルプを見ましょう。
xiは、i.variableのような使い方をする時に必須なんですがね。

658 :132人目の素数さん:2007/08/06(月) 14:49:21
年齢と理想のライフコースの関連を検討するときに用いる分析方法って
何をつかえばいいのでしょうか?

659 :132人目の素数さん:2007/08/06(月) 22:11:34
>>650
田口博士が考案した式だね。
統計を知った上で、統計において分布を仮定してる時点で実用的ではないと指摘したとか。
統計学の書籍も書いていたような。
製造分野では、製品一つ一つの品質保証が重要。
物理量をエネルギー(エントロピー)の次元に変換して加法性をもたせる。
しかしエントロピーは計算がややこしいため簡易式としたのがその式だよ。

等分散性(動特性)を式に盛り込みばらつき量を評価している。

統計学ではなく品質工学を勉強した方がいいかもよ。

660 :132人目の素数さん:2007/08/08(水) 08:23:14
統計モデル構築するときに、変数を増減してモデルを決めると
思うんですが、そのときにそれぞれのモデルに含まれる
観測数が一緒になるというのは大前提なのでしょうか?
自分がやっているモデルだと、変数を増減するごとに観測数が
変わってしまうのですが、これはそれまでのデータ処理に
問題があったっていうことなんですかね・・。
超基本な質問ですみませんです。

661 :132人目の素数さん:2007/08/08(水) 08:37:37
>>660
そうじゃない。変数によって観測値が変わるのは当然だよ。

662 :132人目の素数さん:2007/08/08(水) 08:52:20
>>661さん
レスありがとうございます。
言葉足らず(というかあやまり)でした。すみません。
観測数というのはそのモデルにあてはまるサンプル数(observed number と
表示されています)のことなんですが、それも変数によって変わるもの
なんでしょうか?

663 :132人目の素数さん:2007/08/08(水) 09:00:59
>>661
観測値ではなく観測数とおっしゃっているようですが、…。
>>660
ある変数は1時間ごとに測定し、ある変数は2時間ごとに測定するとか
欠測値があるとかかな?モデル選択をしようと思っている統計ソフトが
欠測値に対応しているなら観測数が変化しようともそのまま計算してくれる
と思うけど。

664 :132人目の素数さん:2007/08/08(水) 09:19:52
>>663さん
ありがとうございます。
指摘いただいた点を調べたところ、
欠損値の問題のような気がしてきました。
ちなみに今使っているソフトは欠測値には対応してなさそうです。
こういうときは観測数を無視してモデル選択するしか
ないんでしょうかね・・。

665 :132人目の素数さん:2007/08/08(水) 09:33:50
>>660
>>662
どんな統計モデルか少し具体的に書いてくれ

666 :132人目の素数さん:2007/08/08(水) 09:44:28
>>665さん
多項ロジスティック回帰モデルを使おうと思っています。
従属変数が収入の“レベル”(金額ではないです)
を示すカテゴリーデータで、独立変数に教育、性別、
年齢などを入れたいと考えています。
・・・こんな感じでいいんでしょうか?
もし的外れだったらすみません。。。


667 :132人目の素数さん:2007/08/08(水) 09:53:17
共分散

Σ(X-E[X])(Y-E[Y})
これって
(ΣXY)-(ΣX)*(ΣY)
と同じですか?

668 :132人目の素数さん:2007/08/08(水) 16:21:11
共分散 ≠ Σ(X-E[X])(Y-E[Y}) ≠ (ΣXY)-(ΣX)*(ΣY)

669 :教えて下さい。:2007/08/13(月) 19:07:24
心理のツール(質問紙)を作成する時に、
いくつかの項目で「天井効果」が出てしまいました。
天井効果が出るような項目を、統計処理しても
正しい値が出ない?

670 :132人目の素数さん:2007/08/13(月) 19:59:38
なにをもって「正しい値」と言っているかしらないが
統計処理が難しくなることは確か。

671 :132人目の素数さん:2007/08/13(月) 20:42:17
天井効果ということばを知ってる時点でどうすべきかも知っているはず。

672 :教えて下さい。:2007/08/13(月) 21:56:09
同じ質問紙を時間をおいて調査したら、
最初より、二回目の方が点数が高くなってしまって、
二回目に調査した時にはほとんどの項目で天井効果が出ているのです・・・。
これって、差を検定するのにT検定じゃ無理だよね?
相関を見る時、どの方法を使えばいいの?

673 :132人目の素数さん:2007/08/13(月) 22:04:31
>>672
検定する前に調査の妥当性について検討したら?


674 :教えて下さい。:2007/08/13(月) 22:14:38
アメリカで作られたツールを日本語訳したのですが、
アメリカのデータも天井効果になっているみたい・・・。

こまったなぁ〜・・・
どうしよう。夏休み中にまとめなきゃいけないんだけど、
統計に詳しい人いないのですぅ。(涙)

675 :教えて下さい。:2007/08/13(月) 22:15:23
ノンパラで検定するというのは有り?

676 :132人目の素数さん:2007/08/14(火) 05:10:05
>>672
2変数の相関を見たいなら、
Spearman あるいは Kendall の相関係数を使えばよいのでは。

677 :教えて下さい。:2007/08/14(火) 06:46:42
>>676
どうもありがとうございます!

678 :132人目の素数さん:2007/08/14(火) 21:31:52
Rでガンマ分布にあてはめてGLMを行う際のリンク関数について不明な点があります。
デフォルトではinverseが当てはめられていますが,logを使ってもいいですよね。
AICや残差に違いはありません。
これは他の分布でもいえることと思うのですが,この際リンク関数を選択する場合には何を基準にしたらよいのでしょうか?



よろしくお願いします

679 :132人目の素数さん:2007/08/20(月) 04:51:14
√(xy+yz+zx)/3 などの相加平均と相乗平均の間にある平均に名前はついているのでしょうか?

680 :132人目の素数さん:2007/08/20(月) 12:09:31
>>679
算術平均。

と適当なことを書いてみました。

入試問題としてこのような問題文を書いたら間違いなく叱られる。
意味不明です。

681 :132人目の素数さん:2007/08/20(月) 12:12:20
算術平均(arithmetic mean)は相加平均と同じ

682 :132人目の素数さん:2007/08/20(月) 14:27:54
√(xy+yz+zx)/3 が間にあるとは全然思わないが、
冪乗平均(m-乗平均)や一般平均とかのことか??

683 :132人目の素数さん:2007/08/20(月) 14:31:48
>>679
あんまりいい記事じゃないが
http://en.wikipedia.org/wiki/Mean
でも見て来い。
ちなみに、日本語版はもっと酷いから、見ない方がいい。

684 :132人目の素数さん:2007/08/20(月) 14:58:36
>>683 Elementary symmetric mean ってのみたいです。

Elementary symmetric mean -
http://en.wikipedia.org/wiki/Elementary_symmetric_mean

Newton's inequalities - Wikipedia, the free encyclopedia
http://en.wikipedia.org/wiki/Newton's_inequalities

MacLaurin's inequality - Wikipedia, the free encyclopedia
http://en.wikipedia.org/wiki/Maclaurin%27s_inequalities

685 :132人目の素数さん:2007/08/21(火) 01:15:55
推測統計学の特に点推定について、一般化最小二乗法など各種パラメータ推定法について説明した書籍や文献はないでしょうか?
ご存じの方がいましたら教えて下さい。

686 :132人目の素数さん:2007/08/21(火) 18:54:21
正規分布が仮定される10個程度のデータ中にひとつだけ飛びぬけた値があって、外れ値かと思ってグラブス・スミルノフ検定をやったら確かに省いてよいことになりました。
でも、ちょっと気になってこの10個のデータで1標本KS検定をやっても正規性は否定できませんでした。
外れ値を省いた9個のデータが正規性を示すことはわかるのですが、GS検定で外れ値と分かったものを含んでもなおKS検定で正規性が否定できないのはどういった理由からでしょうか?

687 :132人目の素数さん:2007/08/22(水) 06:05:34
スミルノフ・グラブスとコルモゴロフ・スミノフじゃ全然方法が異なるから、
結果が異なっても別に何もおかしくないんじゃないの?
それとも何か結果が一致しなきゃいけない理由があるの?

ついでにスミルノフ・グラブス検定で棄却されたら
その値を除いてもいいなんていう理論はないと思うけど。

688 :132人目の素数さん:2007/08/22(水) 10:10:37
>>687
両方とも正規性を前提にしているんじゃないの?

689 :687:2007/08/22(水) 12:33:20
>>688
そうだけど、統計量の構成の仕方が違うでしょ。
SG検定は、パラメトリックに、ある観測値が異常値かを検定してる。
一方KS検定は、経験分布関数全体をノンパラで検定してる。
私はその分野に詳しい訳ではないが、同値な検定には見えない。

690 :132人目の素数さん:2007/08/22(水) 12:56:33
>>689
なるほど。なのでKSの方がパワーレスなのか。

691 :132人目の素数さん:2007/08/22(水) 15:57:55
統計関係の雑誌のランク付けというか好みの傾向とかまとめてるところないでしょうか?

692 :132人目の素数さん:2007/08/22(水) 16:07:22
Econ journal ranking から econometrics に関係するものを抜き出せ。傾向なんか知らん。

693 :132人目の素数さん:2007/08/22(水) 17:24:40
カイ二乗検定や、G検定等の検定方法について質問です。
netと買った本だけで独学を始めたばかりなのでよくわかっていません。
あまりにバカな質問なのかもしれませんがお許しください(つД`;)

1)2x2分割表であらわせなく、かつ期待値が小さい場合にはG検定を使う方が良い
この理解であっているのやら間違っているのやら、、、。

2)G検定の式はG=博タ測値ln(実測値/期待値)
これで正しいのでしょうか・・・?(Wikiに書いてあったものを鵜呑みです)

3)ln(実測値/期待値)とは、log(実測値/期待値)だと思うのですが
 実測値が0の場合、実測値/期待値=0で、log0の計算が
 うまいことできないと思ってしまいます。
 これはどのように解決すれば良いのでしょうか?

以上。。。無知すぎて遅々として進まないのですが、どーにかしたい
あがく者からの質問でした〜。


694 :132人目の素数さん:2007/08/23(木) 02:52:41
>>691
こんなサイトもある。信頼性は知らん。
http://www.alba.edu.gr/survey/Ststns/

695 :132人目の素数さん:2007/08/23(木) 21:07:05
相関係数について質問があります.

3変数x, y, zがあったとして
xとyの相関係数,xとzの相関係数が既知のとき,
yとzの相関係数というのは一意に定まるのでしょうか?

よろしくお願いします

696 :132人目の素数さん:2007/08/23(木) 21:56:51
T検定のやり方を教えて下さい。
頭は良い方ではないので、わかりやすく説明していただければ嬉しいです。
よろしくお願いします。

697 :132人目の素数さん:2007/08/23(木) 21:59:56
>>695
定まらない。コインを3回投げるくらいで簡単に反例が作れる。

698 :132人目の素数さん:2007/08/23(木) 22:01:51
>>696
自分で調べようとせず、頭が良くない人に掲示板で説明するのは無理。

699 :132人目の素数さん:2007/08/23(木) 22:29:34
698→様々なサイトを見て回った結果、理解できなかったのでここに頼ってみました。
再度、お願いします。

700 :132人目の素数さん:2007/08/23(木) 22:37:14
>>699
無理。あきらめろ。

701 :132人目の素数さん:2007/08/23(木) 22:46:15
別に、あなただけに聞いているわけではないから

702 :132人目の素数さん:2007/08/23(木) 23:01:47
さまざまなサイトを見てわからないのに
ここで聞いて分かるという発想が理解できんな

703 :132人目の素数さん:2007/08/23(木) 23:14:09
器小せぇな
ま〜期待はしていなかったがな

704 :132人目の素数さん:2007/08/23(木) 23:55:48
>>693
1)G検定でも必ずしも適当とは言い切れないが、まぁその理解でもいいと思う。
2)2が抜けてる
3)lim[t→+0]tlogt=0なので0で計算する。エントロピーと一緒。
log(実測値/期待値)の前に乗じてある(実測値)が重要。

705 :132人目の素数さん:2007/08/25(土) 15:05:21
>>696
まず先にt検定をどんなデータに使うか説明してみてくれよ。

706 :132人目の素数さん:2007/08/25(土) 18:35:03
>>703
器の問題じゃないし。ヴァカに手取り足取り教えるのは掲示板では無理。
リアルで手取り足取り教えてくれる人がいないお前は、かなり悲惨そうだな。
まずは友達作る能力を身につけることからお勧めする。

ほんとうに不愉快な人間だな。


707 :703:2007/08/26(日) 04:06:21
>>706
お前の方がもっと不愉快な人間だぜ。分かんねの?

708 :132人目の素数さん:2007/08/26(日) 12:39:53
>>703
通りすがりのものだが、
教科書にいくらでも詳しい説明が載ってることを
掲示板で聞くのはどーかと思うよ。

もっと言えば、実世界で聞く場合でも、
説明を読んだ上でどの部分が分からないのかくらいは
はっきりさせておくべきだろう。

709 :132人目の素数さん:2007/08/26(日) 14:14:30
>>708
いいじゃねーかよ。たかが掲示板。答えてくれる香具師だって出てくるさ

710 :132人目の素数さん:2007/08/26(日) 14:54:35
この空気で答えたら顰蹙物だけどな

711 :132人目の素数さん:2007/08/26(日) 16:00:53
>>696
>T検定のやり方を教えて下さい。

1. 仮説下で t 分布にしたがう検定統計量の値を計算する。
2. その検定統計量の自由度を計算する。
3. 【お勉強】 テキストの t 分布表で自由度に対応する行を見る。
  【実際】 自由度、検定統計量の値に対応する P値 を計算する。
4. あとは普通の検定手順。

以上//

712 :132人目の素数さん:2007/08/26(日) 23:43:45
はき古しとまでいかないけど
そんなパンツより、新品のパンツで挑んだほうがいいんですか
新品のパンツだとしてユニクロの安いパンツで構わないんですか

あとちん毛ボーボーでもいいですか?
少し剃った方がいいんでしょうか

統計学の方は他の場所で統計取って自慢し合ってください

713 :132人目の素数さん:2007/08/29(水) 09:32:26
JRSSBのエディターに

もし載せるチャンスをもちたいなら、ここ直せ

でrejectされたのですが
直した内容で再投稿するべきか、
もっとランクを落とした雑誌に投稿すべきか
悩んでます

ちなみにすでに任期なしの職にはついていますが
来年から雑用が大量にくると聞いています

714 :132人目の素数さん:2007/08/29(水) 10:20:33
わざわざ指摘されたってことはいい兆候ではないのか?

715 :132人目の素数さん:2007/08/29(水) 15:03:30
confidence band とconfidence intervalの違いって何ですか?

716 :132人目の素数さん:2007/08/30(木) 08:58:01
confidence interval は、true parameter (あるいはその関数)
に対する信頼区間、
confidence band は、モデルで想定している誤差項を含んだ
信頼区間を指すのでは?

例えば、正規分布に従うX の平均 μ=EX を推定したいとして、
X の観測値が100個あって、平均が5, 標準偏差で3だとすると、
大雑把に言って
μの95% confidence intervalは、(5-2*3/10,5+2*3/10) = (4.4, 5,6)
(注:2標準偏差=95%信頼区間, 10は観測数の平方根),
Xの95% confidence band は、(5-2*3, 5+2*3) = (-1, 11)
になるのでは?




717 :713:2007/08/30(木) 11:17:50
>>713
>>714
ありがとうございます
レジェクトされた論文をランクを落とした雑誌に投稿後に
レビューアにいわれた追加実験を加えたものをJRSSBに再投稿
というのはありなのでしょうか?

前回との差分が減るのでかえってレジェクトされやすくなるだけでしょうか

718 :132人目の素数さん:2007/08/30(木) 12:17:45
知らんがな、自分で考えろ、って感じだけど、
何故再投稿を躊躇しているのか良く分からん。
常識的には、アドバイス貰って直して他にだけ提出・・・というのは道理が通らないと思うが。

719 :713:2007/08/30(木) 13:58:16
知人に相談したところ
editorの段階でrejectされただけなので望み薄といわれました

まあどんなrejectでも理由は書くよね


720 :132人目の素数さん:2007/09/01(土) 07:13:04
ロジスティック回帰についての初心者向けの本、もしくはウェブページで何かいいもの
はないでしょうか?

721 :132人目の素数さん:2007/09/01(土) 08:38:06
>>720
ググったかい?

722 :132人目の素数さん:2007/09/04(火) 08:40:32
editorにrejectされたってことは、指定の論文スタイルに則ってないってことでしょ。
まずそれが直せなきゃ、採択も何もありませんがな。


723 :720:2007/09/06(木) 06:03:34
はい。ロジスティック回帰の本ってかなり少なくないですか?
あるとしてもとてもむずかしいものしか。wikipediaに掲載されていたウェブページで
ざっと分かった感じなんですけれども、もう少し数学的に詳しく知りたいなと

724 :132人目の素数さん:2007/09/06(木) 12:12:19
>>723
generalized linear model についての本を見れば載ってるだろ。
logistic modelだけでいいなら、
計量経済分析の方法(マダラ)なんかにも簡単な説明は載ってる。

725 :132人目の素数さん:2007/09/06(木) 21:19:05
すみません。こんなところにおじゃやまして。
専門家の方がいらっしゃるので投稿してしまいました。

先生から次の問題を出されたのですが、答えは正規分布と言われました。
なぜだか教えてくれないのですが、この問題は簡単ですか?難しいですか?




じゃあ手元の統計の教科書から基本事項を一問。

P(X≦x)=∫(-∞→x)exp(-t^2/2)/√(2π)dt
変量xが上の式を満たすときxは何に従うでしょう。

726 :132人目の素数さん:2007/09/06(木) 23:42:09
>>725
正規分布の定義どおりなんだが。。。

727 :132人目の素数さん:2007/09/06(木) 23:45:28
>>725
受験板に帰れよ。

728 :132人目の素数さん:2007/09/07(金) 10:32:52
分布関数 F(x)=P(X≦x) が右連続であることは
定理(前提から証明される)でしょうか,
それとも規約( F(x)=F(x+)と決める)でしょうか。
手元の(初級・中級)本ではよく分かりませんでした。
よろしくお願いします。

729 :132人目の素数さん:2007/09/07(金) 10:51:41
>>728
定理だろ。P(X≦x +1/n) は n → 無限大のとき、
P(X≦x) に収束することが可算加法性から導かれるはず。


730 :132人目の素数さん:2007/09/07(金) 11:24:19
>>729
やはりそうですか。手元の本(*)でも,F(x)=F(x+) がまず
証明してありました。ただ,私の数学力(文系)では,
同じような論法(というのが怪しいですが)で F(x)=F(x-) も
証明できてしまうのではないかと思えて悩んでおりました。
ネットを探索していたら,規約であるように書いてあるサイトを
見付けて,さらに戸惑っていた次第です。
http://aoki2.si.gunma-u.ac.jp/lecture/Bunpukansu/seisitu.html

* DeGoot&Schervish, Probability and Statistics
ちなみに上で書いた「初級・中級」というのは
あくまで文系初心者向けのテキストとして,という意です。

731 :132人目の素数さん:2007/09/07(金) 15:09:11
関係ないけど、「お受験数学が苦手(または不勉強)」という意味で
「文系」と言うのはやめれ。定理か規約かを気にしている点で十分
数学マインドを持ってるんだから。

732 :132人目の素数さん:2007/09/07(金) 16:00:31
>>725
難しいか難しくないかの問題ではなく、この問題を出した先生は統計学がわかってるの?


733 :132人目の素数:2007/09/07(金) 22:43:26
まあまあ。
確かにこんな先生に教わっている学生さんも可愛そうだが、最近は大きな書店に行けばよい入門書はあるし、インターネットでもよい本は買えるんだから、こんな所で聞かずに本買って勉強する事を薦めるよ。


734 :132人目の素数さん:2007/09/07(金) 23:05:51
>>731
同意。

735 :729:2007/09/07(金) 23:22:41
>>730
F(x) = F(x-) は成立しない。
もちろん、凡例は P(X=a) > 0 となるようなaが存在する場合、
ということになる。

F(x)=F(x+) と同様に証明できない理由は不等号の向きにある。
例えば、F(x-)は定義より、P(X≦x-1/n) のn→無限大のときの
極限であるが、これは P(X<x)であってP(X≦x)ではない。

リンクについては、確率変数を用いずに「分布関数」を定義
してるから、確率論的な構成とは言えない。


736 :729:2007/09/07(金) 23:24:11
「凡例」→「反例」

737 :132人目の素数さん:2007/09/08(土) 12:18:06
>>730
定理か定義かは議論の展開がどういう枠組みに沿っているかによるとおもうぞ。

738 :132人目の素数さん:2007/09/08(土) 12:20:11
>>732
「問題」としてだしたのではなく、
本当に基本事項の「確認」として
だしたのかもしれんぞ。
質問者があまりにもバカすぎる。

739 :132人目の素数さん:2007/09/08(土) 12:39:56
>>738
なんでお前の憶測をもとに質問者をバカ呼ばわりするんだよ?
ふざけるな。こういうヤツはほんとにムカつくな。消えろ。


740 :132人目の素数さん:2007/09/08(土) 12:44:39
>>739

一文目は憶測だが、二文目は>>725から従う事実で憶測じゃない。
もしかして一文目と二文目が繋がってると思ったのか?
もしそうなら、お前も相当バカってことになるが。

741 :132人目の素数さん:2007/09/08(土) 12:46:17
>>739
>>732>>733は「先生」をバカ呼ばわりしてるわけだが、
それにはなにも言わないのか?

742 :728:2007/09/08(土) 14:11:48
>>731 >>734
失礼しました。
とりあえず自分の数学レベル(大学で数学の
トレーニングを受けていない)を表すのに
つい「文系」というラベルを使ってしまいました。
テキストについて言えば,微積分と線形代数の最初歩だけを
使って説明している(測度論等を使わない)という意味でした。

>>735
ありがとうございます。
重ねて申し訳ないですが:
ynが上からxに近づいていくときは
 {X≦x}=∩(n->∞){X≦yn}
となるのに,
ynが下からxに近づいていくときは
 {X<x} = ∪(n=1->∞){X≦yn}
にしかならないのは,直感的にいうと,
ynが上から近づけば {X≦yn} によって {X=x} もカバーできるが,
下からだと {X≦yn} ではついに {X=x} をカバーできない,という感じでしょうか。

>>737
つまり>>735さんが言うように,確率論的な構成を
とっているかどうかで変わってくるという理解でいいでしょうか。
上記のテキストは,Random Variables and Distributionsという
章で,まずrandom variableを関数として定義して,次にその
分布関数を説明するという流れでした。

長文すいません

743 :132人目の素数さん:2007/09/08(土) 14:38:39
>>742
直感的というか、論理的にそうにしかなれない。
↓は参考になるかもしれない。
http://ja.wikipedia.org/wiki/%E5%92%8C%E9%9B%86%E5%90%88
http://ja.wikipedia.org/wiki/%E7%A9%8D%E9%9B%86%E5%90%88

744 :132人目の素数さん:2007/09/08(土) 14:52:57
>>739
本人がバカだからに決まっておる。

745 :132人目の素数さん:2007/09/08(土) 16:25:12
>>728の彼は彼なりに問題があってレスをしている。その彼の質問に対してのレスを
悪意無しにつける人もそれなりに居る。そんな中で>>739みたいな発言って確かに
気分悪いですよね。どんな意図であれこう言う発言しちゃう人って性格が歪んでるんだろう
なって思う。どんなレベルだろうといいじゃない。質問者と回答者がいれば健全なスレを
保てるんだから。口は悪いけど>>739の気持ちは分からなくも無いよね。上から目線で水を
差す様な発言をする人って醜いね。まあこんな事言っても分からないんだろうけど

746 :132人目の素数さん:2007/09/08(土) 16:51:30
馬鹿にはわからないから言っても伝わらないだろうな。

747 :132人目の素数さん:2007/09/08(土) 18:27:05
だから馬鹿と言い出した>>738も馬鹿なんだよ。あの馬鹿め。
まあ馬鹿には分からないだろうが。

748 :132人目の素数さん:2007/09/08(土) 19:31:05
>>742
735じゃないけど、「カバーする・しない」の意味が曖昧。
問題にしてるのは分布関数 F(x) の上半連続性だから、F(x) の値で考えないと。

つまり
>ynが下からxに近づいていくときは
> {X<x} = ∪(n=1->∞){X≦yn}
この時、
 F(x) > lim(n=1->∞) F(yn)
となるような不連続点 x が「ありうる」ということ。
一番簡単な例は、F(x) = 1 (x≧0)、F(x) = 0 (x<0) で x=0 の場合。

749 :749:2007/09/08(土) 21:58:26
7=√(49)


750 :132人目の素数さん:2007/09/08(土) 22:03:16
>>739
お前質問者だろ。数学板には来るなと受験板で言ったはず。こいつは受験板で散々叩かれたバカな荒らしだよ。質問もこいつ自身の先生からじゃない。

751 :132人目の素数さん:2007/09/08(土) 22:25:00
>>750
ちげーよボケ。こいつ何勘違いしてんだよ。ガキはおとなしく受験勉強してろよ。

752 :132人目の素数さん:2007/09/08(土) 22:37:11
荒れるから消えろよ。

753 :132人目の素数さん:2007/09/08(土) 23:26:39
>>745
もしかして>>728じゃなくて>>725かな?文脈的に。。。
あんまりこのスレでこういうことは言いたくないんだけど
>>738は正直な感想だと思う。一般的に本読めば普通に分かることだし。
ただそれ以前に>>725はただの受験板の煽りをこの板にもってきただけ。
http://ex23.2ch.net/test/read.cgi/kouri/1186502228/l50
このスレ>>327以降の流れ見れば実にくだらないことだと分かる。
バカバカしくて本当はこんなクソスレ晒したくないんだが、
このままだと何も知らない人が>>725の質問にレスしちゃいそうで、
荒れる。この質問はスルーでいいと思う。

754 :132人目の素数さん:2007/09/09(日) 00:00:33
荒らしとかはどうでもいいから自然言語処理の衰退ぶりをなんとかしてくれ。
プログラム板にスレがあるんだが過疎りすぎ。統計学の力でなんとかしてくれ頼む。

755 :132人目の素数さん:2007/09/09(日) 01:12:55
753のスレッドに行ってみたが、見るに耐えない幼稚な喧嘩だな。
それがここに持ち込まれて荒れたようだ。
厳重に注意しておいたよ。これからは荒らしはスルーにしよう。

756 :132人目の素数さん:2007/09/09(日) 05:49:15
>>753
こんなクソスレに居る香具師は大して変わらんよ。お前もその1人だと言う事を忘れんな

757 :748:2007/09/09(日) 09:11:55
>>742
スマソ、読解間違い。それで正しい。
要は「∩ or ∪ 集合が要素 x を含む/含まない」で決まる。

y1 > y2 > … > x で yn → x (n→∞) なら
(a) P( ∩ {X≦yn} ) = lim P(X≦yn) = P(X≦x) = F(x)

y1 < y2 < … < x で yn → x (n→∞) なら
(b) P( ∪ {X≦yn} ) = lim P(X≦yn) = P(X<x) ≦ F(x)

(a)(b) は↓のTheorem1.1から得られる。
http://www.math.kobe-u.ac.jp/HOME/higuchi/h18kogi/prob1-3.pdf
全内容 http://www.math.kobe-u.ac.jp/HOME/higuchi/h18kogi/h18prob1.html
                          

758 :754:2007/09/09(日) 11:03:06
>>755
俺の単発レスと荒らしを結び付けて被害妄想されても……
そうかこれがKingに代表される数学板クオリティというやつか……

759 :754:2007/09/09(日) 11:17:29
ごめんなさいレスアンカーを見間違えました。最初からスルーされてました…。
数学板住人が全員King氏であるかのような書き込みをしてしまいすみません。
我々はKingだ。お前たちを同化する。抵抗は無意味だ。というフレーズが脳裏をかすめただけなんです。
本当にすみません。

760 :728:2007/09/09(日) 20:29:42
>>743 >>757
飲み込めた,ような気がします。
神戸のリンク先は腰を落ち着けて読んでみます。
お世話になりました。

761 :132人目の素数さん:2007/09/10(月) 09:21:09
>>745
>>728>>739は別の流れだとおもうが。

762 :132人目の素数さん:2007/09/10(月) 10:38:29
>>761
お前まだちゃちゃいれてーの?しつけー

763 :132人目の素数さん:2007/09/10(月) 23:20:55
>>723

基本的に「最尤法」の範疇なんで、「ロジスティック単独の」本となるとなかなか無いのが現状だとは思います。

>もう少し数学的に詳しく知りたいなと

ここですね。
実際の分析過程なのか、それとも最尤法の数学的な話なのか。

異論もあるかもしれませんが、ホントに優しい初心者向けのロジスティック回帰の解説本とすると、

マンガでわかる統計学-回帰分析編

がいいと思います。

>ざっと分かった

と言ってもどの程度なのかイマイチ分かりませんし、(と言うのもざっと分かったならあとは使ってみればいいだけ、だと思うんで)、
試しに目を通してみて下さい。




764 :132人目の素数さん:2007/09/10(月) 23:24:04
荒らしはスルーで。

765 :132人目の素数さん:2007/09/10(月) 23:26:11
764は761に対してね。

766 :132人目の素数さん:2007/09/11(火) 04:34:51
>>763

ロジスティック回帰だけで、本一冊分も書くことあるか?
単なるgeneralized linear model の一部分のような気がするんだが。

あるいは、多項ロジスティックとか、ランダムエフェクト付きとか
そういう方向に進んでいくんだろうか。。。

767 :132人目の素数さん:2007/09/11(火) 07:54:48
すいません、ある本に載っていた問題なのですが、分らないことが
あります。質問させてください。

問題
あるエレベータ(11人乗り)の利用客の一人一人の体重の母標準偏差は、
σ=10Kgであることがわかっている。利用客の中から121人を選んで
調査したところ、標本の平均体重は65Kgであった。
信頼係数95%のもとでは、満員での総体重をどのくらいに見積もればいいか。
区間推定せよ。

解答は、(65×11)±1.96×(10/√11×11)という計算から、650.0≦μ≦780.0
となっています。
でもこれを、一人一人の体重の区間推定をしてから、その区間を11倍する
という方法で計算すると、
-1.96≦(65-μ)/(10/√121)≦1.96
となって、これを計算すると、
695.4≦μ≦734.6
となるんじゃないかと思うのですが、間違ってますでしょうか?


768 :132人目の素数さん:2007/09/11(火) 12:05:04
>>767
申し訳ないですが後半部分は意味不明です。
まずμは、11人分の体重の推定量?
それだったら、(65-μ)という部分は変だし。

それと、11人の体重の信頼区間は
1人の体重の信頼区間の11倍じゃありませんから。


769 :132人目の素数さん:2007/09/11(火) 12:25:40
>>768
11人分の合計体重の推定量です。

> それと、11人の体重の信頼区間は
> 1人の体重の信頼区間の11倍じゃありませんから。
どうして、そのようにすぐに11倍じゃないと分るのですか?


770 :132人目の素数さん:2007/09/11(火) 14:45:58
確率の問題集をやっていたら、二項分布の近似で正規分布が便利だという事を知りました。
平均値±標準偏差などは本当に便利だと思いました。

計算しないでわかるというのは本当にいいことですが、そもそもの計算方法はどういうものなんでしょうか。
平均値±標準偏差*1の範囲が全体の約68%だという事はどうやって計算すればいいのでしょうか?

平均値から80%を確保するには平均値からいくつの確保?が必要かなども計算方法がわかればとても便利ですよね。
どうぞ宜しくお願いいたします。


771 :132人目の素数さん:2007/09/11(火) 15:37:39
>>769
もうちょっとちゃんとちゃんと考えてから聞くべし。
11人の体重が独立として、その平均をとったら、
ある1人の体重よりばらつきが小さくなるでしょ。
直観だけでも、そういうことって分からないかな。

>>770
残念ながら、数値計算に頼るだけ。

772 :132人目の素数さん:2007/09/11(火) 16:31:07
>>769
だと
>-1.96≦(65-μ)/(10/√121)≦1.96
が意味不明。あと、平均を取ると1観測値より安定するのはなぜか?

>>770
絵付きで計算できるページ http://econom01.cc.sophia.ac.jp/stat/normprob.htm
Excel だと NormDist, NormInv 関数

773 :132人目の素数さん:2007/09/11(火) 20:41:27
>>766

>ロジスティック回帰だけで、本一冊分も書くことあるか?
>単なるgeneralized linear model の一部分のような気がするんだが。

僕も基本的にはそう思います。
ただ、ロジスティック回帰がポピュラーになる前、朝倉書店(だったかな?)が
丸々一冊使って「ロジスティック回帰」に付いてだけ、の本を出版してたと
思います。
今みたいにわりに当たり前になった状況と当時は違ってたんでしょうね。

774 :766:2007/09/11(火) 23:11:36
>>773
ググってみたけど、これのことかな↓
図書館に入ってるとかならともかく、
わざわざ個人の金で買う気はしないな。

ロジスティック回帰分析
―SASを利用した統計解析の実際 (統計ライブラリー) (単行本)
丹後 俊郎 (著), 高木 晴良 (著), 山岡 和枝 (著)



775 :132人目の素数さん:2007/09/12(水) 10:29:06
>>774

そうですね。それです。
僕もそれ高いしSAS用ですし、過去止めた経験があります(笑)。
それだったら東京書籍のExcel本の方がマシかな、と(笑)。

776 :132人目の素数さん:2007/09/12(水) 10:37:27
Agresti(翻訳)ではダメかの
一冊丸ごとロジ回帰ではないけど

777 :132人目の素数さん:2007/09/14(金) 09:11:00
分散を計算するとき、データ数がnとして、
(1) 1/n Σ(Xi-E[X])^2
(2) 1/(n-1) Σ(Xi-E[X])^2
の2つの方法がありますが、どうやって使い分ければよいですか?


778 :132人目の素数さん:2007/09/14(金) 18:35:36
>>777
E[X] がわかってる時に、(2)を使うのは見た事がない

779 :132人目の素数さん:2007/09/15(土) 00:45:22
手近に古いStatView5.0があったんで、
Kolmogorov-Smirnov検定で「正規性の検定」をやってみたんですけど
結果の見方がわからないんです。
・かなり正規分布のデータ→ p>.9999
・正規分布っぽいデータ→ p >.9999
・正規分布とは言えないデータ → p>.9447

同じデータをstatisticaのShapiro-Wilk検定でやると
・かなり正規分布のデータ→ p<0.9147
・正規分布っぽいデータ→ p <0.5515
・正規分布とは言えないデータ → p<0.0392
となるようです(web情報)。このpは正規分布と見なせる確率らしい。

StatViewのKS検定で表示されるpは、何でしょうか?
帰無仮説を「標本は正規分布である」とした場合の有意確率?
pが1近い値しか出ないので、違うような。。。
取説には、「有意な差がある場合(たとえばp<0.05)には正規分布ではない」
と書いてありますが、そういうデータを入力してもp>.9447となるのは何故?



780 :132人目の素数さん:2007/09/15(土) 02:15:02
>>779
Rにもks.test()という関数があってKolmogorov-Smirnov検定が
できるので同じデータで試してみたら?
データxの正規性の検定ならks.test(x,"pnorm")だよ。
それで結果のp値が異なるならStatViewは何か変なことをしている
と言うことだけは分かる。

781 :779:2007/09/15(土) 15:00:24
>>780
どうもです。Rを試してみます。

StatViewでKS検定をやったことある方がいらっしゃいましたら、
pの意味、教えてください。

782 :132人目の素数さん:2007/09/15(土) 15:23:08
  女性への性的虐待は許さない。!! 

足立区綾瀬で、少年A=横O祐O(当時 宮O)と少年C=ミOト伸Oは、
プラスティク工場からアルバイトを終えて帰る女子高生を自転車ごと
蹴り倒して誘拐、少年Cの自宅に40日間監禁し暴行して殺害しました。
少年Cの両親と兄は自宅2階での監禁を知っていましたが黙認しました。
少年Cは街で知合った仲間を自宅に呼び込み金を受取り、女子高生を暴行させたり
ヌードダンスを踊らせていました。彼女はどのような気持ちだったでしょうか?
女子高生の遺体の手足には焼かれたヤケドがあり、乳首は溶け落ち、
性器と肛門に異物が挿入され、栄養失調で痩せ細った体でした。
 「女子高生コンクリート詰め殺人事件」
   
ご存知かもしれませんが、この事件の副主犯、少年B=神O(旧姓はO倉)は
再び暴行・監禁事件を起こして服役していました。


783 :132人目の素数さん:2007/09/15(土) 17:43:34
統計学に関する質問をさせていただきます。

とある文系の大学院入試の過去問なのですが。。

(1)確率変数Xはある未知の平均値μ、分散が1の正規分布に従い、ある閾値θ以上のときにのみXの値が観察可能だとする。確率変数Xの値が閾値θ未満なら閾値を越えなかったということはわかるとする。このときθの最尤推定量を求めよ。標本数はnとする。

(2)Suppose Yi(i=1,…,n) are independent and each has the normal distribution with mean μ and variance 1. If we only observe the sign of Yi, show that one can consistently estimate μ.

以上の2問がわからなくて困っています。

(1)はθの尤度関数を求めてやっていけばよいと思うのですが 、それが求められません。

n個のうちk個が閾値θを超えたとして、確率密度関数をk個掛け合わせてみたのですが、これではθではなくμの関数になってしまうのでうまくいきません。

また、(2)は「Yiの符号を観察しさえすれば、μを一致推定できる」という主張そのものがあやしいような気がしてなりません。

わたしは統計に関してまったく無知なので、どなたかわかる方がいらしたら、教えていただけると幸いです。

784 :779:2007/09/15(土) 18:46:27
Rでやってみました。zは正規性のないデータ。yはほぼ正規性、xは正規性あり。

shapiro.text(x) ... p=0.8996
shapiro.test(y) ... p=0.5486
shapiro.test(z) ... p=0.03626

ks.test(x) ... p=0.9988
ks.test(y) ... p=0.9673
ks.test(z) ... p=0.5727

ks法のpの解釈法はどう考えたらいいのかな?
少なくともstatviewのks法のp値はおかしいことは確か。



785 :132人目の素数さん:2007/09/15(土) 23:08:15
>>784
StatViewは何かバグがあるのかもね。もう売ってないソフトのようだからどうしようも
ないけど。
正規分布関数と比較したのなら解釈は普通に正規分布に従うかどうかでいいと思う。
このデータに関してはKS検定の方が感度が低いということでしょう。
KS検定は分布形によらないので正規分布に特化した検定を行いたいなら
Shapiro-Wilk検定の方がいいと言えるな。

786 :132人目の素数さん:2007/09/16(日) 15:19:58
>>783
とりあえず(1)。
X_1,...,X_n を n 個のサンプルとし, 閾値を越えなかったものの数をm,
閾値を越えなかったものをそれぞれ Y_1, ..., Y_{n-m}, 尤度関数をL(θ)とする。
また、Φ(x)を標準正規分布の分布関数とする。
このとき、
L(θ) = Φ(θ-μ)^m * C (if θ≦min(Y_1,...,Y_{n-m}))
   = 0 (if θ>min(Y_1,...,Y_{n-m}))
ただし、C はθに依存しない X_1, ...., X_n の関数である。
したがって、Φ(x)の単調増加性より θ=min(Y_1,...,Y_{n-m})。

■ちなみに、尤度関数L(θ)を明示的に表したい場合、観測される変数のpdfを求める必要が
 あるが、観測される変数は実数上絶対連続でない(A:="閾値を越えない"という事象に
 point mass を持つ)ので、A∪[θ,∞) 上にσ-finite 測度 を設定する必要がある。
 しかし、どのようにこの測度を設定しても、上記のL(θ)は正しい。


787 :786:2007/09/16(日) 15:24:18
補足:m=n のときは、
θ=min(Y_1, ..., Y_{n-m}) = ∞
と解釈してください。

788 :786:2007/09/16(日) 15:54:07
>>783 (2)。
Let Φ(x) be the stadnard normal cdf, and m be the number of
observations with Y_i > 0. Then, the likelihood function of
μ is shown to be:
L(μ) = Φ(μ)^m * (1-Φ(μ))^(n-m).
One can easily see that likelihood equation: ∂/∂μ(log(L(μ)))
has a unique zero at μ with Φ(μ)=m/n.
A unique solution of a likelihood equation is consistent.



789 :786:2007/09/16(日) 15:57:15
>>783
ところでどの分野の試験問題?社会科学か経済学あたり?


790 :132人目の素数さん:2007/09/16(日) 18:03:51
>>788
m=0のときとm=nのときはμの推定値が-∞と∞になるんだけど
consistentなのか?

791 :786:2007/09/16(日) 18:13:09
>>790
おいおい、とんちんかんなこというな。
μは、題意から実数だろ。
有限なμに対して、n→∞とするとどうなるか考えてみよ。
m=0, n となる確率はゼロに近づく。



792 :779:2007/09/16(日) 22:51:47
>>785
参考になるご意見、ありがとうございました。

793 :132人目の素数さん:2007/09/17(月) 12:21:19
>>791
そうか推定値が無限大になることがあって実用的でなかろうとも
一致性の上では問題なしか。
ほとんど確実にlim_n→∞(m/n)=Φ(μ)でOKということだな。


794 :132人目の素数さん:2007/09/17(月) 16:02:36
統計学直接の質問ではないので、場違いだったらスルーしてください。

共分散構造分析で推定された係数の詳細な(小数点以下5桁以上で)p値を知りたいのですが、
どのような方法があるでしょうか?
自分は、AMOS4.0を使っていますが、小数点以下3桁までしか表示されません。

思いつきですが、一つは、各係数の統計量が表示されるので、
これに基づいてp値を算出すればよいのかとも思います。

ただこの場合、ここで表示される統計量は重回帰分析同様t値になるのでしょうか?
また、その場合、自由度はどのように算出すればよいのでしょうか?
モデルの自由度とは違いますよね??

統計量をもとに計算する方法でなくともよいので、申し訳ありませんが、
何か方法をご存知でしたら、教えていただけると幸いです。

795 :132人目の素数さん:2007/09/17(月) 16:13:10
783です。
ご回答ありがとうございます。
レス遅くなってしまって、すみません。
これからいただいた回答を見て、勉強させていただきます。

>>789さん
経済系の入試問題です。

796 :132人目の素数さん:2007/09/17(月) 16:15:33
すみませんが、もうひとつ質問させてください。

問題. ある確率変数Xの平均値はμ、Yの平均値は0のときXとYのデータを使ってμを推定することを考える。
推定量としてはα, β, γをある定数としてαX+βY+γというかたちのものを考える。
このとき、XとYの間の相関係数ρ、Xの分散(σ_{X})^2 、Yの分散(σ_{Y})^2はすべて既知だとする。
αX+βY+γというかたちのμの不偏推定量の中で、最小分散をもつものを求めよ。

こういう問題なのですが、わたしは以下のように考えて解いたのですが、最後がγ=μとなってしまうのに違和感を感じます。
たしかに、推定量がγであれば、その分散は0となり最小にはなるのですが、でも、何かがおかしいような気がします。
質問多くてすみませんが、どなたかご教授お願いします。

E(・):平均   V(・):分散  Cov(・,・):共分散  η:=αX+βY+γ とする。
ηは不偏推定量なので、
μ=E(η)=αE(X)+βE(Y)+γ=αμ+γ  ∴μ=αμ+γ…(*)
F(α,β,γ):= μα+γ−μ
V(η)=(α^2)V(X)+(β^2)V(Y)+2αβCov(X, Y)
=(α^2) (σ_{X})^2+(β^2)(σ_{Y})^2+2αβρ(σ_{X})(σ_{Y})=:G(α,β,γ)
H(α,β,γ,λ):= G(α,β,γ)−λF(α,β,γ)
∂F /∂α=μ  ∂F /∂β=0  ∂F /∂γ=1  より、
F(α,β,γ)=0を満たす任意のα, β, γに対し、(∂F /∂α, ∂F /∂β, ∂F /∂γ)≠(0, 0, 0)
Lagrangeの未定乗数法により、 ∃λ∈R s.t.
@∂H /∂α=∂G /∂α−λ(∂F /∂α)=2((σ_{X})^2)α+2ρ(σ_{X})(σ_{Y})β−λμ=0
A∂H /∂β=∂G /∂β−λ(∂F /∂β)=2((σ_{y})^2)β+2ρ(σ_{X})(σ_{Y})α=0
B∂H /∂γ=λ=0
Bより、 λ=0
@, Aより、 @’((σ_{X})^2)α+ρ(σ_{X})(σ_{Y})β=0
       A’ρ(σ_{X})(σ_{Y})α+((σ_{y})^2)β=0
@’, A’を満たすα, βが存在しなければならないので、
((σ_{X})^2) ((σ_{y})^2)−ρ(σ_{X})(σ_{Y})ρ(σ_{X})(σ_{Y})
=((σ_{X})^2) ((σ_{y})^2)(1−ρ^2)≠0  ∴σ_{X}≠0, σ_{Y}≠0, ρ≠±1
@’, A’を解くと、 α=β=0
また、(*)より、 γ=μ Q.E.D

797 :132人目の素数さん:2007/09/17(月) 19:46:25
問題. nをある自然数として、Y_{i}(i=1,…,n)は互いに独立な平均μ、分散市の正規分布に従うとする。
平均値が0であるという帰無仮説を平均値が負であるという対立仮説のもとで検定するとき、普通に用いられる方法では棄却域を(−∞,R]という形にとり、
ある有意水準αを所与としてRを帰無仮説のもとでPr{Z∈(−∞,R)}≧αとなるように選ぶ。
ここで、Z=(Y_{1}+Y_{2}+…+Y_{n})/nである。
帰無仮説のもとでPr{Z∈S}≧αとなるような集合Sは無数にあるが、とくに(−∞,R]というかたちの棄却域を設定する理由を説明しなさい。

質問:この問題は『(−∞,R]というかたちの棄却域を設定すれば、一様最強力検定である』ことを示せばよいのでしょうか?

798 :132人目の素数さん:2007/09/18(火) 11:43:34
>>796
確かにおかしな問題だな。
α=1以外はγにμを含まないと不偏にならない。
それでは未知であるμを含んだ推定量となり、意味がないな。
Yの平均に何らかのミスがあるんじゃないのか?

799 :132人目の素数さん:2007/09/18(火) 12:45:30
>>798さん
こんにちは。796です。
ですよねー。わたしもそのように思います。
私自身、特に計算を間違えているようには思わないので。

800 :132人目の素数さん:2007/09/18(火) 15:05:25
塾講師(文系)なんですが質問させてください
塾の生徒の学校の同級生が偏差値96.5取ったらしいと
言ったんですね。そんなことあるわけないといってたら
携帯に、そのこの模試の帳票撮ってきて、みてみたら
ほんとに96.5なわけですよ。理論上は100超えることもあ
ると聞きましたが、実際そんなことあるんですか。
できたら単純なモデルで教えてくれませんか。
例えばクラス45人でそのこ以外10点でそのこが99点とか。

801 :132人目の素数さん:2007/09/18(火) 15:21:02
>>800
100人中1人が100点、残りが0点なら簡単に100を超えるんじゃね。

802 :800:2007/09/18(火) 15:30:23
>>801
ぎりぎりのラインを教えていただけたら幸いです

そもそも全国模試でありうるんでしょうか
そのこは全体(人数は不明)の25番だかだったみたいです

803 :132人目の素数さん:2007/09/18(火) 15:35:21
>>796
「推定量」は、推定する未知母数を知らなくても計算できる必要があるから、
α、β、γ は μ に依存しない定数。
不偏性より μ = αμ + γ (任意の μ について)。
よって、α = 1、γ = 0。
つまり「不偏推定量 X + βY」で分散最小となる β を求める問題になる。

804 :132人目の素数さん:2007/09/18(火) 15:36:49
>>802
妥当な試験なら、100を超えることはまず無い。もし超えたのなら
試験が妥当でないことの、一つの根拠になる可能性もある。

805 :132人目の素数さん:2007/09/18(火) 16:28:28
>>802
問題作成者がアフォだと起きるよ。
誰でも解ける問題と滅多に解けない問題が混ざっていて
中間的な難易度の問題が僅かしかないケース。
(それか、問題数があまりに多く、ほとんど全員が時間内に答えられないケース)
全国模試のように人数が多いと、滅多に解けない問題でも解くヤシが居る。
どのぐらい「滅多に解けない」かというと、その偏差値 96.5 の場合は、

偏差値 = 10×z値 + 50 だから
96.5 = 10×z値 + 50 → z値 = 4.65
P{ z ≧ 4.65 } = 0.0000166 = 1 / 602410

よって、約 60 万人に 1人。

806 :132人目の素数さん:2007/09/18(火) 16:44:03
近ごろの模擬試験では
昔なら中卒で就職するような成績のやつまで
進学希望で試験を受けるようになったので
そもそも母集団が正規分布などしていないのです。

近ごろの傾向としては、中央あたりではなく
すこし上とすこし下に2つのピークがあることがよくあります。


807 :800:2007/09/18(火) 17:26:16
>>805
ありがとう

808 :805:2007/09/18(火) 19:00:35
×P{ z ≧ 4.65 } = 0.0000166 = 1 / 602410
○P{ z ≧ 4.65 } = 0.00000166 = 1 / 602410

実際は、正規分布とは程遠い分布かもしれないし、
選択式解答だと、適当に塗りつぶした複数個の難問が、
偶然当った宝くじ的なケースかもしれないし、、、

809 :132人目の素数さん:2007/09/18(火) 23:59:23
標準偏差σと紛らわしい標準誤差なるものが、Excelでも分析ツール/基本統計量の中に
表示されますが、計算式は下記Q&Aで判ったのですが、標準誤差ってどのようなものの
算出作業に使うのですか?
エクセルでの標準誤差の求め方を教えてください 04/04/17
http://oshiete1.goo.ne.jp/qa833491.html

810 :132人目の素数さん:2007/09/19(水) 04:09:38
偏差値の定義も知らずに塾講師なんてやってて大丈夫なの?
俺は、中3の時にすでに偏差値の計算方法くらい知ってたぞ。
で、クラスの女の子に点数つけて(ry

811 :132人目の素数さん:2007/09/19(水) 13:56:46
質問させてください。

プロビットやロジットなどの二項選択モデルにおいて、
Y=0であるサンプル数と、Y=1であるサンプル数の比率について、
何らかの制約はあるのでしょうか?

例えば、サンプル100個の中に、Y=0となるサンプルが10個だけでも、
プロビット分析を行っていいのでしょうか?

よろしくお願いします。

812 :800:2007/09/19(水) 15:25:18
>>810
塾講師であるには偏差値をものさしとして利用
できれば、特に定義を知っている必要はないですね。
力をつけてあげられる力、周りが辟易してしまうよ
うな自慢話をしたりしない性格が要求されます。

813 :132人目の素数さん:2007/09/19(水) 21:36:29
山から抜き取ったサンブルデータの標準偏差から山自体の標準偏差を割り出す公式をどなたか教えてください
よろしくお願いします。

814 :132人目の素数さん:2007/09/19(水) 21:49:01
まずその、なんでも公式って言うのからやめてみよう。

815 :132人目の素数さん:2007/09/19(水) 21:56:48
>>814すみません
では求め方を教えてください

816 :132人目の素数さん:2007/09/19(水) 22:31:14
>>812
 極端に技術的で知る必要のない定義もあるけど
偏差値の定義はそれを知らないとまともな運用ができるとは思えないものだよ。

 前に教育評価の専門家が大手予備校の担当者でも
まともに偏差値の意味がわからず運用できていないと嘆いていたよ。

ちなみに810じゃないよ。

817 :132人目の素数さん:2007/09/20(木) 00:20:49
>>816
同意。>>812は、
例えば生徒200人が2回のクラス分けテストのどちらかを受験した
場合にどういう風にクラス分けをしたら落ちこぼれがでにくいか、
考えたことがあるのだろうか。
きっと、各々のテストの下位2割を一番下のクラス、とか決めて
いくんだろうなw

818 :132人目の素数さん:2007/09/20(木) 02:06:30
>>816
「偏差値の定義」ってのは何のことを言ってるのかわからんが
モノサシとしての使い方を知っているというのは
運用ができるということだと思うのだが違うのだろうか?
運用するに当たって純粋に確率論的意味統計学的意味を知る必要はあるまい。

>>817
ひょっとして成績(というか能力順)に分ければオチこぼれが出にくいと思ってる?
成績順に分けるのと落ちこぼれるかこぼれないかは別の物差しだぞ。
点数で単純に分けても、統計的に成績順をつけても、たいして変わらん。
それより、その生徒がどちらのクラスに向いているかを見るほうがよほど効果がある。


819 :132人目の素数さん:2007/09/20(木) 04:30:11
>>818
だったら、偏差値について質問するの止めたらw

>理論上は100超えることもあ ると聞きましたが、実際そんなことあるんですか。
>できたら単純なモデルで教えてくれませんか。

というのが、お前の元の質問じゃなかったのか?
そもそも「偏差値」ってgoogleに打ち込めば、
一番上にwikipediaの解説がでてきて、
その内容は少なくともまともな高校1年生には理解できる内容だ。
物事を調べる能力のない奴に、物を教える能力があるとは思えん。

820 :132人目の素数さん:2007/09/20(木) 04:38:53
>>818
だからあ、その使い方を知っているっていうのが信じられないんだって。

 偏差値の定義はちょっと気の利いた高校生でも理解できるくらいやさしいし、
しかも本質に関わっている。

 定義も知らずに使いこなしていると言っても、たとえばみのもんたが
「俺は政治も医学も評論できる」って言うのと大差ないってこと。


821 :818:2007/09/20(木) 04:38:55
>>819
いや俺、そのひとじゃないから、その指摘は取り下げてくれたまえ。
その人の不利益になりそうなので俺はもうコメントしないよ。

822 :132人目の素数さん:2007/09/20(木) 04:43:54
>>820
同時に書いてたようなので、もうひとレス。

それは使いこなしているとは言わない。
使いこなしていない状態を想定して、それじゃダメだといっても
アドバイスとしては何の役にも立たないよ。

823 :塾講師@数学担当:2007/09/20(木) 04:53:44
偏差値の定義がどうこうっていってるやつって
ほんとに塾での進路指導の経験があるとは思えないな。

そもそも進路指導に偏差値なんぞ使いこなすというほどには役に立たんものだ。
塾で模試などの偏差値がどう使われているのかの現実を知らんのだろう。

塾で使う偏差値で一番重要なのは、推薦するのに足りてるか足りてないかだ。
ただの比較だよ。

偏差値の定義なんぞ知ってってもクソの役にも立たん。
そもそも、きちんとした偏差値の話をしたところで、親が理解しない。

824 :塾講師@数学担当:2007/09/20(木) 05:04:12
ちなみに 塾で偏差値を 「使いこなしている」 というのは、
定義を知っていることでも正しく理解して運用しているかでもなくて
それを使って何人進学させたかということだ。
学問の場と、実業の場の違いだろうな。

まあ文系講師には、点数と偏差値は比例すると思ってるくらいひどいのもいるけどね。
もちろんちゃんと知っていた方がいいとは思うが、そんなことよりも先にやることはいっぱいある。

825 :132人目の素数さん:2007/09/20(木) 09:23:45
しつけーよおめーら

826 :132人目の素数さん:2007/09/20(木) 09:55:58
偏差値が必要なのは塾経営者だけだよ。

827 :132人目の素数さん:2007/09/20(木) 09:57:24
統計量としての偏差値はいろんなところで使うと思うが

828 :132人目の素数さん:2007/09/20(木) 11:35:06
偏差値って、平均を50、分散を100にする単なる標準化なのに、
それをあたかも難しすぎて使い物にならない概念のように
とらえるのが俺には滑稽に思える。

↑の塾講師は、
自分の分からないものに「難しすぎて役に立たない」
ってレッテル貼ってるだけだってことに気付いていないんだろうな。
複数人を装って弁護してるみたいだが、
数学が苦手な塾講師がこの板に何人いるか想像すれば(ry

829 :132人目の素数さん:2007/09/20(木) 11:42:56
文系塾講師って800ひとりだけじゃないの?

830 :132人目の素数さん:2007/09/20(木) 14:55:55
統計量としては偏差値よりも生の平均・分散のほうがはるかに
使いやすいと思うけどなあ。わざわざ100点満点のテストの点数みたいな
ところに規格化するから、余計な誤解が生まれたりするんだろう。

831 :132人目の素数さん:2007/09/20(木) 16:31:36
統計スレなんで言うが、上位から合格する入試において
模試などの結果の統計指標として最も適切なのは、
その点数が「上位何%か」を表す「100−百分位」。
これなら正規分布に程遠い、二山分布や歪んだ分布でもOK。
また誰でも理解できる。

入試で学校側が、科目得点の調整を行って合計点を求める時は、
科目毎に得点を「百分位(0〜100の範囲)」に変換してから合計する。

これが一番自然で偏りのない相対評価方法。偏差値は欠点だらけ。

832 :132人目の素数さん:2007/09/20(木) 19:39:54
>>817
塾で40人のクラスなんてなくね?

833 :132人目の素数さん:2007/09/20(木) 21:19:26
>>830
>100点満点のテストの点数みたいなところに規格化・・・・
規格化って何?標準化>>828のこと?基準化のこと?

>>813
>山自体の標準偏差を割り出す公式を・・・・
普通に、χ^2分布を利用した母分散の推定式でよいのでは?

>>809
>標準誤差ってどのようなものの算出作業に使うの・・・・
区間推定の信頼区間幅算出に使われているね。excelの回帰分析出力表にも
標準誤差列があったと記憶する。

834 :math太郎:2007/09/20(木) 21:38:33
>統計量としての偏差値はいろんなところで使うと思うが

偏差はよく使うが、
偏差値は進学関係でしか聞いたこと
ないなあ。。。



835 :132人目の素数さん:2007/09/20(木) 21:46:30
>>833,>>834
統計用語としての偏差/誤差/残差の違いを、解り易く述べた書籍を
ご存じないでしょうか?

836 :132人目の素数さん:2007/09/20(木) 21:51:52
大標本理論の良書って何があるの?

837 :132人目の素数さん:2007/09/21(金) 00:28:08
>>833
物理屋さんとかはnormalizeを規格化と訳す。

838 :132人目の素数さん:2007/09/21(金) 01:49:04
>>831
その得点調整だと科目にばらつきのある学生より点が揃っている学生が
優遇される。一芸に秀でたものより全部平均的なものの方がよければ
向いているだろう。


839 :132人目の素数さん:2007/09/21(金) 03:55:15
>>836
もうちょっと具体的に。
(具体的に言ってもらっても俺が知ってるとは限らないわけだが。)

840 :132人目の素数さん:2007/09/21(金) 04:13:13
>>838
言ってることが全然わからんのだが。もしそう思うのなら数値例を示せ。

841 :132人目の素数さん:2007/09/21(金) 04:15:43
>>838

> その得点調整だと科目にばらつきのある学生より点が揃っている学生が 優遇される。

ん? どして?

842 :132人目の素数さん:2007/09/21(金) 04:18:42
>>831
近ごろの入試は、上位から合格とは限らないんですよ。
それでやっていけるのは、成績上位校だけになりつつあります。

843 :132人目の素数さん:2007/09/21(金) 04:47:57
極端だが簡単な例で考えてみる。

試験科目は2科目、どちらの試験も中央値は70点だった。
受験生A 数学100点(一位) 英語0点(ビリ)
受験生B 数学60点 英語60点。(どちらも順位は中央よりは下)
合計点方式だと、 Aは100点 Bは120点で Bのほうが合格のチャンスが大きい。
>>831方式だと、 Aは100点 Bは100点未満にしかならず、Aのほうがチャンスは多い。

逆のケースも容易に想定できる。

ただしここで取り上げていない、各教科の偏差値の合計という基準で合否を決めるようにすると
一教科だけが極端に抜きん出て出来のいい生徒は有利にはなるかもな
それと比べた話をしたかったのか?

844 :132人目の素数さん:2007/09/21(金) 07:33:41
n科目の得点を X_1, ... , X_n としたとき、
どのような関数 f(X_1, ... , X_n) が評価に最適であるかは
当然ながら状況による。それだけの話だろ。

845 :132人目の素数さん:2007/09/21(金) 09:52:43
>>811
理論的な裏付けは言えないんだけど、
同じ質問を経済の教授にした事がある。

あなたの考えの通り、
Y=0または1のサンプルが極端に少ないと、probit分析の信頼性は落ちるそうだ。
ただ、比率として1:9なら結構ありそうじゃない?
10という絶対数が問題になるなら、サンプルを200−300に増やすのがいいかも知れん。

846 :132人目の素数さん:2007/09/21(金) 16:33:12
(x,y)=(1,1),(2,2)という2つの(x,y)のデータが得られたとき、
cov(x,y)=0.5ですか?0.25ではなく?

847 :132人目の素数さん:2007/09/21(金) 17:15:49
>>846
共分散=相関係数×(xの標準偏差)×(yの標準偏差)
が成り立たないとマズイから、
両分散推定値を 0.5 とすれば、共分散推定値は 0.5。 (不偏推定量)
両分散推定値を 0.25 とすれば、共分散推定値は 0.25。(積率法、
多変量正規分布下の最尤推定量)

「わからんからどっちかに決めてくれーー!」と言われたら、
テキストや統計ソフトの流行りは 0.5 なので、流行りに合わせとくのが吉でそ。

848 :132人目の素数さん:2007/09/21(金) 19:25:42
>>803さん
なるほど!!そういうことだったんですね!
ありがとうございます。

849 :132人目の素数さん:2007/09/21(金) 20:42:06
>>844
いや、838の言ってることはそういうことじゃないと思うよ。

850 :132人目の素数さん:2007/09/22(土) 02:28:42
>>843
中央値以下で合格することは考えてなかったな。
それがありなら逆もあるか。
中央値以上で累積度数のグラフが上に凸の形状のところだけなら
科目に差があるより平均化している方がその得点調整に強いんだけどな。


851 :132人目の素数さん:2007/09/22(土) 03:03:58
>>850
そりゃまたずいぶん特殊な条件だな。
今の高校受験などでは、倍率2倍以上あることのほうが珍しいというのに。


852 :132人目の素数さん:2007/09/22(土) 11:53:27
>>851
大学入試だと2倍以上あるのが普通だけどね。

853 :132人目の素数さん:2007/09/22(土) 17:31:48
倍率は関係ないだろ。カスの中からマシなカスを選ぶ学校もある。

854 :132人目の素数さん:2007/09/22(土) 20:02:26
>>852
それも大学によるんだな。
数だけで言えば2倍ない大学のほうが多いかもしれないぞ。

855 :132人目の素数さん:2007/09/22(土) 20:10:33
日本の全大学の学生募集の定員の合計は、入学志望者数を上回ります。
単純に大学生になるためであれば競争率は1倍ないということです。
ただし、延べ受験者数はもうすこし大きくなります。ふたつ以上の大学を
受験するひとが多いからです。
見かけの競争率(受験者数÷募集数)が2倍以上になるのはそのせいですが
実際には合格してもその大学に行かないひとが多くいるので
実質競争率はもっと低くなります。

856 :132人目の素数さん:2007/09/22(土) 21:09:08
単にかけもち受験のせいだけではなく、一つの大学が定員を分割して何度も試験するからという
面もあります。例えば、100人の定員を40人、30人、30人とわけて「前期」「中期」「後期」とすれば、
実際の受験希望者が105人しかいないのに、「前期」で105÷40=約2.6倍、「中期」は65÷30=約2.2倍
後期は35÷30=約1.1倍となり、延べ205人もの受験者数を集めることが出来るわけです。
90年代頃から「受験機会の多様化」などという名目でこのような手法が用いられてきたわけですが、
実際は受験料収入の確保策でもあり、名目上の競争率の維持策でもあります。
ということは言わずもがなのことですが、補足です。

857 :132人目の素数さん:2007/09/22(土) 22:14:43
>>856
目からナマコが落ちた

858 :132人目の素数さん:2007/09/22(土) 22:30:23
>>850
>中央値以上で累積度数のグラフが上に凸の形状のところだけなら

それが正規分布迷信にドップリ嵌った発想。
実際の試験得点の分布をいろいろと見てみればわかる。

度数分布が一様な部分は、累積度数分布が直線に、
度数分布が右上がりな部分は、累積度数分布が上に凹になる。
中央値や平均値以上の分布部が、そんな形になるのはザラ。

859 :132人目の素数さん:2007/09/23(日) 00:00:46
>>858
入試でそんな風に満点に集中するような上がりっぱなしの形状ってあるの?
それとも左にすそをひく形状(平均値以上もある程度までまだ右上がり)ってこと?

860 :858:2007/09/23(日) 01:37:34
最後まで上がりっ放しとは言ってないよ。
隙間があったり、また上がったり下がったり、いろんな箇所があるっつー話。
だから順位に変換した時、中央からの距離が伸びる箇所も縮む箇所も両方ある。

861 :132人目の素数さん:2007/09/23(日) 03:26:01
そういや、大阪××高の、有名大学のべ合格者数のうち半分は
たった一人の卒業生の合格実績だったってのがあったな。
なんでも有名大学の七十数学部にひとりで合格したとか

862 :132人目の素数さん:2007/09/24(月) 07:26:56
>>860
すごく人数が多い入試(たとえばセンター試験とか)でないと
ある程度でこぼこがあるのは普通でしょう。
それが偶然によるものか問題や採点によるものか
受験生の質によるものかを区別するのは難しいでしょう。
偏差値と順位のどちらが妥当かは難しいところですね。
(偏差値による調整自身は単なる標準化で正規分布を
前提としている訳ではないからな。)


863 :132人目の素数さん:2007/09/24(月) 09:09:27
「平均」もそうだが、「標準偏差」っつーさらに分布の両裾に敏感な
指標を尺度に使ってることが一番大きな問題だろ。
分布の中央部でドングリの背比べやってるような連中が一喜一憂
するための指標には適さない。

864 :132人目の素数さん:2007/09/24(月) 09:26:52
天才(生まれつきの天賦の才)と
無能(生まれつきの無能)を除外しないと
正確な統計は出せない。
アメリカではクラスを分けてるよ。

865 :132人目の素数さん:2007/09/24(月) 20:19:52
>>863
それなら順位はもっと滑稽だな。全国模試なら中央で1000位も上がったとか意味なさげ。


866 :132人目の素数さん:2007/09/24(月) 21:49:08
平均も偏差も一面的には有用ではあるけど、テストの中身が高度に規格化されてないと意味が無いんじゃない?
問題形式なんかによって得意不得意あるだろうし。
個人レベルの指導ではそっちのほうが点に響くよ。

867 :132人目の素数さん:2007/09/24(月) 21:51:44
まあ所詮統計は全体としての動向がわかるだけで
個々の動向がわかるようなものではないですからねえ

868 :132人目の素数さん:2007/09/25(火) 11:08:27
>>866
高度に規格化した問題をいつも出すと、それに対して高度に訓練して来て
差が付かなくなる。だから試験(特に入試)というのは、高度に規格化できないんだよ。
ある割合での意外性(ブレ)が常に必要。そうすると出題者の予想に反する事態が
毎回のように起きて、総合点を争う入試では得点調整が必要になる。
しかしそれに偏差値を使うのは、統計学的にマズイっつーのが、ここでの話の流れ。

>>867
個々の特徴を判定するには、全体像を推測し、その中で個々の位置を見る
っつーのが統計学のそもそも基本よ。

869 :132人目の素数さん:2007/09/26(水) 20:10:27
>>868
得点調整に偏差値がマズイっていうのが流れと言うことはないと思う。意見の一つだな。
得点分布が正規分布であると考えるのはマズイっていうのは共通理解でいいと思うが。


870 :132人目の素数さん:2007/09/26(水) 22:12:08
保護者(とくに母親)には、
偏差値とは、能力を示すものではなくて集団での位置を示すものであって
同じ能力でも母集団が変われば偏差値は変わることを理解しておいていただきたい。


871 :132人目の素数さん:2007/09/27(木) 01:19:03
>>870
母(はは)集団?母が変わればいいんですか!?
という理解になりそうな悪寒

872 :132人目の素数さん:2007/09/27(木) 08:42:28
むしろ2chでは、同じ偏差値の数値でも母集団が異なれば能力も異なることを理解しておいていただきたい。
学歴板とかうざすぎ。
わかってやってる連中もいるんだろうけど、リアルに偏差値60=優秀とか思ってるやつがいるぞ。たぶん。

873 :132人目の素数さん:2007/09/27(木) 08:57:36
>>871
いやじっさい母が変わってくれれば伸びそうな子供も(ry

874 :132人目の素数さん:2007/09/28(金) 00:00:43
>>872
だから「上位何%」とかの「相対順位」を使うのが良いんだよ。
それなら母集団の違いが母親でもわかるからな。
このスレにはそれもわからないアフォが約1匹居るが・・・w

875 :132人目の素数さん:2007/09/28(金) 00:24:43
>>874
母集団が違えば相対順位だって意味がないのだが…。


876 :132人目の素数さん:2007/09/28(金) 10:57:34
だから「母親でもわかる」と・・・w

問題は、累積相対度数×100 のネーミングだな。
「トップ度」「勝組度」「上位度」なんかどうよ

877 :132人目の素数さん:2007/09/28(金) 15:40:26
>>872
偏差値60は平均より優秀じゃないか。
それとも優秀って絶対的な尺度のことなの?

878 :132人目の素数さん:2007/09/28(金) 16:17:23
偏差値60、一昔前の東大京大模擬試験なら合格ラインを十分超えていたな

879 :132人目の素数さん:2007/09/28(金) 17:13:40
昔は大学行かないやつも多かったからね。

880 :132人目の素数さん:2007/09/28(金) 19:34:49
一昔前って、そんな昔じゃないって

881 :132人目の素数さん:2007/09/30(日) 02:43:10
偏差値の話題つまらんよ。
技術的な話は大いに結構だが、ここは学歴板じゃないんだから。
バイオ関係の人の「困ってますう〜教えてください」
っていう投稿の方がずっとまし。

882 :132人目の素数さん:2007/09/30(日) 03:54:39
きっとそんな終わった話題に2日もたってから今更言われてもって感じなんじゃないかなだぶん。


883 :132人目の素数さん:2007/09/30(日) 11:49:52
統計つかった仕事ってなにかないかな?
おれが調べた限りだと
アクチュアリー(保険)
投資顧問系(銀行、証券)
臨床、薬品の会社?
ぐらいか
みんな結構ハードル高いな・・・
統計士になっても意味ないかな・・・

884 :132人目の素数さん:2007/09/30(日) 15:13:34
ハードルが高いってどういう意味?
臨床はともかく、保険と金融は数学科からの
代表的な就職先だと思うけど。

885 :132人目の素数さん:2007/09/30(日) 18:54:42
>>883
普通にメーカーに勤めたら?
品質管理ならどこでもあるでしょ。

886 :132人目の素数さん:2007/09/30(日) 19:11:11
黒、白、赤、青、黄の5種類のボールが計1億個箱に入っていて、
黒のボールはそのうちの何%であるか、有意水準5%で調べるためには、
最低何個のボールを取り出せばいいのでしょうか?

「有意水準5% 1.96」「t分布」「x^2分布」などの単語でググったのですが
分かりませんでした… 簡単でいいので計算式も知りたいです。

「わからない問題はここに書いてね 228」で同じ質問をしたのですが、
解答がなかったので、スレ違いかと思い、あちらで重複して解答をいただかないように、
断りを書き込んだ上でこちらで同じ質問をしています。
マルチまがいですいません。

よろしくお願いします。

887 :132人目の素数さん:2007/09/30(日) 21:36:52
>>886
問題文がおかしいから誰も相手にしてくれなかったのでは?
精度がないとボールの個数は決められないよ。

888 :132人目の素数さん:2007/10/01(月) 03:10:41
精度?

889 :888:2007/10/01(月) 03:18:41
すまん、勘違い。 気にしないでくれ。



890 :132人目の素数さん:2007/10/01(月) 04:52:30
>>886
黒のボールの割合を推定する問題だから、
「有意水準5%」っていうのは変。
信頼区間とか誤差率に関する問題では?

891 :132人目の素数さん:2007/10/01(月) 15:35:50
割合でも「優位水準5%」を使う問題にできなくはないが
やはりちょっと不自然かなと思う。

でなけりゃなにか条件を書き写し忘れているんじゃないだろうか?

892 :132人目の素数さん:2007/10/01(月) 19:53:31
回帰係数を求める時に、まず散布図で分布を確認しました。
すると2群に分かれていました。
この場合はみなさんの場合はどのような判断をし、どういうことを実施しますか?

よろしくお願いします。

893 :132人目の素数さん:2007/10/01(月) 21:03:10
>>892
そうなるともうデータマイニングだよな。
ケースバイケースじゃないかな。
分かれる理由を探索する方向に進む人もいれば
単にクラスター分析とかに行く人もいるだろう。


894 :894:2007/10/01(月) 22:17:15
894 年 遣唐使の廃止


895 :132人目の素数さん:2007/10/01(月) 23:25:43
>>892
定数項ダミー、傾きダミー、両ダミー(2群完全分離)。

896 :132人目の素数さん:2007/10/02(火) 00:37:20
>>895
定数項ダミーは分かるが、傾きダミーって変じゃないか?
傾きを別に扱うってことか?
どれにしても2群になぜ分かれるか分かった後か
クラスター分析などで2群に分けた後の話だね。

897 :132人目の素数さん:2007/10/02(火) 12:39:20
>>896
勾配だけにダミー入れるのは、原点を通る直線や(超)平面の時。
なら切片はゼロにすべきだけど、母数制約一つ毎にF検定やった方がいい。

898 :132人目の素数さん:2007/10/03(水) 04:12:15
>>892
まず、2群は明確に分かれているのか否か?
もしそうなら、二つのグループに分け、
そうでないなら例えば線形判別分析などなんらかの方法で判別する。
二つのかたまりが存在するという程度で
二つのかたまりの間にも点がたくさんあるなら、
そもそも2つに分けるべきでないケースも多々考えられる。

次に、各群に分けて回帰分析したときに、一部のパラメータが
2つの群に対して同じである積極的な理由があるのかどうかを考える。
もしないなら、別々に回帰分析をし、あるならば、先見的に同じとは
みなせないパラメータに関してダミーを入れて回帰する。
(以上、パラメトリックな分析を行う場合を仮定した。)

899 :132人目の素数さん:2007/10/03(水) 18:16:34
S=不偏分散の平方根 としたとき、
Sの平均と分散ってどうやって求めればいいですか?

900 :132人目の素数さん:2007/10/03(水) 23:27:28
>>899
こんなページがあるぞ。
http://www.aandt.co.jp/jpn/qc/basic/kukansuitei.htm

901 :892:2007/10/05(金) 12:02:11
ありがとうございます。
二群を分けるという、回帰分析の前の事前準備が必要なわけですね。
このような分析前の手順が詳しく記載されている書籍があれば
一度自分で調べてみたいと思います。
もしよろしければ、おすすめの書籍等ありましたら教えていただけると幸いです。

902 :132人目の素数さん:2007/10/05(金) 12:21:58
>>883
科学論文に統計処理はつきものだから
統計学の活躍範囲はもっと広いはず

903 :132人目の素数さん:2007/10/06(土) 01:49:34
>>902
日本は統計を専攻した人の活躍範囲が(米国等に比べ)恐ろしく狭いよね。
日本人は、数学が比較的得意だから、統計を本格的に学んでいなくても、
それなりに解決できちゃうからだろうか、とも思ったけど、
そのあたりはかなり微妙。


904 :132人目の素数さん:2007/10/06(土) 02:03:54
統計学は既に数学から経済学にその拠点を移しています。

905 :132人目の素数さん:2007/10/06(土) 09:53:55
>>903 統計の重要性を一般の人が理解していないからだろう。

906 :132人目の素数さん:2007/10/06(土) 10:59:13
>>904
逆だよ。日本では統計学は経済学部を中心に維持されてきたんだけど、
(例えば竹内啓さんなんかは東大経済でその典型)
各種分野での発展に伴って、もはや経済学部では収容し切れなくなった。

やはり欧米のように、独立した「統計学部」が必要。
統計専門家の指導や共同研究体制がないから、日本の各種学問分野での
研究における統計分析やデータ処理のレベルは著しく低い。
所詮、欧米研究者のモノマネしかできない。

907 :132人目の素数さん:2007/10/06(土) 11:16:50
>>906
アメリカは、医療産業が巨大なのでバイオメトリックス分野の
比重が高い。割合でいったら6割はいくだろう。
続いてエンジニアリング・コンピュータサイエンス関連、
それから、金融・経済関係が続く。

統計学を一つの学科で扱うのは知識の集積の上では役に立つが、
最近は基礎理論の発展はやや停滞気味で応用の比率が上がって
いるので、その重要性はどちらかというと薄れている印象。

908 :132人目の素数さん:2007/10/07(日) 00:56:34
>>906
統計解析研究所が各旧帝に植民地を作ればそれでおkなのになんでしないのかね
文部科学省の利権問題だとしか思えれない

909 :132人目の素数さん:2007/10/07(日) 03:50:33
文科省は、日本の教育よりも自分の利権の方が大事です。


910 :899:2007/10/07(日) 21:32:36
>>900

ありがとうございます!
なんとか解決しました。

911 :132人目の素数さん:2007/10/09(火) 02:11:13
2元配置法についてだれか教えてくれませんか?


912 :132人目の素数さん:2007/10/09(火) 02:47:24
2変数の順位の一致率を調べたいと思っています。
スピアマンの順位相関係数と
ケーンドルの順位相関係数の
どちらを使えばよいかを迷っています。

どのような判断で選択すればよいでしょうか?
よろしくお願いします。

913 :132人目の素数さん:2007/10/09(火) 03:36:09
>>911
http://mkobaya-ld.hp.infoseek.co.jp/no10.htm

>>912
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc006/001.html

914 :132人目の素数さん:2007/10/09(火) 11:17:29
>>912
913さんのリンクをみても分かるように、
要するに好きなほうを使えばよいということです。
目的は同だけど、別の統計量だというだけのことです。


915 :132人目の素数さん:2007/10/09(火) 11:44:23
統計学には全く疎い素人ですが
最近「統計学を拓いた異才たち」という本を読んで
感銘を受けました
著者の日本語版への序文で
角谷先生と北川先生が出てきますが
中身を読むと日本はこの分野でもっとがんばらなければ
いけないという気になりました

916 :132人目の素数さん:2007/10/09(火) 12:13:21
>>906
>やはり欧米のように

ほんと?

917 :132人目の素数さん:2007/10/09(火) 12:32:40
欧米か

918 :132人目の素数さん:2007/10/09(火) 13:54:47
なんでも「欧米」でくくるいなかもの

919 :132人目の素数さん:2007/10/09(火) 15:26:04
それ以外の外国を知らんからだろ。

920 :906:2007/10/09(火) 22:20:18
はいはい、うかつでしたよ、「欧米」はね。
書くとき迷ったけど、「英語圏その他」とかだと何か特殊な感じがするし、
『まあ何となく「欧米」にしとけ!』と面倒くさくなったのが敗因。

あと"Department of Statistics"または"Statistics Department"も
>>307さんの言うように「統計学科」に近いよね。これも面倒だったから。

くだんねーことには、うるせー連中だよなあ。んとに・・・

921 :132人目の素数さん:2007/10/09(火) 22:39:22
北川先生はこの分野だけど角谷先生は違う分野じゃない?

922 :132人目の素数さん:2007/10/09(火) 23:52:35
角谷の不動点定理はこの分野といっても過言ではない

923 :132人目の素数さん:2007/10/10(水) 00:16:40
北側って親子のどちら?

924 :132人目の素数さん:2007/10/10(水) 01:41:49
アジアは、ビジネスや社会科学関係の学科で統計をやってる
国が結構多そうだね。
アメリカでも、数学科、確率論、バイオ系、CS系とくっつ
いていたりしていろんなパターンがある。


925 :132人目の素数さん:2007/10/10(水) 10:33:26
>>923
世代にもよるが
まだ敏夫の方が有名だろう

926 :132人目の素数さん:2007/10/10(水) 14:44:17
>>922
角谷の不動点って統計学と接点あんの?

927 :132人目の素数さん:2007/10/10(水) 17:00:21
確率解析が関係あるのなら角谷不動点もありだろ

928 :132人目の素数さん:2007/10/11(木) 16:25:26
意味が分らん。統計学で角谷の不動点定理を使ってる実例を
教えてくれ。


929 :132人目の素数さん:2007/10/11(木) 16:36:44
統計学を拓いた異才たち
を読んでくれ

930 :132人目の素数さん:2007/10/11(木) 21:18:59
>統計学を拓いた異才たち

...なんだ、素人さんか。

931 :132人目の素数さん:2007/10/12(金) 08:28:40
わけもわからず、統計学の宿題をやっています。
そこで質問なんですが、s.e.って何かわかる方いらっしゃいますか?


932 :132人目の素数さん:2007/10/12(金) 09:06:03
標準偏差のことだよ。

933 :132人目の素数さん:2007/10/12(金) 09:12:15
sdじゃなく、s.e.だから、標準誤差じゃないの。


934 :932:2007/10/12(金) 09:31:18
>>933
標準偏差だって言ってるだろ

935 :132人目の素数さん:2007/10/12(金) 10:30:03
>>921>>926>>930
角谷のマルコフ過程についての研究のいくつかは
統計的な問題に応用されてきた
...
よって不動点定理が統計学と接点を持つと言っても
過言でないというのは間違いではない

936 :132人目の素数さん:2007/10/12(金) 12:26:59
>>934
S.E. は Standard error で標準誤差
S.D. は Standard deviation で標準偏差。
二つの違いについては読者の宿題とする。

937 :132人目の素数さん:2007/10/12(金) 12:57:52
なお,SEはシステムエンジニア.

938 :132人目の素数さん:2007/10/12(金) 13:08:07
931の者です
その標準誤差ってどうやって出せますか?

939 :132人目の素数さん:2007/10/12(金) 13:11:39
>>935
その論法だと
「フォン・ノイマンは数理物理とゲーム理論で業績がある。
 よって量子力学がゲーム理論と接点を持つ」
ということになるが、どう考えたっておかしいだろ。

結局、角谷の不動点定理が統計学に応用された実例は
存在しない、ということでいいんだな?

940 :132人目の素数さん:2007/10/12(金) 13:13:29
>>938
標本分散のルートを計算しろ。
それすら分らんのなら、教科書を読み直せ。

941 :132人目の素数さん:2007/10/12(金) 14:53:29
>>角谷の不動点定理が統計学に応用された実例は
存在しない、ということでいいんだな?
存在しないかどうかは断言できないし
情報幾何やペレルマンの証明における統計的方法の存在から推測するに
大いにあり得ると考える


942 :132人目の素数さん:2007/10/12(金) 15:07:58
現時点で、すでに、存在するかどうかを聞いてんだよ。
意固地になってくだらない言い訳並べてんじゃねぇよ。
おおかた、ポアンカレ予想も知らないでペレルマンとか
言ってんだろ?

943 :132人目の素数さん:2007/10/12(金) 17:44:04
存在しないと断言できる人間に質問しているつもりなのかな?
ちなみにポアンカレ予想とは
コンパクトで単連結な3次元多様体が
3次元球面と同相かどうかを問うものです
ポアンカレは初め単連結の条件を1次元ベッチ数=0でよいと考えたが
ホモロジー球面の発見により予想を修正したとされていますが
ポアンカレの論文を詳しく読んだ人によると
反例として最初に上がったのはホモロジー球面ではなく
円周上のトーラスバンドルだったとか

944 :132人目の素数さん:2007/10/12(金) 18:10:02
「角谷の不動点定理」なんてどこにも使えんよ。
昔の話さ。

945 :プリズナーNO6:2007/10/12(金) 20:54:59
ホモロジー……………古い話だなぁ
今は ヘテロジニアスなんですけどね

946 :132人目の素数さん:2007/10/13(土) 00:32:18
>>943
伝聞かよ

947 :132人目の素数さん:2007/10/13(土) 05:53:28
>>939
接点を持ってるじゃん。 フォンノイマンという。

948 :132人目の素数さん:2007/10/13(土) 05:54:26
>>946
伝聞じゃなければ、おまいの知り合いか?

949 :132人目の素数さん:2007/10/13(土) 14:09:12
>>940
>標本分散のルートを計算しろ。

ダウト!

950 :132人目の素数さん:2007/10/14(日) 21:54:04
数学板には初めてきました。
困っております、たすけてください。

とある小さなメーカーの企画部にいるのですが、
このたび新製品の企画にあたって、他社製品の分析をすることになりました。
なにぶん小さな会社なのできちんとした分析など実施したこともなく、
手探り状態です。

現在、因子分析と、数量化理論 I 類 ができるソフトを探しているのですが、
できればフリーウェアでありませんでしょうか?
私が探した限りでは見つかりませんでした。
「excelで多変量解析」というような参考書に付属しているCD-ROMには
そのようなソフトが入っているのでしょうか?

データはexcelで入力済みなので、できればexcelのアドインソフトだと助かります。

よろしくお願いします。

951 :950:2007/10/14(日) 22:03:09
すみません、追記ですが、
Rというフリーソフトを見てみたのですが、とても使いこなせそうにありません。
もう少し易しいのはありますでしょうか?
最低限、因子分析とはなんぞや は勉強しているつもりですが・・・

952 :132人目の素数さん:2007/10/14(日) 22:26:02
Excelでもできないことは無いが、余計難しくなると思う。
(フリーのソフトは余程のことが無いと信頼できない、というのもある)

結局 R を覚えるのが一番手っ取り早いということになりそう。業界標準でもあるし。
全機能使いこなす必要なんて無いから、必要そうなところだけ
ウェブのサンプルとかみながらやってみることをお勧めしておく。

953 :132人目の素数さん:2007/10/15(月) 00:44:13
>業界標準でもあるし。

思わず吹き出した。嘘を言うな嘘を。
業界標準はSASとSPSSだろが!

Rは統計学習用にはよく出来ているが、まだ実務で使うのはきついな。


954 :950:2007/10/15(月) 08:19:14
レスありがとうございます。
Rを覚えるのが早いですか・・・
ざっと概要を見てみたのですが、難しいですね。
統計の前に覚えなきゃいけないことが多いです 泣

高価で使い勝手良いソフトが買えればよいのですが、
予算がまったくなくて・・・
(会社では、いままで競合他社製品やブランドイメージの分析など
していないため、私が言いだしっぺとなったんです。
会社自体は、もともと分析など不要 と考えているので予算を割いて
くれません)


955 :132人目の素数さん:2007/10/15(月) 08:26:17
高価だからって使い勝手がいいわけじゃないんだけどな

956 :132人目の素数さん:2007/10/15(月) 10:23:18
正規分布を標準化するときに、eの前の1/(√2π σ)の中のσが
消えないような気がするのですが、これはどうやって消えるのですか?


957 :132人目の素数さん:2007/10/15(月) 11:47:18
>>954
Rは、日本語の「R-Tips」というサイトが初心者にも分かりやすく
説明しているのでオススメ。
http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html

邦訳された解説書も、結構あちこちに落ちてるよ。

R/S-plusは企業ではSASに比べればまだ普及度は低いが、
既にSPSSを抜いたかも知れない。
俺は(大学関係ではあるが)実務の分析でも使いまくり。
巨大データとかを扱うとかでない限りSASよりは便利。

958 :132人目の素数さん:2007/10/15(月) 13:10:17
>>956
確率と違って、確率密度は変数の単位に依存する値だから。

例えば x が長さの計測値で単位 o の時、それを単位 m に
変換した値を z とすると、
 x = 1000z
という関係にある。
x の確率密度を f(x) とした時、z の確率密度は?

959 :132人目の素数さん:2007/10/15(月) 17:57:18
なんで日本ではStata使わないの?
SPSSみたいに、大きいデータで困る事もなければ、不便なUIに惑わされる事もない。
行列計算もできる本格派。

SASはもっと高いと思うし。

960 :132人目の素数さん:2007/10/15(月) 20:02:14
f(z)=1/(√(2π)1000σ)*exp(-0.5 * z^2) ?
でも、違うような。。。

961 :132人目の素数さん:2007/10/16(火) 03:39:50
>>959
なにが”日本では”だよこの貧乏野郎が


962 :132人目の素数さん:2007/10/16(火) 03:54:04
>>961 リラックスしろよ。海外で金ないんだよきっと

963 :132人目の素数さん:2007/10/16(火) 04:24:42
>>961-962
そんな事が気に障ったの?

ここ見ると、
www.ats.ucla.edu/stat/technicalreports/
SPSSはANOVAが最も簡単にできるが、
Bootstrap, Cross-Sectional Time Series analysis, Logistics Regression, Missing Data, Monte Carlo, Robust Regression
といったその他の計量経済らしい面では、Stataが(一部SASも)ずっと優れているとある。

964 :132人目の素数さん:2007/10/16(火) 04:32:39
気に障ったわけじゃなくて
自分が知らないことを受け入れるのが下手なだけなんだ
許してやってくれ。

965 :132人目の素数さん:2007/10/16(火) 04:36:37
>>964
お前誰だよ?調子乗ってると殺るよおい

966 :132人目の素数さん:2007/10/16(火) 05:53:06
ってかS+/Rで十分なんだけど

967 :132人目の素数さん:2007/10/16(火) 06:39:08
>>960

dx=σdzを考えないと・・・

968 :132人目の素数さん:2007/10/16(火) 12:42:16
>>960
>>958の答えは、z の確率密度を g(z) とすると g(z) = 1000・f(1000z)。
確率密度 f(x) は幅 1o あたりの確率なので、幅 1m あたりの
確率 g(z) に換算するには、f の値を 1000 倍する必要がある。
これが変数変換 x = 1000z のケース。

では x = μ + σ・z なら、答えは?

969 :132人目の素数さん:2007/10/16(火) 13:58:57
>>954

>統計の前に覚えなきゃいけないことが多いです

ぶっちゃけ、「何でもかんでもR」ってのはマゾ意見です。
と言うか、あれだけのコマンドラインを全部覚えろ、ってのは>>954氏が
言う通り、「統計の前に覚えなきゃいけない」だけなんで、一部の統計
専門家がしゃかりきになってるだけ、ですね。
そして、その姿勢を初心者に対しても行う事で、Excelより〜って論法が
無意味になる事をあまり分かっていないとは思っています。
今のやり方を続ける限り、普及するワケないんです。

初心者向けでググってもあまり十分な情報が得られないモノにRコマンダー
と言うGUIインターフェースがあります。Rをインストールした後、これを
インストールすればコマンドラインでそんなに悩む事もないでしょう。
Windowsでしたら、Rをインストールしたあと、上部にある[パッケージの
ダウンロード](だったかな?)でインストールしてそれを起動すれば良いです。
あまり複雑な分析ですとこれじゃあ限界がありますが、少なくともデータの
インポートくらいの手間は直感的に行えますよ。あとは「必要なトコだけ」
コマンドラインを覚えればいいです。
確かに「慣れると」コマンドラインの方が早くなるのは確実ですが、最初から
初心者に対してそれを強調する必要は無い、と考えています。まずはGUIで
「出来る事」だけ覚えて、と言う段階を踏んで勉強していけば十分だと
思います。
基本的な分析だったらRコマンダーだけで殆ど可能ですしね。

http://web.sfc.keio.ac.jp/~maunz/wiki/index.php?R%B8%C0%B8%EC%A5%DE%A5%CB%A5%E5%A5%A2%A5%EB1

970 :950:2007/10/16(火) 23:08:56
>>969

レスありがとうございます。こんな便利なものがあったんですね。
実はあれから、因子分析に関わる部分を必死で勉強してました。
pfa関数やら、青木先生の関数やら、よく分からないけどコピペしまくって、
とりあえず相関行列はexcelで検算したらピッタシになりました・・・


971 :132人目の素数さん:2007/10/16(火) 23:47:26
>>970

>よく分からないけどコピペしまくって

それでいいんですよ(笑)。
1Linuxユーザーの意見から言うと、確かに「コマンドライン」はメンド臭そうに
見える事は確かです。
が、逆に言うと「コピペ」やるにあたっては実はこっちの方が便利なんです(笑)。
GUIだと「コピペして下さい」とはなかなか言えないので(笑)。
取り敢えず最初は「コマンドを自分で全部打つ」必要性はあんまありません。
実際、コマンド打つ人たちも毎回スクラッチでコマンド書くワケではなくって、
バッチファイルとか作って読み込ませる方がはやい、と言う裏技習得している
確率の方が高いのです。
そう言う「GUIじゃやりづらい」ショートカットがあるんだ、ってのを頭の片隅で
いいので置いておいて下さいね。

972 :132人目の素数さん:2007/10/17(水) 02:44:06
>>969
まあ、状況によりけりですね。

私も、計量分析初心者の頃は対話形式で進むソフトが好きでしたが、
複数人でやるプロジェクトの場合、全ての組み合わせを試したり
データを変更したりすることが多いので、最終的にはコードを書いた
方が早いんですよ。

GUIの場合は操作に慣れても分析にはそれなりに時間がかかりますが、
コードの場合は、ノウハウが蓄積されてどんどん速くなりますし、
ルーチン作業を体系化することで結果的にミスも減ると思います。

なので、Rコマンダーなどは積極的に使えば良いと思いますが、
使ってない人も別にしゃかりきになってる訳ではないんです。

973 :132人目の素数さん:2007/10/17(水) 18:28:41
>>967
ありがとうございます。なるほど。
>>968
ありがとうございます。
g(z)=σ f(σ z + μ)+μ
ですか?

974 :132人目の素数さん:2007/10/18(木) 02:45:05
>>973
>g(z)=σ f(σ z + μ)+μ

最後の「+μ」は何だあ???μが負で絶対値が大きいと密度が負になるぞ!
原点移動しても区間幅の単位は変わらんし、ましてやそれが密度の式に
加わるようなことは、ペットボトルを逆さに振っても起きるはず無いだろうが!
おまいデタラメに式を書き換えてるのかあ?
小中学校あたりの勉強からやり直せ!!!ヴォケ!

975 :132人目の素数さん:2007/10/19(金) 20:44:02
>>974
すいません。ということは、
g(z)=σ f(σ z + μ)
ですか?


976 :132人目の素数さん:2007/10/20(土) 14:17:50
「ですか?」って・・・文部省の画一無脳化飼育の勝利だな。
けど、ここは無能さでは負けない2ちゃんだぞw

977 :976:2007/10/20(土) 14:19:52
あ、×無能さ ○無脳さ orz

978 :132人目の素数さん:2007/10/20(土) 17:55:14
純粋数学的にみて、もっとも良い統計学書はなんですか?

979 :132人目の素数さん:2007/10/20(土) 22:02:00
目的や対象がわからないと何がいいともいいがたい。

980 :132人目の素数さん:2007/10/20(土) 23:24:21
>>978

数学者が書いた統計の入門書がよろしいのではないでしょうか?
(意外とそう言うのはすくないです)

岩波書店の「確率・統計入門」(小針あき宏著)がいいとおもいます。

981 :統計初心者:2007/10/22(月) 01:08:35
統計多様体って何なの? なんで接続が双対で出てくるんだろう。

982 :132人目の素数さん:2007/10/22(月) 07:33:49
>>980
それって高校4年の本

983 :132人目の素数さん:2007/10/22(月) 07:49:17
では、どんな本が良いですか?

984 :132人目の素数さん:2007/10/22(月) 07:59:15
>>982
つまんねーよ糞ボケが

985 :132人目の素数さん:2007/10/22(月) 12:21:10
無能はつらいよ

986 :132人目の素数さん:2007/10/22(月) 13:18:17
統計学全体を純粋数学的な立場から述べた本って、ほとんど
ないよね。というか、俺は見たこと無い。あれば読んでみたいけど、
実際に必要とする人がいないからなかなか書かれないんだろうね。
書ける人も殆どいないだろうし。


987 :132人目の素数さん:2007/10/22(月) 17:04:32
>>982
すばらしいじゃないの
他の分野で高校4年の本は思いつかない

988 :132人目の素数さん:2007/10/22(月) 22:06:19
まあ、実際のトコ

「物理学全体を純粋数学的な立場から述べた本」

を挙げろ、っていわれてなかなか思いつかないのと同じだよね。
ジャンルが違うから前提も違うし。

989 :132人目の素数さん:2007/10/22(月) 23:18:50
統計は数学ではなく統計とはよく言われるな

990 :132人目の素数さん:2007/10/23(火) 00:04:45
まともに数理統計のできる統計学者が応用数学としてはつまらんって言ってるよ。


991 :132人目の素数さん:2007/10/23(火) 03:31:38
二百六十九日。


992 :132人目の素数さん:2007/10/23(火) 19:03:34
解けないので教えてください。

「問い」
小学校4年生の学芸会で、さとしくんは次のようなゲームを作りました。

6面のサイコロを振ります。
1か2が出たら当たり。飴をもらえます。
外れたらまた振ることができ、それが外れてもまた振れます。
10回振った時点で当たりが出なかった場合、そこで終了ですが、飴は貰えます。

さて、このゲームに挑戦する子は、平均何回で、飴をゲットすることができるでしょうか。

993 :132人目の素数さん:2007/10/23(火) 19:22:38
1: 1/3
2: 2/3 * 1/3
3: 2/3 * 2/3 * 1/3
4: 2/3 * 2/3 * 2/3 *1/3
-------
n: (2/3)^(n-1) * 1/3, n>=10

994 :132人目の素数さん:2007/10/23(火) 19:50:43
ありがとうございました。
これで子供にじまんできます

995 :132人目の素数さん:2007/10/23(火) 19:55:23
こんな親に自慢される子供がかわいそうだ

996 :993:2007/10/23(火) 21:03:10
>>994
あの〜
途中経過までで、解は書いてないのは分かってます?

997 :132人目の素数さん:2007/10/23(火) 23:07:06
別スレで T検定について悩んでいるやつがいるから そっち行って教えてやれ
数学スレの中で たしかあったぞ

998 :132人目の素数さん:2007/10/24(水) 03:31:38
二百七十日。


999 :132人目の素数さん:2007/10/24(水) 03:32:38
二百七十日一分。


1000 :132人目の素数さん:2007/10/24(水) 03:33:38
二百七十日二分。


1001 :1001:Over 1000 Thread
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。

290 KB
★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50


read.cgi ver 05.05 2022/08/31 Walang Kapalit ★
FOX ★