データ分析系プログラマーのブログ

主にPythonを使ったデータ分析や機械学習をやっています。

Pythonを使った独立性のカイ二乗検定統計量の求め方

検定には、母平均、母比率、母分散を用いた検定の他に、二項分布、ポアソン分布、適合度、独立性の検定があります。このうち、カイ二乗統計量を用いた独立性の検定は、2つ以上の分類基準を持つクロス集計表において、分類基準間に関連があるかどうかを検定…

Pythonを使った適合度のカイ二乗検定統計量の求め方

検定には、母平均、母比率、母分散を用いた検定の他に、二項分布、ポアソン分布、適合度、独立性の検定があります。このうち、カイ二乗統計量を用いた適合度の検定は、ある調査によって得られたクロス集計表がある場合、実測度数がある特定の分布に適合(一…

Pythonを使ったポアソン分布の検定統計量の求め方

検定には、母平均、母比率、母分散を用いた検定の他に、二項分布、ポアソン分布、適合度、独立性の検定があります。このうち、ポアソン分布を用いた検定は、事故や地震などのようにサンプル数が非常に大きく、確率が非常に小さい場合にサンプル数×確率を一定…

Pythonを使った二項分布の検定統計量の求め方

検定には、母平均、母比率、母分散を用いた検定の他に、二項分布、ポアソン分布、適合度、独立性の検定があります。このうち、二項分布を用いた検定は、コインやサイコロなどのようにある値が出るか出ないかと言った二項分布からコインやサイコロなどの確率…

Pythonを使った等分散の検定統計量の求め方

母分散の検定には2標本を使った等分散の検定があります。この2つの標本のた母分散を使っ等分散の検定は、2つの標本から得た標本分散を使って2つの分散が等しいかをF分布を使って検定する方法となります。この記事では、Pythonを使った、等分散の統計検定…

Pythonを使った母分散の検定統計量の求め方(母平均未知)

検定には、母平均、母比率、母分散を用いた検定がそれぞれあります。このうち、母分散を用いた検定は、母平均が既知の場合は、標本平均の分布は、自由度nのカイ二乗分布に従い、母平均が未知の場合は、自由度n-1のカイ二乗分布に従います。この記事では、Pyt…

Pythonを使った母比率の差の検定統計量の求め方(大標本)

母比率の検定には2標本を使った検定があります。この2つの標本を使った母比率の差の検定は、2つの標本から得た標本比率を使って母比率が等しいかを検定する方法となります。この記事では、Pythonを使って、母比率の差の統計検定量の求め方と検定の行い方に…

Pythonを使った母比率の検定統計量の求め方(大標本)

検定には、母平均、母比率、母分散を用いた検定がそれぞれあります。このうち、母比率を用いた検定は、標本が十分に大きい場合には標本平均の分布は正規分布に従うことから、標準正規分布を用いて検定を行うことができます。この記事では、Pythonを使って、…

Pythonを使った母平均の差の検定統計量の求め方(母分散未知)

母平均の検定には2標本を使った検定があります。このうち、サンプル数が同じ場合(対応のある)とサンプル数が異なる場合(対応のない)とで求め方が違います。この記事では、Pythonを使った母平均の差の検定統計量の求め方について、対応がある場合、対応…

Pythonを使った母平均の検定統計量の求め方(母分散未知)

統計学には、確率を元に仮説を立てて、検証して、結論を導くという手順で行う検定があります。検定には、母平均、母比率、母分散を用いた検定がそれぞれあります。この記事では、Pythonを使って、母分散が未知である場合の母平均の統計検定量の求め方と検定…

Pythonを使った母平均の検定統計量の求め方(母分散既知)

統計学には、確率を元に仮説を立てて、検証して、結論を導くという手順で行う検定があります。検定には、母平均、母比率、母分散を用いた検定がそれぞれあります。この記事では、Pythoを使って、母分散が既知である場合の母平均の統計検定量の求め方と検定の…

Pythonを使った母分散の95%信頼区間の求め方

区間推定には、母平均の信頼区間の他に、母比率や母分散の信頼区間も求めることができます。この記事では、Pythonを使った母分散の95%信頼区間の求め方について紹介しています。 母分散の信頼区間とは Pythonを使った母分散の95%信頼区間 参考 母分散の信頼…

Pythonを使った母比率の差の95%信頼区間の求め方

母比率の信頼区間は、2つの異なる母集団の比率の差の信頼区間を算出することもできます。この記事では、Pythonを使った母比率の95%信頼区間の求め方について紹介しています。 母比率の差の95%信頼区間 Pythonを使った母比率の差の95%信頼区間その1 Pythonを…

Pythonを使った母比率の95%信頼区間の求め方

区間推定には、母平均の信頼区間の他に、母比率や母分散の信頼区間も求めることができます。この記事では、Pythonを使った母比率の95%信頼区間の求め方について紹介しています。 母比率の95%信頼区間とは サンプルサイズの算出 Pythonを使った母比率の95%信…

母平均の差の信頼区間について

母平均の信頼区間は、2つの異なる母集団の平均の差の信頼区間を算出することもできます。2つのデータが対応のあるデータの場合は、それぞれのデータの差を求めることで信頼区間を求めることができます。一方で、対応のないデータの場合では、母分散が既知、…

Pythonを使った母平均の95%信頼区間(母分散未知)の求め方

母集団から標本を抽出して母集団のパラメータを推定する場合には、点推定と区間推定の2種類があります。このうち、区間推定にも、母集団の分散がわかっている場合(母分散既知)と母集団の分散がわからない場合(母分散未知)に分けられます。この記事では…

Pythonを使った母平均の95%信頼区間(母分散既知)の求め方

母集団から標本を抽出して母集団のパラメータを推定する場合には、点推定と区間推定の2種類があります。このうち、区間推定にも、母集団の分散がわかっている場合(母分散既知)と母集団の分散がわからない場合(母分散未知)に分けられます。この記事では…

標準誤差について

母集団から標本と抽出して、母集団のパラメータを求めるような推定を行う場合、母集団の統計量と標本から求める推定量には誤差が生じます。このような誤差を標準誤差と言います。この記事では、pythonを用いた標準誤差の求め方とサンプル数を増やした時の標…

不偏分散について

母集団の標本を用いて、母集団を特徴づけるパラメータ(母数)の推定値を求めるような点推定のうち、標本から求める分散のことを不偏分散といい、分散(標本分散)と区別しています。この記事では、Pythonを使った不偏分散の求め方について紹介しています。 …

点推定について

統計学は、データを整理し、表やグラフを使ってわかりやすく表すような記述統計学と、母集団の標本を使って、母集団の情報を推測するような推測統計学の2種類に分けられます。そのうち、推測統計学は推定と検定があります。そして、推定には平均値などを1つ…

連続一様分布について

確率密度関数が常に一定の値をとる分布のことを一様分布と言います。一様分布には、離散型確率分布と連続型確率分布があります。この記事では、連続一様分布について紹介しています。 連続一様分とは 連続一様分布に従う確率密度関数と期待値と分散 連続一様…

離散一様分布について

確率密度関数が常に一定の値をとる分布のことを一様分布と言います。一様分布には、離散型確率分布と連続型確率分布があります。この記事では、離散一様分布について紹介しています。 離散一様分布とは 離散一様分布に従う確率と期待値と分散 離散一様分布に…

指数分布について

連続型確率分布の一つに、機械が故障してから次に故障するまでの期間や、災害が起こってから次に起こるまでの期間のように、次に何かが起こるまでの期間が従う分布の指数分布があります。この記事では、pythonを使った指数分布の求め方について紹介していま…

標準化について

正規分布に従う確率変数は、標準化を行うことによって標準正規分布に従う確率変数に変換することができます。標準化したデータは、異なる分布のデータ同士を比較したりすることができます。この記事では、pythonを使った標準化の方法について紹介しています…

正規分布について

連続型確率分布には正規分布と呼ばれる分布があります。正規分布は、検定や推定など様々な場面で用いられます。この記事では、pythonを使った正規分布ついて解析的に求める場合と、数値的に求める場合について紹介しています。 正規分布とは 正規分布に従う…

Pythonを使った幾何分布の求め方

離散型確率分布には、成功確率がpの時のベルヌーイ試行を繰り返すとき、初めて成功するまでの試行回数に従う確率分布として幾何分布があります。この記事では、pythonを使った幾何分布の求め方について解析的に求める場合と、数値的に求める場合について紹介…

Pythonを使ったポアソン分布の求め方

離散型確率分布のうち、結果が2つしかないような試行のことをベルヌーイ試行と言いますが、このうちnが大きく、pが小さい時をポアソン分布と言います。この記事では、pythonのライブラリを使ってポアソン分布の確率を解析的に求める場合と、数値的に求める…

Pythonを使った二項分布の求め方

離散型確率分布のうち、コインを投げた時のような結果が2つしかない場合を二項分布と言います。この記事では、pythonのライブラリを使って二項分布の確率を解析的に求める場合と、数値的に求める場合について紹介しています。 ベルヌーイ試行とは 二項分布…

連続型確率変数の期待値と分散について

連続型確率変数においても期待値と分散を計算することができます。期待値とは、1回の試行で得られる値の平均値です。また分散とは、ばらつき具合を示しています。この記事では、Pythonを使った連続型確率変数における期待値と分散の求め方について紹介して…

離散型確率変数の期待値と分散について

離散型確率変数においても期待値と分散を計算することができます。期待値とは、1回の試行で得られる値の平均値です。また分散とは、ばらつき具合を示しています。この記事では、Pythonを使った離散型確率変数における期待値と分散の求め方について紹介して…