KabuGuide.com Blog # A B C D E F G H I J K L M N O P Q R S T U V W X Y Z NASDAQ NYSE AMEX

T-テストは何ですか?

t検定は、特定の機能に関連していてもよい2つのグループの平均間の有意差があるかどうかを決定するために使用される推論の統計のタイプです。データセットは、コインを100回反転から結果として記録されたデータセットのように、正規分布に従うことになると未知の分散を有することができる場合には、主に使用されます。 t検定は、集団に適用可能な仮定のテストを可能にする仮説テストツールとして使用されます。

t検定は、2つのデータセット間の差の確率を決定するためにt統計量、t分布値、及び自由度を調べ。三個の以上の変数でテストを行うためには、分散分析を使用する必要があります。

1時38分 T検定

T検定を説明します

基本的に、t検定は、私たちは二つのデータセットの平均値を比較し、それらが同じ母集団から来たかどうかを判断することができます。上記の例では、我々は>からの学生のサンプルを採取した場合

数学的には、t検定は、二組の各々からサンプルを取り、二つの手段が等しいという帰無仮説を仮定することによって、問題文を確立します。適用可能な式に基づいて、特定の値を計算し、標準値と比較し、想定帰無仮説は、受け入れ又は相応拒否されます。

帰無仮説は棄却さする条件を満たしている場合、それは、データの読みが強く、偶然ではないことを示しています。 t検定は、ただ一つ、この目的のために使用される多くのテストです。統計は、さらに大きなサンプルサイズでより多くの変数およびテストを調べるために、t検定以外のテストを使用しなければなりません。大きなサンプルサイズのために、統計学者はz検定を使用します。その他のテストオプションは、カイ二乗検定とF検定が含まれます。

そこt検定の3つのタイプがあり、それらは従属および独立t検定として分類されています。

重要ポイント

t検定は、特定の特徴のt検定に関連することができる2つのグループ平均間の有意差があるかどうかを決定するために使用される推論の統計のタイプは、仮説検定のために使用される多くの試験の一つでありますt検定をstatistics.Calculatingに3つの主要なデータ値が必要です。それらはによって行うことができるt検定のいくつかの異なるタイプである(平均差と呼ばれる)は、各データセットからの平均値の差は、各群の標準偏差、および各group.Thereのデータ値の数を含みます必要なデータと分析の種類に。###あいまいなテスト結果

製薬会社が新たに発明の薬をテストしたいことを考えてみましょう。これは、患者の一つのグループに薬をしようと対照群と呼ばれる別のグループにプラセボを与えるの標準的な手順に従います。対照群に与えられたプラセボはない意図する治療価値の物質であり、実際の薬剤が与えられ、他のグループは、どのように応答するかを測定するためのベンチマークとしての役割を果たす。

薬物裁判の後、プラセボ給餌対照群のメンバーは、3年間の平均寿命の増加を報告しながら、新しい薬のレポートを4年間の平均寿命の増加を処方されているグループのメンバー。インスタント観察結果は、薬剤を使用して、グループのために優れているとして、薬剤が実際に働いていることを示してもよいです。しかし、観察が偶然発生、運の特に驚くべき作品に起因することも可能です。 t検定は、結果が実際に正しいと人口全体に適用される場合と結論するのに便利です。

学校では、100人の学生>で

t検定仮定

t検定について作られた最初の仮定は、測定のスケールに関するものです。 t検定のための仮定は、収集されたデータに適用される測定のスケールは、作られたIQ test.The第2の仮定のスコアとして、連続または順序尺度に従うことで、データであること、単純なランダムサンプルのものですプロットされたときに代表から集め、総population.The第三の仮定のランダムに選択された部分は、データは、正規分布をもたらし、釣鐘型の分布は、第四の仮定が合理的に大きなサンプルサイズが使用されているcurve.The。より大きなサンプルサイズが通常の釣鐘状curve.The最終仮定に近づくべき結果の分布は分散の均質性であることを意味します。サンプルの標準偏差がほぼ等しい場合、均質、または等しい、差異が存在します。

T-テストの計算

t検定を計算すると、3つの主要なデータ値が必要です。彼らは、(平均差と呼ばれる)は、各データセットは、各群の標準偏差、および各グループのデータ値の数からの平均値の差を含みます。

t検定の結果はt値を生成します。この計算されたT値は、その後、(t分布表と呼ばれる)臨界値テーブルから得られる値と比較されます。この比較手段の間の差が偶然またはデータセットは本当に本質的な違いがあるかどうか発生してどのように可能性を判断するのに役立ちます。群間の差は、研究中またはそれはおそらく無意味な統計学的な差である場合はtrueの違いを表しているかどうかをt検定問題。

t分布表

t分布表は、一尾と二尾の形式で利用可能です。前者は(正または負)の明確な方向性を有する固定値または範囲を有するケースを評価するために使用されます。たとえば、-3の下に残っている、またはサイコロのペアを転がしたときに7つ以上を取得した出力値の確率は何ですか?後者は、このような座標は-2と+2の間に入るかどうかを尋ねるように、レンジ結合分析のために使用されます。

計算は、MS Excelで見られるように、必要な統計関数をサポートする標準のソフトウェアプログラムを実行することができます。

T-値と自由度

t値と自由度:t検定は、その出力として2つの値を生成します。 t値は2つのサンプルセットの平均およびサンプルセット内に存在する差との差の比です。分子値(2つのサンプルセットの平均値との間の差)を計算することは簡単であるが、分母(サンプルセット内に存在する差)が関与するデータ値の種類に応じて少し複雑になることができます。比率の分母は、分散又は変動性の測定値です。また、Tスコアと呼ばれるT値の高い値は、大きな差は、2つのサンプルセット間に存在することを示しています。 t値が小さいほど類似度は、2つのサンプルセットの間に存在します。

ラージTスコアは、グループがdifferent.A小T-スコアを基に類似していることを示していることを示しています。

自由度が変動し、重要性と、帰無仮説の妥当性を評価するために不可欠な自由を持っている研究で値を参照します。これらの値の計算は、通常、サンプルセットで利用可能なデータレコードの数に依存します。

相関(またはペア)T検定

サンプルは、典型的には同様の単​​位の整合ペアから成る場合、または反復測定の場合がある場合相関t検定が行われます。例えば、同じ患者のインスタンスを繰り返し、前及び特定の治療を受けた後に試験されているがあってもよいです。このような場合に、各患者は、自身に対するコントロールサンプルとして使用されています。

この方法はまた、サンプルは子供、親や兄弟を含む比較分析のように、何らかの方法で関連または一致する特性を持っている場合に適用されます。これらのサンプルの2つのセットが関連している場合を含むように相関するか、対応のあるt検定は、依存型です。

対応のあるt検定の自由t値と度を計算するための式であります:

VAR1とVAR2は、サンプルセットのそれぞれの分散を表してMean1とmean2は、サンプルセットのそれぞれの平均値です。

残りの2種類は、独立したt検定に属します。これらのタイプのサンプルは互いに、つまり、二つのグループのデータセットが同じ値を参照しないとは無関係に選択されます。彼らは、50人の患者それぞれの2つのセットに分割されている100人の患者のグループのような場合が挙げられます。グループの一つは、対照群となり、他のグループが所定の治療を受けている間、プラセボを与えられています。これは、互いに対になっていない二つの独立したサンプルグループを構成します。

等分散(またはプール)T-##試験

各群のサンプル数は同じであるか、または二つのデータセットの分散が類似している場合等分散t検定が使用されます。以下の式は、T値および等分散t検定の自由度を算出するために使用されます。

T値= mean1-mean2(N1-1)×var12 +(N2-1)×var22n1 + N2-2 1n2where + 1N1×:mean1とeachofサンプルsetsvar1のmean2 =平均値及びVAR2のそれぞれの分散=サンプルsetsn1、各サンプル・セット内のレコードのN2 =数\開始{整列}&\テキスト{T値} = \ FRAC {mean1 - mean2} {\のSQRT {\ FRAC {(N1 - 1)\回VAR1 ^ 2 +(N - 1)\回VAR2 ^ 2} {N1 + N2 - 2}} \回\ SQRT {\ FRAC {1} {N1} + \ FRAC {1} {N2}}} \&\ textbf {ここ} \&mean1 \テキスト{と} mean2 = \テキスト{それぞれの平均値} \&サンプルセットの\テキスト{} \&VAR1 \テキスト{と} VAR2 = \テキストの各々の{分散サンプルセット} \&N1 \テキスト{と} N2 = \テキスト{各サンプルセット内のレコード} \ \端{整列} T値= N1 + N2-2(N1-1)×var12 +(N2の数-1)×var22×N11 + N21 mean1-mean2:レコードのmean1とmean2 = eachofサンプルsetsvar1とVAR2の平均値=分散試料setsn1の各々の及びn2 =番号、各サンプル中のセット

そして、

自由度= N1 + n2-2where:n1とn2 =各サンプル・セット内のレコード数が\開始{整列}&\テキスト{自由度} = N1 + N2 - 2 \&\ textbf {ここ} \&N1 \テキスト{と} {各サンプルセット内のレコードの数} N2 = \テキスト\ \端{整列}自由度= N1 + n2-2where:n1とn2 =各サンプルセット内のレコード数

不等分散T検定

不等分散t検定は、各群のサンプル数が異なる、2つのデータセットの分散が異なる場合に使用されます。このテストは、ウェルチのt検定と呼ばれています。以下の式は、不等分散t検定のためのt値と自由度を算出するために使用されます。

T値= mean1-mean2var12n1 + var22n2where:サンプルsetsn1、各サンプル・セット内のレコードのN2 =数の各々のeachofサンプルsetsvar1とVAR2 =分散のmean1とmean2 =平均値が\ {整列}始める&\テキスト{T値} = \ FRAC {mean1 - mean2} {\のSQRT {\ FRAC {VAR1 ^ 2} {N1} + \ FRAC {VAR2 ^ 2} {N2}}} \&\ textbf {ここ} \ \&mean1 \テキスト{と} mean2 = \テキスト{それぞれの平均値} \&{サンプルセットの} \テキスト\&VAR1 \テキスト{と} VAR2 = \テキスト{サンプルセットのそれぞれの分散} \ \&N1 \テキスト{と} N2 = \テキスト{各サンプルセット内のレコードの数} \ \端{整列} T値= n1var12 + n2var22 mean1-mean2:mean1とmean2 =平均値各サンプルセット内のレコードのサンプルsetsn1とn2 =番号のそれぞれのeachofサンプルsetsvar1とVAR2 =分散

そして、

サンプルsetsn1、各サンプル・セット内のレコードのN2 =数のそれぞれのVAR1とVAR2 =分散\開始{整列:自由=(var12n1 + var22n2)2(var12n1)2n1-1 +(var22n2)2n2-1where度}&\テキスト{自由度} = \ FRAC {\左(\ FRAC {VAR1 ^ 2} {N1} + \ FRAC {VAR2 ^ 2} {N2} \右)^ 2} {\ FRAC {\左( \ FRAC {VAR1 ^ 2} {N1} \右)^ 2} {N1 - 1} + \ FRAC {\左(\ FRAC {VAR2 ^ 2} {N2} \右)^ 2} {N2 - 1}} \&\ textbf {ここ} \&VAR1 \テキスト{と} VAR2 =テキスト\ {サンプルセットのそれぞれの分散} \&N1 \テキスト{と}各サンプルセット内のN2 = \テキスト{レコードの数それぞれのVAR1とVAR2 =分散:自由= N1-1(n1var12)2 + N2-1(n2var22)2(n1var12 + n2var22)2} \ \端{整列}度サンプルsetsn1、各サンプルセット内のレコードのN2 =数の

使用する正しいt検定を決定

以下のフローチャートは、t検定は、サンプルセットの特性に基づいて使用されるべきかを決定するために使用することができます。考慮すべき重要な項目は、サンプルレコードは、各サンプル・セット内のデータ・レコードの数、および各サンプルセットの分散に類似しているかどうかが挙げられます。

不等分散T-試験例

私たちはアートギャラリーで受信された絵画の対角線の測定値を取っていることを前提としています。他の20枚の絵画を含むが、サンプルの一つのグループは、10枚の絵画を含みます。次のようにデータセットは、対応する平均値と分散値です。

セット2の平均値は、セット1のそれよりも高いですが、我々はセット2の分散がセット1が偶然にこのか、それとも違いが本当に存在しないよりもかなり高いので、すべての絵は21.6台の周りの平均の長さを持っていると結論づけることはできませんアートギャラリーで受信したすべての絵の全体的な人口の?私たちは、平均値は、2つのサンプルセットの間で同じであるという帰無仮説を仮定することによって、問題を確立し、仮説が成り立つかどうかを確認するためにt検定を実施しています。

データレコードの数が異なる(= 10、N1とN2 = 20)であり、分散も異なるため、t値と自由度は、上記のデータに対して計算される不等分散T検定で前記式を使用して設定セクション。

t値は-2.24787です。 2トン値を比較するときにマイナス記号を無視することができるので、計算値は2.24787です。

自由値度は24.38であり、最小限の整数値に値を切り捨てる必要式の定義のために、24に低減されます。

正規分布を仮定したときはいつでも、一方が受け入れ基準として確率(アルファレベル、有意水準はp)のレベルを指定することができます。ほとんどの場合、5%の値を想定することができます。

24と5%の有意水準として自由度の値を用いて、t値の分布表を見ては、2.064の値を与えます。 2.247の計算値に対してこの値を比較すると、計算されたT値は、5%の有意水準でのテーブル値よりも大きいことを示しています。したがって、手段の間に差がないという帰無仮説を棄却しても安全です。人口セットは本質的な違いを持っ​​ており、彼らは偶然ではありません。