KabuGuide.com Blog # A B C D E F G H I J K L M N O P Q R S T U V W X Y Z NASDAQ NYSE AMEX

四分位とは何ですか?

四分位は、データとどのように観測のセット全体と比較の値に基づいて、4つの定義された間隔に観測の分割を記述する統計的用語です。

理解が四分位

四分位数を理解するためには、中心傾向の尺度として中央値を理解することが重要です。統計上の中央値は、一連の数値の中間値です。これは、データの正確に半分が中央値より下と上にある点です。

だから、13個の数字の組が与えられると、中央値は、第七の数であろう。この値を前の6つの数字はデータで最も低い数値であり、中央値の後に6つの数字は、所与のデータセット内の最高数です。中央値は、分布の極値または外れ値に影響されないので、それは時々平均に好適です。

中央値は、場所の堅牢な推定量であるが、その値のいずれかの側のデータが広がったり分散されているかについては何も言いません。つまり、ここでの四分位手順である。四分位数は、4つのグループに分布を分割することにより、平均の上下値の広がりを測定します。

重要ポイント

使用されるデータset.Quartiles 4つのグループを形成するために - 低い四分位、中央値、上位四分位 - 四分位対策上記四のgroups.Aの四分位に分布を分割することによって、平均未満の値の広がりは、三点にデータを分割します中央値の周りのばらつきの尺度である四分位範囲を計算する。###どのように仕事を四分位

測定の50%が中央値より下にあると50%がそれの上にあるように、中央値が半分にデータを分割と同じように、測定の25%は低い四分位数未満になるように、四分位数は50、四半期にデータを破壊します%は、平均未満であり、75%が上位四分位点未満です。

データセットの四つのグ​​ループを形成するために - 低い四分位、中央値、上位四分位 - 四分位3点にデータを分割します。下位四分位点または第一四分位数は、Q1として示され、データセットの中央値の最小値の間にある中間の数です。第二四分位数、Q2は、また、中央値です。 Q3として示される上部または第三四分位数は、中央値および分布の最大数との間に位置する中心点です。

今、私たちは、四分位から形成された4つのグループをマッピングすることができます。値の最初のグループは、Q1までの最小数が含まれています。第2のグループは、中央値にQ1を含みます。第三のセットは、Q3の中央値です。第四のカテゴリーは、セット全体の最高のデータポイントにQ3を備えます。

各四分位数は、全観測の25%が含まれています。一般的に、データは、最小から最大に配置されています。

第一四分位:numbersSecond四分位数の最低25%:25.1%と50%との間の第3四分位数(中央値まで):51%〜75%(中央値以上の)第四分位数:数の最高25%

四分位例

のは、一例で作業しましょう。 、で数学のスコアの分布を仮定>

59、60、65、65、68、69、70、72、75、75、76、77、81、82、84、87、90、95、98

75:第一、この場合には第十の値である中央値、Q2を、マークダウン。

Q1は、最小スコアと中央値との間の中心点です。この場合、Q1は、第一及び第五のスコアの間に入る:68は、[値の奇数のセットについてQ1またはQ3を算出する際にメジアンも含めることができることに留意されたいです。 (第5 + 6位)/ 2 =(68 - 私たちは中間点の両側に中央値を含むようにした場合、Q1は、第5及び第6のスコアの平均値である第一及び第10のスコアとの間の中間値になり+ 69)/ 2 = 68.5]。

84それとも、中央値を含む場合、Q3 =(82 + 84)/ 2 = 83]:Q3は、Q2と、最も高いスコアとの間の中間値です。

今、私たちは私たちの四分位数を持っていること、のは、自分の番号を解釈してみましょう。 68(Q1)のスコアが第一四分位数を表し、25パーセンタイルです。 68、すなわち59から75までのスコアの中央値は、利用可能なデータに設定されたスコアの下半分の中央値です。

Q1は、スコアの25%が>パーセンタイル未満の68及び75%であることを教えてくれるし、スコアの50%が75未満であることを示し、そしてスコアの50%が75最後に、Q3、75以上でありますパーセンタイルは、スコアの25%が大きく、75%が84未満であることがわかります。

特別な考慮事項

Q1のためのデータポイントが離れQ3は、中央値からよりも、中央から遠い場合には、我々は、より大きな値のうち、よりデータセットの小さい値の中で大きなばらつきがあることを言うことができます。 Q3が遠くQ2からQ1よりも中央値であるである場合、同じ論理が適用されます。

データポイントの偶数がある場合あるいは、中央値は、真ん中の2つの数値の平均であろう。私たちは20名の代わりに19を持っていた場合は、上記の例では、そのスコアの中央値は、第10及び第11の数の算術平均になります。

四分位数は、中央値の周りに変動性の尺度である四分位範囲を計算するために使用されます。 Q1 - Q3:四分位範囲は、単に第一および第三四分位数の間の差として計算されます。実際には、データが広がる方法を示していたデータの途中半分の範囲です。

大規模なデータセットの場合、Microsoft Excelは、四分位数を計算するQUARTILE機能を持っています。