PR

ヒストグラムとは~定義の図解と度数折れ線を添えて~

統計学
記事内に広告が含まれています。

ヒストグラムとは,度数分布表を柱状のグラフで表したものです。度数分布図とも言います。ヒストグラムについて,定義と具体例,棒グラフとの違いも解説します。

なお,最後には「度数折れ線」というのも紹介します。

ヒストグラムとは

ヒストグラムの定義

定義(ヒストグラム)

データをある範囲ごとに区切って,その範囲に属する数を表にした度数分布表 (frequency table)を柱状のグラフで表した以下のようなものをヒストグラム (histogram) または度数分布図という。

度数分布表をグラフとして可視化することで,分布の様子を分かりやすくとらえようというわけですね。なお,ヒストグラムにおける各柱のことをビン (bin) といいます。

具体例を確認していきましょう。まず,以下のデータがあったとします。

東京における20日間の気温データ(偽データ)

これを度数分布表にしたのが以下の表です。度数分布については,度数分布表とは~定義と関連用語をまとめて図解~で解説しています。

この表について,横軸を階級,縦軸を度数にしたものが,ヒストグラムです。

ヒストグラムの例

棒グラフとの違い

棒グラフとは「各データを棒の大きさで比較するグラフ」です。ヒストグラムは,広義には棒グラフの一種と言ってもよいでしょう。しかし「上の20日間のデータを棒グラフにする」というと,ふつう以下のようなグラフを想起すると思います。

各日にちに対し,気温を縦軸に取ったグラフですね。それぞれの「棒」は対等であり,ヒストグラムとは違うのが分かるでしょう。

また,ヒストグラムは横軸が連続データのため,横に間隔を開けずにかくのが普通ですが,上のような棒グラフは横に隙間を開けても構いません。

「気温のデータは変化を見たいため,折れ線グラフにすべきだ」という意見もあるでしょうが,それは置いておいて,棒グラフとヒストグラムでは,想起するものが違います。

度数折れ線

ヒストグラムに関連して「度数折れ線」を定義しておきましょう。

定義(度数折れ線)

ヒストグラムの各棒の上辺の中点を結んだ以下のような赤い線を度数折れ線 (frequency polygon) という。

度数折れ線の定義

ヒストグラムは柱状でしたが,それを折れ線にした感じですね。

データの分布を可視化するその他の方法

関連する記事