2012年1月24日火曜日

楕円と直線

グラフは効果的な表現技法ですが,
不適切な表現で誤った印象を与えかねないものも多くあります.
(参考:3D円グラフを使うのはやめよう | Okumura's Blog

勘違いしやすいグラフには幾つかパターンがあって
注意していれば間違うことはあまりないですが,
最近ちょっとおもしろいパターンを見つけたのでメモしておきます.

まず上のグラフを見てください.黒い点は誤差を含んだ計測値で,
赤い線は $y=\frac{1}{3}x$ ,青い線は $y=2x$  の式を表しています.
この場合,赤線は青線よりも計測値の傾向をよく表現しているように見えます.

一方,このグラフでは青線のほうが赤線よりもデータ点を良く表しているように見えると思います.

しかし,実はこれらの2つのグラフは縦横の比率と表示範囲を変えただけで
全く同一のグラフです.

つまり,同じデータに対して,左の図を書いて $y=\frac{x}{3}$ の関係があると結論付けることも右の図を書いて $y=2x$ の関係を主張することもできてしまうわけです.

ちょっと不思議な感じがしますが,
  • 線形変換は楕円と長軸の関係を保存しない
  • 人間は楕円状に分布するデータを見ると無意識に長軸の方向に線を引きたくなる
といったことに留意すると納得できるかなと思います.

教訓は,「楕円状のデータにあてがわれた直線の傾きで結論が出されているのを見たら,その直線がどういう基準で引かれたものか注意しなければならない.」ということでしょうか.


おそらく Google Chrome 以外のブラウザでは動きませんが,
スライダーで縦横比を調整できるグラフも下においておくので
良ければ納得がいくまで遊んでいってください.