外れ値と異常値の違いがわかる男
○毎日データをモニタリングしていても、ビジネスインパクトにつながらないワケ ─ リクルート式ビッグデータのビジネス活用最前線
この記事のチェック表が参考になるなぁ、とみていたわけなんですが、以下の部分。
外れ値と異常値の違いを意識しない
へ?・・・違うの?
え、もしかしてみんな「プロ」は意識してるわけ?
やばい、めっちゃハズいんですけど。。。
ということで、Wikipedia師匠で検索すると、あれ、概念は違うんだけど区別できない場合もあるのね。
普通は実質的にありえる値・ありえない値で識別するんでしょうが。
まぁ、異常値は完全にクリーニングすべきで、外れ値においては取扱いを吟味する、ということなのでしょう。
対象集団の傾向性をみるときは外れ値を除き、ポテンシャルの高い対象の選別などのときには入れるってことなのかしらね。