仮説設計の重要性とポイント

データ分析

データ分析において「精度の高い仮説」を設計することの重要性

皆さん初めまして。合同会社StudioData代表のRyumaと申します。

私は普段スクラムチームのデータサイエンティスト・データアナリストとして、施策の立案や仮説検証を担当させていただいております。

そんな日々を過ごす中で、改めて「精度の高い仮説」の重要性を感じており、今回備忘録としてこの記事を記載することにいたしました。

当記事では、仮説設計に対するポイントや必要な理由についての当たり前を今一度再確認するという形でまとめてまいります。

なお、今回まとめる内容は下記の参考文献をもとに作成させていただいておりますので興味がありましたらぜひ読んでみてください。

「それ、根拠あるの?」と言わせないデータ・統計分析ができる本

仮説がなぜ必要か

仮説が必要な理由は大きく分けて3つあります。

仮説が必要な3つの理由

  • 無駄な分析を避けることができる
  • 分析の目的が明確になる
  • 大局的な視点でストーリを作りやすい

無駄な分析を避けることができる

まず、「優秀なデータアナリトとは、無駄な分析をスパッと切ることができる人」ということが大前提です。

ある程度やるべきことがまとまったら考えすぎずに作業する、というのももちろん重要ですが、それは仮説あっての話です。

仮説が無いと、設計図が無いまま家具を組み立てるくらいグラグラした分析になってしまい非常に危険です。

「何を明らかにしたいのか」という目的と、「おそらくこういうことが言えるのではないか」という仮説を持ち、仮説を検証するために分析をするということを忘れないでください。

分析の目的が明確になる

上でも少し解説しましたが、「仮説」よりも前の段階に大前提としての「目的」が存在しています。

しかし、複雑なSQLを書いていたり、複数の関数をスプレッドシートで扱うなど試行錯誤していると、目的がいまいち分からなくなってしまうというのはよくある話ではあります。

社会人になりたての頃の著者はまさにこの状態でした。

そのため、仮説がしっかり設計されていると、「明らかにしたいもの」と「そのために何をするべきか」が絶対に揺らぐことはないので、ここをぶらさないようにしましょう。

大局的な視点でストーリーを作りやすい

最後は、広い視野で物事を考えるために仮説が必要だということをお話しします。

「選択肢を狭めずに広い視野を持つ」「AかBかではなくCも考える」というような表現は皆さんもどこかで目にしたことがあると思います。

要するに狭い視野じゃダメだよということを言われているのですが、どうしても目の前の作業に熱中するとこれらは疎かになりがちです。

聞き飽きたような表現ではありますが、広い視野で物事を捉えるためにも仮説設計が必要だということです。

仮説を立てる際のポイント

様々な書籍やWEB記事などで「仮説の立て方」のポイントが紹介されていると思います。

この記事では個人的に実践で仮説を立てる際に最低限出来ていれば大丈夫なポイントを2つ紹介します。

ポイント

  • 「言い切り」の形にする
  • 行動に繋げられる

「言い切り」の形にする

仮説を立てる際は必ず「言い切り」の形にしてください。

例えば「ディズニーリゾートの来場人数の変動はどのような原因で引き起こされるのだろうか」という疑問に対して、強引にでも「言い切り」の形にしたものが仮説になります。

例を挙げると「ディズニーリゾートの来場人数は天気と相関がある」です。

このように仮説は必ず言い切りの形で設定するのが1つ目のポイントです。

行動に繋げられる

実践で意外とハマってしまうのがこちらのポイント。

そもそもデータ分析は施策に落とし込み、効果を測定して初めて意味のあるものとなります。

「その仮説が分かったところでどうするの?」となってしまうような仮説は良い仮説ではありません。

「仮説がなぜ必要か」のパートでも解説した通り、無駄な分析を避けるために必ず仮説の真偽が分かった後の行動までセットで設計するようにしましょう。

仮説を分析につなげる4つのポイント

続いて、立てた仮説を効果的に分析につなげるためのポイントを4つ紹介します。

ポイント

  • 複数の仮説を用意する
  • MECE
  • 現状の制約条件に捉われない
  • 最初から100点を狙わない

複数の仮説を用意する

1つの目的に対して仮説は複数用意します。

先程の例だと、「ディズニーリゾートの来場人数は天気と関係があるかもしれない」に加えた「周辺のホテルの予約数と関係がある」など複数の仮説を用意します。

関係がありそうな事柄を複数まとめ確度が高そうなものから優先度をつけて順次検証していきましょう。

MECE

MECEとはMutually Exclusively and Collectively Exhaustiveの略で一言でまとめると「漏れなくダブりなく」です。

仮説を設計し、調べる予定の母数には漏れがないか、ダブりがないか。

基礎的な部分ですが、ここの確認を絶対に怠らないようにしましょう。

現状の制約条件に捉われない

現状の制約条件とは要するに、手元にデータがない、調べたことがないなどです。

これらを理由に仮説を最初から排除してしまうのはとても危険です。

データがないならその部分の調査から始めてはどうか、調べたことがないならある程度仮説を作ってやってみるのはどうかなど、分析を進めるためのポジティブ思考も重要です。

最初から100点を狙わない

最後に完璧を求めすぎないという点です。

出された仮説はもちろん間違っていることもあります。

発明王エジソンが「これは『失敗』ではない。成功しないということを発見した『成功』だ。」のような言葉を残していますが同じようなことが分析においても言えると思っています。

「この仮説はXXの理由で間違っていた」ということがわかっただけでもデータ分析の成果の1つと言えますのでめげずに頑張りましょう。

もちろん仕事には締め切りがありますので、確度の高い仮説を出したいですが、考えすぎて先に進まないなどよりは100点を狙わないでどんどん仮説を出して検証する方が生産性の高い分析が出来ます。

仮説の重要性まとめ

今回はデータ分析の「目的」→「仮説」→「手段」の流れにおける仮説の重要性について解説させていただきました。

難しく考えすぎてしまって時間をロスしてしまったり、確度が低すぎる仮説で無駄な分析をしてしまったなど、初めは多くの問題点があると思います。

分析をしていく中で、この「仮説設計」のある種のコツのようなものが自分の中で固まってくるとより生産性の高い分析をできると思い、僕は日々頑張っております。

最後までご視聴いただきありがとうございました!

-データ分析
-

© 2024 今すぐ使えるデータサイエンス Powered by AFFINGER5