平均年収、平均年齢……プレゼンやデータで当たり前に使われる「平均」という言葉。でも、そもそも平均ってなんだろう。同じデータからさまざまな平均値が生まれる“操作”とは? 「ビジネス数学」の第一人者・深沢真太郎氏の新刊『数字にだまされない本』(日経ビジネス人文庫)から一部抜粋してお届けする。

往路は時速20㎞、復路5㎞。平均時速は?

 まずは、とても簡単な算数・数学のお話。少しだけおつき合いください。

【問題】
100kmの距離を往路は時速20kmで走り、復路は時速5kmで走った。
往復での平均の速さは?

 一般的な算数の正解はこうです。

【回答】
往路でかかった時間:100÷20=5(時間)
復路でかかった時間:100÷5=20(時間)

往復で200kmの距離を25時間かけて進んだので、平均の速さは200÷25=8

時速8km

 しかし、この問題を(20+5)÷2=12.5と答える方もいます。
 時速20kmと時速5kmという2つの数字のまさに平均値を計算したのでしょう。

 気持ちはよく分かりますし、これを間違いとしてしまうのは少しかわいそうな気もします。

 私の個人的な解釈ですが、もしこの問題が「往路の速度と復路の速度の平均は?」であればその考え方で正解となるでしょう。

 簡単な算数を体験していただきましたが、この問題を通じてあなたにお伝えしたいのは、平均にも定義が必要なときがあるということです。

データを“操作”するテクニック

 例えばある企業が従業員に対して、職場の満足度について5段階(最高が5、最低が1)で評価してもらったとします。対象者は計8人。
 当然ですが、正直に評価することを前提とします。

 またこの調査において平均が3.5を下回る場合は「問題あり」と評価することが決まっているとします。

 実際に調査した結果、8人の平均スコアは図1のように3.5。
 ちょうど基準値ですから、現状は問題ないと評価するのが妥当でしょう。

(出所)『数字にだまされない本』(日経ビジネス人文庫)
(出所)『数字にだまされない本』(日経ビジネス人文庫)
[画像のクリックで拡大表示]

 しかし、あなたがこの調査データを使ってどうしても「問題あり」という結論にしたい立場だとします。

 例えば金子さんのように現状の環境に不満を持っている人であれば、職場環境を変えてもらえるようにこの情報を“操作”したいと思っても不思議ではありません。

 だからといって、実際のスコアを勝手に変えるとデータの改竄(かいざん)になります。

 では、このようなデータをどのように“操作”することで、「問題あり」という結論をつくることができるでしょうか。

次ページ 変えたのは「定義」だけ