クイックノート

ちょっとした発見・アイデアから知識の発掘を

読書偏差値を診断「自分の読書量は多い?少ない?」

下の月間読書数の欄に、
一月に読む本の数を入力して「計算」ボタンを押すと、
読書偏差値を計算します。

月間読書数:
読書偏差値:


趣味は読書ですと自信を持っていうのは難しくないでしょうか。

無難な回答をしているように思われがちですし、
他人の読書量がわからないので、
自信を持って人よりたくさん読書していると言いにくいのもあります。

もしも、読書量が偏差値のように点数化されていたら、
「自分の読書偏差値は60です。
 人よりもたくさん本を読んでいます」
と自信を持って言えるのではないでしょうか。

この計算の中身について解説していきます。

大まかなアイデア

偏差値は、テストの点数を相対化して、
自分の位置をわかりやすくするものです。

単純に読書量を点数に見たてて、
テストの点数と同じように偏差値を計算すれば、
読書偏差値が計算できるでしょう。

もちろん、偏差値を計算するには、
それなりの人数について、読書量のデータが必要なので、
そのデータを取得することが必要となります。

読書データ

ブクログは読書のログサービスとして有名です。

ここには、多数のユーザーの読書データが、
ユーザーのプロフィールとして公開されています。

ということで、このブクログで公開されている月間の読書数を取得して、
平均値と標準偏差を計算し、偏差値の計算に利用します。

ただし、登録しているだけで利用していないユーザーもいるため、
読書数が0であるユーザーについては除外するものとします。

また、読書数のカウント対象は「本」と「電子書籍」としました。

月間読書量の分布

偏差値を解釈する上で、
元々の点数の分布が正規分布であると好都合です。

そこで、読書量がどのように分布しているかが気になります。

実際に集計したデータのヒストグラムが下の図です。

f:id:u874072e:20190910142918p:plain
月間読書量の分布

正規分布っぽくはないですね。

対数読書量

上のグラフを見ると、
月に数冊読む人と、十数冊読む人、数十冊読む人では、
かなり大きな隔たりがあるように見えます。

下のグラフは月間読書量の対数をとったものの分布です。

f:id:u874072e:20190910143342p:plain:w300
月間読書量の対数の分布

まだ、正規分布と見るにはあやしいですが、
少しは山っぽくなってきました。

この対数読書量に対して、
偏差値を計算することにします。

読書偏差値の計算式

読書偏差値の計算は次の式で行われています。

 \frac{log(x) - \mu}{\sigma}\times 10 + 50

x が月間の読書量、
\muは対数読書量の平均値、
\sigmaは対数読書量の標準偏差です。

読書偏差値早見表

読書量と偏差値の対応は以下の通りです。

月間読書量 読書偏差値
0 -Inf
1 35
2 42
3 45
4 48
5 50
6 52
7 53
8 55
9 56
10 57
11 58
12 58
13 59
14 60
15 60
16 61
17 62
18 62
19 63
20 63
21 64
22 64
23 64
24 65
25 65
26 66
27 66
28 66
29 67
30 67
31 67
32 68
33 68
34 68
35 68
36 69
37 69
38 69
39 69
40 70
41 70
42 70
43 70
44 70
45 71
46 71
47 71
48 71
49 71
50 72
51 72
52 72
53 72
54 72
55 73
56 73
57 73
58 73
59 73
60 73
61 74
62 74
63 74
64 74
65 74
66 74
67 74
68 75
69 75
70 75
71 75
72 75
73 75
74 75
75 75
76 76
77 76
78 76
79 76
80 76
81 76
82 76
83 76
84 77
85 77
86 77
87 77
88 77
89 77
90 77
91 77
92 77
93 77
94 78
95 78
96 78
97 78
98 78
99 78
100 78

まとめ

読書量から読書偏差値を計算する診断機を作りました。

ベースにしているデータがブクログという
読書好きの人が利用するサービスのものなので、
少々シビアな判定になっているかもしれません。

プライバシーポリシー