よくわかるデータリテラシー データサイエンスの基本
インプレスグループで理工学分野の専門書出版事業を手掛ける近代科学社は、2021年6月30日に、阿部圭一氏著書による、データサイエンスの要所を楽しみながら身に付けられる「よくわかるデータリテラシー データサイエンスの基本」を発売した。
阿部圭一Profile●1968年 名古屋大学大学院博士課程了、工学博士
静岡大学、愛知工業大学を経て、現在はフリー
静岡大学名誉教授
専門は情報学、情報教育
主要著書
『明文術 伝わる日本語の書きかた』(NTT出版 2006年)
『「伝わる日本語」練習帳』(共著、近代科学社 2016年)
『よくわかるデジタル数学 離散数学へのアプローチ』(近代科学社 2020年)
「よくわかるデータリテラシー データサイエンスの基本」内容紹介
データサイエンスの重要性が叫ばれるなか、その教育への期待が産官学で高まっている。
高等教育では文・理を問わず全学生にデータサイエンス教育を課すことが決まった。
こうした背景を受け、本書ではデータサイエンスの要であるデータリテラシー(データを正しく読み取り情報を正確に提示できる能力)の総合的解説を試みている。
初学者が一から理解できるよう豊富な例題・演習・解答を盛り込んでいる特徴から、データリテラシーを教えるにあたって適切な教材を探している教師の方々や、データサイエンスを身につけるための足がかりを欲している学生の方々のどちらの要望にも応える、充実の教科書となる。
「よくわかるデータリテラシー データサイエンスの基本」目次
第0講 データリテラシーとデータサイエンス
データリテラシーとは
なぜ今、データリテラシーが重要なのか
第1講 数値には4つの類別がある
数値の 4 つの類別
名義尺度
順序尺度
間隔尺度
比率尺度
質的データと量的データ
離散的データと連続データ
4つの尺度のまとめ
第2講 どう示すか? 値そのもの、相対値、比率、単位あたり
数値の示しかた
相対値、比率、相対比率
値そのものと単位あたりの値
区間の端の表現
GDPと1人あたりGDPの意味
1人あたりGDPは生産性?
第3講 数値には誤差がつきもの
誤差とは
誤差のある数値の表示
有効数字、有効桁数
桁落ち
有効桁数を考慮していない例
小数点下の余分な0の表示
第4講 大ざっぱに値をつかもう
日本と世界に関する基本的な数値
目の子算に強くなろう
値の推定を含む目の子算
オーダーとは
オーダーが違うと質が違う
大きな数値はオーダーでつかむ
第5講 いくつかの数値を1つの値で代表させる
平均
平均の欠点
中央値と最頻値
外れ値
第6講 数値のばらつき具合を測る
分散
標準偏差
偏差値とは
正規分布
第7講 相関イコール因果関係ではない
相関とは
相関係数の計算
相関係数の意味
相関が強いことは因果関係を意味しない
相関関係と因果関係についての演習
データを分割すると、関係が変わる
第8講 偶然のいたずら
コイン投げで遊ぼう
例題といくつかの演習問題
二項分布
二項分布の平均と分散
pとqが極端に違わないかぎり、試行回数nを増やすと二項分布は正規分布に近づく
第9講 大数の法則が成り立つ
大数の法則
なぜ正規分布になりやすいのか? ――中心極限定理
大数の法則と中心極限定理の応用
アンケートは回答率にも注意
インターネットを用いたアンケート結果
第10講 「統計的に有意」とは
「統計的に有意」とはどういうことか
有意水準はどうやって決めるか
「統計的に有意」に関する誤解や注意事項
第11講 隠れている要因はないか
例1 経済政策と景気
例2 若者が海外に行かなくなった?
例3 少年の凶悪犯罪が増えている?
例4 高齢者の運転による事故
その他の例
第12講 “3た”論法を信じますか ―データの信頼性
怪しげな健康・医療情報
偽薬効果
ランダム化比較試験と二重盲検法
健康・医療情報の松竹梅
検査の結果と病気の有無 ――誤検出と見逃し
第13講 引っかけグラフにご用心
社長の自慢
グラフの種類と使いかた
縦軸と横軸についての注意
3次元のグラフは使わない
モノの大きさで値を表すときの注意
表示の直接性
第14講 もっと大きなごまかしにも気をつけよう
データに基づかない感覚的意見や思いこみ
定性的な議論、量を無視した議論
結論が先で、データが後
データとは一致しない結論
おかしな論理
第15講 データリテラシーを磨くには
一次情報に当たれ
メディアバイアス
信頼できる情報を見つける方法
良い知人と良い本を
複雑な問題に簡単な解答はない
自己防衛が唯一の策
データに頼りすぎるな
「よくわかるデータリテラシー データサイエンスの基本」Amazonでの購入はこちら