【機械学習】重回帰分析とは
2022 年 6 月 6 日 月曜日 by higakik重回帰分析とは
具体例があるとわかりやすいと思いますので、「健康診断の結果から寿命を重回帰分析にて予測する」という設定で進めていきます。
まず、今回求めたいものは「寿命」となるわけですが、BMI数値のデータのみでは流石に分かりそうにないです。
肝臓の数値や中性脂肪値、コレステロール値なども必要そうです。
さらに言えば現在の年齢や喫煙者かどうかなども寿命に大きく関わりそうです。
このように、たくさんのデータ(入力変数)から、ある特定のものの予測することを「重回帰分析」と言います。
補足ですが、BMI値のみから寿命を予測する場合にはこちらを「単回帰分析」と言います。
モデルの作り方
今回使うデータは説明用に、年齢、喫煙年数(20本/年)、血圧、BMIとします。
これらのデータは、主に「入力変数」と呼ばれますので覚えておきましょう。
そして予測したい「寿命」を予測値と呼びます。
予測値を求めるには今回の入力変数を全て足せばいいというわけではなく、
色々と学習準備をしないといけません。