【成果物紹介】子どもたちの将来肥満度予測モデル開発とデータ分析レポート

こんにちは!株式会社キカガクの樋田です!
今回は、キカガクの「DX を推進する AI ・データサイエンス人材育成コース」を卒業された方の最終成果物をご紹介します。

DX を推進する AI ・データサイエンス人材育成コースとは?

DX を推進する AI ・データサイエンス人材育成コース(以下「長期コース」)は、プログラミング未経験から、AI プログラミングやデータサイエンスを学ぶことのできる 6 ヶ月間のコースです。
AI エンジニアやデータサイエンティストへの転職実績も豊富で、自走できるAI・データサイエンス人材を輩出しています。

コースを通して、講師と二人三脚でオリジナルの成果物を作成することができます。
そのため、知識・スキルの定着はもちろん、転職活動時の実績としてもアピールすることができます!

肥満度予測モデル

今回は、そんな長期コースの2024 年の 1 月期を受講して、2024 年 6 月に卒業された受講生の成果物をご紹介します!

作成の背景

この方は、業務で地元の小中学生の小児生活習慣病予防健診を実施しているそうです。
生活指導により改善する児童がいる一方で、小学生の時には正常体格だった児童が中学生になると肥満になるケースが多く見受けられたとのこと。
この問題を解決するために、健診時には正常体格であっても将来的に肥満になる可能性がある児童を事前に予測し、生活指導を行うことで正常体格を維持させることを目的としました。

概要

上記背景から、地元の小中学校で行われる健診データを基に、中学生の肥満度を予測するモデルを作成し、データ分析を行いました。

ここでは、分析レポートの一部を抜粋して掲載します。

データの分布を確認したところ、中学時に「肥満」と診断された児童の34.8%が小学時は「肥満ではない」に分布していました。
そのような児童を予測するAIモデルを開発し、生活指導をすることで中学時に肥満になってしまう児童を減らすことができるのでは、と仮説立てられています。

また上記は肥満度と関連する要因を分析し、グラフ化したものとなります。
この結果から、小学時の肥満度には以下の要因が影響していると考えられます。

  • 食べる速さ
  • 運動の少なさ
  • TVゲーム時間
  • 魚と肉の摂取バランス(肉の多さ)

中学生を対象としたデータでも近しい結果が得られたようです。

こちらでは、影響度合いを客観的な数値で示すために、因子分析という手法で分析を行っています。
この結果を見ると、最も影響力の大きい要因として先程挙げた「食べる速さ」や「運動の少なさ」といった生活習慣に関わる変数が第一因子(最も影響が大きい要素)となっています。

AIモデルの構築前に、このようにあらかじめ重要な因子を特定しておくことで、入力変数の重み付けや重要度の調整に役立ちます。

作成されたモデル結果

AIモデルの開発に関しては、機械学習モデルとディープラーニングモデルの2パターンの肥満度予測モデルを作成されたそうです。この結果から、下記のように結論づけられました。

  • 結論:肥満度に影響する要因とその関係を明らかにし、肥満度を健診データから予測するモデルを作成した
  • 予測精度:0.7前後 (1.0が最大)

また、今後の方針としては以下のように検討されており、最終的に所属学会での論文投稿まで目指されていて、とても素敵です!

  1. モデルの精度Up(男女別検討、特徴量エンジニアリングなど)
  2. 精度を維持しながら説明変数を絞り込み、簡単に活用できるAPIモデルの開発
  3. 肥満度以外の項目(脂肪肝など)を目的変数としたモデルの開発
  4. 上記を学会雑誌にニューラルネットワークモデルとして論文投稿

この予測モデルやデータの活用によって、子どもたちの健康指導の質がさらに向上し、健康に育ってくれると嬉しいですね!

使用技術

  • 探索的データ分析
    • 可視化を通じたデータ理解、データの主要な特徴を理解するための統計的アプローチ
  • 機械学習モデル
    • 重回帰分析:Linear、Ridge、Lasso
    • PLSモデル:説明変数間の相関関係を基にGridSearch
  • ディープラーニングモデル
    • 回帰モデル
    • ハイパーパラメータチューニング:GridSearch、Optuna
  • 多変量解析
    • 因子分析:肥満度に影響を与える因子の特定
    • 共分散構造分析:因子間の関係を明らかにする

上記のように様々な手法を駆使し、データ分析・モデル作成までを行っているのは素晴らしいですね!

キカガクの長期コースで 6 ヶ月間しっかり学ぶことで、このような手法を用いたデータ分析レポートや AI を搭載したアプリも開発できるようになります!

機械学習講師からのコメント

お忙しい中、ハイパーパラメータチューニングから因子分析など様々な工夫をされており本当に素晴らしいです。個人的には因子分析を行ってくださったことが嬉しいです!
相関で終わるのではなく、因果関係があるのかを量的に図られていてとても良いなと感じました。
今後の論文もとても楽しみにしております。本当にお疲れ様でした!

まとめ

今回は、長期コース卒業生の最終成果物をご紹介しました。
学習を継続して様々な手法を用いて分析の試行錯誤、また今後の検討提案まで進められて本当に素晴らしいですね!

キカガクの「DX を推進する AI ・データサイエンス人材育成コース」は自走できる AI ・データサイエンス人材の輩出を目指すオンラインスクールです。気になる方はぜひ無料説明会にご参加ください!