SeaHub

海とソフトウェア、何ができるか分からないけど、始めてみます

水産業の課題解決を目指す機械学習:GeminiとMLflowで積み重ねる私の学びの記録

はじめに

私はAI(Gemini等)を活用した機械学習の学習体験や、その成果を効率的に管理するMLflowの利用について、複数の記事で紹介しています。
これらの記事は、私が機械学習を学び、将来的に水産業の課題解決に貢献したいという思いから始めた、これまでの学習記録です。
Google Gemini を先生として機械学習の基礎を固め、Kaggleの「タイタニック号生存者予測」のような実践的な課題に取り組みました。
さらに、試行錯誤のプロセスを効率的に管理し、実験の再現性を確保するためMLflow を導入。
水槽の魚の数から酸素濃度を予測するモデル構築 や、その先にあるアクアポニックスへの応用まで、AIツールと共に歩んだ具体的な学びの軌跡を紹介します。

AI(Gemini)による機械学習の学習体験

note.com

  • 夏休みの大人の自由研究として、GoogleGemini と共にKaggleの「タイタニック号の生存者予測」チュートリアルに取り組みました。
  • データの前処理では、欠損値の処理(Cabin列の削除、Age列の中央値補完など)、文字データの数値変換(ダミー変数)、特徴量エンジニアリング(FamilySizeの作成)といった重要な概念を学びました。
  • モデル学習の過程で発生した警告に対し、StandardScaler を用いてデータのスケールを揃えることでモデルの安定化を図り、機械学習モデルの学習メカニズムを深く理解しました。

MLflowによる機械学習実験管理

note.com

note.com

  • 機械学習プロジェクトで生じる「実験の再現性の問題」や「モデル比較の困難さ」を解決するため、MLflow を導入しました。
  • 水槽の魚の数から酸素濃度を予測する単回帰・重回帰モデルの構築を通じて、MLflowがパラメータ、メトリクス、生成物(グラフやモデルファイル)を自動的に追跡・記録する仕組みを体験しました。
  • MLflowの主要な機能として、実験の意図を明確にする MLproject、パラメータと結果を自動で紐付ける mlflow.log_param() や mlflow.log_metric()、実行環境を固定するpython_env.yamlが挙げられます。
  • これにより、実験の再現性、モデル比較の容易さ、チーム協業の促進といった大きなメリットが得られ、試行錯誤のプロセスを「技術的負債」から「未来への資産」へと変えることができると考えています。

機械学習のアクアポニックスへの応用

note.com

note.com

  • 機械学習の初歩として、「魚の数」から「水中の酸素濃度」を予測する 単回帰分析 や、さらに「水槽の容量」も加えた 重回帰分析 のモデル構築を実践しました。
  • この基本技術は、魚と野菜を同時に育てる循環型農業 「アクアポニックス」 に応用できる可能性を秘めています。例えば、魚の数や環境データから植物の栄養となる硝酸塩濃度を予測し、スマートな農業を実現する足がかりになると考えられています。
  • アクアポニックスに関連するKaggleデータセットとして 「Cleaned Aquaponics Pond Dataset」 にも注目。これは、小規模なアクアポニックスシステムからIoTセンサーで収集された水質(pH、TDS、水温)の時系列データで、時系列予測モデルの構築に適した形で前処理が施されています。

海とソフトウェア、何ができるか分からないけど、始めてみます

この度、ITエンジニアとしての専門性と、個人的な興味から海に関わる知見を融合させたメディア「SeaHub」を立ち上げました。

 

幼少期より親しんできた釣りや、食卓を彩るサーモン、そして日々の暮らしの中にあるアクアポニックス。

 

これらの身近な存在に、ソフトウェア開発の視点から光を当てることで、どのような新たな価値が生まれるのかを模索していきたいと考えています!

 

現状、具体的な課題解決策や、大規模なプロジェクト計画があるわけではありません。

しかし、身の回りのささやかな疑問や発見を、技術的なアプローチで掘り下げていくことは、やがて水産業の未来に貢献する小さな一歩になると信じています。

 

SeaHubでは、今後、データ分析やAIを活用した実験や考察を発信していく予定です。

 

このメディアが、海とテクノロジーの新たな接点を見つけるきっかけとなれば幸いです。

 

どうぞ、よろしくお願いいたします!