職務経歴書
2026年1月12日現在 山口 敏弘
職務要約
データサイエンティストおよび機械学習エンジニアとして9年のキャリアを持ち、メディア、エンタープライズSaaS、インフラ、広告など多岐にわたる業界で事業課題を技術で解決してきました。特に推薦システム、MLOps、そして最新のLLM/マルチエージェント開発において、設計から実装・評価までEnd-to-Endで主導した実績を有しています。
ビジネス課題の本質的解決を目的とし、推薦システムによるエンゲージメント向上やLLM/RAGを用いた業務プロセスの高度化など、最適な機械学習手法を選定・適用します。技術の先進性だけでなく、実運用におけるコスト対効果や安定性を重視した「実務で機能する機械学習システム」の構築を通じて、ビジネス価値の最大化に貢献します。
活かせる経験・知識・技術
得意分野
- 推薦システム・埋め込み技術: Two-Tower Architecture、メトリックラーニング、ベクトルデータベース構築、リアルタイム推論
- MLOps/基盤構築: Vertex AI PipelinesやDatabricksを用いた学習・推論パイプラインの自動化
- RAG・評価設計: Ragas/LangFuseを用いた検索精度・回答品質の定量的評価、ハルシネーション抑制
- LLM/マルチエージェント開発: LangChainを用いたオーケストレーション、自律型エージェントの設計
- フルスタック開発: Next.js (TypeScript) から Python/Go によるバックエンド、AWS/GCPのインフラ構築まで
技術スタック
- LLM/AI: LangChain, LangGraph, Amazon Bedrock, LiteLLM, Ragas, LangFuse, DSPy
- ML/DL: Python, PyTorch, TensorFlow, scikit-learn, Pandas, PySpark, XGBoost
- Backend: Python (FastAPI, Flask), Go, Node.js (NestJS), Prisma, tRPC
- Frontend: TypeScript, Next.js, React, Tailwind CSS
- Infrastructure/Data: AWS, GCP, Azure, Databricks, BigQuery, Terraform, Docker
資格
- ネットワークスペシャリスト
- 情報セキュリティ安全確保支援士試験合格
活動・登壇
- MLOps勉強会登壇: 「推薦システムにおける継続的学習パイプラインの実装」
- Databricks公式イベント登壇: 「Sparkを用いた大規模データ処理の最適化」
プロダクト開発/サービス公開
shisapost(https://www.shisapost.com/)
- 期間: 2024年10月〜現在(継続運用中)
- 概要: ユーザーの関心に合わせてニュースを選別・分析する個人開発のキュレーションサービス。
- 技術的特徴:
- エージェント・ワークフロー: ニュースの「収集」「分析」「要約」「評価」を担う専門エージェント群(Summarizer, Analyst, Critic等)を定義し、LangGraph等で協調動作させるアーキテクチャ。
- DSPyによる評価・最適化: 各エージェントのプロンプトをDSPyを用いて体系的に最適化。データセットを用いた定量評価により、分析品質の向上とハルシネーションの抑制を実現。
- サーバーレス基盤: AWS LambdaによるFan-out構成(Parent/Childパターン)を採用し、ユーザーごとのエージェント実行を効率的に並列化。
- 成果:
- 個人開発ながらStripe/Google Sheets連携を含む完全なSaaSとして稼働。
- インフラコストを最小化しつつ、実用的なニュース配信システムを構築。
ポートフォリオ
-
- LangGraph StateGraph による5つの専門AIエージェント(Recruiter, TechWriter, Copywriter, UX/Visual Designer)のオーケストレーション。Fan-out/Fan-in パターンで並列実行し、ハイブリッド・マルチモデル構成(Gemini/OpenAI/Claude)によりコスト効率と処理速度を改善。
-
Spec-Driven Development | CalcioA Unity移植プロジェクト
- 24種類の専門AIエージェントによる自己修復型開発ワークフロー。産業規模のコード移植(Cocos2d-x → Unity)において、仕様書とソースコードの差分を自動検出し、100%カバレッジ達成まで自律的に修正するループを構築。VLM(画像認識AI)による画面検証、厳格なTDD、コンテキスト効率化により、手戻りを最小化。
職務経歴詳細
2025年01月~現在: フリーランス
-
エンタープライズ向けAIプラットフォーム開発(大手SaaS企業)
- 担当: AIエンジニア
- 環境: Python (FastAPI, LiteLLM), Dify, GCP (Cloud Run, BigQuery)
- 概要: AIエージェント基盤の開発および、LiteLLMを用いたマルチプロバイダーLLM統合の実装。
-
Unity + 生成AI 連携ゲーム開発プロジェクト
- 期間: 2024/10 - 2025/03
- 概要: LLMを用いたNPCの動的思考エンジンおよび生成AIによるアセット制作パイプラインの構築。
- 詳細: ML-Agentsを用いた強化学習とLLMによる意思決定を統合。3Dモデル生成AI(Tripo3D等)のAPI連携により、アセット制作工数を削減。
2023年07月~2023/12: 業務委託
- 社内ナレッジ活用RAG導入プロジェクト PoC
- 期間: 2023/07 - 2023/12
- 概要: 社内ドキュメント(PDF/Wiki)から回答を生成するシステムの構築。
- 担当: PM 兼 リードエンジニア
- 環境: Amazon Bedrock (Claude 3), LangChain, LangFuse, Pinecone
- 詳細:
- 精度の定量的改善: Ragasを用いた評価基盤を構築。チャンクサイズの最適化とハイブリッド検索(ベクトル+キーワード)の導入により、初期回答精度(Faithfulness)を65%から92%へ向上。
- ビジネスインパクト: 導入部署において、情報検索に要する時間を削減。
- ハルシネーション対策: 引用元の明示および、メタデータを用いたフィルタリングにより、回答の信頼性を担保。
2024年01月~2025年06月: HJホールディングス株式会社
- TVODサービスの推薦システム構築
- 担当: データサイエンティスト / 機械学習エンジニア / リード
- 環境: Python, PyTorch (PyTorch Lightning / PyTorch Similarity), Vertex AI (Pipelines / Experiments / Workbench), BigQuery, Dataflow, Digdag, GitLab CI/CD, Two-Tower Architecture, Metric Learning (Triplet Loss)
- 概要:
- HJホールディングス株式会社が運営するVODサービスにおいて、TVOD(都度課金型ビデオ・オン・デマンド)作品の視聴促進を目的とした推薦システムを構築。
- ユーザーの嗜好に合わせたパーソナライズ、および関連性の高いアイテム推薦により、コンバージョン(購入率)向上とユーザー体験の改善を実現。5名体制のチームで、設計から本番運用までを一貫して担当。
- 課題:
- 推薦精度の向上: 従来のアルゴリズムでは捉えきれないアイテム間の潜在的な類似性や、ユーザーの文脈(セッション内行動)の反映。
- コールドスタート問題の解消: 新規作品や視聴履歴の少ないユーザーへの対応。
- MLOps基盤の確立: 学習・推論・評価の自動化パイプラインの欠如。
- 定性的な妥当性: ジャンル間の自然な遷移など、違和感のない推薦結果の提供。
- 取り組み (Action):
- Two-Tower Architectureによる埋め込み構築: BERT等の事前学習済みモデルを活用し、アイテムのメタデータと視聴ログを統合したTwo-Towerモデルを設計。スケーラブルな近傍探索を実現するベクトル表現を構築。
- メトリックラーニング(Triplet Loss)の導入: PyTorch Similarityを用い、同一セッション内での連続視聴パターンからポジティブペアを抽出。Lift値を教師ラベルとして活用し、関連性の高いアイテムがベクトル空間上で近くなるよう最適化。
- ジャンル概念を考慮した学習設計: 親ジャンル概念を導入し、特定のジャンルに偏りすぎず、かつ関連性の高いジャンル間を自然に推薦できるよう損失関数を調整。
- Vertex AI Pipelinesを用いたMLOpsの実装: BigQueryからのデータ抽出、Dataflow前処理、Vertex AI上での学習・評価・推論をパイプライン化。GitLab CI/CDと連携し、モデル更新を完全自動化。
- 評価・可視化プロセスの確立: UMAPを用いて埋め込み空間を可視化し、学習状況を定性的に検証。A/Bテストを設計し、主要KPIへの影響を統計的に評価する体制を構築。
- 成果 (Result):
- 精度の向上: アイテム埋め込みの評価指標(Accuracy)において、0.91から0.96への改善を達成。
- 定性的な改善: UMAP分析により、ジャンル間の類似性が適切に学習され、ユーザーにとって違和感のない「自然な関連作品」の提示が可能に。
- 運用負荷の軽減: Vertex AI PipelinesとDigdagによる定期実行ジョブ構築により、モデル再学習・推論デプロイの手動運用工数を削減。
- ビジネスインパクト: A/Bテストにて、従来手法と比較してCTRおよび視聴時間(Completion Rate)の向上を確認。
2021年12月~2022年03月: EYストラテジー・アンド・コンサルティング株式会社
- データ駆動型事業改善コンサルティング
- 担当: データサイエンティスト / データアナリスト
- 環境: Python, Elasticsearch, Kibana, Pandas, scikit-learn
- 概要: 大手クライアントのビジネス課題に対し、データの統計分析と可視化を通じて解決策を提示。
- 詳細:
- ログデータのリアルタイム分析: Elasticsearch/Kibanaを活用し、非構造化ログデータからKPIに関するインサイトを抽出するダッシュボードを構築。
- 統計的因果推論による施策評価: 単なる集計に留まらず、scikit-learn等を用いた因果推論を行い、施策のビジネスインパクトを定量化。
- 意思決定支援: 分析結果を経営層向けに可視化し、データに基づく迅速な意思決定プロセスを確立。
2021年06月~2021/12: 株式会社JMDC
- 医療データ利活用プラットフォームの開発
- 担当: バックエンドエンジニア
- 環境: AWS (Step Functions, Lambda, KMS), Python, Terraform
- 概要: 保険審査業務の自動化および製薬向け分析レポート基盤の構築。
- 実績:
- データパイプライン構築: AWS Step Functionsを用いたサーバーレス処理により、医療情報の照合作業リードタイムを数日から数時間へ短縮。
- セキュリティ実装: AWS KMSを用いた厳格な暗号化設計により、機密性の高い医療データの安全な取り扱いを実現。
2019年08月~2021年05月: 株式会社日本経済新聞社(嘱託契約)
- ニュースアプリのパーソナライズ基盤開発およびMLOps推進
- 担当: データ基盤エンジニア / データサイエンティスト
- 環境: Databricks, Spark (PySpark/Scala), Python, AWS, GCP, MLFlow, BERT, Golang
- 詳細:
- データ基盤の統合: Databricks (Spark) を導入し、数百万ユーザーのアクセスログを処理するデータ基盤を構築。
- ハイブリッド推薦アルゴリズムの開発: 従来の協調フィルタリングに加え、BERTを用いた記事のセマンティック(意味)分析を導入。ユーザーの閲覧文脈(Context)を考慮した推薦を実現し、CTRを改善。
- リアルタイム推論基盤: Golangを用いた推論コンポーネントを実装し、低レイテンシでのリアルタイム推薦レスポンスを実現。スパイクアクセス時でも安定稼働。
- MLOpsの確立: MLFlow活用による実験管理とデプロイパイプラインの自動化を行い、モデル改善サイクルを数日単位から数時間単位へ短縮。
2017年04月~2019年01月: 株式会社グリッド
- 自社DLフレームワーク(ReNom)開発およびプラント制御の強化学習プロジェクト
- 担当: 機械学習エンジニア / データエンジニア
- 環境: Python, Flask, Vue.js, MQTT, VGG, VAE, SSG, 強化学習
- 概要: 自社開発ディープラーニングフレームワーク(ReNom)の機能拡張、および産業用プラントの最適化を目指した強化学習プロジェクトの基盤構築に従事。
- 詳細:
- 論文ベースのアルゴリズム実装: VGG, VAE, SSG(半教師あり学習)などのアルゴリズムを論文から実装し、ライブラリのモジュールとして製品化。
- リアルタイム強化学習基盤: プラント制御のため、MQTTを用いたIoTデータ収集パイプラインを設計・構築。
- 可視化ダッシュボード: Flask/Vue.jsを用いて、学習状態や制御シミュレーションの結果をリアルタイムに可視化する環境を整備。
- 成果: 自社ライブラリの機能拡充により外観検査案件への対応力を強化し、物理プラント制御におけるAI適用の実証に成功。
その他職務経歴
- 株式会社aiforce solutions (2019/02-2019/07): AI教育プラットフォーム開発および商社向けデータ分析コンサルティングに従事。
- 株式会社Cuon (2016/01-2017/03): WebエンジニアとしてRuby on Rails/PHPを用いたスタートアップ向けMVP開発に従事。
- 株式会社APコミュニケーションズ (2014/05-2015/12): Windows/Linuxサーバーのインフラ運用・保守およびPowerShellによる運用自動化を担当。
- 日本通信株式会社 (2013/04-2014/04): LAMP構成によるサービスサイトの設計・構築(キャリア初期の経験)。