Langfuse品質基盤
RAG / Agentのトレース、評価観点、プロンプト管理を整理し、改善サイクルを回せる品質基盤を構築。
AI Agent Ops / Langfuse / RAG
AI Agentを、作って終わりにしない。業務PoCから本番運用・改善まで、一気通貫で設計します。
計測・評価・改善を最初から組み込み、要件定義→実装→検証→改善のサイクルを回す。だから“作っただけ”で止まらず、使うほど良くなります。
業務Agent PoC / Agent Ops診断 / Langfuse実装・運用伴走
01Services
導入して終わりにしない。計測・評価・改善を組み込み、“回すほど良くなる”AIエージェントを、小さく始めて運用まで伴走します。
業務ヒアリングからRAG / Agent設計、ツール連携、検証画面までを短期間でPoC化します。
既存Agentの会話ログ、失敗パターン、レイテンシ、プロンプト運用を確認し、改善優先度を整理します。
トレース、スコアリング、プロンプト管理、評価データを整え、運用後の改善サイクルを作ります。
02Selected Work
技術テーマと担当範囲がわかる粒度で、これまで関わったプロジェクトを紹介します。
RAG / Agentのトレース、評価観点、プロンプト管理を整理し、改善サイクルを回せる品質基盤を構築。
複数モデルを用途別に使い分け、レポート生成の品質、コスト、安定性を比較しながら改善。
SharePoint上の社内ナレッジを整理し、Copilot Studioで業務カテゴリ別の回答導線を設計。
Graph-RAGを活用し、関係性を含む情報検索とチャットUIの検証用ツールを開発。
※ NDAに基づき企業名・詳細数値は非公開とし、技術テーマと担当範囲が伝わる粒度で記載しています。
03Media
AI・RAG・エージェント開発の最新動向をYouTubeで発信しています。最新の動画を自動で掲載しています。

2026.06.15

2026.05.17

2026.05.12

2026.05.04

2026.04.23

2026.04.14
04Career Timeline
世界的なデータサイエンス、機械学習コンペで銅メダル受賞。EDA、特徴量設計、モデル評価、アンサンブル戦略までを一通り実践し、機械学習の実装力を固めた活動。
社内データソースを横断する質問応答・ドキュメント検索システムを設計し、検索と生成のパイプラインを構築。
Graph-RAGを活用したチャットボットとWebアプリを構築し、フロントエンドからバックエンドまで担当。
複数企業の課題ヒアリング、業務フロー分析、LLM活用の要件整理、PoC設計、効果測定を支援。
医療機器、チューブ、ベッド周辺環境などを画像・動画から解析し、LLM連携用に構造化する基盤を検証。
RAG型AIエージェントの実装に加え、トレース、メトリクス、プロンプト管理、A/Bテスト基盤を構築。
16カテゴリ・300ファイル以上の社内ナレッジを整理し、SharePoint連携のRAG型回答精度改善を主導。
RAG、マルチエージェント、LLM評価、医療AI、企業ナレッジ検索を中心に、PoCで終わらせず、運用後に改善できるAIシステムづくりに取り組んでいます。
05Contact
お問い合わせへのご返信には通常3営業日ほどお時間を頂戴しております。万が一3営業日を過ぎても返信がない場合は、お手数ですが再度ご連絡いただけますと幸いです。
YouTubeで発信を見る