AI Agent Ops / Langfuse / RAG

RagEngine

AI Agentを、作って終わりにしない。業務PoCから本番運用・改善まで、一気通貫で設計します。

計測・評価・改善を最初から組み込み、要件定義→実装→検証→改善のサイクルを回す。だから“作っただけ”で止まらず、使うほど良くなります。

業務Agent PoC / Agent Ops診断 / Langfuse実装・運用伴走

01Services

サービス

導入して終わりにしない。計測・評価・改善を組み込み、“回すほど良くなる”AIエージェントを、小さく始めて運用まで伴走します。

01

業務Agent PoC

業務ヒアリングからRAG / Agent設計、ツール連携、検証画面までを短期間でPoC化します。

02

Agent Ops診断

既存Agentの会話ログ、失敗パターン、レイテンシ、プロンプト運用を確認し、改善優先度を整理します。

03

Langfuse実装・運用伴走

トレース、スコアリング、プロンプト管理、評価データを整え、運用後の改善サイクルを作ります。

02Selected Work

実績

技術テーマと担当範囲がわかる粒度で、これまで関わったプロジェクトを紹介します。

AI Agent Ops

Langfuse品質基盤

RAG / Agentのトレース、評価観点、プロンプト管理を整理し、改善サイクルを回せる品質基盤を構築。

Trace設計評価指標Prompt改善
Generation Workflow

マルチモデル生成

複数モデルを用途別に使い分け、レポート生成の品質、コスト、安定性を比較しながら改善。

Model routing生成品質評価自動生成
Enterprise Knowledge

Copilot / SharePoint Agent

SharePoint上の社内ナレッジを整理し、Copilot Studioで業務カテゴリ別の回答導線を設計。

Copilot StudioSharePoint社内検索
RAG Tooling

Graph-RAG Tool

Graph-RAGを活用し、関係性を含む情報検索とチャットUIの検証用ツールを開発。

Graph-RAGNext.jsTool連携

※ NDAに基づき企業名・詳細数値は非公開とし、技術テーマと担当範囲が伝わる粒度で記載しています。

04Career Timeline

経歴とフリーランス活動

2023.06個人開発

Kaggle ICR - Identifying Age-Related Conditions 銅メダル受賞

世界的なデータサイエンス、機械学習コンペで銅メダル受賞。EDA、特徴量設計、モデル評価、アンサンブル戦略までを一通り実践し、機械学習の実装力を固めた活動。

ICR - Identifying Age-Related Conditions分類モデルの改善Kaggle Bronze Medal
2023.06 - 2023.11PM兼エンジニア

RAG型チャットボット開発

社内データソースを横断する質問応答・ドキュメント検索システムを設計し、検索と生成のパイプラインを構築。

RAGアーキテクチャ設計LangChain実装GCP / MySQL
2023.09 - 2023.11共同開発

Graph-RAGチャットボット / Webアプリ開発

Graph-RAGを活用したチャットボットとWebアプリを構築し、フロントエンドからバックエンドまで担当。

Next.js / ReactFlask / Node.jsGraph-RAG
2024.07 - 2024.10AIエンジニア・コンサル混成チーム

生成AI導入コンサルティング / 営業支援

複数企業の課題ヒアリング、業務フロー分析、LLM活用の要件整理、PoC設計、効果測定を支援。

業務ヒアリングPoC設計生成AI導入計画
2024.07 - 2025.05AIリサーチャー・PM・医療従事者混成チーム

ICU向け医療画像・動画解析 / VLM活用基盤

医療機器、チューブ、ベッド周辺環境などを画像・動画から解析し、LLM連携用に構造化する基盤を検証。

PyTorch / OpenCVYOLO / SAM / VLM医療特化LLM
2025.06 - 2025.10PM・開発チーム

対話型AIエージェント / Langfuse基盤構築

RAG型AIエージェントの実装に加え、トレース、メトリクス、プロンプト管理、A/Bテスト基盤を構築。

LangChain / LangfuseOpenAI / Vertex AIObservability
2026.01 - 2026.03PM・開発チーム

企業ナレッジ検索 / Copilot Studioマルチエージェント

16カテゴリ・300ファイル以上の社内ナレッジを整理し、SharePoint連携のRAG型回答精度改善を主導。

Microsoft Copilot StudioSharePoint / Microsoft 365Vertex AI

現在の主軸

RAG、マルチエージェント、LLM評価、医療AI、企業ナレッジ検索を中心に、PoCで終わらせず、運用後に改善できるAIシステムづくりに取り組んでいます。

05Contact

お問い合わせ

お問い合わせへのご返信には通常3営業日ほどお時間を頂戴しております。万が一3営業日を過ぎても返信がない場合は、お手数ですが再度ご連絡いただけますと幸いです。

YouTubeで発信を見る