アリババ「Metis」がエージェントの無駄ツール呼び出しを98%→2%に圧縮・Sun FinanceがAWS生成AIで身分証処理を20時間→5秒に──AIエージェントが"効率"フェーズへ
5月1日、AIエージェントの"使い物になる速度"を一段引き上げる発表が二本同日に並びました。アリババの研究チームは、エージェントが余計にツールを叩いてしまう問題を強化学習で抑え込むフレームワーク「HDPO」と、それを使ったエージェント「Metis」を公開。同じ日、ラトビアのフィンテックSun FinanceはAWS BedrockとClaude Sonnet 4を組み合わせた身分証処理パイプラインで、20時間かかっていた審査を5秒未満にまで圧縮した実装事例を公表しました。"動くAI"から"効率と精度を両立する業務AI"へ──この境目を象徴する一日です。
① アリババ「Metis」、AIエージェントの無駄ツール呼び出しを98%→2%に削減
アリババの研究チームは、AIエージェントが必要のない外部ツールまで呼び出してしまう「過剰呼び出し」問題を解決する強化学習フレームワーク「HDPO(Hierarchical Direct Preference Optimization)」と、それを使って訓練した実エージェント「Metis(メティス)」を発表しました。Metisは検証ベンチマークで、本来不要なツール呼び出しの発生率を従来手法の約98%から約2%にまで圧縮しつつ、推論精度自体も向上させたとされています。AIエージェントは「使えば使うほどAPI課金が膨らむ」「外部呼び出しが増えるほど遅延と失敗確率が上がる」というビジネス上の壁を抱えており、HDPOはまさにこの問題に対する一つの解として位置付けられています。
エージェントが"動くか"はもう論点ではなく、これからは「いくらで・どれだけ速く回るか」が選定軸になります。中小企業が自社にAIエージェントを入れる際は、ツール呼び出し回数とそれに紐づく月次API費用を必ず初週から計測する設計にしておくと、半年後のスケール判断でブレません。
② Sun Finance、AWS生成AIで身分証処理を20時間→5秒・コスト91%削減
9カ国でオンライン融資を展開するラトビア発フィンテックSun Financeが、AWS上で構築した身分証データ抽出と不正検知の生成AIパイプラインの詳細を公開しました。Amazon TextractによるOCRに、Amazon Bedrock経由のClaude Sonnet 4を組み合わせて構造化と判定を行い、抽出精度は79.7%から90.8%に向上、1件あたりの処理コストは91%削減、処理時間は最大20時間から5秒未満まで短縮されたといいます。さらにStep FunctionsでセルフィのスクリーンショットやデジタルマニピュレーションをClaudeが並列で見抜く構成にしており、OCR単体・LLM単体のどちらよりも上回る精度を実現したと報告されています。
"OCRかLLMか"の二者択一ではなく、定型抽出はOCR・あいまい判定はLLMという役割分担が、現場でROIが出るレシピになりつつあります。本人確認や請求書処理を抱える士業・金融・不動産・人材系の中小企業にとっては、この二段構えを社内のどの帳票で先に試すかが、次の四半期の生産性を決める論点になります。
AIエージェントの議論はこの春、「動くか/動かないか」から「どれだけ無駄を削れるか」「どれだけ速く・安く回るか」へ完全に移りました。アリババのMetisは技術側、Sun Financeは業務実装側から、それぞれ同じことを言っているように見えます。
コプラスでは、AIを"入れる"ところで止めず、ツール呼び出し回数・処理時間・1件単価という"AIのKPI"を可視化し、四半期ごとに磨き込むAI内製化支援を行っています。
無料相談はこちら →

