家計診断AIのプロンプト最適化に挑戦──Difyの月間API上限に到達するまでの開発記録

今回の開発ブログでは、家計診断アプリ（総合評価AI） のプロンプトチューニングを数日かけて行い、Dify Sandbox の API 上限に到達し、診断が停止する ところまでの記録をまとめました。

評価ロジックの再設計から開始

まず最初に取り組んだのは、総合評価プロンプトの「採点ルール」を厳密化することでした。

特にこだわったのが、
**「summary_markdown の記述が必ず per_metric と一致する」**という整合性ルール。

AIは意外とズレた説明を書きやすいため、
強制的に一致させるルールをSYSTEMに組み込みました。

次に、UI側のテーブル項目と完全一致させるために、以下を実装。

最終的に、WebとPDFで表の並び順を揃えるところまで到達。

FP相談コメントについても

という微妙な表現の違いにも対応。

さらに、
「FPや金融機関」→「FPや専門家」
とするなど、ユーザー目線への調整も実施しました。

PDFでは

といった問題が発生していたため、

といったフロント側の改善も行いました。

結果、印刷物として通用するレベルのPDFに。

最終調整の段階で突然診断が動作しなくなり、
以下の通知が届きました。

Monthly API Rate Limit for the Sandbox Plan (limit: 3000) has been exceeded.

つまり：

という状態。

開発段階で何度も診断を走らせたため、
3000 回を超えてしまったようです。

DifyのSandboxはとても便利ですが、

という課題が見えてきました。

そこで次回は、
OpenAI APIを WordPress から直接叩く方式に移行します。