顛末
深夜の不審な通知
深夜0時過ぎに11万5千円くらいのカード利用通知が来たけど、身に覚えのない買い物だった。不正利用かと思ってカード明細を確認しようとしたけど、まだ反映されていなかった。
不正利用への懸念と限度額の引き下げ
もし不正利用が続くといやなので、カードの利用限度額を半分に下げた。これで最悪の事態は避けられると思ったけど、もし不正利用じゃなかったら課金は避けられないし、不正利用だったらカード番号が変わって、登録している色々なサービスの設定変更が面倒だな、と憂鬱になった。
請求書
数時間後、Google Cloudから先月分の請求書がメールで届いた。金額は800ドル。これだった。
油断の原因
Vertex AIのGeminiで遊んでいて、たまたま100ドルのクレジットがあったので安心して使っていた。Clineのタスクに表示されるAPIコストは小さかったから、問題ないと思っていた。
問題のタスク
どんなタスクをやったかというと、簡単なバックエンドのコード(RESTfulとGraphQL)に対して、指定した技術でフロントエンドを書いてもらう、というもの。
ふんわり&デカすぎるタスクだった。
想定を大きく超える請求額
一つのタスクで94.6483ドルになっているものがあって、これは認識していて、100ドルのクレジットを使い切りそうだなと思っていた。次の日も少し使ったけど、特に高くなるような使い方はしなかった。
だから、この時点では想定の10倍になっているとは思わなかった。
実際の利用金額はこうなっていた。$100引かれていてこれだ。
コストアラートを見た時点でも気づけなかった
設定していたコストアラートのメールが来たけど、設定金額は10ドル。内容は利用金額が100%に達したというものだったので、100ドルを少し超えたくらいかな、という認識だった。
高額請求の原因:トークン数
900ドル発生したことに気づいてからタスクをよく見たら、「↑ 43.3m」と表示されていた。これが原因だ。Gemini 2.5 Proは、一定のトークン数を超えると料金が急に上がる。インプットトークンは2倍、アウトプットトークンは1.5倍になるらしい。ClineのAPIコストは目安程度に考えて、トークン量をちゃんと意識すべきだった。
※ Context WindowのMAXがおかしい(小さい)のは、ビビって設定をClaude 3.7に変えたから
反省点
そもそも、モデルの選び方も間違っていたかもしれない。gemini-2.5-pro-preview-03-25ではなくて、gemini-2.5-pro-exp-03-25を使うべきだったかもしれない。勉強のためにやっていただけなので、学習されるのを避けるつもりはなかった。100ドルのクレジットとClineのAPIコスト表示に油断したのが完全に自分の責任。
Clineの設定をAuto Approveにしたのもよくなかった。1分に2リクエストまでは無料、みたいな料金体系ではなかったか?
完全に、クレジットの存在とClineのAPIコスト表示に油断していた。
今後の利用方法と定額サービスの検討
最近バイブコーディングが流行っているけど、油断せずに、できれば定額のサービスを使った方がよさそう。ただ、定額のサービスで良い価値が出せるかは今後見ていく必要がありそう。特に、コーディング性能に優れているGeminiは、近いうちに定額サービスとなることはあるのか?
課金後の気づきと後悔
そして、この料金に気づいたのが課金が行われてからというのも残念なポイントだった。
GW真っ只中に悲しみの通知。
もう少し早く気づいていれば、Google Developerプログラムに割引で入り、$500のクレジットをもらい、実質Google Developerプログラムの有料プランを無料で使うことで、気持ち的ダメージを軽減できたかもしれない。