サーバレスのサムネイル

サーバレス

CloudFlare Workers AIの料金体系・無料枠まとめ

公開日: 2024.2.2

サーバーレスで誰でも気軽にAIを使うことができる「CloudFlare Workers AI」の料金体系、無料枠について解説します。

編集ノート:SERVERSUSでは、パートナーリンクからコミッションを得ています。コミッションが記事の意見や、サービスの評価に影響を与えることはありません。

CloudFlare Workers AIの料金体系

Cloudflare Workers AIは「処理で使用したニューロン数」によって課金される従量課金システムになっています。

従量課金のベースは二つ種類が用意されています。

  1. Regular Twitch Neurons (RTN):1,000ニューロンあたり0.01ドル。
  2. Fast Twitch Neurons (FTN):1,000ニューロンあたり0.125ドル。

RTNは実行するデータセンターを指定しない場合の方法で、FTNはその名の通り、ユーザーの最寄りのデータセンターで処理をする方法です。

この二つがどのように使い分けられるかは現状では明らかにされていません。

CloudFlare Workers AIの「ニューロン」とは?

ニューロンという単位がイメージがしづらいですが、Cloudflaredは以下のように解説しています。

ニューロンは、AIの出力を測定する方法であり、常にゼロにスケールダウンする(使用量がゼロの場合、0ニューロン分の料金が課金される)。 1,000個のニューロンで何ができるかというと、130個のLLM応答、830個の画像分類、1,250個の埋め込みを生成できる。

ただし、料金については2024年2月1日現在「予定価格」とされていて、現時点ではベータ版を使ったとしても課金はされません。

Workers AI:Cloudflareのグローバルネットワーク上でサーバーレスGPUによる推論を実現 | Cloudflareブログ

CloudFlare Workers AIの無料枠

2024年2月1日現在、Cloudflare Workers AIはオープンベータ版のため、有料プラン・無料プランどちらのユーザーも無料で使うことができます。

ただし、利用の際には以下のリクエスト制限があるほか、事前告知なしで制限が加わる可能性もあるとしてます。

  • @cf/meta/llama-2-7b-chat-int8: 50 リクエスト
  • @cf/openai/whisper: 4000 リクエスト/分
  • @cf/meta/m2m100-1.2b: 4000 リクエスト/分
  • @cf/huggingface/distilbert-sst-2-int8: 6000 リクエスト/分
  • @cf/microsoft/resnet-50: 6000 リクエスト/分
  • @cf/baai/bge-base-en-v1.5: 6000 リクエスト/分

Limits | Cloudflare


価格は記載がある場合を除き、すべて税込みです。

関連キーワード

サーバレスの新着記事