Cohere APIのデータはトレーニングに使われないようにオプトアウト設定できる

Tadashi Shigeoka ·  Fri, September 12, 2025

LLMをアプリケーションに組み込む際、最大の懸念の一つが「API経由で送信したデータはどのように扱われるのか?」という点です。特に、機密情報や個人情報を含む可能性がある場合、そのデータがモデルのトレーニングに利用されることは避けたいと考えるのが自然です。

この記事では、Cohere API利用時のデータプライバシーに関するポリシーと選択肢についてご紹介します。

Cohere APIのデータ利用ポリシー:デフォルトとオプトアウト

まず結論から言うと、デフォルトでは、Cohere APIに送信されたデータはモデルの改善目的で利用される可能性があります。

しかし、Cohereはユーザーが自身のデータをコントロールできるよう、明確なオプトアウトの手段を提供しています。

最も手軽な方法は、Cohereのダッシュボードから設定を変更することです。設定画面でデータ利用を無効化するオプションが用意されています。

この設定を無効にすることで、あなたのAPIデータがモデルのトレーニングやファインチューニングに使用されることはなくなります。多くのユースケースでは、このダッシュボードでのオプトアウトがシンプルかつ十分な解決策となるでしょう。

以下、Cohere ダッシュボードの設定画面 https://dashboard.cohere.com/data-controls から引用です。

Data Controls

Use the toggles below to control how we may use prompts, generations, or fine-tune data to train our models. You may change your settings at any time and they will take effect immediately. To learn more about how we handle and protect enterprise data, read our Enterprise Data Commitments.

On ✅ ALLOW PROMPT AND GENERATION USE FOR TRAINING

Prompts are the text or content that you input to the model (e.g. your messages to chat.cohere.com), and Generations are the model outputs (e.g. the responses generated in the chat).

  • ON - we may use prompts or generations to help train our models to improve their quality.

  • OFF - we do not use prompts or generations to train our models.

On ✅ ALLOW FINETUNE DATA USE FOR TRAINING

Finetune data are your data sets (csv, jsonl, etc) uploaded to create a fine-tuned model.

  • ON - we may use these datasets to help train our models to improve their quality.
  • OFF - we do not use fine-tune data to train our models.

We never share fine-tuned models you create with any other customer.

より高度なプライバシー要件への対応

企業のセキュリティポリシーや扱うデータの機密性によっては、さらに厳格なデータ管理が求められる場合があります。Cohereはそうしたニーズに応えるため、複数の高度な選択肢を提供しています。

1. Zero Data Retention (ZDR)

「Zero Data Retention (ZDR)」は、その名の通りデータを一切保持しないための機能です。このオプションを有効にすると、APIリクエストに関するすべてのデータロギングが無効化されます。

ZDRは、以下のような特に機密性の高い情報を扱うアプリケーションに最適です。

  • 法務関連のドキュメント分析
  • 医療情報の処理
  • その他、コンプライアンス要件が非常に厳しい業界

この機能の利用には、Cohereのプライバシーチームおよびセールスチームとの協議が必要です。

2. プライベートクラウドでのデプロイメント

データを自社のインフラストラクチャ内に完全に留めたい場合、プライベートクラウドへのデプロイメントが最適なソリューションです。Cohereは、AWS BedrockやAWS SageMakerといった主要なクラウドプラットフォーム上でのプライベートデプロイメントをサポートしています。

この方式のメリットは明確です。

  • Cohere社は顧客データに一切アクセスしない: データは顧客の管理するクラウドインスタンス内(例: 自社のAzure環境)で完結します。
  • 完全なデータ主権: データの管理、セキュリティ、コンプライアンスはすべて自社のポリシー下でコントロールできます。

インフラ管理のコストは発生しますが、最高レベルのデータガバナンスが求められるエンタープライズ環境では非常に有効な選択肢です。

コンプライアンスと法的保証

Cohereは、GDPR(EU一般データ保護規則)やCCPA(カリフォルニア州消費者プライバシー法)、SOC IIといった主要なデータ保護・セキュリティ基準に準拠しています。

また、企業間の契約として法的な保証を求めるユーザー向けに、**DPA(データ処理契約)**の締結も可能です。DPAは、Cohereが顧客データをどのように保護し、コンプライアンスを遵守するかを法的に約束する文書であり、企業が安心してサービスを利用するための重要な要素となります。

まとめ

Cohere APIのデータプライバシーに関する設定は、開発者や企業の要件に応じて柔軟に選択できるようになっています。

  • 手軽な対策: Cohereダッシュボードでデータ利用をオプトアウトする。
  • 厳格な要件: **Zero Data Retention (ZDR)**でデータを一切保持させない。
  • 最高レベルの管理: プライベートクラウドにデプロイし、データを自社環境内に留める。

LLMを安全に活用するためには、こうしたプライバシーポリシーと提供される選択肢を正しく理解することが不可欠です。自社のプロジェクト要件に最適な方法を選択し、安心して開発を進めましょう。

以上、Cohere APIのデータプライバシー設定について調べた、現場からお送りしました。

参考情報