# 画像キャプション

画像キャプションにより、SillyTavernがチャットで使用されるイメージのテキスト説明を自動的に生成できます。

会話で視覚的コンテンツを「見て」応答するようにAIキャラクターに利用します。

  • アップロードまたはチャットに貼り付けられたイメージのキャプションを作成
  • チャット履歴の既存イメージにコンテキストを追加
  • ローカルモデル、クラウドAPI、クラウドソースネットワークを含むさまざまなソースを使用

セットアップ不要、お金不要、GPUが不要なオプションがあります。GPU が必要な一部またはすべてが必要なオプションもあります。ニーズとリソースに適したものを選択してください。

画像キャプション拡張機能はSillyTavernに組み込まれているため、個別にインストールする必要はありません。

# クイックスタート

  1. セットアップ:
    • Image Captioningパネルを**拡張機能**パネル内で開く
    • キャプション ソースを選択("ローカル"または"マルチモーダル"が最も可能性が高い)
    • "マルチモーダル"の場合は、API接続タブで接続をセットアップしたことを確認
  2. キャプションを生成:
    • 拡張機能ポップアップメニューから「キャプション生成」を選択
    • プロンプトされたときのイメージファイルを選択
    • キャプションが生成されるまで待機
  3. レビューと送信:
    • キャプション付きイメージがメッセージに挿入される
    • イメージツールチップを使用してキャプションを確認
    • 送信をクリックしてキャラクターの意見をチャット内で見る!

# パネルコントロール

# ソース選択

イメージキャプション用のソースを選択します。サポートされているオプション:

Source Description
マルチモーダル クラウド:OpenAI、Anthropic、Google、MistralAI、他。
ローカル:Ollama、llama.cpp、KoboldCpp、テキスト生成WebUI、vLLM。
カスタムプロンプトをサポートするため、イメージにどのような質問もできます。
ローカル SillyTavernサーバー内で実行しているtransformers.jsを使用。ゼロセットアップ!
Horde AI Hordeネットワークを使用します。クラウドソースされたモデルの分散ネットワーク。ダウンロード、構成、または支払いなし。可変応答時間。
Extras Extrasプロジェクトは2024年4月に廃止されました。保守またはサポートされていません。

# キャプション構成

  • キャプション プロンプト:キャプション用のカスタムプロンプトを入力します。デフォルト プロンプトは"この画像に何が入っていますか?"です
  • 毎回尋ねる:各イメージキャプション用にカスタムプロンプトをリクエストするために切り替え

# メッセージテンプレート

  • メッセージテンプレート:キャプション メッセージテンプレートをカスタマイズします。{{caption}}マクロを使用して生成されたキャプション挿入。デフォルト テンプレートは[{{user}}がキャプションを含む画像を{{char}}に送る:{{caption}}]です

# 自動キャプション

  • 自動的にイメージをキャプション:イメージを貼り付けまたはメッセージに添付するように自動キャプション切り替え
  • 保存前にキャプション編集:保存前にキャプション編集を許可切り替え

# イメージのキャプション

SillyTavernでイメージをキャプションするすべての方法:

  • 拡張機能ポップアップメニューから「キャプション生成」を選択し、プロンプトされたときのイメージファイルを選択
  • メッセージ内で既にあるイメージの上部にあるキャプションアイコンをクリック
  • 自動キャプションが有効でチャット入力にイメージを直接貼り付け
  • メッセージのアクションでファイルまたはイメージを埋め込みボタンを使用してイメージファイル添付
  • 埋め込みイメージを送信
  • /caption スラッシュコマンドを使用

# 自動キャプション

自動キャプション機能により、手動でキャプション処理をトリガーせずにチャットにイメージが追加されるとキャプションを自動的に生成できます。

有効にするには、Image Captioningパネルで「イメージを自動的にキャプション」チェックボックスを選択。"保存前にキャプション編集"をチェックしてキャプション保存前に編集することもできます。

有効化後、自動キャプション処理は以下のシナリオでトリガー:

  • イメージがチャット入力に直接貼り付けられる場合。
  • イメージファイルがメッセージに添付される場合。
  • 埋め込みイメージを含むメッセージが送信される場合。

システムは選択したキャプション ソース(ローカル、Extras、Horde、またはマルチモーダル)と構成設定を使用して、イメージ用キャプションを生成します。

# 保存前にキャプション編集(Refineモード)

"保存前にキャプション編集"オプションを有効にした場合:

  1. イメージが追加された後、生成されたキャプション付きのポップアップが表示される。
  2. 必要に応じてキャプション確認および編集できます。
  3. "OK"をクリックしてキャプション適用、または"キャンセル"をクリックしてキャプション保存なしで破棄。

# キャプション送信

生成され(必要に応じて編集された)キャプション構成されたメッセージテンプレートを使用してプロンプトに自動的に挿入されます。デフォルトでは次の形式で送信されます:

[BaronVonUserがSeraphina画像が含まれる画像を送信... ]