コンテンツにスキップ

メモリとコンテキスト

セッションをまたぐ記憶と、長い会話をモデルのコンテキスト内に収める方法を設定する。

画面表示(主)内部キー(サブ)製品既定値推奨
永続メモリmemory.memory_enabledオン個人利用はオン、機密作業は要検討
ユーザープロファイルmemory.user_profile_enabledオン個人利用はオン
メモリ予算memory.memory_char_limit2200 文字既定値
プロファイル予算memory.user_char_limit1375 文字既定値
メモリプロバイダーmemory.provider空欄空欄または builtin
コンテキストエンジンcontext.enginecompressorcompressor
自動圧縮compression.enabledオンオン
圧縮しきい値compression.threshold0.50.5~0.7
圧縮目標compression.target_ratio0.20.2
保護する直近メッセージcompression.protect_last_n2020

永続メモリとユーザープロファイル

Section titled “永続メモリとユーザープロファイル”
設定オンオフ
永続メモリ将来のセッションで役立つ事実や作業文脈を保存・参照セッションをまたぐメモリの保存・利用を停止
ユーザープロファイル好みや継続的な指示を短いプロファイルとして維持ユーザープロファイルを更新・注入しない

共同端末、顧客ごとに分離が必要な環境、保存してはいけないデータを扱う場合はオフを検討する。メモリへ資格情報や秘密鍵を保存させない。

文字数上限を増やすと多くの情報を保持できるが、毎ターンのコンテキスト消費も増える。まず既定値を使い、重要事項が頻繁に欠落するときだけ段階的に増やす。

画面表示(主)保存値(内部)既定動作
(なし)空文字はいHermes の標準選択に委ねる。このビルドでは通常、組み込みメモリへ解決される
BuiltinbuiltinいいえHermes のローカル組み込みメモリを明示的に使う
HonchohonchoいいえHoncho の外部またはセルフホストメモリを使う。HONCHO または HONCHO BASE URL が必要
画面表示(主)保存値(内部)既定動作
CompressorcompressorはいHermes の圧縮設定を使い、古い会話を要約して空きを作る
Defaultdefaultいいえコンテキストエンジンの標準実装へ委ねる
Customcustomいいえ登録済みのカスタムコンテキスト実装を使う。実装がない環境では選ばない
  • 自動圧縮 オン: しきい値到達時に古い会話を要約する。
  • 自動圧縮 オフ: 自動要約を行わない。長い会話ではモデル上限に達しやすい。
  • 圧縮しきい値: コンテキスト上限に対する開始比率。0.5 は50%で開始する。小さいほど早く圧縮し、大きいほど原文を長く保持する。
  • 圧縮目標: 圧縮後に残すコンテキスト比率。0.2 は上限の20%程度を目標にする。
  • 保護する直近メッセージ: 要約せず原文のまま残す最新メッセージ数。20 は直近20件を保護する。