メモリとコンテキスト
セッションをまたぐ記憶と、長い会話をモデルのコンテキスト内に収める方法を設定する。

| 画面表示(主) | 内部キー(サブ) | 製品既定値 | 推奨 |
|---|---|---|---|
| 永続メモリ | memory.memory_enabled | オン | 個人利用はオン、機密作業は要検討 |
| ユーザープロファイル | memory.user_profile_enabled | オン | 個人利用はオン |
| メモリ予算 | memory.memory_char_limit | 2200 文字 | 既定値 |
| プロファイル予算 | memory.user_char_limit | 1375 文字 | 既定値 |
| メモリプロバイダー | memory.provider | 空欄 | 空欄または builtin |
| コンテキストエンジン | context.engine | compressor | compressor |
| 自動圧縮 | compression.enabled | オン | オン |
| 圧縮しきい値 | compression.threshold | 0.5 | 0.5~0.7 |
| 圧縮目標 | compression.target_ratio | 0.2 | 0.2 |
| 保護する直近メッセージ | compression.protect_last_n | 20 | 20 |
永続メモリとユーザープロファイル
Section titled “永続メモリとユーザープロファイル”| 設定 | オン | オフ |
|---|---|---|
| 永続メモリ | 将来のセッションで役立つ事実や作業文脈を保存・参照 | セッションをまたぐメモリの保存・利用を停止 |
| ユーザープロファイル | 好みや継続的な指示を短いプロファイルとして維持 | ユーザープロファイルを更新・注入しない |
共同端末、顧客ごとに分離が必要な環境、保存してはいけないデータを扱う場合はオフを検討する。メモリへ資格情報や秘密鍵を保存させない。
文字数上限を増やすと多くの情報を保持できるが、毎ターンのコンテキスト消費も増える。まず既定値を使い、重要事項が頻繁に欠落するときだけ段階的に増やす。
メモリプロバイダー
Section titled “メモリプロバイダー”| 画面表示(主) | 保存値(内部) | 既定 | 動作 |
|---|---|---|---|
| (なし) | 空文字 | はい | Hermes の標準選択に委ねる。このビルドでは通常、組み込みメモリへ解決される |
| Builtin | builtin | いいえ | Hermes のローカル組み込みメモリを明示的に使う |
| Honcho | honcho | いいえ | Honcho の外部またはセルフホストメモリを使う。HONCHO または HONCHO BASE URL が必要 |
コンテキストエンジン
Section titled “コンテキストエンジン”| 画面表示(主) | 保存値(内部) | 既定 | 動作 |
|---|---|---|---|
| Compressor | compressor | はい | Hermes の圧縮設定を使い、古い会話を要約して空きを作る |
| Default | default | いいえ | コンテキストエンジンの標準実装へ委ねる |
| Custom | custom | いいえ | 登録済みのカスタムコンテキスト実装を使う。実装がない環境では選ばない |
- 自動圧縮 オン: しきい値到達時に古い会話を要約する。
- 自動圧縮 オフ: 自動要約を行わない。長い会話ではモデル上限に達しやすい。
- 圧縮しきい値: コンテキスト上限に対する開始比率。
0.5は50%で開始する。小さいほど早く圧縮し、大きいほど原文を長く保持する。 - 圧縮目標: 圧縮後に残すコンテキスト比率。
0.2は上限の20%程度を目標にする。 - 保護する直近メッセージ: 要約せず原文のまま残す最新メッセージ数。
20は直近20件を保護する。