消息规范化、增量协议与多维输入路径
sequenceDiagram
participant GT as Game Thread
participant PL as Plugin Layer
participant K as Kernel (VRAM)
GT->>PL: 发送消息数组 (Messages)
PL->>PL: 执行 Gemma 角色合并 (Normalizing)
PL->>PL: 检查增量 (Delta Check)
PL->>K: 物理推送 Token 差量
Note right of K: 开始后台异步推理循环
PL-->>GT: 立即返回 (Non-blocking)
适用于需要完全自定义历史记录和采样参数的场景。
// 物理地址绑定 + 增量推送
FLiteRtLmUnrealApi::SendChatRequest(AgentPtr, Messages, ...);
通过 ULiteRtLmComponent 封装。它会自动管理 AgentPtr 的哈希映射。
// 蓝图或 C++ 均可调用,极简发送
MyBrainComponent->SendChatMessage(UserMessageText);
本地插件不发废话。每次只物理同步新说的那几个词,极大降低长对话下的 Prefill 延迟。
插件会自动将 system 提示词物理合并入首条用户消息,以兼容 Gemma 等不原生支持 System 模式的模型。