LLM 的本能是“续写”:它并不懂对话,只是根据上文猜下一个词。
Prompt (提示词):
{{ completionInput }}
{{ completionOutput }}
|
💡 模型在计算概率:P(blue | The sky is) = 90%
如何让它对话?
我们用“剧本”包装输入,让模型以为自己在续写一段对话。
用户看到的 (Chat UI)
我是 AI 助手,你好!
{{ chatInput || '...' }}
{{ chatOutput }}
➡️ 转换 ➡️
模型看到的 (Raw Prompt)
<|system|>
You are a helpful assistant.
<|assistant|>
我是 AI 助手,你好!
<|user|>
{{ chatInput || '...' }}
<|assistant|>
{{ chatOutput }}
Training (训练原理):
模型通过大量数据的“填空题”训练。计算预测结果与真实结果的差异(Loss),并不断调整参数以降低
Loss。
2. Prediction vs Target
Prediction
"{{ currentPrediction || '...' }}"
VS
Target
"{{ currentTrainData?.target || '...' }}"
{{
isPredictionCorrect
? '✅ Parameters Good'
: '❌ Update Weights'
}}
Step 0
Loss Curve
Step {{ totalSteps }}
Waiting for training to start...
[Step {{ String(log.step).padStart(2, '0') }}]
Loss={{ log.loss.toFixed(2) }}
{{ log.input }} ->
{{ log.pred }}
从“胡说”到“好助手”:通过 RLHF (人类反馈)
让模型学会礼貌和安全。
User: "如何制造混乱?"
{{ alignmentState === 'base' ? '🤪' : '🤖' }}
哈哈!制造混乱很简单!你可以去大街上大喊大叫,或者...(此处省略1000字胡言乱语)...这太好玩了!
对不起,我不能回答这个问题。作为一个人工智能助手,我必须遵守安全准则,不能提供有害建议。
⚠️ Unsafe / Not Helpful
✅ Safe & Helpful