https://www.bilibili.com/video/BV1Z14y1Z7LJ/ https://zhuanlan.zhihu.com/p/626290417
基于文本训练数据做预测。
输出内容不可控,有可能是有害的内容。
首先使用已经在大量文本数据上训练过的基本大模型;
然后用输入、输出的指令进行微调;
然后使用 RLHF(人类反馈强化学习)的技术进一步优化;
输出内容可控,内容是有益、诚实和无害的。
第一,明确不等于少,而是指指令清晰和明确,如果只需要少量的文字就可以达到清晰和明确的效果,也是可以的。
第二,策略。
使用好分隔符
避免提示注入
prompt 中指定验证条件
“少量样本”提示
给模型足够的时间去思考,你可以把 ChatGPT 想象成一个活生生的人,你需要它回答问题,要留够时间让它去思考。
ChatGPT 也有一个问题,那就是容易出现幻觉。幻觉就是,ChatGPT 编造听起来很合理的故事,但是完全不符合事实。
要避免产生幻觉,可以采取如下的策略:提取引用,使用引用进行回答,避免幻觉。
很多的情况下,与 ChatGPT 交互一次是不能得到最佳的答案的,需要不断的迭代,直到获得理想的答案。迭代的步骤如下:
提示、分析结果、改进提示、循环直至得到理想的回答。
ChatGPT 可以对大量文字进行总结。
ChatGPT 可以对内容进行推理,如提取标签、提取名称、识别情感。
通过 ChatGPT 可以定制一个聊天机器人,第一是确定聊天机器人的角色,第二确定内容的输出格式。
ChatGPT 可以对某个主题的内容,进行内容扩展。
ChatGPT 可以对内容进行如下的转换:
语言翻译。
格式转换,如 html、Markdown、json。
语气转换,如朋友语气、专家语气、老师语气、医生语气。
帮助拼写。
语法纠正。