核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
没办法,华为想做 iOS 想疯了,不仅手机HarmonyOS...
2025-06-21阅读全文 >>周鸿祎的二手迈巴赫卖出了990万的高价,拍卖结束后,周鸿祎请...
2025-06-21阅读全文 >>为什么要在本地部署deepseek R1?1. 数据隐私与安...
2025-06-21阅读全文 >>首先,确实是有钱人家的孩子。 这火箭比冲230,硝糖树脂基...
2025-06-21阅读全文 >>OpenWrt 可以做很多有趣的事情,只要你愿意,它可以约等...
2025-06-21阅读全文 >>