为什么几款工具会存在这样的差异?首先我们要理解「输入」和「输出」的概念。
所谓的「与文档对话」,在每一次对 ChatDOC 们的提问时,实际上是将我们的问题和文档内容作为「输入」,传给了大语言模型的接口,由它返回给我们「输出」,也就是我们在聊天中得到的解答。
目前由于大语言模型的 token 记忆限制(_e.g. ChatGPT 的限制为 4096 个 token,约 3000 词;其他大语言模型目前的 token 限制一般在 2000-8000 之间_),当我们提问时,ChatDOC 们无法将整篇文章的内容和我们的提问都输入进去,而是根据问题的语义,匹配相关度高的文章片段,传送给大语言模型的 API,得到最终答案。
也就是说,基于我们的提问,ChatDOC 们并非在整篇文章里进行检索,而是在最相关的片段里寻找答案。由此我们便可以总结一下 ChatDOC 的优缺点,做到趋利避害了。
ChatDOC 们擅长处理基于「重点内容」的相关任务,包括但不限于:
介绍本论文的主要内容总结说话人 A 的主要观点
介绍该公司的投资策略及业务侧重点有何转变
进行周度/阅读的数据整理
“灾难性遗忘”是什么意思什么是大语言模型
开一家淘宝店铺需要哪几个步骤?(你还可以通过多轮追问,让它阐释子步骤,从而在同一个主题下生成、组织和优化内容。)
选中个股数据,并输入“请对该只股票近期的数据表现进行点评”选中实验数据结果,并输入“请总结该实验结果的数据结论”
分析以下基金投资策略的优缺点,打上标签,并以 markdown 表格的形式输出请依次告诉我这篇招股书的行业背景、核心技术、市场地位、公司历史沿革、主要财务指标、股东情况,用大纲列表的形式输出
而由于前文所述的记忆限制, ChatDOC 们暂不擅长精确的「全文定位」任务:
在 ChatDOC 们擅长的任务中,我们也可以通过优化提示语(Prompt)获得更理想的答案。以下是几个亲测有效的方法:
尽可能地减少解释空间,限制 AI 的操作范围。比如明确列出你希望 AI 帮你总结的字段,明确需要注意的细节,明确输出的格式。比如:
请使用小红书流行的文案风格概括总结这篇文章。小红书的风格,特点是:
- 引人入胜的标题
- 每个段落中包含表情符号
- 在末尾添加相关标签
请确保原文的意思保持不变。
把一个大的问题拆解为细分步骤,每个逻辑步骤清晰,告诉 AI 第一步做什么,第二步接着做什么。比如:
选中的表格数据,是 A 公司近期的股票数据。请你根据选中的数据完成以下两个任务:
1. 请对 A 公司近期的股票数据进行点评
- 根据收盘价计算每日收益率,并以表格的形式输出
告诉 AI 它现在需要以一个什么样的身份来回答问题。比如:
你现在是一名帮助我回答税收相关问题的助理。回答问题时,请遵循以下要求:
1. 只回答跟税收相关的问题
- 如果你不确定问题的答案,请回答「我不确定」
你可以让 AI 输出表格、大纲。比如:
请使用大纲列表 outliner 的形式,依次告诉我这篇文章的引言、文献回顾、理论框架、创新点、研究方法、研究过程、主要观点和结论、进一步研究方向。生成的回答格式如下,以此类推。每个部分的回答,要细分为多个子内容。- 引言 - 此处为引言内容。- 子内容 - 子内容 - 文献回顾 - 此处为文献回顾内容 - 子内容 - 子内容
也可以让它输出评分、解释。比如:
你是一名助手,旨在分析语音数据中的情绪。选中的内容是用户 A 的语音数据。评分范围为 1-10(10 为最高),请给出评分,并解释为什么给出这个评级。
在最开始时,告诉 AI 你希望它执行的任务,然后再共享其他上下文信息或示例,可以帮助产生更高质量的输出。
模型容易受到最新偏差的影响,在这种情况下,末尾 Prompt 信息可能比开头 Prompt 信息对输出的影响更大。因此,当提示语比较长的时候,在 Prompt 末尾重复指令,是值得一试的方法。
除此之外,还推荐大家去看看微软官方出品的 Prompt 教程:
以上,祝大家 Happy Chatting!
5000+ 个 AI 项目详解,效率工具篇:01https://mp.weixin.qq.com/s/ZrBbYucQY97uLvW6h6CRbQ