为了提升解题策略的准确性和可靠性,「自洽性增强法」(Self-consistency Enhancement)近年来成为了一个重要的补充手段。这种方法不仅仅局限于构建单一的推理链路,而是通过生成多条独立的思考路径,并从中提炼出最常见的解答,以达到优化最终结果的目的。
具体操作
具体操作时,首先根据已有的少量样本推理链路作为模板,引导模型独立产生多个推理过程。如同下图所示,我们可以观察到一个使用少样本推理链例子编制的提示,它引导生成了多个独立的思考路径。
从每条路径中,我们提取出一个答案,并通过所谓的「边缘化推理路径」技术,即通过对答案进行汇总并选择出现频率最高的答案,来确定最终的解决方案。这种方法的核心在于通过数量上的优势,来提高决策的准确率和可信度。
有效性
「自洽性增强法」的有效性已经在多个领域得到了验证,包括但不限于算术问题、常识判断以及符号逻辑推理等领域。研究显示,即便是在传统思路链提示无法奏效的情况下,这种方法依然能够显著提升问题解决的成功率。
更为复杂的方法
值得一提的是,Wang 等人在他们的研究中还讨论了一种更为复杂的「边缘化推理路径」方法,该方法考虑了每条思路链在生成时由大型语言模型计算出的概率。尽管他们的实验并未采用这种方法,但多数投票的策略在很多情况下已经显示出了相同甚至更好的效果。
阅读全文
温馨提示: