基于不确定性估计的微调代码生成模型与大语言模型的协同方法
针对代码生成任务,微调模型与大语言模型(LLM)的互补机制尚未得到系统性分析,导致二者在协同过程中存在决策边界模糊的问题。提出一种基于不确定性估计的微调代码生成模型与LLM的协同方法 Coral,分析微调代码生成模型与LLM的互补机制,量化两者决策边界。Coral通过预期校准误差的思想,比较不确定性估计方法,为微调模型配备较为稳定的不确定性估计方法,使其能够输出不确定性估计得分,反应输出的不确定性。Coral通过最大化微调模型与LLM在验证数据集的BLEU指标,计算不确定性估计阈值,量化二者的决策边界。基于阈值与微调模型输出的不确定性估计得分识别分布内(In-Distribution,ID)与分部外(Out-ofDistribution,OOD)数据,利用LLM提升微调模型在OOD数据的泛化能力,从而提升代码生成任务的整体效果。在两个基准数据集的性能测试中,Coral的BLEU与Exact Match得分优于单独使用微调模型或LLM,证明所提方法能够有效协同微调模型与LLM。
计算机应用研究
网络首发
立即查看 >
图书推荐
相关工具书