RLHF

AIの出力を技術的な正確さだけでなく、ユーザーの信頼性や使い心地(UX)に合わせるための手法