10.3 设计奖励函数