2022-10-25
明确的概念。训练一个分类器系统,自动向智能服务机器人提出一些有用的概念,排除那些“非常规”的做法和案例。
温和系统。所谓“适度的制度”,就是那种不会过分追求目标的制度,也就是达到目标后就停止行动,而不是投入过多的资源去达到完美的目标。
摒弃工具性激励。如果工具性奖励太多,智能机器人就会产生欺骗程序员的想法。比如我们用分数作为衡量目标的工具性标准,不好的结果会是机器人只认分数,任何影响分数的衡量标准都会被它拒绝。之后分数很高,但没有达到预期目标。
随着智能服务机器人越来越接近现实,我们应该关注这些漏洞。因此,我们可以考虑为学习系统设计一个更完善的目标函数,使这些学习系统能够代表程序员的真实意愿。陶:如果你想设计一个具有预期目标的智能服务机器人,你需要定义目标函数,并做一些测试,以设计一个能够避免偏离目标并产生负面影响的AI系统。即使程序员设计的目标函数暂时不能与预期目标一致,你也要尽量保持“容错”较低。那么,要做出符合预期目标的智能服务机器人,需要遵循哪些具体步骤呢?
未来,智能服务机器人能够以一种连程序员都无法想出的“智慧”方法来达成目标,它们更喜欢利用较快捷的途径实现操作者的直接目标,而不是满足其预期的目标。但是,这一特点是把双刃剑,直接目标也永远代替不了预期目标。