说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111560795.8 (22)申请日 2021.12.20 (71)申请人 四川云盾光电科技有限公司 地址 610000 四川省成 都市双流区西南 航 空港经济开发区工业 集中区三期 (72)发明人 王德麾 姜世平 董小春 杨武  谢伟民 张宜文  (74)专利代理 机构 成都九鼎天元知识产权代理 有限公司 51214 代理人 孙海博 (51)Int.Cl. G06N 7/00(2006.01) G06N 20/00(2019.01) (54)发明名称 一种类生物体 机器概率决策算法 (57)摘要 本发明公开了一种类生物体机器概率决策 算法, 按照行为决策、 参数调整、 动作执行的顺序 进行, 重复运行, 每一个完整动作序列称为一个 执行周期; 在参数调整中, 对于每种行为, 每被执 行一次, 其发生概率下降a%; 如果该行为在当前 周期选中执行, 则a会增加; 如果该行为 没有在当 前周期选中执行, 则a会衰减。 本发明的有益效 果: 约束条件能够通过若干参数定义和限定, 参 数具有一定的意思, 便于人类快速掌握调参原 理; 算法应具有一定的自学习能力, 能够根据所 出环境和应用场景, 在人工限定约束的基础上, 动态优化行为决策。 权利要求书1页 说明书3页 附图1页 CN 114418102 A 2022.04.29 CN 114418102 A 1.一种类生物体机器概率决策算法, 其特征在于: 按照行为决策、 参数调整、 动作执行 的顺序进行, 重复运行, 每一个完整动作序列称为一个执行周期; 在参数调整中, 对于每种 行为, 每被执行一次, 其发生概率下降a%; 如果该行为在当前周期选中执行, 则a会增加; 如 果该行为没有在当前周期选中执 行, 则a会衰减。 2.根据权利要求1所述的类生物体机器概率决策算法, 其特征在于: a初始取值为2~5, 如果该行为在当前周期选中执行, 则a会增加e, e为2~5间的随机数; 如果该行为没有在当 前周期选中执 行, 则a会衰减b%, b为10~3 0间的随机数。 3.根据权利要求1所述的类生物体机器概率决策算法, 其特征在于: 在行为决策中, 存 在主动行为和被动行为, 主动行为存在发生概率, 执行每种行为会消耗能量, 机器 当前总剩 余能量为E, 根据E的多少划分能量级, 在每 个能量级中, 每种主动行为存在 初始发生 概率。 4.根据权利要求3所述的类生物体机器概率决策算法, 其特征在于: 所有主动行为的发 生概率之和为 1, 在主动行为的发生概率变化后, 对所有主动行为的发生概率进 行归一化处 理。 5.根据权利要求3所述的类生物体机器概率决策算法, 其特征在于: 主动行为包括休眠 行为, 其发生 概率随着E的减少而增 加, 执行休眠行为会增 加能量。 6.根据权利要求5所述的类生物体机器概率决策算法, 其特征在于: 能量会随着休眠时 间的增加而增加。 7.根据权利要求1所述的类生物体机器概率决策算法, 其特征在于: 动作执行包括主动 行为执行和被动行为执行, 被动行为执行后, 需要进 行惩罚调整, 当E的绝对值小于th时, 则 增加所有能量级中, 休眠行为的概 率。 8.根据权利要求7所述的类生物体机器概率决策算法, 其特征在于: 对于m能量级, 休眠 行为的概 率增加c%的m次方, c取值 为2~5。 9.根据权利要求1所述的类生物体机器概率决策算法, 其特征在于: 动作执行包括主动 行为执行和被动行为执行, 主动行为执行后, 需要进行休眠判定, 判定为是则进行随机微 调, 该能量级中该 行为的概 率随机增 加或衰减, 判定为否则进行 下一周期。 10.根据权利要求9所述的类生物体机器概率决策算法, 其特征在于: 该能量级中该行 为的概率增加或衰减d%, d为 ‑20~20间的随机数。权 利 要 求 书 1/1 页 2 CN 114418102 A 2一种类生物体机 器概率决策算法 技术领域 [0001]本发明属于机器行为决策算法技术领域, 具体为一种类生物体机器概率决策算 法。 背景技术 [0002]机器人、 智能体在与人类交互时, 为了 获得人类的亲近感, 需要表 现出类生物体的 行为和决策。 目前常用的机器行为决策算法主要有2类, 一类是具有确定规则的决策机制, 即通过预先编程形成机器行为序列, 或预先编制外界刺激 ‑机器反应对应关系表, 实现机器 的行为决策。 [0003]另一类则为随机决策, 即预先定义每种外界刺激对应的机器行为集, 以及该集合 中每种机器行为的发生 概率, 随机决策哪种发生哪个行为。 [0004]对于具有固定规则的第一种行为决策算法, 其主要应用于严格要求机器确定行为 的场合, 如工业场景。 如果应用于机器人伴侣、 娱乐机器人等场景下, 因其行为可以被准确 预测, 因而不 容易被人类接受为 “伴侣”, 仅仅会被当成机器。 [0005]对于第二种随机决策算法, 如果不严格的对各行为发生概率进行限定, 很容易形 成过于随机的行为序列, 使得其完全无法被预测, 给人类造成恐慌。 但严格的进 行行为概率 限定, 是一项复杂耗时的工作。 [0006]因此需要一种通过可以通过简单调参, 即能形成行为 “基本”可预测的一种行为决 策算法。 并且, 如果能通过设定不同的参数取值, 根据每台机器人所处环境, 形成不同 “性 格”的机器行为决策, 将极大的降低调试工作量, 丰富产品种类。 发明内容 [0007]本发明的目的在于: 本发明提供了一种类生物体机器概率决策算法, 解决了严格 进行概率限定的随机决策算法复杂耗时的问题。 [0008]本发明目的通过 下述技术方案来实现: [0009]一种类生物体机器概率决策算法, 按照行为决策、 参数调整、 动作执行的顺序进 行, 重复运行, 每一个完整动作序列称为一个执行周期; 在参数调整中, 对于每种行为, 每被 执行一次, 其发生概率下降a%; 如果该行为在当前周期选中执行, 则a会增加; 如果该行为 没有在当前周期选中执 行, 则a会衰减。 [0010]进一步的, a初始取值为2~5, 如果该行为在当前周期选中执行, 则a会增加e, e为2 ~5间的随机数; 如果该行为没有在当前周期 选中执行, 则a会衰减b%, b为 10~30间的随机 数。 [0011]进一步的, 在行为决策中, 存在主动行为和被动行为, 主动行为存在发生概率, 执 行每种行为会消耗能量, 机器 当前总剩余能量为E, 根据E的多少划分能量级, 在每个能量级 中, 每种主动行为存在 初始发生 概率。 [0012]进一步的, 所有主动行为的发生概率之和为1, 在主动行为的发生概率变化后, 对说 明 书 1/3 页 3 CN 114418102 A 3

.PDF文档 专利 一种类生物体机器概率决策算法

文档预览
中文文档 6 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共6页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种类生物体机器概率决策算法 第 1 页 专利 一种类生物体机器概率决策算法 第 2 页 专利 一种类生物体机器概率决策算法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:15:45上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。