您好,欢迎来到叨叨游戏网。
搜索
您的当前位置:首页MAB算法之UCB1

MAB算法之UCB1

来源:叨叨游戏网

帮助理解

在实现一个较好的算法时,我们需要探索(exploration)利用( exploitation)

  • exploration
    探索:就是不断搜索新的或不断更新自己得到的数据来得到一个更优的数据来实现自己的预期目标
  • exploitation
    利用:充分使用自己得到的一些数据,通过叠加、相减、各种信号处理、最优检测或估计之类的东西处理,来实现自己预期的目标

问题描述1

假设寝室到食堂总共有K条路,要选出一条路程最短的一条路。但是你唯一可记录的工具只有可以记录步数的手环(记录的也不一定准确),所以我们为了得到一个较为可靠的结果,就用到了UCB1[1]的策略。

算法流程

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- gamedaodao.net 版权所有 湘ICP备2024080961号-6

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务