雷达上的
雷达上的

上下文强盗

已发布:2021年4月13日
现在的版本没有
这个光点不在当前版本的雷达上。如果它是最后几个版本中的一个,那么它很可能仍然是相关的。如果这个信号的年代更久远,它可能就不再相关,我们今天的评估可能就不同了。不幸的是,我们没有足够的带宽来持续检查以前版本的雷达的光点 了解更多
2021年4月
试验 值得一试。了解为何要构建这一能力是很重要的。企业应当在风险可控的前提下在项目中尝试应用此项技术。

上下文强盗是一类非常适用于解决探索/利用权衡问题的强化学习算法。该算法以赌场中的“老虎机”命名,通过探索不同的选择,学习有关预期结果的更多信息,并通过利用表现良好的选项来平衡该结果。我们已经在一些场景中成功地使用了该技术,在这些场景中只使用了少量的数据来训练和部署一些机器学习模型。事实上,我们可以在此探索/利用的权衡过程中添加上下文,使它适合于各种用例,包括A / B测试,推荐和布局优化。

雷达

下载第25期技术雷达

英语|西班牙语|葡萄牙商业银行|中文

雷达

获取最新技术洞见

立即订阅

查看存档并阅读往期内容

Baidu