背景强盗|技术雷达|思想工作188bet宝金博app下载 - 188金宝搏app怎么下载

菜单

关闭

中国|中文

美国

英语
中国

英语 | 中文
印度

英语
加拿大

英语
新加坡

英语
联合王国

英语
澳大利亚

英语
德国

英语 | 多伊奇
巴西

英语 | 葡萄牙商业银行
西班牙

英语 | 西班牙语
泰国

英语
智利

英语 | 西班牙语
厄瓜多尔

英语 | 西班牙语
全球

英语

技术雷达

下载

已发布:2021年4月13日

现在的版本没有

这个光点不在当前版本的雷达上。如果它是最后几个版本中的一个，那么它很可能仍然是相关的。如果这个信号的年代更久远，它可能就不再相关，我们今天的评估可能就不同了。不幸的是，我们没有足够的带宽来持续检查以前版本的雷达的光点了解更多

2021年4月

试验

上下文强盗是一类非常适用于解决探索/利用权衡问题的强化学习算法。该算法以赌场中的“老虎机”命名,通过探索不同的选择,学习有关预期结果的更多信息,并通过利用表现良好的选项来平衡该结果。我们已经在一些场景中成功地使用了该技术，在这些场景中只使用了少量的数据来训练和部署一些机器学习模型。事实上,我们可以在此探索/利用的权衡过程中添加上下文,使它适合于各种用例,包括A / B测试,推荐和布局优化。

下载第25期技术雷达

英语|西班牙语|葡萄牙商业银行|中文

获取最新技术洞见