雷达上的
雷达上的

上下文强盗

发布日期:2021年4月13日
现在的版本没有
这个光点不在当前版本的雷达上。如果它是最后几个版本中的一个,那么它很可能仍然是相关的。如果这个信号的年代更久远,它可能就不再相关,我们今天的评估可能就不同了。不幸的是,我们没有足够的带宽来持续检查以前版本的雷达的光点 了解更多
2021年4月
试验 值得追求的。了解如何建立这种能力是很重要的。企业应该在能够处理风险的项目上尝试这种技术。

上下文强盗是一种强化学习类型,非常适合于探索/开发权衡问题。该算法以赌场中的“土匪”或老虎机命名,它探索不同的选项,以更多地了解预期结果,并通过利用表现良好的选项来平衡它。我们已经成功地将这一技术应用于我们几乎没有数据来训练和部署其他机器学习模型的情况。事实上,我们可以在这种探索/利用折衷中添加上下文,这使得它适合于各种用例,包括a /B测试、建议和布局优化。

雷达

下载技术雷达第25卷

英语|西班牙语|葡萄牙商业银行|中文

雷达

了解科技

现在就订阅

访问我们的档案,阅读以前的卷

Baidu