深入探索企业技术与卓越工程管理
及时了解数字领导者的最新业务和行业见解
分享职业发展心得,以及我们对社会公正和包容性的见解
有态度的前沿技术解析
服务数字读者的出版物
可以将应对不确定性所需的数字能力进行优先级划分的模型
业务主管的无所不包的技术指南
助力商业的专业洞见
188bet宝金博app下载Thoughtworks全球员工的洞见及观点
浏览更多我们的书籍
分析商业和技术最新趋势的精彩对话
面试准备
了解作为一名Thoughtworker是怎样的体验
正确开启技术生涯
在您所在的区域寻找正在招聘的岗位
订阅我们的月度新闻简报
技术雷达
上下文强盗是一类非常适用于解决探索/利用权衡问题的强化学习算法。该算法以赌场中的“老虎机”命名,通过探索不同的选择,学习有关预期结果的更多信息,并通过利用表现良好的选项来平衡该结果。我们已经在一些场景中成功地使用了该技术,在这些场景中只使用了少量的数据来训练和部署一些机器学习模型。事实上,我们可以在此探索/利用的权衡过程中添加上下文,使它适合于各种用例,包括A / B测试,推荐和布局优化。
英语|西班牙语|葡萄牙商业银行|中文
立即订阅