上下文强盗如果联合国的平衡是exploración或explotación (“Exploration-Exploitation权衡”).在赌场里有多少人值得尊敬(en inglés,“土匪”o“那些赌博机”),算法探索了不同的选择más清醒的结果和平衡的发展,所以是desempeñan好。Hemos usado esta técnica exitosamente在各种情况下,donde se haido muy poca información para entrenar y desplegar otros modelos de rendizaje automático。有可能的情况是在exploración和explotación之间的一个平衡,有可能的情况是在不同的情况下的平衡,有可能的情况是a /B,有可能的情况是diseño的优化,等等。