Off Policy Evaluation Python Packages

obp

Open Bandit Pipeline: a python library for bandit algorithms and off-policy evaluation

2K 703 99

causalrl

Causal reinforcement learning, organized around Bareinboim's 9-task taxonomy, confounded offline→online RL, POMIS, counterfactual policies, transportability, discovery, imitation, curricula.

2K 0 2

scope-rl

SCOPE-RL: A python library for offline reinforcement learning, off-policy evaluation, and selection

933 143 14

offline-evaluation

Implementations and examples of common offline policy evaluation methods in Python.

422 220 25