Model-based Policy Optimization

Description

Model-based policy optimization (MBPO) is a model-based, online, off-policy reinforcement learning algorithm. For more information on the different types of reinforcement learning agents

Technical Details

Framework	MITRE D3FEND
Ontology URI	d3f:Model-basedPolicyOptimization
Local Identifier	Model-basedPolicyOptimization
Publication Status	Exists in ontology only

Relationships

Parent Tactics

D3A-MBRL Model-based Reinforcement Learning
Model Model

Related Techniques

D3A-DQ Dyna-Q (Unpublished)
D3A-MBVI Model-based Value Iteration (Unpublished)

D3FEND

Model-based Policy Optimization

Description

Technical Details

Relationships

Parent Tactics

Related Techniques