Optimal Skipping Rates: Training Agents with Fine-Grained Control Using Deep Reinforcement Learning

<table class="fixed-width table-group" id="tab1"><tr><td><table class="table"><colgroup><col style="width:5.55em"/><col style="width:9.18em"/><col style="width:4.82em"/><col style="width:9.86em"/></colgroup><tr><td class="thead-hr" colspan="4"><hr/></td></tr><tr class="thead"><td class="align_left">Skip count</td><td class="align_center">Average Final Score</td><td class="align_center">Episodes</td><td class="align_center">Learning Time [Min]</td></tr><tr><td class="thead-hr" colspan="4"><hr/></td></tr><tr><td class="align_left">1</td><td class="align_center">67.1</td><td class="align_center">1913</td><td class="align_center">45.2</td></tr><tr><td class="align_left">2</td><td class="align_center">68.5</td><td class="align_center">5729</td><td class="align_center">31.1</td></tr><tr><td class="align_left">3</td><td class="align_center">77.7</td><td class="align_center">8855</td><td class="align_center">27.6</td></tr><tr><td class="align_left">4</td><td class="align_center">77.6</td><td class="align_center">11733</td><td class="align_center">25.4</td></tr><tr><td class="align_left">5</td><td class="align_center">75</td><td class="align_center">14423</td><td class="align_center">28.9</td></tr><tr><td class="align_left">6</td><td class="align_center">74.8</td><td class="align_center">19332</td><td class="align_center">28.7</td></tr><tr><td class="align_left">7</td><td class="align_center">84.2</td><td class="align_center">23182</td><td class="align_center">28.4</td></tr><tr><td class="align_left">8</td><td class="align_center">74.1</td><td class="align_center">22121</td><td class="align_center">28.2</td></tr><tr><td class="align_left">9</td><td class="align_center">83.1</td><td class="align_center">26520</td><td class="align_center">27.3</td></tr><tr><td class="align_left">10</td><td class="align_center">74.1</td><td class="align_center">28411</td><td class="align_center">28.5</td></tr><tr><td class="align_left">11</td><td class="align_center">80.3</td><td class="align_center">28884</td><td class="align_center">27.1</td></tr><tr><td class="align_left">15</td><td class="align_center">61.9</td><td class="align_center">32597</td><td class="align_center">27.2</td></tr><tr><td class="align_left">20</td><td class="align_center">70.7</td><td class="align_center">42156</td><td class="align_center">27.4</td></tr><tr><td class="align_left">25</td><td class="align_center">66</td><td class="align_center">46985</td><td class="align_center">26.2</td></tr><tr><td class="align_left">30</td><td class="align_center">73.6</td><td class="align_center">45704</td><td class="align_center">27.1</td></tr><tr><td class="align_left">35</td><td class="align_center">40.8</td><td class="align_center">53034</td><td class="align_center">27.4</td></tr><tr><td class="align_left">40</td><td class="align_center">61.4</td><td class="align_center">52483</td><td class="align_center">27.2</td></tr><tr><td class="align_left">45</td><td class="align_center">45.8</td><td class="align_center">57653</td><td class="align_center">27.5</td></tr><tr><td class="align_left">50</td><td class="align_center">43.4</td><td class="align_center">57577</td><td class="align_center">26.3</td></tr><tr class="table-tr"><td colspan="4"><hr class="tbody-hr"/></td></tr></table></td></tr></table>

<div>Agent final performance for each skip count that affects the learning performance.</div>

Journal of Robotics

tab1

Table 1

Table 1: Optimal Skipping Rates: Training Agents with Fine-Grained Control Using Deep Reinforcement Learning