Learning navigation policies with deep reinforcement learning

Zhang, Jingwei

doi:10.6094/UNIFR/218235

:

^{{{inst.sup_no}}{{$last ? '' : ','}}

,

{{data.author_function.sup_no}},} et al.

{{language_data.landing_page_publications_show_more_persons_and_details}} {{language_data.landing_page_publications_show_more_persons}} {{language_data.landing_page_publications_show_more_details}} {{language_data.landing_page_publications_show_less_persons_and_details}} {{language_data.landing_page_publications_show_less_persons}} {{language_data.landing_page_publications_show_less_details}}

{{data.value}} . {{pub_id_data.link}}

{{data.title}} , {{data.volume}} ({{data.year}}) , {{data.issue}} , {{data.page}} . {{pub_id_data.link}}

{{data.source_id_type_value}}:

{{data.place}} : {{data.publisher}}

/

{{data.persons}}:

{{data.title}}.

{{data.edition}}.

{{data.place}} :

{{data.publisher}},

{{data.year}},

{{data.page}}.

{{data.source_id_type_value}}:

:

: : URL:

:

: ,

{{language_data.landing_page_documents_heading_keywords}}:

{{data.value}} , {{data.value}} ,

{{language_data.landing_page_documents_heading_classifications}}: {{data.value_long}}, : {{lp_data.conference.number}} {{lp_data.conference.name}}, {{lp_data.conference.place}}, {{lp_data.conference.period}}

${{lp_data.license.type_value}}$

${{lp_data.files_license.type_value}}$

${{lp_data.license.type_value}}$

:

${{lp_data.license.type_value}}$

${{lp_data.files_license.type_value}}$

${{lp_data.license.type_value}}$

SHA256 checksum: {{data.sha256}}

Download ({{data.filesize_display}})

Zip Download (~{{lp_data.files_stat.total_filesize_display}})

Zip Download (~{{lp_data.files_stat.total_filesize}})

{{language_data.label_field_meta_exam_faculty}}: {{language_data.landing_page_documents_label_supervisor}}: {{language_data.label_field_meta_exam_reviewer}}: {{language_data.label_field_meta_exam_second_reviewer}}: