Estimation and control in finite Markov decision processes with the average reward criterion

Cavazos-Cadena, Rolando; Montes-de-Oca, Raúl

doi:10.4064/am31-2-1

Artykuł - szczegóły

Czasopismo

Applicationes Mathematicae

2004 | 31 | 2 | 127-154

Tytuł artykułu

Estimation and control in finite Markov decision processes with the average reward criterion

Autorzy

Rolando Cavazos-Cadena , Raúl Montes-de-Oca

Treść / Zawartość

Pełne teksty:

https://www.impan.pl/download/pdf/am31-2-1 [zdalny]

Warianty tytułu

Języki publikacji

EN

Abstrakty

EN

This work concerns Markov decision chains with finite state and action sets. The transition law satisfies the simultaneous Doeblin condition but is unknown to the controller, and the problem of determining an optimal adaptive policy with respect to the average reward criterion is addressed. A subset of policies is identified so that, when the system evolves under a policy in that class, the frequency estimators of the transition law are consistent on an essential set of admissible state-action pairs, and the non-stationary value iteration scheme is used to select an optimal adaptive policy within that family.

Słowa kluczowe

Kategorie tematyczne

Wydawca

Institute of Mathematics Polish Academy of Sciences

Czasopismo

Applicationes Mathematicae

Rocznik

2004

Tom

31

Numer

2

Strony

127-154

Opis fizyczny

Daty

wydano

2004

Twórcy

autor

Rolando Cavazos-Cadena

Departamento de Estadística y Cálculo, Universidad Autónoma Agraria Antonio Narro, Buenavista, Saltillo COAH 25315, México

autor

Raúl Montes-de-Oca

Departamento de Matemáticas, Universidad Autónoma Metropolitana, Campus Iztapalapa, Avenida San Rafael Atlixco #186, Colonia Vicentina, México 09340, D.F., México

Artykuł - szczegóły

Czasopismo

Applicationes Mathematicae

Tytuł artykułu

Estimation and control in finite Markov decision processes with the average reward criterion

Autorzy

Treść / Zawartość

Warianty tytułu

Języki publikacji

Abstrakty

Słowa kluczowe

Kategorie tematyczne

Wydawca

Czasopismo

Rocznik

Tom

Numer

Strony

Opis fizyczny

Daty

Twórcy

Bibliografia

Typ dokumentu

Bibliografia

Identyfikatory

Identyfikator YADDA