Two-Player Stochastic Games with Perfect and Zero Information (Computer file, 2016) [WorldCat.org]
skip to content
New WorldCat.org coming soon
Two-Player Stochastic Games with Perfect and Zero Information
Checking...

Two-Player Stochastic Games with Perfect and Zero Information

Author: Edon KelmendiHugo GimbertFrançois DufourMarc ZeitounLaurent DoyenAll authors
Publisher: 2016.
Dissertation: Thèse de doctorat : Informatique : Bordeaux : 2016.
Edition/Format:   Computer file : Document : Thesis/dissertation : English
Summary:
On considère des jeux stochastiques joués sur un graphe fini. La première partie s'intéresse aux jeux stochastiques à deux joueurs et information parfaite. Dans de tels jeux, les joueurs choisissent des actions dans ensemble fini, tour à tour, pour une durée infinie, produisant une histoire infinie. Le but du jeu est donné par une fonction d'utilité qui associe un réel à chaque histoire, la fonction est
Subjects
More like this

Find a copy online

Links to this item

Find a copy in the library

&AllPage.SpinnerRetrieving; Finding libraries that hold this item...

Details

Genre/Form: Thèses et écrits académiques
Material Type: Document, Thesis/dissertation, Internet resource
Document Type: Internet Resource, Computer File
All Authors / Contributors: Edon Kelmendi; Hugo Gimbert; François Dufour; Marc Zeitoun; Laurent Doyen; Mahesh Viswanathan; Véronique Bruyère; Université de Bordeaux (2014-....).; École doctorale de mathématiques et informatique (Talence, Gironde).; Laboratoire bordelais de recherche en informatique.
OCLC Number: 967651653
Notes: Titre provenant de l'écran-titre.
Description: 1 online resource
Responsibility: Edon Kelmendi ; sous la direction de Hugo Gimbert et de François Dufour.

Abstract:

On considère des jeux stochastiques joués sur un graphe fini. La première partie s'intéresse aux jeux stochastiques à deux joueurs et information parfaite. Dans de tels jeux, les joueurs choisissent des actions dans ensemble fini, tour à tour, pour une durée infinie, produisant une histoire infinie. Le but du jeu est donné par une fonction d'utilité qui associe un réel à chaque histoire, la fonction est bornée et Borel-mesurable. Le premier joueur veut maximiser l'utilité espérée, et le deuxième joueur veut la minimiser. On démontre que si la fonction d'utilité est à la fois shift-invariant et submixing alors le jeu est semi-positionnel. C'est-à-dire le premier joueur a une stratégie optimale qui est déterministe et sans mémoire. Les deux joueurs ont information parfaite: ils choisissent leurs actions en ayant une connaissance parfaite de toute l'histoire. Dans la deuxième partie, on étudie des jeux de durée fini où le joueur protagoniste a zéro information. C'est-à-dire qu'il ne reçoit aucune information sur le déroulement du jeu, par conséquent sa stratégie est un mot fini sur l'ensemble des actions. Un automates probabiliste peut être considéré comme un tel jeu qui a un seul joueur. Tout d'abord, on compare deux classes d'automates probabilistes pour lesquelles le problème de valeur 1 est décidable: les automates leaktight et les automates simples. On prouve que la classe des automates simples est un sous-ensemble strict de la classe des automates leaktight. Puis, on considère des jeux semi-aveugles, qui sont des jeux à deux joueurs où le maximiseur a zéro information, et le minimiseur est parfaitement informé. On définit la classe des jeux semi-aveugles leaktight et on montre que le problème d'accessibilité maxmin est décidable sur cette classe.

We consider stochastic games that are played on finite graphs. The subject of the first part are two-player stochastic games with perfect information. In such games the two players take turns choosing actions from a finite set, for an infinite duration, resulting in an infinite play. The objective of the game is given by a Borel-measurable and bounded payoff function that maps infinite plays to real numbers. The first player wants to maximize the expected payoff, and the second player has the opposite objective, that of minimizing the expected payoff. We prove that if the payoff function is both shift-invariant and submixing then the game is half-positional. This means that the first player has an optimal strategy that is at the same time pure and memoryless. Both players have perfect information, so the actions are chosen based on the whole history. In the second part we study finite-duration games where the protagonist player has zero information. That is, he gets no feedback from the game and consequently his strategy is a finite word over the set of actions. Probabilistic finite automata can be seen as an example of such a game that has only a single player. First we compare two classes of probabilistic automata: leaktight automata and simple automata, for which the value 1 problem is known to be decidable. We prove that simple automata are a strict subset of leaktight automata. Then we consider half-blind games, which are two player games where the maximizer has zero information and the minimizer is perfectly informed. We define the class of leaktight half-blind games and prove that it has a decidable maxmin reachability problem.

Reviews

Retrieving GoodReads reviews...
Retrieving DOGObooks reviews...

Confirm this request

You may have already requested this item. Please select Ok if you would like to proceed with this request anyway.

Close Window

Please sign in to WorldCat 

Don't have an account? You can easily create a free account.