|
||||
Conférenciers invités à la conférence RFIA 2010 Faculty of Science, University of Amsterdam
Department of Computer Science at the University of Massachusetts, Amherst. Head of the The Resource-Bounded Reasoning Lab Decentralized Decision Making: Challenges and New Directions
Coordinating the operation of a group of decision makers in stochastic environments is a long-standing challenge in AI. Decision theory offers a normative framework for optimizing decisions under uncertainty. But due to computational complexity barriers, developing decision-theoretic reasoning algorithms for multi-agent systems is a serious challenge. We describe a range of new formal models and algorithms to tackle this problem. Exact algorithms shed light on the structure and complexity of the problem, but they have limited use because only tiny problems can be solved optimally. We describe a number of effective approximation techniques that use bounded memory, sampling, and randomization. These methods can produce high-quality results in a variety of application domains such as mobile robot coordination and sensor network management. We examine the performance of these algorithms and describe current research efforts to further improve their applicability and scalability.
Le jeu de Go est devenu un challenge classique en intelligence artificielle, par sa grande dimension et sa complexité. En particulier, les humains restent considérablement meilleur que les ordinateurs. Néanmoins, l'écart s'est considérablement réduit ces dernières années grâce à des techniques nouvelles et généralistes, i.e. utilisables de manière générique pour des problèmes de décision séquentielle dans l'incertain. Nous présenterons l'algorithme, appelé "Monte-Carlo Tree Search" (ou "Upper Confidence Trees" pour l'une de ses variantes), ses différences et ses ressemblances avec les algorithmes usuels, et ses forces et faiblesses, très apparentes sur le jeu de Go, ainsi que diverses applications loin des jeux. Nous présenterons enfin un survol des formules dites de "bandit", abondamment utilisé comme brique de base dans le Monte-Carlo Tree Search.
|