brand.IT

Pluribus, o bot mestre em Poker

Foto Alex Knight - Unsplash

Nos últimos anos, existiram grandes avanços na Inteligência Artificial (IA), principalmente em áreas onde a componente humana parecia imbatível. Um desses avanços ocorreu no mundo poker. De maneira análoga com o que aconteceu há algumas décadas com outro desporto mental, o xadrez, a IA chegou para desafiar a mente humana.

Com o intuito de provar que a máquina pode superar o homem, e logo num desporto onde a estratégia, capacidade de raciocínio e atenção são essenciais, foi criada uma entidade com a capacidade de desenvolver e aprender todas as estratégias da modalidade.

Assim, nasceu o Pluribus. Um bot capaz de se bater com jogadores profissionais e com uma IA por detrás, programada e desenvolvida para tentar superar o ser humano. Neste artigo é apresentada a estratégia por detrás do Pluribus. Como surgiu, qual o seu objetivo e qual é que foi o seu comportamento perante jogadores reais.

Preparado para o conhecer?

Foto Brian Kostiuk – Unsplash

Pluribus, o bot mestre em Poker

Pluribus nasceu em 2019 e é resultado da parceria entre o Facebook e a Universidade Carnegie Mellon nos Estados Unidos. Foi criado com objetivo de provar que uma máquina é capaz de se bater de igual para igual com jogadores reais, num ambiente super competitivo como o do poker.

O desafio estava então lançado. A missão do Pluribus seria derrotar os maiores nomes do poker e logo na variante mais popular deste desporto, o Texas Hold’em. Uma variante com regras específicas e infinita de estratégias, táticas e nuances.

Contudo, o desafio não era apenas vencer na variante mais popular do poker, era também conseguir fazê-lo numa mesa de jogadores de top mundial, incluindo dois vencedores do Main Event das World Series of Poker.

A IA por detrás do fenómeno

Para tornar a vitória “real”, foi preciso capacitar o Pluribus, tal como já foi referido, com todas as estratégias e habilidades para o desafio ser bem-sucedido.

Assim, o primeiro passo foi dotar o Pluribus com conhecimento sobre os jogadores que iria enfrentar. Além disso, foi necessário treiná-lo para conseguir aprender a vencer, sem exemplos ou orientações sobre estratégia.

Começou em jogos de dois jogadores e com o tempo e recursos de computação foi aumentado o nível de dificuldade.

A ideia desta preparação era simples: conseguir com que o Pluribus, e à medida que ia participando em desafios de Texas Hold’em, conseguisse em cada jogo tomar diferentes caminhos e abordar a mesa a longo prazo.

Quando conseguiu mostrar que estava preparado, surgiram então os adversários!

O All-In do Plubribus

Nomes como Chris “Jesus” Ferguson (campeão do Main Event das World Series of Poker de 2000), Greg Merson (campeão do Main Event das World Series of Poker de 2012) e Darren Elias (quatro vezes campeão do World Poker Tour), responderam ao desafio e fizeram parte desta experiência.

Para os jogadores, nada foi mais gratificante do que poder ajudar a modalidade a crescer e a explorar novos campos de atividade. Contudo, também tinham a consciência de que vinham para competir e vencer.

Assim foi. Numa experiência, cada profissional jogava separadamente 5.000 mãos de póquer contra cinco cópias do Pluribus (que jogava contra ele próprio) e numa outra, o Pluribus jogava ao mesmo tempo com cinco jogadores reais.

Quanto às partidas, nada faria prever o desfecho: o Pluribus conseguiu superar as provas e sair vencedor.

Tudo isso graças uma estratégia baseada na probabilidade de atingir a mão ideal, face à mesa e jogada que encontrava em campo. Já para não falar que independentemente da mão, o Pluribus tinha um super motor a calcular todas as mãos possíveis entre os jogadores. Ao ter esta capacidade mostrava também uma certa imprevisibilidade na mesa (como quem diz, “será que estou a fazer bluff?”).

No final, as entidades que desenvolveram o Pluribus mostram-se extremamente satisfeitas com o resultado obtido. Conseguiram superar a mente humana e logo num desporto onde o fator psicológico e as emoções são fatores que podem desequilibrar e fazer com que o jogador saia por cima.

Contas feitas, se cada ficha valesse um dólar, o Pluribus teria ganho uma média de cerca de 5 dólares por mão e teria ganho cerca de 1000 dólares por hora.

Foto Franck V. – Unsplash

 

Quais vão ser os próximos passos?

Tendo em conta que já existem áreas em que este tema está cada vez mais enraizado, caso do setor industrial, esta iniciativa permitiu explorar também as vantagens da inteligência artificial face ao mundo do poker.

O facto de os jogadores sentirem que podem encontrar desafios como este, faz também com que eles mesmos cresçam e se tornem mais recetivos a jogar contra o CPU. Tudo isso porque poder utilizar a IA para seu próprio proveito e melhorarem as suas capacidades.

P.S – Será que o Pluribus também não tem o direito de sonhar em ser campeão mundial?