De Pikachu a Robôs - como jogadores de Pokémon Go ajudaram a treinar máquinas no mundo real

Publicado em 16 de Março

Leitura de 4 minutos

Quando Pokémon Go foi lançado em 2016, milhões de pessoas passaram a caminhar pelas ruas com seus celulares em mãos tentando capturar criaturas virtuais espalhadas pelo mundo real. Para a maioria dos jogadores, a experiência era simples: explorar a cidade, encontrar um Pikachu ou um Charizard e registrar a captura.

Mas por trás dessa experiência aparentemente inocente, algo muito maior estava acontecendo.

Sem perceber, os jogadores também estavam ajudando a criar um dos maiores conjuntos de dados visuais do mundo.

Um banco de dados gigantesco do mundo real

Ao longo dos anos, fotos e varreduras feitas por jogadores de Pokémon Go ajudaram a construir um dataset com mais de 30 bilhões de imagens do mundo real.

Essas imagens foram coletadas através de recursos como:

  • PokéStops
  • ginásios
  • submissões de locais
  • escaneamento de ambientes com a câmera do celular
  • sistemas de AR (realidade aumentada)

Cada vez que um jogador fotografava ou escaneava um local — seja uma praça, uma estátua, uma fachada ou um monumento — essas informações ajudavam a mapear o mundo com mais detalhes.

O resultado é um enorme mapa tridimensional de ambientes urbanos, criado a partir de contribuições de milhões de pessoas.

O que isso tem a ver com IA?

Esses dados não servem apenas para jogos.

Eles também podem ser utilizados para treinar sistemas de navegação para IAs, especialmente em cenários onde o GPS não é confiável ou simplesmente não está disponível.

Robôs de entrega, por exemplo, precisam entender o ambiente ao seu redor para se locomover com segurança. Em vez de depender exclusivamente de GPS, eles podem utilizar visão computacional para reconhecer elementos do ambiente.

Isso inclui:

  • postes
  • placas
  • calçadas
  • prédios
  • árvores
  • monumentos
  • cruzamentos

Com um dataset tão grande de imagens do mundo real, os sistemas de IA conseguem comparar o que o robô está vendo com um banco de dados visual previamente aprendido.

Assim, o IA consegue se localizar mesmo sem sinal de satélite.

Navegação visual em vez de GPS

Esse tipo de tecnologia é conhecido como visual positioning ou localização baseada em visão.

Funciona de forma semelhante ao modo como humanos se orientam:

  • você reconhece uma rua porque já viu aquele prédio antes
  • identifica um ponto de referência
  • entende onde está no mapa mental da cidade

Os robôs fazem algo parecido, mas utilizando modelos de aprendizado de máquina treinados com milhões ou bilhões de imagens.

O dataset gerado pelos jogadores de Pokémon Go ajuda justamente nesse processo.

Crowdsourcing em escala global

O mais interessante dessa história é que ela representa um exemplo poderoso de crowdsourcing.

Milhões de pessoas contribuíram para esse banco de dados sem necessariamente perceber.

Enquanto os jogadores acreditavam que estavam apenas:

  • capturando Pokémon
  • explorando novos locais
  • completando missões do jogo

eles também estavam ajudando a construir um mapa visual extremamente detalhado do planeta.

O caso de Pokémon Go mostra como jogos podem ir muito além do entretenimento.

Aplicações de realidade aumentada e coleta de dados distribuída podem alimentar tecnologias utilizadas em:

  • robótica
  • logística
  • veículos autônomos
  • mapeamento urbano
  • realidade aumentada avançada

Em outras palavras, enquanto milhões de pessoas estavam correndo atrás de um Pikachu no parque, uma infraestrutura tecnológica global estava sendo construída silenciosamente.

O fenômeno de Pokémon Go vai muito além de um jogo de celular. Ele também demonstrou como interações cotidianas de milhões de usuários podem gerar dados extremamente valiosos para tecnologias emergentes.

E talvez o detalhe mais curioso de toda essa história seja justamente esse:

Muita gente achou que estava apenas capturando Pokémon.

Mas, no processo, também estava ajudando a treinar robôs para navegar pelo mundo real.