Quando Pokémon Go foi lançado em 2016, milhões de pessoas passaram a caminhar pelas ruas com seus celulares em mãos tentando capturar criaturas virtuais espalhadas pelo mundo real. Para a maioria dos jogadores, a experiência era simples: explorar a cidade, encontrar um Pikachu ou um Charizard e registrar a captura.
Mas por trás dessa experiência aparentemente inocente, algo muito maior estava acontecendo.
Sem perceber, os jogadores também estavam ajudando a criar um dos maiores conjuntos de dados visuais do mundo.
Um banco de dados gigantesco do mundo real
Ao longo dos anos, fotos e varreduras feitas por jogadores de Pokémon Go ajudaram a construir um dataset com mais de 30 bilhões de imagens do mundo real.
Essas imagens foram coletadas através de recursos como:
- PokéStops
- ginásios
- submissões de locais
- escaneamento de ambientes com a câmera do celular
- sistemas de AR (realidade aumentada)
Cada vez que um jogador fotografava ou escaneava um local — seja uma praça, uma estátua, uma fachada ou um monumento — essas informações ajudavam a mapear o mundo com mais detalhes.
O resultado é um enorme mapa tridimensional de ambientes urbanos, criado a partir de contribuições de milhões de pessoas.
O que isso tem a ver com IA?
Esses dados não servem apenas para jogos.
Eles também podem ser utilizados para treinar sistemas de navegação para IAs, especialmente em cenários onde o GPS não é confiável ou simplesmente não está disponível.
Robôs de entrega, por exemplo, precisam entender o ambiente ao seu redor para se locomover com segurança. Em vez de depender exclusivamente de GPS, eles podem utilizar visão computacional para reconhecer elementos do ambiente.
Isso inclui:
- postes
- placas
- calçadas
- prédios
- árvores
- monumentos
- cruzamentos
Com um dataset tão grande de imagens do mundo real, os sistemas de IA conseguem comparar o que o robô está vendo com um banco de dados visual previamente aprendido.
Assim, o IA consegue se localizar mesmo sem sinal de satélite.
Navegação visual em vez de GPS
Esse tipo de tecnologia é conhecido como visual positioning ou localização baseada em visão.
Funciona de forma semelhante ao modo como humanos se orientam:
- você reconhece uma rua porque já viu aquele prédio antes
- identifica um ponto de referência
- entende onde está no mapa mental da cidade
Os robôs fazem algo parecido, mas utilizando modelos de aprendizado de máquina treinados com milhões ou bilhões de imagens.
O dataset gerado pelos jogadores de Pokémon Go ajuda justamente nesse processo.
Crowdsourcing em escala global
O mais interessante dessa história é que ela representa um exemplo poderoso de crowdsourcing.
Milhões de pessoas contribuíram para esse banco de dados sem necessariamente perceber.
Enquanto os jogadores acreditavam que estavam apenas:
- capturando Pokémon
- explorando novos locais
- completando missões do jogo
eles também estavam ajudando a construir um mapa visual extremamente detalhado do planeta.
O caso de Pokémon Go mostra como jogos podem ir muito além do entretenimento.
Aplicações de realidade aumentada e coleta de dados distribuída podem alimentar tecnologias utilizadas em:
- robótica
- logística
- veículos autônomos
- mapeamento urbano
- realidade aumentada avançada
Em outras palavras, enquanto milhões de pessoas estavam correndo atrás de um Pikachu no parque, uma infraestrutura tecnológica global estava sendo construída silenciosamente.
O fenômeno de Pokémon Go vai muito além de um jogo de celular. Ele também demonstrou como interações cotidianas de milhões de usuários podem gerar dados extremamente valiosos para tecnologias emergentes.
E talvez o detalhe mais curioso de toda essa história seja justamente esse:
Muita gente achou que estava apenas capturando Pokémon.
Mas, no processo, também estava ajudando a treinar robôs para navegar pelo mundo real.
