Em 2025, veremos avanços reais na nossa compreensão da comunicação animal, aproveitando a IA e a aprendizagem automática para responder a uma questão que tem deixado os humanos perplexos desde que os humanos existem: o que os animais dizem uns aos outros “pode ser respondido”. O recente Prémio Coller-Dolittle, que atribui até 500.000 dólares a cientistas que “decifram o código”, é otimista de que os recentes desenvolvimentos tecnológicos na aprendizagem automática e nos modelos de linguagem em larga escala (LLM) estão a resolver este problema. O objetivo está ao nosso alcance.
Muitos grupos de pesquisa trabalham há anos no desenvolvimento de algoritmos para compreender os sons dos animais. Por exemplo, o Projeto Ceti está decifrando as sequências de cliques dos cachalotes e o canto das baleias jubarte. Essas ferramentas modernas de aprendizado de máquina exigem quantidades extremamente grandes de dados e, até agora, faltava essa quantidade de dados bem anotados e de alta qualidade.
Considere um LLM como o ChatGPT que possui dados de treinamento disponíveis na internet, incluindo textos inteiros. Este tipo de informação sobre a comunicação animal nunca esteve acessível antes. Não é apenas que o corpus de dados humanos seja muito maior do que os dados sobre vida selvagem aos quais temos acesso. Mais de 500 GB de palavras foram usados para treinar o GPT-3 para pouco mais de 8.000 “codas”. ”(ou vocalizações) Análise recente da comunicação dos cachalotes pelo Projeto Ceti.
Além disso, ao lidar com a linguagem humana, já sabemos o que estamos dizendo. Sabemos até o que constitui uma “palavra”. Esta é uma enorme vantagem em comparação com a interpretação da comunicação animal. Os cientistas têm pouca ideia se, por exemplo, o uivo de um lobo em particular significa algo diferente do uivo de outro lobo, ou mesmo se os lobos pensam nos seus uivos como sim. É semelhante a “palavras” na linguagem humana.
No entanto, 2025 trará novos avanços tanto na quantidade de dados de comunicação animal disponíveis para os cientistas como nos tipos e capacidades dos algoritmos de IA que podem ser aplicados a esses dados. A popularidade da gravação automática de sons de animais explodiu com dispositivos de gravação de baixo custo, como o AudioMoth, tornando-a prontamente disponível para todos os grupos de pesquisa científica.
Grandes conjuntos de dados estão agora online, permitindo-nos deixar gravadores no campo e ouvir os sons dos gibões da selva e das aves da floresta 24 horas por dia, 7 dias por semana, durante longos períodos de tempo. O gerenciamento manual de conjuntos de dados tão grandes às vezes era impossível. Agora, um novo algoritmo de detecção automática baseado em redes neurais convolucionais pode executar rapidamente milhares de horas de gravações, extrair sons de animais e agrupá-los em diferentes tipos, dependendo das características acústicas naturais dos animais.
A disponibilidade desses grandes conjuntos de dados de animais permitirá novos algoritmos de análise, como o uso de redes neurais profundas para encontrar estruturas ocultas em sequências de vocalização de animais que sejam semelhantes às estruturas significativas da linguagem humana.
Mas a questão fundamental que permanece obscura é o que exatamente queremos fazer com esses sons de animais. Algumas organizações, como a Interspecies.io, definem o seu objetivo de forma muito clara: “transformar sinais de uma espécie em sinais coerentes de outra espécie”. Em outras palavras, traduzir a comunicação animal para a linguagem humana. No entanto, a maioria dos cientistas concorda que os animais não humanos não têm a sua própria linguagem, pelo menos não da mesma forma que nós, humanos, temos a linguagem.
O Prêmio Coller-Dolittle é um pouco mais sofisticado, buscando maneiras de “comunicar-se ou decifrar a comunicação dos seres vivos”. A decodificação é um objetivo um pouco menos ambicioso do que a tradução, considerando que os animais podem não ter realmente uma linguagem traduzível. Hoje, não sabemos quanta ou quanta informação os animais comunicam entre si. Em 2025, os humanos terão o potencial de ultrapassar a nossa compreensão não só de quanto os animais falam, mas também do que exatamente eles dizem uns aos outros.