Há séculos, cientistas se empenham em catalogar os seres vivos de modo sistemático. Em 1753, por exemplo, o sueco Carl Linnaeus consolidou o método binomial, que nomeia toda espécie com duas palavras em latim e é usado até hoje. Mas, a cada expedição, a tarefa se tornava mais complexa, fosse pela dificuldade de acessar amostras, fosse pela quantidade crescente de dados acumulados.

Uma virada começou a se desenhar há aproximadamente três décadas, com os avanços tecnológicos que transformaram o modo de coletar, organizar e compartilhar informações.
Hoje, qualquer pessoa pode acessar catálogos de espécies e contribuir com eles. Mas a comunidade científica ainda enfrenta dificuldades para analisar o volume de registros. Foi diante desse cenário que o pesquisador Weverton Carlos Ferreira Trindade, do Laboratório de Ecologia Funcional de Comunidades da Universidade Federal do Paraná (UFPR), criou o florabr, ferramenta que funciona como atalho para acessar e organizar dados sobre plantas do Brasil.
Modelo de programação facilita o trabalho dos cientistas
Se a tecnologia ampliou a produção de dados, ela também precisou evoluir para organizá-los. Um dos marcos no mapeamento digital da biodiversidade foi a criação da Global Biodiversity Information Facility (GBIF), em 2001. Por meio dessa rede, informações antes dispersas em coleções físicas e arquivos institucionais passaram a dialogar em escala global. O boom dos smartphones, nos anos 2010, ampliou o movimento: com câmera e internet, qualquer pessoa podia registrar uma planta na calçada e compartilhar esses dados.
Por aqui, o projeto Flora e Funga do Brasil, do Jardim Botânico do Rio de Janeiro, seguiu a mesma lógica colaborativa. O portal, aberto em 2020, reúne a catalogação das espécies de plantas, algas e fungos registradas no país ao longo de séculos, mas, apesar de ser relativamente simples de acessar, ainda impõe desafios aos taxonomistas (pesquisadores dedicados à classificação dos seres vivos).
O principal entrave é a quantidade de informações a serem processadas. Bases com milhares de registros podem conter nomes desatualizados, duplicações ou inconsistências geográficas. Transformar esse material bruto em análise científica demanda tempo e padronização.
Foi para enfrentar esse gargalo que Trindade desenvolveu o florabr. Criado na linguagem R, amplamente utilizada na análise de grandes volumes de dados, ele funciona como um pacote de comandos que automatiza tarefas antes feitas manualmente, como corrigir grafias, atualizar nomenclaturas e organizar mapas de distribuição. A ferramenta permite ainda verificar se o nome de uma espécie está correto, duplicidades ou erros de localização e gerar listas organizadas por estado ou bioma, segundo Trindade.
A ideia surgiu durante seu doutorado em Ecologia e Conservação na UFPR, realizado em parceria com a Universidade do Kansas, onde a criação de pacotes em R para integrar bases científicas é comum.
O biólogo estudou 15 mil plantas catalogadas na Mata Atlântica e sentiu dificuldade de extrair informações do Flora e Funga manualmente. ”Eu ia ter que digitar 15 mil vezes o nome da espécie, o que era inviável”, diz. Assim, criou uma solução voltada especificamente para a plataforma brasileira e a disponibilizou gratuitamente. Os resultados do trabalho foram publicados em 2024 no periódico científico Applications in Plant Sciences.
Segundo Trindade, a comunidade que trabalha com R é bastante colaborativa. Pesquisadores costumam aprimorar ferramentas criadas por outros colegas, sugerir ajustes e compartilhar códigos abertamente. “Esse modelo de desenvolvimento coletivo permite que os pacotes evoluam de forma contínua, o que é bom para todos”, argumenta.
Desafios na taxonomia vão além da tecnologia
Apesar dos avanços tecnológicos, a taxonomia enfrenta questões que a tecnologia ainda não é capaz de suprir, como a baixa quantidade de taxonomistas frente à diversidade de espécies a serem estudadas, de acordo com o pesquisador.
“O GBIF é a maior plataforma mundial de biodiversidade e conta com 3,5 bilhões de ocorrências e mais de 1 bilhão de espécies registradas. Mas ainda estamos longe de conhecer toda a biodiversidade do planeta porque temos muitos dados dos mesmos tipos de organismos coletados nos mesmos lugares”, diz.
Segundo Trindade, há muito mais dados de aves do que de anfíbios, por exemplo, porque há mais gente registrando aves do que anfíbios. Assim, os dados ficam enviesados.
“Em países tropicais como o Brasil, há lugares de difícil acesso, em que plantas serão extintas antes de terem amostras coletadas. Muitas vezes, é preciso que tenhamos pelo menos 8 registros para incluir a espécie em estudos de ecologia e conservação e, em muitos casos, não temos registro algum. São espécies invisíveis para a ciência, e isso não ocorre apenas com as plantas”.
Até mesmo a inteligência artificial, que pode ser uma aliada em todo esse trabalho, tem limitações, diz o pesquisador. “Se a gente não tem coleta e não tem material digitalizado o suficiente, a IA não vai bastar. O caminho é lutar para ter mais gente pesquisando”, finaliza.
Fonte: Ciência UFPR
Descubra mais sobre Florestal Brasil
Assine para receber nossas notícias mais recentes por e-mail.
