"Existem muitos dados disponíveis, o que falta é gente para analisar", afirmou o Prof. Dr. Hugo Bastos de Paula, durante a aula Inaugural do Curso de Jornalismo, realizada nesta terça-feira, 14 de março, no Campus Coração Eucarístico. O tema Desafios do jornalismo na era dos dados foi ministrado pelo cientista da computação, que é coordenador do Curso de Graduação em Ciência de Dados, ofertado na Unidade Praça da Liberdade. A mesma Aula Inaugural acontecerá hoje, às 20h40, na Unidade São Gabriel.
Segundo ele, em 60 segundos são gerados mais de 278 milhões de dados na web, entre mensagens trocadas em aplicativos, transações financeiras, acessos a redes sociais e a plataformas de streamings, pesquisas, acesso a sites e às diversas informações que circulam o tempo todo na rede. Entretanto, muitos desses dados se perdem no meio do mar de informações. "Um estudo de 2020 afirmou que apenas 2% desses dados produzidos no mundo são analisados", pontuou.
Essa infinidade de dados é denominada Big Data, área do conhecimento que estuda como extrair, tratar, analisar e obter informações a partir desses dados. Informações essas que podem ser utilizadas para o bem-estar social de diversas formas, como notícias sobre o tempo, sobre o trânsito, sobre economia, entre muitas outras. "Se teve um temporal que gerou inundação e você quer fazer uma reportagem, você consegue saber todo o histórico com dados climáticos, fazer comparações por meio de gráficos, etc.", exemplificou.
Para trabalhar essas informações, existem princípios que norteiam a área, originalmente conhecidas como três V's: Volume, que é a escala dos dados; Velocidade, que é a mudança ao longo do tempo; e Variedade, que são os tipos de dados. Com a sua evolução, foram acrescentados, por uma questão ética, mais dois V's: Veracidade, que é a qualidade dos dados; e Valor, que é a importância dessa informação em uma tomada de decisão. "É o discurso que estão querendo construir", sintetizou. "A primeira coisa que uma pessoa deve fazer é saber visualizar e interpretar esses dados", afirmou Hugo de Paula.
Mas, de onde esses dados vêm? De acordo com o professor, as principais fontes de dados para trabalhar, não só no jornalismo de dados, mas na ciência de dados como um todo, são os chamados open data, ou dados abertos, que são informações públicas que podem ser obtidas em sites governamentais e de Organizações Não-Governamentais (ONG's). No Brasil, um bom exemplo é o Portal da Transparência. Há também os dados obtidos por meio da Lei de Acesso à Informação. "São os mais interessantes porque são os dados que a população tem direito, mas que não estão disponíveis amplamente sem solicitação", explica. Há ainda o Web Scraping, uma técnica de extração automática de dados de sites e páginas da Web publicamente acessíveis. Essas informações, por sua vez, podem ser baixadas ou armazenadas e usadas para qualquer finalidade; e o Crowdsourcing, que é uma coleta de dados colaborativa, como o Wikipedia, por exemplo, entre outros.
Além da extração de dados, a Inteligência Artificial (I.A.) colabora com jornalismo de diversas formas. De acordo com Hugo de Paula, a I.A. reconhece padrões, considera o mais provável, reconhece variações e explora o ambiente. Essas características resultam em iniciativas como as da Associação Brasileira de Jornalismo Investigativo (Abraji), que oferece no seu site algumas ferramentas gratuitas de inteligência artificial que podem ajudar o jornalista a trabalhar informações, como ferramentas de checagem e de cruzamento de dados.
Apesar de poderosa, a I.A. tem suas limitações. "Computador não tem senso crítico, ele é capaz de prever, identificar padrões, mas não de pensar como um ser humano. Muitas vezes, ela nem está preocupada em raciocinar como um humano, só em imitar o humano. Ele sabe que o alô vira hello, mas não sabe que isso é um cumprimento", exemplificou Hugo. "Basicamente, tudo que ela vai trabalhar é reconhecimento de padrão e probabilidade. Só que a I.A. é imprecisa. Se a I.A. fosse precisa demais, ela não ia aprender nada, ia decorar tudo", completou.
A grande novidade do momento é o Chat GPT (Generative Pre-trained Transformer), inteligência artificial desenvolvida para ajudar as pessoas a obter informações por meio de perguntas e respostas. É como ter um assistente virtual que pode responder a quase todas as perguntas. Quase... De acordo com Hugo, o chat pode, sim, gerar notícias, até mesmo porque toda notícia segue um padrão de estrutura, e o reconhecimento de padrões é, justamente, o mecanismo de funcionamento das I.As. Mas, a ferramenta não substitui o fator humano, justamente, por não ter senso crítico, disse, ao explicar o ciclo de usabilidade de uma nova tecnologia, que passa pelo encantamento, decepção até chegar em um "platô de produtividade", que seria o uso ideal. "É a hora que todo mundo aprende a usar de verdade o sistema. Isso acontece com todas as tecnologias e vai acontecer com o Chat GPT também".
Entendendo todas as suas possibilidades e considerando suas limitações, a I.A. pode, sim, ser útil ao jornalismo de dados. De acordo com a Associated Press, uma das agências de notícia mais antigas do mundo, a I.A. serve ao jornalismo em três instâncias: coleta, como a produção e distribuição de notícias. "Para isso, é necessário conhecer e entender as ferramentas disponíveis e trabalhar o pensamento crítico, focando sempre na ética e na transparência, sem deixar de lado a veracidade e a precisão" e, não tem jeito, tem que gostar de tecnologia", concluiu.
Dez maneiras de se utilizar a I.A. no jornalismo:
- Automatizar a produção de notícias;
- Jornalismo investigativo;
- Potencializar o uso do seu repositório de mídia;
- Otimizar engajamento e assinaturas;
- Verificar e checar fatos;
- Compreender o interesse do seu público;
- Moderar comentários;
- Otimizar o uso de imagens;
- Identificar e mitigar vieses e preconceitos;
- Acelerar a cobertura de eventos.
Assessoria de Imprensa
PUC Minas