Em entrevista à Global Editors Network, Richard Gingras, vice-presidente de notícias do Google, explica a importante mudança no algoritmo, que tem por objetivo qualificar os resultados de pesquisa dos usuários.
Recentemente, o Google fez uma mudança importante em seu algoritmo, de modo a destacar as “reportagens originais” e mantê-las mais tempo no topo dos resultados de pesquisa. Com base nesta entrevista de Richard Gingras, vice-presidente de notícias do Google, à Ana Lomtadze, da Global Editors Network, vamos explicar como o algoritmo funcionará e qual será o papel de humanos no processo. E ainda: os critérios do Google para “fontes respeitáveis” favorecem os grandes meios de comunicação e, assim, exacerbam as desigualdades entre os veículos?
- Leia aqui o blogpost de Richard Gingras sobre a mudança.
Vamos dividir a entrevista em cinco grandes temas, dando destaque às respostas de Gingras:
1. A questão conceitual: o que é uma reportagem original?
Gingras – Nossos esforços são no sentido da compreensão de uma notícia e sua evolução ao longo do tempo para, em seguida, usar isso para atender adequadamente nossos usuários em grande escala, quase em tempo real – local, nacional e global.
O primeiro passo é entender a natureza desse conteúdo jornalístico original – é uma cobertura baseada em fatos? Análise? Comentário? Quais são os “sinais” que indicam uma reportagem original? Há algumas ou muitas citações? As aspas são únicas ou se repetem em outros veículos? Existem informações adicionais factuais e / ou análises relevantes?
Alguns desses sinais podem gerar valores opostos. Uma coisa que aprendi com meu trabalho no Google é que todo sinal que parece ouro pode facilmente ser ouro de tolo. É uma coisa muito complicada. Há algum tempo, perguntei a um dos grandes publishers de jornalismo como poderíamos identificar reportagens originais. Ele respondeu com um sorriso: ‘É nisso que gastamos uma tonelada de dinheiro!’ É claro que isso não é um sinal detectável nem uma garantia de qualidade. De fato, é difícil descrever o que é uma reportagem original. Significa coisas diferentes para diferentes publishers e redações em momentos distintos. As pessoas dizem que você sabe o que é quando você vê, mas como você traduz isso para um algoritmo?
Abordo esses detalhes em um esforço de entendimento mútuo entre a comunidade jornalística e aqueles que administram e desenvolvem sistemas algorítmicos. A lente de um editor é sobre a ampliação do excelente trabalho de sua equipe. Nosso objetivo é fornecer o melhor e mais útil conjunto de resultados para nossos usuários. Esses objetivos podem ser próximos, mas não se sobrepõem totalmente.
2. O ranqueamento
Gingras – Nos casos em que o conteúdo original é identificado, precisamos determinar a melhor forma de classificá-lo e apresentá-lo. O contexto é importante, dependendo de como as pessoas acessam as informações. É muito diferente nos ambientes de feeds sem consulta (Google Notícias, Discover etc.) se comparamos com as buscas por pesquisa (Principais notícias). Quanto tempo a notícia fica em uma posição de destaque varia com o tempo e a progressão da história. O assunto principal persiste ou enfraqueceu com a cobertura de outros veículos? A história está sendo buscada pelo endosso das pessoas ou porque está sendo questionada?
Por exemplo, na pesquisa (‘Principais Notícias’), a maneira como garantimos a visibilidade e a capacidade de descoberta de reportagens originais é explicitamente contrariando o fator “mais recente” desses resultados (proporcionando mais prazo de validade) e aumentando a visibilidade de seu posicionamento na página (além do que essas reportagens normalmente receberiam com base na classificação padrão). Como sempre, vamos experimentar e avaliar várias abordagens.
3. Visibilidade para veículos tradicionais x veículos menores
Gingras – As recentes atualizações das diretrizes adicionam as reportagens originais como outra característica do jornalismo de qualidade, independentemente de qualquer prêmio que o veículo tenha ganhado. Além disso, os avaliadores não classificam as histórias em tempo real nem ordenam as classificações. Acreditamos na ampliação do acesso que a Internet permitiu. Queremos ser justos e equitativos com pequenos publishers e com os maiores, tanto locais quanto nacionais.
Para enfatizar o que disse: nossos sistemas evoluirão e melhorarão com o tempo. O trabalho que os repórteres e editores realizam é de grande importância e estamos empenhados em ajudar nossos usuários a ter acesso ao jornalismo de qualidade de uma maneira que seja útil para eles – oferecendo uma compreensão mais profunda de uma história ou um problema para ajudá-los a entender suas comunidades e as conversas ao seu redor. Minha definição preferida de jornalismo é fornecer aos cidadãos as ferramentas e informações necessárias para serem bons cidadãos. Nosso objetivo é conectar os usuários às ferramentas e informações necessárias para serem bons cidadãos.
4. Os avaliadores humanos
Gingras – Vamos ser muito claros sobre o que os avaliadores de qualidade da pesquisa (search quality raters) fazem e não fazem [o Google emprega cerca de 10.000 pessoas que fornecerão feedback sobre o novo algoritmo]. Os avaliadores não afetam diretamente a classificação. Os avaliadores são usados para fornecer uma avaliação humana geral sobre se nossos sistemas de classificação estão entregando ótimos resultados. E o feedback dos avaliadores também é usado em nossos sistemas de aprendizado de máquina.
Em uma tarefa de classificação, eles avaliam quão bem os resultados cumprem o que alguém estava procurando e avaliam a qualidade dos resultados com base na experiência, autoridade e confiabilidade do conteúdo. As classificações não são usadas diretamente em nossos sistemas de pesquisa para fornecer a páginas ou sites específicos qualquer tipo de “classificação” ou “pontuação”. Em vez disso, as classificações nos ajudam a entender até que ponto nossos sistemas satisfazem as pesquisas em geral.
Nossas diretrizes para avaliadores fornecem um padrão comum que todos devem aplicar. As diretrizes são a nossa definição dos objetivos da pesquisa; elas são a especificação do produto. Somos transparentes de três maneiras: transmitimos as políticas e os princípios que norteiam nosso trabalho algorítmico (por meio das diretrizes); explicamos nossas metodologias o mais completamente possível dentro dos limites de segurança e riscos de manipulação; nossos resultados estão todos lá para as pessoas avaliarem. Também trabalhamos com pesquisadores acadêmicos para apoiar suas análises. Nós nos esforçamos para manter sistemas que sejam justos e equitativos, apresentando a nossos usuários as informações de qualidade de que eles precisam.
5. A questão dos paywalls
Gingras – Alguns anos atrás, colaboramos com vários publishers para estudar a interação entre usuários e os paywalls. Como resultado, encerramos nosso sistema “primeiro clique livre” (first click free) em favor da “amostra flexível” (flexible sampling), na qual os editores podem decidir quantos artigos desejam apresentar para que os usuários pesquisem por mês. Portanto, nos últimos anos, independentemente de quanto os veículos gratuitos fornecem aos usuários da pesquisa, todo o conteúdo pago de veículos é também indexado na pesquisa.
Também devemos observar que não há distinções de classificação feitas entre conteúdo pago e não pago. Embora seja verdade que, quando os publishers não oferecem conteúdo gratuito, os usuários aprendem a evitar esses resultados ao longo do tempo, concluímos em nossa pesquisa que seria melhor deixar todas as decisões sobre amostras gratuitas para os próprios publishers, em vez de tentar criar uma solução única para a indústria. E eles gostaram do impacto positivo dessa mudança.