O The New York Times é um dos jornais que melhor funciona em seu paywall, em parte pelo tempo que vem aprendendo sobre seu desempenho e aprimorando-o, desde que o diário lançou o sistema há mais de dez anos, especificamente em março 2011. A tecnologia, neste caso, diferente de outras mídias, está fazendo a diferença para que o desempenho seja tão positivo relata o Laboratorio de Periodismo.
Rohit Supekar, cientista de dados da equipe The New York Times Algorithmic Targets, que trabalha no desenvolvimento e implantação de modelos causais de aprendizado de máquina para alimentar o paywall do jornal, destacou alguns insights interessantes sobre como o jornal usa o aprendizado de máquina para tornar seu paywall mais inteligente.
Desde o início, o muro “medido” foi projetado para que os não assinantes pudessem ler um determinado número de artigos a cada mês antes de encontrar o paywall.
Esta estratégia, no caso específico do The New York Times (e de forma alguma transferível para muitos outros meios) tem-se revelado bem-sucedida na geração de subscrições e, ao mesmo tempo, em permitir o acesso exploratório inicial a novos leitores.
Quando o paywall foi lançado, o limite de notícias que um leitor não assinante podia ler era o mesmo para todos os usuários. No entanto, eles agora estão usando com sucesso um modelo de aprendizado de máquina causal chamado Dynamic Meter para corrigir esse número de artigos legíveis personalizados e tornar o paywall mais inteligente.
A estratégia de paywall do jornal gira em torno do conceito de funil de assinatura.
No topo do funil estão os usuários não registrados que ainda não possuem uma conta no The Times. Quando atingem o limite de leitura de artigos como não registrados, é mostrado a eles um mural de registro que bloqueia o acesso e solicita que criem uma conta ou façam login se já tiverem uma conta.
Isso lhes dá acesso a mais conteúdo gratuito e, como sua atividade agora está vinculada ao seu ID de registro, permite que eles entendam melhor sua necessidade atual de conteúdo do Times.
“Essas informações do usuário são valiosas para qualquer aplicativo de aprendizado de máquina e também alimentam o medidor dinâmico”, explica Supekar.
O modelo Dynamic Meter desempenha um papel duplo. É tanto “apoiar nossa missão de ajudar as pessoas a entender o mundo”, diz Supekar, quanto o objetivo comercial de adquirir assinaturas, por outro. Ou seja, que os leitores registrados leiam o máximo possível, mas, ao mesmo tempo, levem a assinaturas pagas no maior número possível. A busca por esse ponto ideal de equilíbrio.
O sistema do NYT otimiza duas métricas simultaneamente: o engajamento que os usuários cadastrados têm com o conteúdo do Times e o número de assinaturas geradas pelo paywall em um determinado período de tempo.
Essas duas métricas têm uma relação direta inerente A vs B:
A) À medida que aumenta o limite de artigos gratuitos para usuários cadastrados, aumenta a participação medida pelo número médio de visitas à página. Nesse caso, esse aumento no número de artigos abertos é acompanhado por uma redução na taxa de conversão de assinaturas, em grande parte porque há menos usuários registrados que encontram o paywall.
B) Por outro lado, mais viagens ao paywall devido a limites de medição mais rígidos afetam a habituação do leitor e potencialmente os tornam menos interessados no conteúdo. Isso, por sua vez, afeta o potencial de convertê-los em assinantes de longo prazo.
Em essência, o medidor dinâmico deve otimizar a conversão e o engajamento enquanto equilibra uma compensação entre eles.
O objetivo do modelo é, portanto, estabelecer limites quanto ao número de artigos que os assinantes não pagantes, mas registrados, podem ler abertamente, a partir de um conjunto limitado de opções disponíveis.
Dessa forma, o modelo realiza uma ação que afetará o comportamento de um usuário e influenciará o resultado, como sua propensão a se inscrever e seu engajamento com o conteúdo do Times.
É aí que entra em operação o modelo de aprendizado de máquina preditivo, que usa dados de outros usuários para determinar o que teria acontecido e agir de acordo.
O aprendizado de máquina determina para cada caso o equilíbrio entre conversão e engajamento, conforme visto por meio de um teste de controle aleatório.
Como o modelo funciona tecnicamente?
A equipe de dados do NYT treina dois modelos de aprendizado de máquina que chama de “alunos de linha de base”. Os recursos são determinados exclusivamente a partir de dados proprietários sobre sua interação com o conteúdo do Times.
Usando os dados, eles se encaixam nesses dois modelos de aprendizado de máquina, que preveem a propensão e o engajamento da assinatura, respectivamente. Para maximizar esses dois objetivos simultaneamente, eles os convertem em um único objetivo, que detalha o número de artigos que em cada caso um leitor pode ler para maximizar seu engajamento com o conteúdo do jornal .