Después de cerrar acuerdoscon google y OpenAI, el director ejecutivo de Reddit, Steve Huffman, está pidiendo a Microsoft y a otros que paguen si quieren seguir extrayendo datos del sitio.

âSin estos acuerdos, no tenemos voz ni conocimiento sobre cómo se muestran nuestros datos y para qué se utilizan, lo que nos ha colocado ahora en una posición de bloquear a personas que no han estado dispuestas a hacerlo.llegar a un acuerdo sobre cómo nos gustaría que se usaran o no nuestros datos”, dijo Huffman en una entrevista esta semana.Mencionó específicamente a Microsoft, Anthropic y Perplexity por negarse a negociar, diciendo que ha sido "un verdadero dolor de cabeza bloquear a estas empresas".

Reddit ha intensificado su lucha contra los rastreadores en los últimos meses.A principios de julio,su archivo robots.txt fue actualizadopara bloquear rastreadores web con los que no tiene acuerdos.Entoncesla gente empezó a notarque los resultados de Reddit solo eran visibles en los resultados de Google (donde a Reddit se le paga por mostrar sus datos) y no en otros motores de búsqueda como Bing.

Huffman dijo que Microsoft ha estado utilizando los datos de Reddit para entrenar su IA y resumir su contenido en los resultados de Bing "sin avisarnos" y que los datos de Reddit también se han vendido a través de la API de Bing a otros motores de búsqueda..En la entrevista, hizo referencia al reciente comentario del CEO de Microsoft AI, Mustafa Suleyman, en una conferencia de que los datos públicosen Internet es "freeware".

"Hemos hecho que Microsoft, Anthropic y Perplexity actúen como si todo el contenido de Internet fuera de uso gratuito", dijo Huffman."Esa es su verdadera posición".

En respuesta a la reciente desaparición de los resultados de Reddit de Bing, el jefe de búsqueda de Microsoft, Jordi Ribas,dijo en Xque "Reddit ha impedido que Bing rastree su sitio para realizar búsquedas, favoreciendo a otro motor de búsqueda e impactando la competencia de Bing y los motores impulsados ​​por Bing". Caitlin Roulston, portavoz de Microsoftdicho por separadoEl bordela semana pasadaque "respetamos las instrucciones proporcionadas por los sitios web que no desean que el contenido de sus páginas se utilice con nuestros modelos de IA generativa".

âEl intercambio de valor tradicional de los motores de búsqueda ha cambiadoâ

Huffman señaló el OpenAIanuncio reciente de SearchGPT, que podrá mostrar los resultados de Reddit gracias a un acuerdo que ambas empresas alcanzaron a principios de este año, como modelo que quiere replicar.Ninguno de los acuerdos de licencia de contenido que Reddit ha firmado hasta la fecha incluye casos de uso exclusivo para sus datos, según el portavoz Tim Rathschmidt.

Al solicitar acuerdos de licencia, Reddit estáunirse a editores de medios más tradicionales(incluidoThe Verge'sempresa matriz, Vox Media) para solicitar un pago por permitir que su contenido alimente la IA generativa."Creo que el intercambio de valor tradicional de los motores de búsqueda ha cambiado", afirmó Huffman."La búsqueda, el resumen y la capacitación se están fusionando, y el intercambio de valor del rastreo a cambio de tráfico de regreso se está volviendo confuso".

Después de que se publicó esta historia, la portavoz de Anthropic, Jennifer Martinez, envió la siguiente declaración: “Reddit ha estado en nuestra lista de bloqueo para rastreo web desde mediados de mayo y no hemos agregado ninguna URL de Reddit a nuestro rastreador desde entonces.Respetamos el archivo robots.txt, la señal aceptada por la industria para bloquear el rastreo web”. 

Microsoft se negó a hacer comentarios para esta historia.Perplexity no respondió a una solicitud de comentarios.

Línea de comando

/Un boletín de Alex Heath sobre la conversación interna de la industria tecnológica.

Actualización, 31 de julio:Se agregó una declaración de Anthropic y se señaló que Microsoft se negó a hacer comentarios y Perplexity no respondió.