Amazon enquête sur Perplexity AI : des accusations choquantes de piratage de sites web sans autorisation
Wired a déjà découvert un crawler Perplexity qui contourne le protocole d'exclusion des robots. Cela soulève une question intrigante : comment pourrait-on prévenir un tel contournement à l'avenir ?
Tl;dr
- Amazon enquête sur les allégations d’abus de Perplexity AI.
- Perplexity AI est soupçonné de ne pas respecter le protocole d’exclusion des robots.
- L’entreprise nie ces accusations et maintient respecter le protocole.
- Le PDG de Perplexity AI déclare que l’entreprise utilise des robots tiers en plus des siens.
Amazon met les pieds dans le plat
Selon le magazine Wired, Amazon Web Services (AWS) a ouvert une enquête pour déterminer si Perplexity AI enfreint ses règles. En fait, la division Cloud d’Amazon se penche sur des allégations selon lesquelles Perplexity AI utiliserait un robot qui ne respecterait pas le protocole d’exclusion de robots, un standard du web qui permet aux développeurs de donner des instructions aux robots sur l’accès à certaines pages.
Scandale ou malentendu ?
Wired a rapporté avoir découvert une machine virtuelle hébergée sur un serveur AWS, utilisant l’adresse IP 44.221.181.252, qui contournerait les instructions de son fichier robots.txt. Cette machine, “opérée certainement par Perplexity”, aurait visité d’autres propriétés de Condé Nast des centaines de fois ces trois derniers mois pour en extraire le contenu. Les publications du Guardian, du New York Times et de Forbes auraient également détecté la présence de ce robot.
Perplexity se défend
La porte-parole de Perplexity, Sara Platnick, a déclaré à Wired que l’entreprise avait déjà répondu aux demandes d’Amazon et nié que ses robots contournent le protocole d’exclusion des robots. “Notre PerplexityBot – qui fonctionne sur AWS – respecte les instructions du fichier robots.txt, et nous avons confirmé que les services contrôlés par Perplexity ne violent pas les conditions de service d’AWS”, a-t-elle affirmé. Le PDG de Perplexity, Aravind Srinivas, a également nié que son entreprise ignorait le protocole d’exclusion des robots, mais a admis que Perplexity utilisait des robots tiers en plus des siens.
L’avis de la rédaction
Cet incident soulève une question importante : jusqu’où peut-on aller dans l’exploitation des données sur le web ? La ligne est fine et la technologie avance à un rythme effréné. Il est essentiel que les entreprises respectent les protocoles établis pour garantir un internet équitable et transparent. Cette affaire nous rappelle que le respect des règles est une responsabilité partagée.
- Les offres pré-Prime Day sur Amazon font chuter le prix des écouteurs Bose QuietComfort II à un niveau record
- Les meilleures affaires Prime Day à saisir dès aujourd’hui sur Amazon avant l’événement de soldes de Juillet
- Profitez de près de 200$ de réduction sur le pack essentiel Kindle Scribe chez Amazon !