据《连线》杂志报道,亚马逊网络服务(aws)正在调查人工智能搜索初创公司perplexity ai。该公司被指控违反aws服务条款,抓取了被禁止访问的网站内容,包括知名新闻网站的内容。
perplexity ai是一家获得杰夫·贝佐斯家族基金和nvidia支持的初创公司,估值最近达到了30亿美元。据称,perplexity依赖抓取通过robots排除协议禁止访问的网站内容。这一协议用于指示哪些页面不应被自动机器人和爬虫访问,尽管它不具法律约束力,但大多数公司都会遵守。
aws发言人萨曼莎·马约瓦 (samantha mayowa) 表示,aws的服务条款禁止客户进行任何非法活动,客户有责任遵守这些条款和所有适用法律。客户在爬取网站时必须遵守robots.txt标准。
调查显示,perplexity使用未公开的ip地址访问一台服务器,该服务器在过去三个月内多次访问康泰纳仕旗下的资产,显然是为了抓取被禁止的内容。《卫报》、《福布斯》和《纽约时报》的发言人也报告了类似的情况。
perplexity首席执行官aravind srinivas解释说,抓取行为是由一家第三方网络抓取和索引服务公司进行的,但他拒绝透露该公司的名称。perplexity发言人sara platnick表示,公司已回应亚马逊的询问,并称其perplexitybot尊重robots.txt协议,但在用户输入特定url时可能会忽略该协议。
数字内容行业贸易协会digital content next的首席执行官jason kint认为,如果这些指控属实,perplexity就违反了防止潜在众博棋牌的版权侵权的多项原则。他强调,ai公司不应未经许可获取和使用出版商的内容。
此外,perplexity在最近几周因涉嫌抄袭内容而备受关注。比如,《福布斯》指出,perplexity发布的某些内容与其调查报道相似,但未引用来源或获得许可。而美联社发现,perplexity的一款产品编造了真实人物的虚假语录。
srinivas在接受采访时强调,perplexity从未抄袭任何内容,并且其引擎不会对其他人的内容进行训练。然而,《福布斯》的批评促使公司更加突出地展示消息来源。
这一事件引发了对ai公司数据获取方式的广泛讨论。业界期待aws调查结果的公布,以及可能对perplexity采取的进一步行动。