2024-10-03 15:06:06|已浏览:86次
登录才能看全文,知乎为什么突然要给用户添堵? “知乎直答”发布,AI搜索成大模型必争之地,
登录才能看全文,知乎为什么突然要给用户添堵?
文|三易生活
几年前,“打开App、阅读全文”堪称是大家上网时一个几乎无法逃脱的“毒瘤”,稍有不慎就会被强制跳转到应用商店下载App。以至于在2022年春季,工信部发文督促相关互联网企业整改、不得要求用户不下载App就不给看全文,并不得自动或强制下载应用。然而近日有网友爆料称,知乎网页端又开始出现了非登录用户无法查看全文的情况。
根据我们的实测,非登录用户如果点击“展开阅读全文”,知乎确实会自动弹出登录窗口。不过让人意外的的是,在WAP端以非登录状态查看知乎的网页仍可以完整查看内容。这也就意味着,知乎似乎没有走上当年一众资讯类App的老路,即完整内容只对登录用户开放、非登录用户只能看到片段。但就像目前一众头部电商网站的网页版必须完成验证才能使用完整功能一样, 背后其实都有商业方面的考量。
自进入大数据时代以来,用户数据的价值就陆续被充分挖掘,互联网厂商也发现通过分析用户的行为,进而可以总结出某一类用户群体的偏好,因此也就有了所谓的用户画像。而借助用户画像,互联网厂商可以知道每一位用户是什么的年龄、性别、购物偏好,由此数字广告行业也就有了完成精准投放的可能。
但用户画像的完善和更新都依赖用户登录,如果用户“退化”为访客,这一切就变成了空中楼阁,互联网厂商也就无法知道你的行为了。但广告无疑都是大量互联网厂商最重要的业务,所以为了自家的钱袋子,这些厂商当然就有强烈的动力去“督促”用户登录自己的账号。
为了给非登录用户“添堵”,长期以来知乎其实对于未登录用户都不那么友好,只要打开子页面就会一直使用弹窗要求用户登录。在有了弹窗唤醒用户登录的操作在前,进一步强制要求用户必须登录才能查看完整内容的也就不那么令人感到意外了。
更何况,与之前用户可以通过油猴脚本等方式屏蔽知乎的登录弹窗不同,这一次知乎做得“更绝”。打开F12查看网页的源代码就会发现,在没有登录的情况下,知乎压根就没有传输回答的完整数据。换而言之,就算通过技术手段屏蔽登录弹窗,用户也不能在非登录状态下查看完整的知乎回答。
那么知乎为什么要这样做呢?如果再结合近期知乎修改robots.txt文件,答案也就呼之欲出了。
robots.txt是一种存放于网站根目录下的ASCII编码的文本文件,是控制网站被搜索内容的一种策略,它的唯一作用就是告诉搜索引擎的user-agent(网络爬虫),网站中的哪些内容是不对搜索引擎开放、哪些内容又可以被爬取。
在这一次robots.txt的修改之后,知乎方面已经只允许百度和搜狗这两个搜索引擎抓取内容,此前的谷歌和Bing则被从名单上移除,这也就意味着用户在知乎发布的任何新内容都不会被谷歌和Bing收录。为何只有搜狗和百度例外,当然是两者与和知乎有着紧密的关系。根据知乎回港上市时披露的信息显示,搜狗背后的腾讯是知乎的大股东,百度也在2019年联合快手对知乎进行了4.5亿美元的战略投资。
先是不再向未登录用户传输完整的回答数据,再是修改robots.txt、屏蔽谷歌和Bing,知乎的这一套组合拳指向性其实已经非常明确,为的就是不让谷歌和Bing再继续爬取自己的内容。
事实上,目前内容平台向AI厂商卖数据已经成为常态,并且不同于网络巨魔频出的Reddit,作为问答社区的知乎在内容质量上是更有保障的。当初微软的New Bing搞AI搜索时,就把知乎的回答作为了重要的参考文献。
知乎创始人周源在一年前发布“知海图AI”中文大模型的时候就曾强调,知乎拥有中文互联网大量高质量内容,这正是其研发大语言模型的优势所在。到了2024知乎发现大会,周源更是表示,专业、真实的真人分享,认真、友善的人际交流,和透明、高效的信息机制,让知乎可以成为AI时代的可信赖社区。由此可见,知乎管理层对于平台内容在AI领域的价值是有清晰认知的。
既然如此,无论是强制登录、还是禁止搜索引擎抓取,都是知乎为了避免自家内容被某些AI厂商抓取、成为训练AI大模型的语料,所做出的防御性措施。既然百度和腾讯是知乎的股东、是重要的合作伙伴,向其开放数据就是应有之义,而在业务上没有联系的微软和谷歌,自然是不可能继续免费获取数据了。但如果将知乎的这一操作视为是向谷歌和微软询价,似乎也不是不可以。
只可惜在这一过程中,知乎方面似乎没有把用户体验当回事。
“知乎直答”发布,AI搜索成大模型必争之地
今年以来,AI行业风起云涌。大模型加快更新迭代、价格快速下降,并将触角伸向更广的市场、更细分的领域。AI搜索正成为平台在大模型开发上的必争之地。
知乎创始人、CEO周源近日在“第十届盐 Club新知青年大会”正式发布AI搜索工具“知乎直答”,“知乎直答”基于今年3月发布的“发现·AI搜索”,升级了追问功能、内容溯源等功能。
▲周源
投资反映着AI行业的热点与风口,今年以来,AI行业的投资已经发生转移,AI搜索成为行业热点。
据AI投资者Nathan Benaich和Air Street Capital团队制作的《2023年AI现状》报告,截至2023年10月2日,专注研发生成式AI应用的初创企业当年累计获得了近180亿美元的风投资金,较2022年整年增长超360%。整体来看,2023年大量投资集中于基础大模型。
进入2024年,技术加速演进带来的算力成本降低,大模型厂商竞争加剧,共同催化了大模型降价。
一方面,成本下降推动基础大模型普惠,也为平台厂商改善经营提供助力。
从知乎对大模型的投入看,根据财报,2023年三季度,知乎净亏损为2.78亿元,其中一个很重要的原因就是对大模型的成本支出;至2024年一季度,知乎净亏损1.66亿元,较上年同期已大幅收窄。大模型成本降低为受益于AI赋能提效的盐言故事等业务提供更多机会,从成效看,其一季度付费阅读业务占比继续增长,稳居第一大收入来源。
对于AI于知乎业绩增长的作用,周源曾表示,相信AI搜索功能蕴藏的潜力及可信赖社区不断凸显的价值,将为知乎可持续增长提供全新的动力。
另一方面,平台厂商也在价格战外寻找更多模型应用领域。敏锐的投资随之转向模型应用。
其中,AI搜索正是投资转向的主要模型应用领域之一。以主打AI搜索的Perplexity为例,早在ChatGPT发布前,就已开始做AI搜索应用,今年获得了英伟达投资,近期或再得到软银投资1000万至2000万美元,估值达30亿美元,在所有AI应用公司中位列第一。
国内也已有多家厂商平台探索AI搜索。除“知乎直答”外,包括昆仑万维、百度、360等均推出了AI相关搜索产品。AI搜索似乎已处在爆发前夜。
▲盐 Club新知青年大会现场
“追问”实现多轮对话
作为与搜索、回答密切关联的内容平台,搜索对知乎重要性不止是捕捉行业风口。
周源在新知青年大会上阐释了他对AI搜索的理解,“AI搜索是一种全新生产力工具,它不仅能帮助解决问题,提升效率,又能帮助寻找答案背后的原理。答案分散在无数的大脑中,在AI时代,它的一部分被压缩在AI大模型中,需要AI搜索工具重新连接。”
AI搜索具备哪些优势?中国信息协会常务理事、国研新经济研究院创始院长朱克力认为,AI搜索最为明显的优势在于其深度学习和自然语言处理技术的应用,能够更深入地理解用户的搜索意图,从而提供更加精准、个性化的搜索结果。
“跨领域”整合能力是AI搜索另一重要优势。朱克力表示,在信息爆炸的时代,用户往往需要从多个领域获取信息来解答一个问题。AI搜索通过整合不同领域的知识和信息,能够为用户提供全面、深入的搜索结果,满足用户对多元化信息的需求。
这些优势意味着,在垂直领域搜索、问答系统、智能助手等领域,AI搜索都将发挥重要作用,为用户提供更加智能、高效的搜索体验。
知乎作为提问驱动的社区,在垂直内容领域、问答系统上对AI搜索功能有着显著需求。
为此,知乎一直在积极向AI大模型投入。2023年和2024年3月,知乎已分别发布了“知海图AI”大模型和社区原生AI功能“发现·AI搜索”,完成了从模型开发到开放产品应用的两步重要进展。
在“发现?AI搜索”实际使用的数据统计中,知乎发现,用户平均将近3个轮次,如何更好链接多个问答之间的逻辑关系,实现“多轮对话”是其在AI搜索模型能力升级的重点。升级后的“知乎直答”,在“追问”功能中可以更精准地理解用户新问题与过往问题间的关联,对多次问答能够精准识别意图和指代关系,以给出更准确的答案。
从整个行业看,由于AI搜索诞生不久,成熟度与相关规范问题仍值得关注。
AI搜索的可解释性和内容可信度是用户关注的问题。由于AI搜索的决策过程往往难以解释,用户可能会对搜索结果产生疑虑,影响其对AI搜索的信任度。
针对这些现实问题,“知乎直答”在内容来源和溯源手段两方面均做出升级。
内容方面,依托社区内容以全网内容为补充正是“知乎直答”的一个重要优势。据介绍,“知乎直答”立足知乎创作者的真实问答数据,以知乎优秀答主为内容背书;同时引入多种数据源作为辅助,为搜索提供更充分的可获取的信息渠道。
同时,“知乎直答”增加了追溯内容来源的功能。“知乎直答”产品负责人表示,“知乎直答”不仅会列出回答的引用来源,还会以段落级甚至句子级去进行溯源,由此可以更细致地看到回答中有哪些答主的贡献。严格溯源能够在更好保障回答可靠性的问题上,减轻AI领域的“幻觉”问题。
此外,在实测体验中还可以发现,“知乎直答”能按照用户需求提供“简略”和“深入”两种答案生成结果,并支持“找内容”和“找人”,进一步缩短内容需求和回答之间的距离,放大社区创作者及其内容的流通效果。
也应当注意到,从整个AI搜索行业看,仍在发展初期,需要产品持续更新技术水平、升级模型能力。朱克力指出,目前的AI搜索可能面临设计缺陷、操作失误等风险,如何确保AI搜索稳定性和可靠性,是相关产品需要长期关注的问题。
中央财经大学副教授刘春生则表示,包括AI搜索在内的技术快速发展,如何对其有效监管,防治滥用和误用,是未来AI搜索要面临的问题。同时,对于AI搜索处理用户数据可能产生的隐私和安全风险,厂商还需做好进一步的保护措施。
文:张芷菡 责编:宋亚芬