不过由此也不难看出,对相关网站的信息爬取的完整性和有效性,也将直接决定Chat模型接收到的文本质量好坏。因此在将搜索引擎接入Chat模型这个项目中,爬虫技术其实也会起到非常关键的作用。不过在课程的后半部分我们会介绍,如果是主要是围绕一些特定领域的技术问题进行问答(或者当前项目只用于获取某特定类型的信息),我们或许只需要限定在某个网站内进行搜索即可(谷歌搜索支持在某网站内进行搜索,例如知乎、sklearn官网等),而特定网站内的html格式趋于一致,对应的爬虫编写难度较低,更容易获取到高质量内容信息,从而获得高质量答案。因此Chat模型+谷歌搜索API的AI应用开发策略更加适合进行特定领域的问答机器人,例如课程中就将重点介绍将搜索范围限定在知乎内,然后获得高质量大模型技术知识搜索结果和问答的策略。而就特定领域的搜索和问答机器人来说,还有一个非常重要的应用方向,那就是围绕公司章程、制度、流程等内部信息的内网进行搜索和问答。不难发现,相比之下,Browsing with Bing能够顺利获取各类型不同网站的各类信息,会更适合进行通用问题的回答。不过也正是因为Browsing with Bing能够获取全网各类信息,也导致了其快速的下架。