翼度科技»论坛 编程开发 python 查看内容

通过python实现Google的精准搜索功能

2

主题

2

帖子

6

积分

新手上路

Rank: 1

积分
6
问题背景:

我想通过Google或者其他网站通过精准搜索确认该产品是否存在,但是即使该产品不存在Google也会返回一些相关的url链接,现在想通过python实现搜索结果的精准匹配以确认该产品是否为正确的名称【可以通过google搜索到,如果搜索不到则认为该产品不存在】,以下为精准结果截图

实现代码:
  1. import requests
  2. from bs4 import BeautifulSoup
  3. def is_product(product):
  4.     query = product.replace(' ', '+')
  5.     query = '"'+query+'"'
  6.     add = '&sca_esv=396701017a0fe9d3&sca_upv=1&sxsrf=ADLYWIKWgdKR0hofOSCSRshq3fR-z5vDMA%3A1715482705794&ei=UTBAZqCXMMvK1e8Pw_C8gAk&ved=0ahUKEwjgg7CKj4eGAxVLZfUHHUM4D5AQ4dUDCBE&uact=5&oq=%22%E6%96%B0%E8%83%BD%E6%BA%90%E6%B1%BD%E8%BD%A6%E7%94%B5%E6%B1%A0%22&gs_lp=Egxnd3Mtd2l6LXNlcnAiFyLmlrDog73mupDmsb3ovabnlLXmsaAiMgYQABgeGA8yBhAAGB4YDzIGEAAYHhgPMggQABiABBiiBDIIEAAYgAQYogQyCBAAGIAEGKIESP8FUABYAHAAeACQAQCYAeIBoAHiAaoBAzItMbgBA8gBAPgBAvgBAZgCAaAC5QGYAwCSBwMyLTGgB8kC&sclient=gws-wiz-serp'
  7.     URL = f"https://www.google.com/search?q={query}&as_q={query}&tbs=li:1"
  8.     print(URL)
  9.     headers = {
  10.         "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"
  11.     }
  12.     resp = requests.get(URL, headers=headers)
  13.     decoded_text = resp.text
  14.     # print(">>>" * 20)
  15.     # print(decoded_text)
  16.     # print(">>>" * 20)
  17.     results = []
  18.     if resp.status_code == 200:
  19.         soup = BeautifulSoup(resp.content, "html.parser")
  20.         # print(soup)
  21.         for g in soup.find_all('div', class_='tF2Cxc'):
  22.             title = g.find('h3').text
  23.             link = g.find('a')['href']
  24.             item = {
  25.                 "title": title,
  26.                 "link": link
  27.             }
  28.             results.append(item)
  29.         print(results)
  30.     else:
  31.         print("Failed to fetch search results")
  32.     return True if len(results)>=1 else False
  33. query = '"新能源汽车电池"'
  34. query = '"高档数控机床用变频智能电动执行器(电动夹爪)"'
  35. query = '"CAE—多学科设计集成与优化"'
  36. res = []
  37. for query in ["新能源汽车电池","高档数控机床用变频智能电动执行器(电动夹爪)","CAE—多学科设计集成与优化"]:
  38.     res.append(is_product(query))
  39. print(res)
复制代码
到此这篇关于通过python实现Google的精准搜索功能的文章就介绍到这了,更多相关python精准搜索内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

来源:https://www.jb51.net/python/321053gbw.htm
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

举报 回复 使用道具