Update 酒店源1.py

This commit is contained in:
frxz751113
2024-09-26 12:23:09 +08:00
committed by GitHub
parent fb89c297b0
commit b2c84e9984
+31 -31
View File
@@ -48,13 +48,13 @@ urls = [
def is_url_accessible(url): def is_url_accessible(url):
try: try:
# 发送 GET 请求设置超时时间为 3 秒 # 发送 GET 请求,设置超时时间为 3 秒
response = requests.get(url, timeout=3) response = requests.get(url, timeout=3)
# 如果响应状态码在 200 到 401 之间(包括 200 和 401则认为 URL 可访问 # 如果响应状态码在 200 到 401 之间(包括 200 和 401,则认为 URL 可访问
if 200 <= response.status_code <= 401: if 200 <= response.status_code <= 401:
return url return url
except requests.exceptions.RequestException: except requests.exceptions.RequestException:
# 如果请求过程中出现异常不做任何处理直接跳过 # 如果请求过程中出现异常,不做任何处理,直接跳过
pass pass
return None return None
@@ -94,8 +94,8 @@ for url in urls:
page_content = response.text page_content = response.text
# 查找所有符合指定格式的网址 # 查找所有符合指定格式的网址
# 匹配纯域名可能带有http://或https://前缀但不包含端口 # 匹配纯域名,可能带有http://或https://前缀,但不包含端口
# 匹配纯数字IP地址后面跟着端口号 # 匹配纯数字IP地址,后面跟着端口号
pattern = r"(https?://[\w-]+(?:\.[\w-]+)*(?::\d+)?|\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}(?::\d+)?)" pattern = r"(https?://[\w-]+(?:\.[\w-]+)*(?::\d+)?|\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}(?::\d+)?)"
# 使用正则表达式在页面内容中查找所有符合格式的 URL # 使用正则表达式在页面内容中查找所有符合格式的 URL
urls_all = re.findall(pattern, page_content) urls_all = re.findall(pattern, page_content)
@@ -135,7 +135,7 @@ for url in urls:
urld = (f"{urls[0]}//{url_data[2]}/{urls[3]}") urld = (f"{urls[0]}//{url_data[2]}/{urls[3]}")
else: else:
urld = (f"{urls}") urld = (f"{urls}")
#print(f"{name},{urld}") #关闭频道名称和频道地址打印缩短运行时间 #print(f"{name},{urld}") #关闭频道名称和频道地址打印,缩短运行时间
if name and urld: if name and urld:
name = name.replace("高清电影", "影迷电影") name = name.replace("高清电影", "影迷电影")
name = name.replace("中央", "CCTV") name = name.replace("中央", "CCTV")
@@ -257,7 +257,7 @@ for result in results:
with open("iptv.txt", 'w', encoding='utf-8') as file: with open("iptv.txt", 'w', encoding='utf-8') as file:
for result in results: for result in results:
file.write(result + "\n") file.write(result + "\n")
print(result) #关闭频道名称和频道地址打印缩短运行时间 print(result) #关闭频道名称和频道地址打印,缩短运行时间
print("频道列表文件iptv.txt获取完成!") print("频道列表文件iptv.txt获取完成!")
@@ -295,13 +295,13 @@ urls = [
] ]
def is_url_accessible(url): def is_url_accessible(url):
try: try:
# 发送 GET 请求设置超时时间为 3 秒 # 发送 GET 请求,设置超时时间为 3 秒
response = requests.get(url, timeout=3) response = requests.get(url, timeout=3)
# 如果响应状态码在 200 到 401 之间(包括 200 和 401则认为 URL 可访问 # 如果响应状态码在 200 到 401 之间(包括 200 和 401,则认为 URL 可访问
if 200 <= response.status_code <= 401: if 200 <= response.status_code <= 401:
return url return url
except requests.exceptions.RequestException: except requests.exceptions.RequestException:
# 如果请求过程中出现异常不做任何处理直接跳过 # 如果请求过程中出现异常,不做任何处理,直接跳过
pass pass
return None return None
@@ -340,8 +340,8 @@ for url in urls:
# 获取响应的文本内容 # 获取响应的文本内容
page_content = response.text page_content = response.text
# 查找所有符合指定格式的网址 # 查找所有符合指定格式的网址
# 匹配纯域名可能带有http://或https://前缀但不包含端口 # 匹配纯域名,可能带有http://或https://前缀,但不包含端口
# 匹配纯数字IP地址后面跟着端口号 # 匹配纯数字IP地址,后面跟着端口号
pattern = r"(https?://[\w-]+(?:\.[\w-]+)*(?::\d+)?|\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}(?::\d+)?)" pattern = r"(https?://[\w-]+(?:\.[\w-]+)*(?::\d+)?|\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}(?::\d+)?)"
# 使用正则表达式在页面内容中查找所有符合格式的 URL # 使用正则表达式在页面内容中查找所有符合格式的 URL
urls_all = re.findall(pattern, page_content) urls_all = re.findall(pattern, page_content)
@@ -359,41 +359,41 @@ for url in urls:
for url in valid_urls: for url in valid_urls:
try: try:
ip_start_index = url.find("//") + 2 ip_start_index = url.find("//") + 2
# 找到URL中"//"的位置并从该位置的下一个字符开始截取直到找到第一个"/"字符 # 找到URL中"//"的位置,并从该位置的下一个字符开始截取,直到找到第一个"/"字符
ip_dot_start = url.find(".") + 1 ip_dot_start = url.find(".") + 1
# 从URL中找到第一个"."的位置并从该位置的下一个字符开始截取直到找到第二个"/"字符 # 从URL中找到第一个"."的位置,并从该位置的下一个字符开始截取,直到找到第二个"/"字符
ip_index_second = url.find("/", ip_dot_start) ip_index_second = url.find("/", ip_dot_start)
base_url = url[:ip_start_index] # 截取URL中的协议部分例如"http://"或"https://" base_url = url[:ip_start_index] # 截取URL中的协议部分,例如"http://"或"https://"
# 截取从"//"之后到第一个"/"之前的部分这通常是IP地址或域名 # 截取从"//"之后到第一个"/"之前的部分,这通常是IP地址或域名
ip_address = url[ip_start_index:ip_index_second] ip_address = url[ip_start_index:ip_index_second]
# 构造一个新的URL由基本URL和IP地址组成 # 构造一个新的URL,由基本URL和IP地址组成
url_x = f"{base_url}{ip_address}" url_x = f"{base_url}{ip_address}"
# 将原始URL赋值给json_url变量 # 将原始URL赋值给json_url变量
json_url = f"{url}" json_url = f"{url}"
# 使用requests库发起一个GET请求到json_url超时时间设置为3秒 # 使用requests库发起一个GET请求到json_url,超时时间设置为3秒
response = requests.get(json_url, timeout=3) response = requests.get(json_url, timeout=3)
# 将响应的内容解析为JSON格式 # 将响应的内容解析为JSON格式
json_data = response.json() json_data = response.json()
try: try:
# 尝试执行以下代码块如果发生错误则跳转至except部分 # 尝试执行以下代码块,如果发生错误则跳转至except部分
# 解析JSON文件获取'data'键对应的列表中的每个元素 # 解析JSON文件,获取'data'键对应的列表中的每个元素
for item in json_data['data']: for item in json_data['data']:
# 检查每个元素是否为字典类型 # 检查每个元素是否为字典类型
if isinstance(item, dict): if isinstance(item, dict):
# 从字典中获取'name'键的值如果键不存在则返回None # 从字典中获取'name'键的值,如果键不存在则返回None
name = item.get('name') name = item.get('name')
# 从字典中获取'url'键的值如果键不存在则返回None # 从字典中获取'url'键的值,如果键不存在则返回None
urlx = item.get('url') urlx = item.get('url')
# 如果urlx包含'udp'或'rtp'字符串则跳过当前循环的剩余部分 # 如果urlx包含'udp'或'rtp'字符串,则跳过当前循环的剩余部分
if 'udp' in urlx or 'rtp' in urlx: # or 'CCTV' in name or '卫视' in name if 'udp' in urlx or 'rtp' in urlx: # or 'CCTV' in name or '卫视' in name
continue # 跳过包含'udp'或'rtp'的url continue # 跳过包含'udp'或'rtp'的url
# 如果urlx以'http'开头则直接使用这个url # 如果urlx以'http'开头,则直接使用这个url
if 'http' in urlx: if 'http' in urlx:
urld = f"{urlx}" urld = f"{urlx}"
# 如果urlx不以'http'开头则在前面添加一个前缀(注意:这里的url_x变量未在代码中定义) # 如果urlx不以'http'开头,则在前面添加一个前缀(注意:这里的url_x变量未在代码中定义)
else: else:
urld = f"{url_x}{urlx}" urld = f"{url_x}{urlx}"
print(f"{name},{urld}") #关闭频道名称和频道地址打印缩短运行时间 print(f"{name},{urld}") #关闭频道名称和频道地址打印,缩短运行时间
if name and urld: if name and urld:
name = name.replace("高清电影", "影迷电影") name = name.replace("高清电影", "影迷电影")
name = name.replace("中央", "CCTV") name = name.replace("中央", "CCTV")
@@ -530,7 +530,7 @@ for result in results:
with open("iptv.txt", 'a', encoding='utf-8') as file: with open("iptv.txt", 'a', encoding='utf-8') as file:
for result in results: for result in results:
file.write(result + "\n") file.write(result + "\n")
print(result) #关闭频道名称和频道地址打印缩短运行时间 print(result) #关闭频道名称和频道地址打印,缩短运行时间
print("频道列表文件iptv.txt追加写入成功!") print("频道列表文件iptv.txt追加写入成功!")
@@ -593,13 +593,13 @@ replacements = {
"[🏠][🏠]": "[🏠]", "[🏠][🏠]": "[🏠]",
"经典[🏠]电影": "经典[🏠]", "经典[🏠]电影": "经典[🏠]",
"": "", "": "",
"": ""
"": "", "": "",
"": ""
"": "", "": "",
"": ""
"": "", "": "",
"": "" "": "",
"": "",
"": "",
"": "",
"": "", "": "",
"": "" "": ""
} }