From 01bd9aca91e340b4e902e60dff1e6858ff10cc81 Mon Sep 17 00:00:00 2001 From: frxz751113 <156018267+frxz751113@users.noreply.github.com> Date: Tue, 27 Aug 2024 10:32:38 +0800 Subject: [PATCH] =?UTF-8?q?Update=20=E7=BD=91=E7=BB=9C=E6=94=B6=E9=9B=86.p?= =?UTF-8?q?y?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- py/网络收集.py | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git a/py/网络收集.py b/py/网络收集.py index 31f0d72..2f7cc1c 100644 --- a/py/网络收集.py +++ b/py/网络收集.py @@ -296,7 +296,8 @@ excluded_keywords = [ # 定义一个包含所有要提取的关键词的列表 extract_keywords = [ - 'CCTV', '卫视', '动作电影', '风云剧场', '怀旧剧场', '影迷', '高清电影', '动作电影', '影院', '全球大片', '第一剧场', 'TVB', '家庭影院', '神乐电影', '星光', '华语', '美国大片', '峨眉', '凤凰', '星空', '人间', '亚洲', '环球' + 'CCTV', '卫视', '动作电影', '风云剧场', '怀旧剧场', '影迷电影', '高清电影', '动作电影', '全球大片', '第一剧场', 'TVB', '家庭影院', '神乐电影', '星光影院', '华语电影', \ + '美国大片', '峨眉电影', '凤凰中文', '凤凰卫视', '凤凰资讯' # 在这里添加需要提取的关键词 ] @@ -521,7 +522,6 @@ with open("网络收集.txt", "w", encoding="utf-8") as file: import re - def parse_file(input_file_path, output_file_name): # 正则表达式匹配从'//'开始到第一个'/'或第一个'::'结束的部分 ip_or_domain_pattern = re.compile(r'//([^/:]*:[^/:]*::[^/:]*|[^/]*)')