Update 测绘站采集.py

2025-05-06 08:28:13 +08:00
parent ce37608bf7
commit 47d1c057ff
1 changed files with 25 additions and 30 deletions
@@ -40,7 +40,6 @@ DELAY_RANGE = (3, 6)     # 随机延迟时间范围（秒）
 MAX_RETRIES = 3          # 最大重试次数
 REQUEST_TIMEOUT = 10     # 请求超时时间（秒）
 def get_random_header():
    """生成随机请求头"""
    return {
@@ -49,7 +48,6 @@ def get_random_header():
        'Referer': 'https://fofa.info/'
    }
 def safe_request(url):
    """带重试机制的请求函数"""
    for attempt in range(MAX_RETRIES):
@@ -74,18 +72,17 @@ def safe_request(url):
            return response.text
        except Exception as e:
-            print(f"请求失败（第{attempt + 1}次重试）: {str(e)}")
+            print(f"请求失败（第{attempt+1}次重试）: {str(e)}")
            if attempt == MAX_RETRIES - 1:
                raise
 def validate_video(url, mcast):
    """验证视频流有效性"""
    video_url = f"{url}/rtp/{mcast}"
    print(f"正在验证: {video_url}")
    try:
-        # 发送请求，尝试下载1千字节的数据
+        # 发送请求，尝试下载 1 千字节的数据
        response = requests.get(video_url, headers=get_random_header(), timeout=REQUEST_TIMEOUT, stream=True)
        response.raise_for_status()
@@ -101,7 +98,6 @@ def validate_video(url, mcast):
        print(f"视频验证异常: {str(e)}")
        return False
 def main():
    # 获取需要处理的文件列表
    files = [f.split('.')[0] for f in os.listdir('rtp') if f.endswith('.txt')]
@@ -155,14 +151,11 @@ def main():
                    dst.write(modified + '\n')
            print(f"已生成播放列表: {output_file}")
 if __name__ == '__main__':
    main()
 print('对playlist文件夹里面的所有txt文件进行去重处理')
 def remove_duplicates_keep_order(folder_path):
    for filename in os.listdir(folder_path):
        if filename.endswith('.txt'):
@@ -177,14 +170,11 @@ def remove_duplicates_keep_order(folder_path):
            # 将保持顺序的去重后的内容写回原文件
            with open(file_path, 'w', encoding='utf-8') as file:
                file.writelines(unique_lines)
 # 使用示例
 folder_path = 'playlist'  # 替换为你的文件夹路径
 remove_duplicates_keep_order(folder_path)
 print('文件去重完成！移除存储的旧文件！')
 ######################################################
 #####################################################
 ######################################################################################################################
@@ -195,15 +185,14 @@ print('文件去重完成！移除存储的旧文件！')
 ###############检测playlist文件夹内所有txt文件内的组播
 import os
 import cv2
 import time
 from tqdm import tqdm
 import sys
 # 初始化字典以存储IP检测结果
 detected_ips = {}
 def get_ip_key(url):
    """从URL中提取IP地址或域名，并构造一个唯一的键"""
    start = url.find('://') + 3
@@ -212,7 +201,6 @@ def get_ip_key(url):
        end = len(url)
    return url[start:end].strip()
 # 设置固定的文件夹路径
 folder_path = 'playlist'
@@ -221,7 +209,6 @@ if not os.path.isdir(folder_path):
    print("指定的文件夹不存在。")
    sys.exit()
 # 遍历文件夹中的所有.txt文件
 for filename in os.listdir(folder_path):
    if filename.endswith('.txt'):
@@ -232,7 +219,7 @@ for filename in os.listdir(folder_path):
        # 准备写回文件
        with open(file_path, 'w', encoding='utf-8') as output_file:
-            # 使用tqdm显示进度条
+            # 使用 tqdm 显示进度条
            for line in tqdm(lines, total=len(lines), desc=f"Processing {filename}"):
                parts = line.split(',', 1)
                if len(parts) >= 2:
@@ -248,16 +235,25 @@ for filename in os.listdir(folder_path):
                            output_file.write(line)
                        continue  # 无论之前检测结果如何，都不重新检测
-                    # 读取组播地址
+                    # 初始化帧计数器和成功标志
-                    try:
+                    frame_count = 0
-                        with open(f'rtp/{filename.split("_")[0]}_{filename.split("_")[1]}.txt', 'r', encoding='utf-8') as f:
+                    success = False
-                            mcast = f.readline().split('rtp://')[1].split()[0].strip()
+                    # 尝试打开视频流
-                    except Exception as e:
+                    cap = cv2.VideoCapture(url)
-                        print(f"文件读取失败: {str(e)}")
+                    start_time = time.time()
-                        continue
+                    while (time.time() - start_time) < 8:
                        ret, frame = cap.read()
                        if not ret:
                            break
                        frame_count += 1
                        # 如果在8秒内读取到1帧以上，设置成功标志
                        if frame_count >= 1:
                            success = True
                            break
                    cap.release()
-                    # 验证地址有效性
+                    # 根据检测结果更新字典
-                    if validate_video(url, mcast):
+                    if success:
                        detected_ips[ip_key] = {'status': 'ok'}
                        output_file.write(line)
                    else:
@@ -266,7 +262,6 @@ for filename in os.listdir(folder_path):
 # 打印检测结果
 for ip_key, result in detected_ips.items():
    print(f"IP Key: {ip_key}, Status: {result['status']}")
 ######################################################################################################################
 ######################################################################################################################