🐾 一些实用的小脚本

最近用GPT编写了一些好用的脚本，可以很大程度上提升工作效率，分享给大家：

❤️ 信息提取及编辑

这个代码可以从一大堆信息的文件夹中提取出来指定的文件，并且重新编号放到新文件夹中：

import os
import shutil
import pandas as pd

# 定义根目录和目标目录
root_dir = r'E:\文件\研究生\课题组\目诊标注\目-截止0718'
target_base_dir = r'E:\文件\研究生\课题组\目诊标注\report'

# 定义需要提取的图片名称
target_image_name = 'report.pdf'

# 创建一个列表来存储图片信息
image_info = []

# 遍历根目录下的所有文件和子目录
for subdir, _, files in os.walk(root_dir):
    if target_image_name in files:
        # 获取上一级目录名称
        current_dir = os.path.basename(subdir)

        # 获取目标图片的路径
        image_path = os.path.join(subdir, target_image_name)

        # 如果目标目录不存在，则创建
        target_dir = os.path.join(target_base_dir, target_image_name[:-4])  # 去掉图片扩展名作为文件夹名
        if not os.path.exists(target_dir):
            os.makedirs(target_dir)

            # 构造新文件名（从1开始编号）
        # 这里使用一个全局变量来跟踪编号，因为os.walk是递归的，我们不能简单地用字典来跟踪每个文件夹的编号
        new_image_index = len(image_info) + 1  # 全局编号，从1开始
        new_image_name = f'{new_image_index}.pdf'
        new_image_path = os.path.join(target_dir, new_image_name)

        # 复制图片到目标目录并重命名
        shutil.copy(image_path, new_image_path)

        # 记录图片信息（上一级目录名称，新文件名（不带扩展名））
        image_info.append((current_dir, new_image_index))

    # 将记录的信息写入Excel文件
excel_path = os.path.join(target_base_dir, f'{target_image_name[:-4]}.xlsx')
df = pd.DataFrame(image_info, columns=['上一级目录', '重命名后的编号'])
df.to_excel(excel_path, index=False)

print("任务完成！")

这个代码可以从指定文件中提取相应的信息并且整理到一个表格里，唯一需要的就是我们需要将表格不同列的信息稍作整理：

import os
import re
import pandas as pd
from PyPDF2 import PdfReader

# 文件夹路径
folder_path = r"E:\文件\研究生\课题组\目诊标注\report\report"
output_excel = os.path.join(folder_path, "extracted_data.xlsx")

# 定义正则表达式提取相关信息
patterns = {
    "姓名": r"姓名：\s*([^\s]+)",
    "身份证": r"身份证：\s*([\dXx]+)",
    "病历号": r"病历号：\s*([^\s]+)",
    "手机": r"手机：\s*([\d-]+)"
}

# 存储提取的数据
data = []

# 遍历文件夹中的PDF文件，并按照数字大小排序
pdf_files = sorted(
    [f for f in os.listdir(folder_path) if f.endswith(".pdf")],
    key=lambda x: int(re.findall(r'\d+', x)[0])
)

for file_name in pdf_files:
    pdf_path = os.path.join(folder_path, file_name)
    try:
        # 打开并解析PDF
        reader = PdfReader(pdf_path)
        text = ""
        for page in reader.pages:
            text += page.extract_text() + "\n"  # 保留换行符

        # 提取信息
        extracted_data = [file_name]
        for key, pattern in patterns.items():
            match = re.search(pattern, text, re.MULTILINE)
            value = match.group(1) if match else ""
            extracted_data.append(value)

        # 添加到数据列表
        data.append(extracted_data)
    except Exception as e:
        print(f"Error processing file {file_name}: {e}")

# 将数据保存到Excel
columns = ["文件名", "姓名", "身份证", "病历号", "手机"]
df = pd.DataFrame(data, columns=columns)
df.to_excel(output_excel, index=False)

print(f"提取完成，结果已保存到 {output_excel}")

上面的代码运行的时候别忘了修改需要操作的文件路径，建议自己先拿一个小文件夹试验一下，可以了再应用到需要操作的所有文件里。

❤️模拟器自动点击

使用mumu模拟器打开拼多多或小红书时，可能会出现回车发不了消息的情况，我们可以设置AutoHotkey自动脚本来实现:

#Persistent  ; 让脚本一直运行

Enter::
NumpadEnter::
    IfWinExist, ahk_class Qt5156QWindowIcon  ; 检查模拟器窗口存在（小红书）
    {
        if (WinActive("ahk_class Qt5156QWindowIcon"))
        {
            ; 如果是小红书窗口，模拟点击发送按钮
            MouseMove, 1798, 994  ; 小红书的发送按钮坐标
            MouseClick, left  ; 模拟点击发送按钮
        }
    }
    Else IfWinExist, ahk_class AnotherWindowClass  ; 其他程序窗口（假设为 AnotherWindowClass）
    {
        if (WinActive("ahk_class AnotherWindowClass"))
        {
            ; 如果是另一个程序窗口，调整发送按钮的坐标
            MouseMove, 1796, 989  ; 这里是另一个程序发送按钮的坐标
            MouseClick, left  ; 模拟点击发送按钮
        }
    }
Return

AutoHotkey 是一种用于自动化任务和创建快捷键的编程语言，通常用于模拟键盘输入、鼠标操作等。