#配置清华镜像源 pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple pip config set global.trusted-host pypi.tuna.tsinghua.edu.cn #安装依赖库 pip install pywin32
import time import win32api import win32gui time.sleep(2) point = win32api.GetCursorPos() #win32api.GetCursorPos 获取鼠标当前的坐标(x,y) hwnd = win32gui.WindowFromPoint(point) #查看坐标位置窗口的句柄 print(hwnd) #输出句柄
vi main.py
import time import win32api import win32gui # 通过句柄获取窗口类名 def get_clasname(hwnd): clasname = win32gui.GetClassName(hwnd) print('窗口类名:%s' % (clasname)) return clasname time.sleep(2) point = win32api.GetCursorPos() hwnd = win32gui.WindowFromPoint(point) #查看窗口类名 get_clasname(hwnd)
import time import win32api import win32gui #获取当前主机上的所有句柄id def get_all_windows(): all_window_handles = [] # 枚举所有窗口句柄,添加到列表中 def enum_windows_proc(hwnd, param): param.append(hwnd) return True # 调用枚举窗口API win32gui.EnumWindows(enum_windows_proc, all_window_handles) return all_window_handles #返回的是一个句柄id的列表 #查询传入的句柄id、类名 def get_title(window_handle, class_name): #查询句柄的类名 window_class = win32gui.GetClassName(window_handle) #判断窗口类名是否和指定的类名相同,如果相同则返回该窗口句柄,否则返回空值 if window_class == class_name: return window_handle #遍历窗口句柄的所有子窗口 def get_child_windows(parent_window_handle): child_window_handles = [] def enum_windows_proc(hwnd, param): param.append(hwnd) return True #win32gui.EnumChildWindows 遍历窗口句柄的所有子窗口 win32gui.EnumChildWindows(parent_window_handle, enum_windows_proc, child_window_handles) return child_window_handles # 根据标题查找窗口句柄 def find_hwnd_by_title(title): all_windows = get_all_windows() #查询所有句柄 matched_windows = [] #存放所有匹配类名的句柄id # 在所有窗口中查找标题匹配的窗口句柄 for window_handle in all_windows: #get_title方法 检查传入句柄对应的类名和我们实际的类名是否对应 window_title = get_title(window_handle, title) if window_title: matched_windows.append(window_title) #如果对应就写入列表 # 如果没有匹配到,则在所有子窗口中查找标题匹配的窗口句柄 if matched_windows: return matched_windows else: child_window_handles = [] for parent_window_handle in all_windows: #不论子窗口是否有数据都追加到列表 child_window_handles.extend(get_child_windows(parent_window_handle)) for child_window_handle in child_window_handles: if get_title(child_window_handle, title): matched_windows.append(get_title(child_window_handle, title)) return matched_windows if __name__ == '__main__': hwnd = find_hwnd_by_title("Edit") print(hwnd)
消息类型 | 作用 | 消息标识 | 作用 |
WM_MOUSEMOVE | 鼠标 移动 | 移动通用左键右键标识 | |
WM_RBUTTONDOWN | 鼠标 右键按下 | MK_RBUTTON | 左键按下 |
WM_RBUTTONUP | 鼠标 右键释放 | None | 释放时无需标识 |
WM_LBUTTONDOWN | 鼠标 左键按下 | MK_LBUTTON | 右键按下 |
WM_LBUTTONUP | 鼠标 左键释放 | None | 释放时无需标识 |
#在win32api下有个函数PostMessage,是用来与windows api交互的,参数如下 1、要发送消息的目标窗口的句柄 2、发送的消息类型 3、以及消息的参数 win32api.PostMessage(句柄id, 消息类型, 消息标识, 具体的坐标(x,y))
#获取坐标 time.sleep(3) print(win32api.GetCursorPos())
(328, 250)
下面定义了一个类,先去接受我们上面获取到的句柄id,在使用鼠标按键的时候调用win32api.PostMessage函数 去发送给句柄所在的窗口按键信息
在左右键按下的时候才需要定义标识,比如模拟左键时会使用WM_LBUTTONDOWN和MK_LBUTTON ,而松开时使用WM_LBUTTONUP和None
变量pos 是只鼠标按键的坐标,需要通过win32api.MAKELONG 转换数据类型后才能调用
#声明鼠标操作的类 class WinMouse(object): #初始化函数,接受传入的句柄id def __init__(self, handle_num: int): self.handle = handle_num #鼠标左键按下 def left_button_down(self, pos): win32api.PostMessage(self.handle, win32con.WM_LBUTTONDOWN, win32con.MK_LBUTTON, pos) #鼠标左键释放 def left_button_up(self, pos): win32api.PostMessage(self.handle, win32con.WM_LBUTTONUP, None, pos) if __name__ == '__main__': hwnd = find_hwnd_by_title("Edit") #通过类名获取句柄 bd = WinMouse(hwnd[0]) #实例化WinMouse 类,传入句柄值 pos = win32api.MAKELONG(328, 250) #将正常的x,y坐标值转换为特定的数据结构, #给win32api.PostMessage调用 #按下、等待1s、松开 bd.left_button_down(pos) time.sleep(1) bd.left_button_up(pos)
#按下鼠标左键并移动 def mouse_move(self, pos): win32api.PostMessage(self.handle, win32con.WM_MOUSEMOVE, win32con.MK_LBUTTON, pos) #按下鼠标右键并移动 def right_button_move(self, pos): win32api.PostMessage(self.handle, win32con.WM_MOUSEMOVE, win32con.MK_RBUTTON, pos) #指定坐标按下右键 def right_button_down(self, pos): win32api.PostMessage(self.handle, win32con.WM_RBUTTONDOWN, win32con.MK_RBUTTON, pos) #右键释放 def right_button_up(self, pos): win32api.PostMessage(self.handle, win32con.WM_RBUTTONUP, None, pos) #模拟左键双击 def left_double_click(self, x_pos:int, y_pos:int, click=2, wait=0.4): wait = wait / click #click 表示点击次数,wait是的等待时间,意思是双击的间隔 point = win32api.MAKELONG(x_pos, y_pos) for i in range(click): self.left_button_down(point) time.sleep(wait) self.left_button_up(point) #右键双击 def right_doubleClick(self, x, y, click=2, wait=0.4): wait = wait / click pos = win32api.MAKELONG(x, y) for i in range(click): self.right_button_down(pos) time.sleep(wait) self.right_button_up(pos)
#让他可以直接接收x,y坐标,wait是松开按键的间隔,一般默认即可 #左键单击 def left_click(self, x_pos:int, y_pos:int, wait=0.2): point = win32api.MAKELONG(x_pos, y_pos) self.left_button_down(point) time.sleep(wait) self.left_button_up(point) #右键单击 def right_click(self, x_pos:int, y_pos:int, wait=0.2): point = win32api.MAKELONG(x_pos, y_pos) self.right_button_down(point) time.sleep(wait) self.right_button_up(point) #模拟左键双击 def left_double_click(self, x_pos:int, y_pos:int, click=2, wait=0.4): wait = wait / click #click 表示点击次数,wait是的等待时间,意思是双击的间隔 point = win32api.MAKELONG(x_pos, y_pos) for i in range(click): self.left_button_down(point) time.sleep(wait) self.left_button_up(point) #右键双击 def right_doubleClick(self, x, y, click=2, wait=0.4): wait = wait / click pos = win32api.MAKELONG(x, y) for i in range(click): self.right_button_down(pos) time.sleep(wait) self.right_button_up(pos)
vi main.py
#计算鼠标从起始点到目标点的偏移过程 def getPointOnLine(start_x, start_y, end_x, end_y, ratio): x = ((end_x - start_x) * ratio) + start_x y = ((end_y - start_y) * ratio) + start_y return int(round(x)), int(round(y)) class WinMouse(object): def __init__(self, handle_num: int, num_of_steps=80): #添加num_of_steps=80 self.handle = handle_num self.num_of_steps = num_of_steps #添加偏移值
#模拟点击并拖拽目标,接受两对坐标值 def left_click_move(self, x1:int, y1:int, x2:int, y2:int, wait=2): point1 = win32api.MAKELONG(x1, y1) self.left_button_down(point1) #起始点按下鼠标左键 #获取我们在init初始化时定义的偏移值 steps = self.num_of_steps #调用我们上面的方法返回具体,循环0-80的值 #你看这里的循环值是80,也就说会做80次循环操作 #我们传入了起始坐标和目标坐标,而i / steps就相当于起始到结束的偏移位置 #可以理解为从左上角到右下角的点 points = [getPointOnLine(x1, y1, x2, y2, i / steps) for i in range(steps)] points.append((x2, y2)) wait_time = wait / steps unique_points = list(set(points)) unique_points.sort(key=points.index) for point in unique_points: x, y = point point = win32api.MAKELONG(x, y) self.mouse_move(point) time.sleep(wait_time) self.left_button_up(point) #右键单击并滑动批量勾选(与上方函数同理) def right_click_move(self, start_x, start_y, end_x, end_y, wait=2): pos = win32api.MAKELONG(start_x, start_y) self.right_button_down(pos) steps = self.num_of_steps points = [getPointOnLine(start_x, start_y, end_x, end_y, i / steps) for i in range(steps)] points.append((end_x, end_y)) time_per_step = wait / steps distinct_points = list(set(points)) distinct_points.sort(key=points.index) for point in distinct_points: x, y = point pos = win32api.MAKELONG(x, y) self.right_button_move(pos) time.sleep(time_per_step) self.right_button_up(pos)
pip install opencv-python pip install pillow pip install opencv-contrib-python pip install numpy pip install PIL
我这边在安装上opencv-python 后调用cv2下任意方法都提示报黄,没有代码提示,下面列出解决方法
(venv) PS C:\Users\Administrator\IdeaProjects\test> pip install opencv-python Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple Requirement already satisfied: opencv-python in c:\users\administrator\ideaprojects\test\venv\lib\site-packages ( Requirement already satisfied: numpy>=1.21.2 in c:\users\administrator\ideaprojects\test\venv\lib\site-packages (from opencv-python) (1.24.3)
我们在安装成功opencv-python模块后会返回一个安装路径,登录这个路径,进入cv2的目录下,将cv2.pyd 文件放到下面的路径下,重启编辑器即可
import cv2 # 加载一张图片 img = cv2.imread('11.png', 1) #脚本文件旁边自行准备一个图片 # 显示图片 cv2.imshow('image', img) cv2.waitKey(0) cv2.destroyAllWindows()
import ctypes import time import cv2 import numpy as np import win32api import win32con import win32gui import win32ui from PIL import Image def get_bitmap(hwnd): """ 获取窗口的位图并返回图像对象。 参数: hwnd (int): 窗口的句柄。 返回: Image: 窗口的位图图像。 """ # 获取窗口的位置和大小信息 left, top, right, bot = win32gui.GetWindowRect(hwnd) # 获取窗口的左上角和右下角坐标 w = right - left # 计算窗口的宽度 h = bot - top # 计算窗口的高度 # 获取窗口的设备上下文(DC) hwnd_dc = win32gui.GetWindowDC(hwnd) # 获取窗口的设备上下文 mfc_dc = win32ui.CreateDCFromHandle(hwnd_dc) # 创建一个与窗口设备上下文兼容的设备上下文 save_dc = mfc_dc.CreateCompatibleDC() # 创建一个与窗口设备上下文兼容的设备上下文 # 创建与窗口大小相同的兼容位图 save_bitmap = win32ui.CreateBitmap() # 创建位图对象 save_bitmap.CreateCompatibleBitmap(mfc_dc, w, h) # 创建与窗口大小相同的兼容位图 # 将位图选择到设备上下文中 save_dc.SelectObject(save_bitmap) # 将位图选择到设备上下文中 # 将窗口内容绘制到位图中 windll.user32.PrintWindow(hwnd, save_dc.GetSafeHdc(), 0) # 将窗口内容绘制到位图中 # 获取位图的信息和位图数据 bmpinfo = save_bitmap.GetInfo() # 获取位图的信息 bmpstr = save_bitmap.GetBitmapBits(True) # 获取位图的数据 # 使用位图数据创建图像对象 bmp = Image.frombuffer('RGB', (bmpinfo['bmWidth'], bmpinfo['bmHeight']), bmpstr, 'raw', 'BGRX', 0, 1) # 使用位图数据创建图像对象 # 清理资源 win32gui.DeleteObject(save_bitmap.GetHandle()) # 删除位图对象 save_dc.DeleteDC() # 删除设备上下文 mfc_dc.DeleteDC() # 删除设备上下文 win32gui.ReleaseDC(hwnd, hwnd_dc) # 释放设备上下文 # 将位图保存到文件(用于调试目的) bmp.save("asdf.png") # 将位图保存到文件 return bmp # 返回位图图像对象 #调用代码 if __name__ == '__main__': hwnd = find_hwnd_by_title("AfxFrameOrView140u") # 通过类名获取句柄 # bd = WinMouse(hwnd[0]) #实例化WinMouse 类,传入句柄值 # bd.left_click_move(109,180,232,341) #调用截图函数并返回位图 print(get_bitmap(hwnd[0]))
left # 计算窗口的宽度 h = bot - top # 计算窗口的高度 # 获取窗口的设备上下文(DC) hwnd_dc = win32gui.GetWindowDC(hwnd) # 获取窗口的设备上下文 mfc_dc = win32ui.CreateDCFromHandle(hwnd_dc) # 创建一个与窗口设备上下文兼容的设备上下文 save_dc = mfc_dc.CreateCompatibleDC() # 创建一个与窗口设备上下文兼容的设备上下文 # 创建与窗口大小相同的兼容位图 save_bitmap = win32ui.CreateBitmap() # 创建位图对象 save_bitmap.CreateCompatibleBitmap(mfc_dc, w, h) # 创建与窗口大小相同的兼容位图 # 将位图选择到设备上下文中 save_dc.SelectObject(save_bitmap) # 将位图选择到设备上下文中 # 将窗口内容绘制到位图中 windll.user32.PrintWindow(hwnd, save_dc.GetSafeHdc(), 0) # 将窗口内容绘制到位图中 # 获取位图的信息和位图数据 bmpinfo = save_bitmap.GetInfo() # 获取位图的信息 bmpstr = save_bitmap.GetBitmapBits(True) # 获取位图的数据 # 使用位图数据创建图像对象 bmp = Image.frombuffer('RGB', (bmpinfo['bmWidth'], bmpinfo['bmHeight']), bmpstr, 'raw', 'BGRX', 0, 1) # 使用位图数据创建图像对象 # 清理资源 win32gui.DeleteObject(save_bitmap.GetHandle()) # 删除位图对象 save_dc.DeleteDC() # 删除设备上下文 mfc_dc.DeleteDC() # 删除设备上下文 win32gui.ReleaseDC(hwnd, hwnd_dc) # 释放设备上下文 # 将位图保存到文件(用于调试目的) bmp.save("asdf.png") # 将位图保存到文件 return bmp # 返回位图图像对象 def get_clasname(hwnd): clasname = win32gui.GetClassName(hwnd) print('窗口类名:%s' % (clasname)) return clasname if __name__ == '__main__': hwnd = find_hwnd_by_title("SysListView32") # 通过类名获取句柄 # bd = WinMouse(hwnd[0]) #实例化WinMouse 类,传入句柄值 # bd.left_click_move(109,180,232,341) #调用截图函数并返回位图 print(get_bitmap(hwnd[0]))
import cv2 import numpy as np # 读取大图和小图 large_image = cv2.imread('asdf.png') small_image = cv2.imread('111.png') # 将小图匹配到大图中 result = cv2.matchTemplate(large_image, small_image, cv2.TM_CCOEFF) min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(result) # 获取小图在大图中的坐标 top_left = max_loc bottom_right = (top_left[0] + small_image.shape[1], top_left[1] + small_image.shape[0]) # 在大图中标记出小图的位置 cv2.rectangle(large_image, top_left, bottom_right, (0, 255, 0), 2) # 显示标记后的大图 cv2.imshow('Result', large_image) cv2.waitKey(0) cv2.destroyAllWindows()
from ctypes import wintypes from PIL import Image # 获取指定窗口的大小和位置 def get_window_rect(hwnd): try: # 调用win api获取窗口属性(位置、大小、状态) f = ctypes.windll.dwmapi.DwmGetWindowAttribute except WindowsError: f = None if f: # 创建结构体存储窗口的状态(这个结构体通常包含四个整数成员:left、top、right、bottom,分别表示矩形区域的左边界、上边界、右边界和下边界的坐标值) # https://blog.csdn.net/jxlhljh/article/details/129815925 rect = wintypes.RECT() DWMWA_EXTENDED_FRAME_BOUNDS = 9 # ctypes.wintypes.HWND(hwnd) 将我们传入的句柄转换成windows api定义的句柄类型 # ctypes.wintypes.DWORD(DWMWA_EXTENDED_FRAME_BOUNDS) 指定获取窗口扩展边界信息 # ctypes.byref(rect) 将获取到的窗口属性信息写入到这个结构体中 # ctypes.sizeof(rect) 获取 RECT 结构体的大小 f(wintypes.HWND(hwnd), wintypes.DWORD(DWMWA_EXTENDED_FRAME_BOUNDS), ctypes.byref(rect), ctypes.sizeof(rect) ) return [rect.left, rect.top, rect.right, rect.bottom] # 定义一个窗口操作的类 class windowControl(): def __init__(self, hwnd): self.hwnd = hwnd # 传入句柄 # Target 图片位置 # A 窗口位置 def window_capture(self, Target, windowPosition, zqd=0.99): # 获取句柄窗口的大小 # 获取窗口的宽高 w_A = windowPosition[2] - windowPosition[0] h_A = windowPosition[3] - windowPosition[1] # 使用Windows API进行窗口图像的捕获和处理,创建了位图对象,并使用BitBlt函数将窗口图像复制到位图对象中 hwndDC = win32gui.GetWindowDC(self.hwnd) mfcDC = win32ui.CreateDCFromHandle(hwndDC) saveDC = mfcDC.CreateCompatibleDC() saveBitMap = win32ui.CreateBitmap() saveBitMap.CreateCompatibleBitmap(mfcDC, w_A, h_A) saveDC.SelectObject(saveBitMap) saveDC.BitBlt((0, 0), (w_A, h_A), mfcDC, (windowPosition[0], windowPosition[1]), win32con.SRCCOPY) ###获取位图信息 bmpinfo = saveBitMap.GetInfo() bmpstr = saveBitMap.GetBitmapBits(True) ###生成图像 im_PIL_TEMP = Image.frombuffer('RGB', (bmpinfo['bmWidth'], bmpinfo['bmHeight']), bmpstr, 'raw', 'BGRX', 0, 1) # 使用OpenCV将图像转换为可处理的格式 img = cv2.cvtColor(np.asarray(im_PIL_TEMP), cv2.COLOR_RGB2BGR) target = img template = cv2.imread(Target) theight, twidth = template.shape[:2] # 获得模板图片的高宽尺寸 # 执行模板匹配,采用的匹配方式cv2.TM_SQDIFF_NORMED result = cv2.matchTemplate(target, template, cv2.TM_SQDIFF_NORMED) # 归一化处理 cv2.normalize(result, result, 0, 1, cv2.NORM_MINMAX, -1) # 寻找矩阵(一维数组当做向量,用Mat定义)中的最大值和最小值的匹配结果及其位置 min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(result) strmin_val = str(min_val) # 释放句柄、设备上下文、hwndDC win32gui.DeleteObject(saveBitMap.GetHandle()) mfcDC.DeleteDC() saveDC.DeleteDC() win32gui.ReleaseDC(self.hwnd, hwndDC) if abs(float(strmin_val)) <= (1 - zqd) and min_loc[0] != 0 and min_loc[1] != 0: return min_loc[0] + windowPosition[0], min_loc[1] + windowPosition[1] else: return 0, 0 if __name__ == '__main__': hwnd = find_hwnd_by_title("SysListView32") bd = WinMouse(hwnd[0]) # bd.left_double_click(395,619) #400 450 # 初始化窗口类 w = windowControl(hwnd[0]) #指定窗口检查坐标 #(0, 0, 1920, 1080) 是窗口地址 0 0 表示最左边和最上面,1920 1080是最右边和最下面 #我因为是在桌面操作,就按照最大值跑,后面用小窗口就直接引用窗口的大小 # 0.95 是匹配度,模糊匹配95%的都符合 result_x, result_y = w.window_capture("111.png", (0, 0, 1920, 1080), 0.95) print("目标图像在窗口中的位置坐标:", result_x, result_y) # 不知为何,匹配出来的坐标始终差一点,先手动调整了 if result_x - 50 < 0: x = result_x else: x = result_x - 50 if result_y - 50 < 0: y = result_y else: y = result_y - 50 # 鼠标点击 bd.left_double_click(x, y)
zqd) and min_loc[0] != 0 and min_loc[1] != 0: return min_loc[0] + windowPosition[0], min_loc[1] + windowPosition[1] else: return 0, 0 if __name__ == '__main__': hwnd = find_hwnd_by_title("SysListView32") bd = WinMouse(hwnd[0]) # bd.left_double_click(395,619) #400 450 # 初始化窗口类 w = windowControl(hwnd[0]) #指定窗口检查坐标 #(0, 0, 1920, 1080) 是窗口地址 0 0 表示最左边和最上面,1920 1080是最右边和最下面 #我因为是在桌面操作,就按照最大值跑,后面用小窗口就直接引用窗口的大小 # 0.95 是匹配度,模糊匹配95%的都符合 result_x, result_y = w.window_capture("111.png", (0, 0, 1920, 1080), 0.95) print("目标图像在窗口中的位置坐标:", result_x, result_y) # 不知为何,匹配出来的坐标始终差一点,先手动调整了 if result_x - 50 < 0: x = result_x else: x = result_x - 50 if result_y - 50 < 0: y = result_y else: y = result_y - 50 # 鼠标点击 bd.left_double_click(x, y)