pip install search4file
你好,我是Python程序员晚枫。这个库实现的功能:根据文件内容,搜索文件位置。
已经集成到python-office里了👉视频教程 开发者微信:CoderWanFeng
- 通过内容查找文件
- 通过名称查找图片
- ocr识别图片内容
- 通过字幕、画面查找视频
有3类并行推进的任务:
接口传送门 负责开发:@yinzeyuan
def search_pdf_file(self, file_path, search_content):
pass
def search_ppt_file(self, file_path, search_content):
pass
def search_excel_file(self, file_path, search_content):
pass
接口传送门 负责开发:@yinzeyuan
class SearchByName():
# 搜索文件名的逻辑
def search_files(self, search_path, search_content):
pass
优化内容,目前主要有:
- 目前的word查找基于python-docx库,而这个库不支持mac、linux库。
- 考虑改为解压docx的方式,对解压后的文件进行查找。
- 目前对文件的查找,采用单线程同步遍历的方式,速度太慢。
- 考虑改为进程 + 协程的异步方式,提高查询效率。
- 增加OCR自动根据指定的图片内容,进行图片搜索。
- 例如:用户输入:河流,查找出电脑里所有和河流有关的图片
- 识别出视频里的内容。
- 例如:用户输入:大山,查找出某个视频里,所有和大山有关的画面、字幕