網站首頁 編程語言 正文
一、使用ImageFolder讀取數據集時忽略特定文件
如果事先知道需要忽略哪些文件,當然直接從數據集里刪除就行了。但如果需要在程序運行時動態確認,或者篩選規則比較復雜,人工不好做,就需要讓ImageFolder
在讀取時使用自定義的篩選規則。
ImageFolder有一個可選參數為is_valid_file
,參數類型為可調用的函數,該函數傳入一個str參數,返回一個bool值。當返回值為True時保留該文件,否則忽略。
例如,讀取時想要忽略所有文件名帶‘invalid’的文件,
代碼如下:
import platform from torchvision.datasets import ImageFolder class Check(object): ? ? def __init__(self, ? ? ? ? ? ? ? ? ?key_word: str): ? ? ? ? self.key_word = key_word ? ? ? ? self.separator = '\\' if platform.system() == 'Windows' else '/' ? ? def __call__(self,? ? ? ?? ??? ??? ? file_name: str) -> bool: ? ? ? ? folders = file_name.split(self.separator) ? ? ? ? return folders[-1].find(self.key_word) < 0 dataset = ImageFolder('./data', is_valid_file=Check('invalid'))
這里定義了一個實現了__call__
方法的Check類,相比于直接定義函數的好處在于可以在構造函數里指定想要忽略的字符,并且能夠根據操作系統的不同把文件目錄分隔符給確定了。
更加復雜的功能可以自行修改代碼邏輯實現,但是要注意如果某個類別的所有文件都被篩選掉了,ImageFolder
會報FileNotFoundError
錯誤。
如果想要忽略整個類別可以使用下面方法?。?!
二、ImageFolder只讀取部分類別文件夾
直接繼承并且重寫ImageFolder
類的find_classes
方法即可
from torchvision.datasets.folder import * from typing import * class FilterableImageFolder(ImageFolder): ? ? def __init__( ? ? ? ? ? ? self, ? ? ? ? ? ? root: str, ? ? ? ? ? ? transform: Optional[Callable] = None, ? ? ? ? ? ? target_transform: Optional[Callable] = None, ? ? ? ? ? ? loader: Callable[[str], Any] = default_loader, ? ? ? ? ? ? is_valid_file: Optional[Callable[[str], bool]] = None, ? ? ? ? ? ? valid_classes: List = None ? ? ): ? ? ? ? self.valid_classes = valid_classes ? ? ? ? super(FilterableImageFolder, self).__init__(root, transform, target_transform, loader, is_valid_file) ? ? def find_classes(self, directory: str) -> Tuple[List[str], Dict[str, int]]: ? ? ? ? classes = sorted(entry.name for entry in os.scandir(directory) if entry.is_dir()) ? ? ? ? #增加了這下面這句 ? ? ? ? classes = [valid_class for valid_class in classes if valid_class in self.valid_classes] ? ? ? ? if not classes: ? ? ? ? ? ? raise FileNotFoundError(f"Couldn't find any class folder in {directory}.") ? ? ? ? class_to_idx = {cls_name: i for i, cls_name in enumerate(classes)} ? ? ? ? return classes, class_to_idx
使用時,例如有mouse
、cat
、dog
三個類別的數據集文件夾,只想讀取cat
和dog
,
代碼如下:
dataset = FilterableImageFolder('./data', valid_classes=['cat', 'dog'])
原文鏈接:https://blog.csdn.net/qq_44980390/article/details/123439341
相關推薦
- 2022-07-22 如何處理SQL Server中附加數據庫時出現的錯誤
- 2022-09-05 淺析Servlet三大容器的常用方法及其作用域
- 2022-06-02 C語言?隊列的實現全解析_C 語言
- 2023-02-10 docker安裝nginx容器的方法_docker
- 2022-04-05 解決IDEA .properties文件中文亂碼的問題
- 2023-07-05 cnpm安裝appium出現cannot find module xxx
- 2022-10-29 前端圖片上傳發現圖片倒置解決方案 圖片鏡像效果實現
- 2021-11-23 Linux系統下SystemC環境配置方法_Linux
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支