網(wǎng)站首頁 編程語言 正文
一、使用ImageFolder讀取數(shù)據(jù)集時忽略特定文件
如果事先知道需要忽略哪些文件,當(dāng)然直接從數(shù)據(jù)集里刪除就行了。但如果需要在程序運行時動態(tài)確認,或者篩選規(guī)則比較復(fù)雜,人工不好做,就需要讓ImageFolder
在讀取時使用自定義的篩選規(guī)則。
ImageFolder有一個可選參數(shù)為is_valid_file
,參數(shù)類型為可調(diào)用的函數(shù),該函數(shù)傳入一個str參數(shù),返回一個bool值。當(dāng)返回值為True時保留該文件,否則忽略。
例如,讀取時想要忽略所有文件名帶‘invalid’的文件,
代碼如下:
import platform from torchvision.datasets import ImageFolder class Check(object): ? ? def __init__(self, ? ? ? ? ? ? ? ? ?key_word: str): ? ? ? ? self.key_word = key_word ? ? ? ? self.separator = '\\' if platform.system() == 'Windows' else '/' ? ? def __call__(self,? ? ? ?? ??? ??? ? file_name: str) -> bool: ? ? ? ? folders = file_name.split(self.separator) ? ? ? ? return folders[-1].find(self.key_word) < 0 dataset = ImageFolder('./data', is_valid_file=Check('invalid'))
這里定義了一個實現(xiàn)了__call__
方法的Check類,相比于直接定義函數(shù)的好處在于可以在構(gòu)造函數(shù)里指定想要忽略的字符,并且能夠根據(jù)操作系統(tǒng)的不同把文件目錄分隔符給確定了。
更加復(fù)雜的功能可以自行修改代碼邏輯實現(xiàn),但是要注意如果某個類別的所有文件都被篩選掉了,ImageFolder
會報FileNotFoundError
錯誤。
如果想要忽略整個類別可以使用下面方法?。。?/p>
二、ImageFolder只讀取部分類別文件夾
直接繼承并且重寫ImageFolder
類的find_classes
方法即可
from torchvision.datasets.folder import * from typing import * class FilterableImageFolder(ImageFolder): ? ? def __init__( ? ? ? ? ? ? self, ? ? ? ? ? ? root: str, ? ? ? ? ? ? transform: Optional[Callable] = None, ? ? ? ? ? ? target_transform: Optional[Callable] = None, ? ? ? ? ? ? loader: Callable[[str], Any] = default_loader, ? ? ? ? ? ? is_valid_file: Optional[Callable[[str], bool]] = None, ? ? ? ? ? ? valid_classes: List = None ? ? ): ? ? ? ? self.valid_classes = valid_classes ? ? ? ? super(FilterableImageFolder, self).__init__(root, transform, target_transform, loader, is_valid_file) ? ? def find_classes(self, directory: str) -> Tuple[List[str], Dict[str, int]]: ? ? ? ? classes = sorted(entry.name for entry in os.scandir(directory) if entry.is_dir()) ? ? ? ? #增加了這下面這句 ? ? ? ? classes = [valid_class for valid_class in classes if valid_class in self.valid_classes] ? ? ? ? if not classes: ? ? ? ? ? ? raise FileNotFoundError(f"Couldn't find any class folder in {directory}.") ? ? ? ? class_to_idx = {cls_name: i for i, cls_name in enumerate(classes)} ? ? ? ? return classes, class_to_idx
使用時,例如有mouse
、cat
、dog
三個類別的數(shù)據(jù)集文件夾,只想讀取cat
和dog
,
代碼如下:
dataset = FilterableImageFolder('./data', valid_classes=['cat', 'dog'])
原文鏈接:https://blog.csdn.net/qq_44980390/article/details/123439341
相關(guān)推薦
- 2022-03-29 關(guān)于使用Redisson訂閱數(shù)問題_Redis
- 2022-04-21 新一代Python包管理工具_python
- 2022-06-02 C語言結(jié)構(gòu)體(struct)的詳細講解_C 語言
- 2022-12-09 C#中async和await的深入分析_C#教程
- 2022-06-12 Python使用matplotlib.pyplot?as?plt繪圖圖層優(yōu)先級問題_python
- 2022-09-25 注解@Autowired如何自動裝配
- 2022-06-01 C語言的動態(tài)內(nèi)存管理你了解嗎_C 語言
- 2022-05-27 python中torch.nn.identity()方法詳解_python
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細win安裝深度學(xué)習(xí)環(huán)境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡單動態(tài)字符串(SD
- arthas操作spring被代理目標(biāo)對象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支