網(wǎng)站首頁 編程語言 正文
數(shù)據(jù)API
數(shù)據(jù)集方法不會修改數(shù)據(jù)集,而是創(chuàng)建新數(shù)據(jù)集。
可通過調用 map() 方法將轉換應用于每個元素:
dataset = dataset.map(lambda x: x * 2)
亂序數(shù)據(jù)
交織來自多個文件的行
list_files() 函數(shù)返回一個亂序的文件路徑的數(shù)據(jù)集。
filepath_dataset = tf.data.Dataset.list_files(train_filepaths, seed=42)
一次讀取5個文件,并交織它們的行。
n_readers = 5
dataset = filepath_dataset.interleave(
lambda filepath: tf.data.TextLineDataset(filepath).skip(1),
cycle_length=n_readers)
預處理數(shù)據(jù)
X_mean, X_std = [...] # 每個特征的均值和標準差
n_inputs = 8 # 對應8個特征
def preprocess(line):
defs = [0.] * n_inputs + [tf.constant([], dtype=tf.float32)] # 包含csv中每一列的默認值的數(shù)組
fields = tf.io.decode_csv(line, record_defaults=defs)
# line 是要解析的行,record_defaults 是一個包含CSV文件每一列的默認值的數(shù)組
x = tf.stack(fields[:-1])
y = tf.stack(fields[-1:])
return (x - X_mean) / X_std, y
我們在除最后一個(目標值)之外的所有張量上調用 tf.stack() ,從而將這些張量堆疊到一維度組中。然后對目標值執(zhí)行相同的操作。
合并在一起
def csv_reader_dataset(filepaths, repeat=1, n_readers=5,
n_read_threads=None, shuffle_buffer_size=10000,
n_parse_threads=5, batch_size=32):
dataset = tf.data.Dataset.list_files(filepaths)
dataset = filepath_dataset.interleave(
lambda filepath: tf.data.TextLineDataset(filepath).skip(1),
cycle_length=n_readers, num_parallel_calls=n_read_threads)
dataset = dataset.map(preprocess, num_parallel_calls=n_parse_threads)
dataset = dataset.shuffle(shuffle_buffer_size).repeat(repeat)
return dataset.batch(batch_size).prefetch(1)
原文鏈接:https://blog.csdn.net/GW_Krystal/article/details/127885412
相關推薦
- 2021-11-21 ASP.NET?Core應用JWT進行用戶認證及Token的刷新方案_實用技巧
- 2022-10-08 Python使用xlrd和xlwt實現(xiàn)自動化操作Excel_python
- 2022-12-31 C++?Boost?Uuid超詳細講解_C 語言
- 2023-02-01 Bat腳本-Call,Start,直接調用,goto?四種方式調用批處理_DOS/BAT
- 2022-10-22 Python中的Unittest基本使用_python
- 2021-12-07 Linux系統(tǒng)的修復模式(單用戶模式)_Linux
- 2022-01-31 Nginx的平滑重啟和平滑升級
- 2022-06-13 Python數(shù)據(jù)類型及常用方法_python
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細win安裝深度學習環(huán)境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結構-簡單動態(tài)字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支