網站首頁 編程語言 正文
引言
其實IO操作相較于服務端,客戶端做的并不多,基本的場景就是讀寫文件的時候會使用到InputStream或者OutputStream,然而客戶端能做的就是發起一個讀寫的指令,真正的操作是內核層通過ioctl指令執行讀寫操作,因為每次的IO操作都涉及到了線程的操作,因此會有性能上的損耗,那么從本篇文章開始,我們將進入IO的世界,了解IO到NIO機制的演進,從底層關注序列化的原理。
1 Basic IO模型
那么在Java(Kotlin)中,IO主要分為兩種:Basic IO 和 Net IO;Basic IO是我們在開發當中常用的一些IO流,例如:
FileInputStream://文件輸入流
FileOutputStream://文件輸出流
BufferedInputStream://緩存字節輸入流
BufferedOutputStream://緩存字節輸入流,此類數據流為了提高讀寫效率,可以緩存數據到buffer,通過flush一起寫入;內核分配內存為一頁4K,但是Java緩沖區默認是8K
ObjectInputStream
ObjectOutputStream:// 將數據序列化處理
RandomAccessFile://提供位移數據插入
對于前面的幾個數據流,我就不介紹用法了,對于最后一個RandomAccessFile,我想簡單介紹一下,因為很多伙伴們可能不知道RandomAccessFile的存在,這里曾經有個面試題:
假設有一個5G的文件,我想在文章的末尾追加一段話,我該怎么處理?或者我指定任意位置添加一部分文字內容,該怎么處理?
很多伙伴看到這個問題之后,一拍腦門說:先通過FileInputStream把文件讀寫進來,然后再在末尾追加一部分內容組合成新的字節流,然后再通過FileOutputStream寫入到新的文件中。
完蛋,直接pass掉!因為前提這里已經是5G的文件了,如果通過FileInputStream讀寫,大概率就會直接OOM! 所以如果知道RandomAccessFile的存在,這些就不是問題了。
fun testAccessFile() {
//file文件
val file = File("/storage/emulated/0/NewTextFile.txt")
val accessFile = RandomAccessFile(file, "rw")
//先寫一段
val text = "IO主要分為兩種:Basic IO 和 Net IO;"
accessFile.write(text.toByteArray())
//再等5s
Thread.sleep(5000)
accessFile.seek(5)
accessFile.write("seek to pos 5".toByteArray())
accessFile.close()
}
首先我們常見一個RandomAccessFile,傳入要讀寫的文件,首先寫入一段話,然后等到5s后,調用RandomAccessFile的seek方法,此時指針就是移動到了文件第五個字符的位置,然后又寫入了一些文字。
所以按照這種思想,回到前面的問題,即便是5G的文件,也不需要進行讀寫操作獲取之前的全部數據就能夠實現零內存追加;當然還有一個場景也會經常用到,就是斷點續傳。
1.1 RandomAccessFile的緩沖區和BufferedInputStream緩沖區的區別
首先我先簡單介紹下BufferedInputStream的緩存區效果,系統內核緩存區默認為4K,當緩存區滿4K之后會進行磁盤的寫入;那么在Java中是對其做了優化處理,將緩存區變為8K,當緩存區超過8K之后,會將數據復制給到內核緩存。
fun testBuffer() {
val file = File("/storage/emulated/0/NewTextFile.txt")
val bis = BufferedOutputStream(FileOutputStream(file))
val text = "8888888888888888".toByteArray()
bis.write(text, 0, text.size)
// bis.flush()
}
例如上面的案例,此時App的內存緩存區沒有滿,那么如果不調用flush,那么數據不會寫到磁盤文件中,只有當緩沖區滿了之后,才會復制到內核空間緩存區。
fun testAccessFile() {
//file文件
val file = File("/storage/emulated/0/NewTextFile.txt")
val accessFile = RandomAccessFile(file, "rw")
//先寫一段
val text = "IO主要分為兩種:Basic IO 和 Net IO;"
accessFile.write(text.toByteArray())
//再等5s
Thread.sleep(5000)
accessFile.seek(5)
val channel = accessFile.channel
val mapper = channel.map(FileChannel.MapMode.READ_WRITE, channel.position(), channel.size())
mapper.put("seek to pos 5".toByteArray())
}
如果按照BufferedOutputStream的思想,我們往緩沖區寫數據,沒有flush就不會有復制的操作,那么我們實際看到的是數據還是寫進去了。
其實MappedByteBuffer,是提供了一個類似于mmap性質的能力,實現了App緩沖區與內核緩沖區的橋接或者映射。
當App寫入緩存數據的時候,直接映射到了內核緩存區,完成了磁盤的讀寫操作。
1.2 Basic IO模型底層原理
其實對于基礎的IO模型,也就是Basic IO的實現是阻塞的,其實我們也可以自己驗證,在主線程中進行讀寫操作就是阻塞的。
那么對于IO來說,主要分為兩個階段:
(1)數據準備階段;這里是由Java實現的,寫入到JVM中;
(2)復制階段;內核空間復制用戶空間緩存數據,這部分需要調用內核函數(ioctl、sync),完成復制的工作。
剩下的磁盤寫入操作就完全是由內核完成的,如果對于讀寫操作有疑問的,可以去看看下面這篇對于Binder底層原理的介紹。
Android Framework原理 -- Binder驅動源碼分析
對于傳統的Socket來說,這種屬于Net IO,本質也是阻塞性質的,例如App進程想要獲取一些數據,
上圖展示了read操作的整個調度過程:
(1)當App調用系統方法想要獲取某些數據的時候,首先系統內核會等待數據從網絡中到達,這個過程內核處于阻塞的狀態;
(2)等到數據到達之后,就會將網絡數據復制到用戶空間的緩沖區中,并通知App進程復制數據成功,此時App中其他業務才能夠繼續執行。
所以整個過程中,App處于阻塞狀態,而在高并發的場景中(客戶端很少,這里拿服務端來舉例),例如10000QPS(每秒10000次查詢操作),此時如果采用IO阻塞模型,帶來的后果就是CPU極速拉滿最終可能導致熔斷,所以針對這種情況,出現了NIO模型。
2 NIO模型
相對于IO模型來說,NIO模型做的優化是通過輪詢機制獲取內核的數據等待狀態,看下圖:
當一次詢問發出之后,如果當前內核還是數據等待狀態,那么內核空間會被”掛起“,此時App進程可以做其他的事情,等到下一次輪詢時間到了之后,再次發起詢問,如果此時已經拿到了數據,那么就會進行復制操作,將數據放入用戶進程緩沖區。
那么對此,java.nio包下提供了很多非阻塞IO的API,例如我們前面提到的MappedByteBuffer。其實還是前面我們探討的一個問題,在Android的場景下,很難碰到高并發的場景,所以基本上也很難用到這個,但是對于NIO模型的原理我們需要掌握透徹,在面試中可能會涉及到這些問題。
3 OKIO
最后介紹一個IO模型---OKIO,如果使用到OkHttp的伙伴們應該已經見到過這個,但是沒有實際地去研究,為啥要引入這個okio三方庫。
首先okio是OkHttp團隊基于Basic IO研發的一套自己的IO體系,為啥要搞一個這個玩意出來呢?通過前面我們分析Basic IO存在的一些問題,首先 Basic IO是阻塞的,而且在客戶端端如果頻繁地進行網絡請求,而且網絡請求是雙向的,從客戶端發出請求,服務端返回響應,那么這個過程必定會使用到InputStream和OutputStream。
因為OkHttp是有自己的緩存策略的,如果使用到緩存,那么對于InputStream就需要一個buffer,對于OutputStream也需要一個buffer,每次讀寫操作都需要兩個buffer來做支撐,因此針對這種場景,okio在底層做了處理。
具體的處理就是不再使用byte[]數組存儲數據,而是采用Segment數據結構。有熟悉Segment的伙伴應該知道,它是一個數組的雙向鏈表,其中data就是一個byte數組,其中有next和pre兩個指針。
internal class Segment {
@JvmField val data: ByteArray
/** The next byte of application data byte to read in this segment. */
@JvmField var pos: Int = 0
/** The first byte of available data ready to be written to. */
@JvmField var limit: Int = 0
/** True if other segments or byte strings use the same byte array. */
@JvmField var shared: Boolean = false
/** True if this segment owns the byte array and can append to it, extending `limit`. */
@JvmField var owner: Boolean = false
/** Next segment in a linked or circularly-linked list. */
@JvmField var next: Segment? = null
/** Previous segment in a circularly-linked list. */
@JvmField var prev: Segment? = null
當進行讀寫操作的時候,都會往Segment中寫入,就是將InputStream和OutputStream需要創建的緩沖區合并。
這里需要說明一點,okio屬于OkHttp內部核心IO框架,并不是單獨拿出來任意業務方可以使用,所以對于okio的具體實現原理,后續會放在OkHttp框架原理中做詳細的介紹。
原文鏈接:https://juejin.cn/post/7194324478199857189
相關推薦
- 2022-07-30 淺談Redis緩沖區機制_Redis
- 2023-07-02 Python利用scikit-learn實現近鄰算法分類的示例詳解_python
- 2023-12-11 Spring利用注解自動裝配
- 2023-01-23 C++中引用處理的基本方法_C 語言
- 2022-06-11 C#把DataTable導出為Excel文件_C#教程
- 2023-03-21 C++將字符串格式化的幾種方式總結_C 語言
- 2023-09-12 django數據庫篩選功能
- 2022-09-16 C#?Socket數據接收的三種實現方式_C#教程
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支