日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學(xué)無(wú)先后,達(dá)者為師

網(wǎng)站首頁(yè) 編程語(yǔ)言 正文

python常見(jiàn)讀取語(yǔ)音的3種方法速度對(duì)比_python

作者:王延凱的博客 ? 更新時(shí)間: 2023-02-06 編程語(yǔ)言

python 讀取語(yǔ)音文件時(shí),常用的無(wú)非以下三種方式,但是在我們數(shù)據(jù)量變的很大是,不同的讀取方式之間的性能差異就會(huì)被進(jìn)一步放大,于是本文著重對(duì)比了librosa、soundfile、wavfile三種方式的在重復(fù)讀取一萬(wàn)次某個(gè)文件所耗時(shí)間的差異,為確保實(shí)驗(yàn)結(jié)果的可比性,每種方式讀取出的語(yǔ)音序列值均一致。具體數(shù)值,在下方程序結(jié)果中已經(jīng)標(biāo)示。

# -*- coding: utf-8 -*-
"""
# @Time : 2022/12/29 17:27
# @Author : WangYK
# @Site : 
# @File : check_speed.py.py
# @Software: PyCharm
# @Desc:    本文件實(shí)現(xiàn)對(duì)比三種常見(jiàn)的都區(qū)語(yǔ)音方式的速度區(qū)別

"""
import librosa
import soundfile as sf
from scipy.io import wavfile
from time import process_time
from tqdm import tqdm


# 讀取方式1
def librosa_loa(filename):
    wav_data,fs=librosa.load(filename,sr=16000)     #float64類(lèi)型
    #wav_data:[-0.03305054 -0.03561401 -0.03814697]
    return wav_data,fs

#讀取方式2
def soundfile_load(filename):
    wav_data,fs=sf.read(filename)                   #float64類(lèi)型
    #wav_data:[-0.03305054 -0.03561401 -0.03814697]
    return wav_data

#讀取方式3
def wavfile_load(filename):
    fs,wav_data=wavfile.read(filename)              #int16類(lèi)型
    #轉(zhuǎn)為float64類(lèi)型
    wav_data=wav_data/(32768)
    #wav_data:[-0.03305054 -0.03561401 -0.038114697]
    return wav_data

if __name__ == '__main__':
    filename = ['01.wav']
    filenames = filename * 10000   #重復(fù)1萬(wàn)遍,用于對(duì)比各個(gè)方式耗時(shí)
    for filename in tqdm(filenames):
        wav_data=soundfile_load(filename)           # soundfile  讀取耗時(shí)   1.7031s
        wav_data=librosa_loa(filename)              # librosa    讀取耗時(shí)   416.23s
        wav_data=wavfile_load(filename)             # wavfile    讀取耗時(shí)   1.6875s

    print('當(dāng)前程序耗時(shí):{:.9}s'.format(process_time()))

實(shí)驗(yàn)結(jié)果分析

  • 最快的方式為 wavfile 的方式,一萬(wàn)次語(yǔ)音讀取僅耗時(shí) 1.6875s
  • 其次是 soundfile 的方式,一萬(wàn)次語(yǔ)音讀取耗時(shí) 1.7031s ,與wavfile相差不大
  • 最慢的為 librosa 的方式,一萬(wàn)次語(yǔ)音耗時(shí) 416s ,與其他兩種方式對(duì)比,巨慢。

但是還需要注意的一點(diǎn)就是 soundfile的方式讀取,時(shí)長(zhǎng)會(huì)受到版本限制,例如numba等,此外如果在linux環(huán)境下進(jìn)行實(shí)驗(yàn),可能會(huì)出現(xiàn) OSError: sndfile library not found,如果你是在內(nèi)網(wǎng)或者連接網(wǎng)絡(luò)不方便的話(huà),可以選擇wavfile方式讀取語(yǔ)音文件吧。

附:語(yǔ)音的播放

# 音頻的播放,本實(shí)驗(yàn)使用pyaudio(代碼相對(duì)matlab較麻煩,后期簡(jiǎn)化)
import pyaudio
import wave

chunk = 1024
wf = wave.open(r"C:\Users\zyf\Desktop\Jupyter\1.wav", 'rb')
p = pyaudio.PyAudio()

# 打開(kāi)聲音輸出流
stream = p.open(format = p.get_format_from_width(wf.getsampwidth()),
? ? ? ? ? ? ? ? channels = wf.getnchannels(),
? ? ? ? ? ? ? ? rate = wf.getframerate(),
? ? ? ? ? ? ? ? output = True)

# 寫(xiě)聲音輸出流到聲卡進(jìn)行播放
while True:
? ? data = wf.readframes(chunk)
? ? if data == "":
? ? ? ? break
? ? stream.write(data)

stream.stop_stream()
stream.close()
p.terminate() ? # 關(guān)閉PyAudio

總結(jié)

原文鏈接:https://blog.csdn.net/weixin_38468077/article/details/128486487

欄目分類(lèi)
最近更新