compute_fbank_matrix

paddle.audio.functional. compute_fbank_matrix ( sr, n_fft, n_mels=64, f_min=0.0, f_max=None, htk=False, nrom='slaney', dtype='float32' ) [源代码]

计算 mel 变换矩阵。

参数

  • sr (int) - 采样率。

  • n_fft (int) - fft bins 的数目。

  • n_mels (float,可选) - mels bins 的数目,默认是64。

  • f_min (float,可选) - 最小频率(hz),默认是0.0。

  • f_max (Optional[float],可选) - 最大频率(hz),默认是 None。

  • htk (bool,可选) - 是否使用 htk 缩放,默认是 False。

  • norm (Union[str, float],可选) - norm 的类型,默认是'slaney'。

  • dtype (str,可选) - 返回矩阵的数据类型,默认'float32'。

返回

paddle.Tensor,Tensor shape (n_mels, n_fft//2 + 1)。

代码示例

import paddle

n_mfcc = 23
n_mels = 51
paddle_dct = paddle.audio.functional.create_dct(n_mfcc, n_mels)