「Audio SA」は、TFFT画像として声紋なども取ることができるスペクトラムアナライザーです。
作成したTFFT画像は、高解像度の画像としてエクスポートすることができます。(画像サイズ例 iPhoneSE3:4096×4096, iPhoneX:6144×6144)
試しに声紋を作成したいだけであれば、設定に迷う必要はありません。声を録音してTFFTを実行するだけで声紋が表示されます。
「Audio SA」は、FFT関連の学習にもご利用いただけます。FFTの周波数分解能やダイナミックレンジといった重要な特性の変化を、FFTサイズや窓関数を切り替えながら確認することもできます。
付帯機能として、簡易波形ジェネレータを実装しておりますので、学習の際には是非お試しください。簡易波形ジェネレータでは、サイン波、矩形波、ガウスホワイトノイズとその組み合わせ波が生成できます。
TFFT画像を機械学習に用いる場合などは、十分検討した設定が必要になるかと思います。
「Audio SA」では、音声波形の解析範囲、FFTサイズ、パワースペクトラムのスケール、窓関数、描画色のタイプ、が設定できます。
音声波形の解析範囲は、音声波形を拡大縮小移動することで設定します。表示されている範囲が解析範囲になります。
プレイボタンをタップすると、解析範囲だけが再生されますので、確認に便利です。
FFTサイズは256,512,1024,2048,4096,8192,16384,32768から選択できます。
(ただし、録音時、再生時は256,512,1024,2048,4096からの選択となります)
パワースペクトラムのスケールは、リニアスケール、ログスケール、メルスケールから選択できます。
メルスケールの場合は、ブレーク周波数が設定できます。メルスケールでは、ブレーク周波数まではリニアスケールに近く、ブレーク周波数以降はログスケールに近い特性となります。最も多く用いられている700Hzが規定値として設定されています。
窓関数は、Blackman、Hamming、Hann、Rectangular、から選択できます。
ダイナミックレンジを広く取りたい場合には、Blackmanを、周波数分解能を高くしたい場合には、Hammingを選択することになるかと思います。
大雑把な言い方になってしまいますが、HannはBlackmanとHammingの間の特性です。
Rectangularでは、FFT変換時に特別な窓関数を乗算せず、音声波形からFFTサイズ分切り出した音声データをそのまま使用しています。
その他、TFFT画像に描画する際のダイナミックレンジの下限値も設定可能です。設定は簡単で、FFT画像を上下にスワイプするだけです。FFT画像として表示されている部分がそのままTFFT画像として描画されます。
「Audio SA」では、広告を見て獲得したチケットを消費して録音をする形式でご利用いただきます。
ただし、アプリ内課金で「広告の削除」を購入いただきますと、チケットなしで無制限に録音可能となります。
[詳細]
https://app.brain-workout.org/spectrumanalyzer/