音声認識

人工知能

倍速再生すればAI音声認識は速くなるのか

高精度な音声認識のモデルWhisperを使って、動画の文字起こし→切り抜きに応用しています。 Whisperは複数のモデルサイズがあり、モデルサイズが大きいほど、高精度になりますが、処理も遅くなります。 私はポッドキャストや、...
切り抜きAI

切り抜きAI作成記

8月の終わりに切り抜きAIをTransformerで作成するというブログを書きました。そちらの進展がどうなったか報告いたします。 結論から言うと前回の構想からはかなり変更して、それなりに動くものができました。以下では、ざっくりと作っ...
気になったガジェット

オフライン音声認識付きボイスレコーダー「SR302 Pro」を使ってブログを書いてみる

こちらの記事は音声入力で作成されております。 ※ 手作業の修正は行なっています。 というわけで、ボイスレコーダーで録音した音声をテキストに変換してくれるというAIライティングレコーダー「SR302 Pro」を手に入れたので、そ...
タイトルとURLをコピーしました