音声認識
音声認識
この業務の関連項目
この業務に関連する業務領域
データサイエンス領域
データサイエンス領域のタスクを示すもの。
データサイエンス領域のタスクを示すもの。
この業務に関連する評価項目
音をデジタルデータとして、wav や mp3 などに変換する
音データからノイズ、雑音などの余計な音を識別して除去する
分析目的にあったデータ(音高、音量など)を抽出する
【本人認証・話者識別・音声認識・音声合成】音声データから抽出したスペクトラムやメル周波数ケプストラム係数(MFCC)などの特徴量を用いて、本人認証や話者識別などのパラメータの推定・モデル構築・精度評価を行う
【感情分析】音声データから抽出した周波数や音量変化量などの特徴量を用いて、感情を識別するパラメータの推定・モデル構築・精度評価を行う
【テキスト化】音声データから抽出した周波数を用いて音響モデルを構築し、さらに音声データから書き起こしたテキストから言語モデルを構築し、テキスト識別するためのパラメータの推定・モデル構築・精度評価を行う
【音楽分析】音楽データから、周波数やMFCC、さらにテンポやコード進行などの特徴量を抽出し、ジャンルやアーティストなどを識別するパラメータ推定・モデル構築・精度評価を行う
音データからノイズ、雑音などの余計な音を識別して除去する
分析目的にあったデータ(音高、音量など)を抽出する
【本人認証・話者識別・音声認識・音声合成】音声データから抽出したスペクトラムやメル周波数ケプストラム係数(MFCC)などの特徴量を用いて、本人認証や話者識別などのパラメータの推定・モデル構築・精度評価を行う
【感情分析】音声データから抽出した周波数や音量変化量などの特徴量を用いて、感情を識別するパラメータの推定・モデル構築・精度評価を行う
【テキスト化】音声データから抽出した周波数を用いて音響モデルを構築し、さらに音声データから書き起こしたテキストから言語モデルを構築し、テキスト識別するためのパラメータの推定・モデル構築・精度評価を行う
【音楽分析】音楽データから、周波数やMFCC、さらにテンポやコード進行などの特徴量を抽出し、ジャンルやアーティストなどを識別するパラメータ推定・モデル構築・精度評価を行う