Skillbook

データサイエンス領域 > DS_Phase3>非構造化データ処理

音声認識

このスキルの細分化業務

この業務の関連項目

この業務に関連する業務領域

データサイエンス領域
データサイエンス領域のタスクを示すもの。

この業務に関連する評価項目

音をデジタルデータとして、wav や mp3 などに変換する
音データからノイズ、雑音などの余計な音を識別して除去する
分析目的にあったデータ（音高、音量など）を抽出する
【本人認証・話者識別・音声認識・音声合成】音声データから抽出したスペクトラムやメル周波数ケプストラム係数（MFCC）などの特徴量を用いて、本人認証や話者識別などのパラメータの推定・モデル構築・精度評価を行う
【感情分析】音声データから抽出した周波数や音量変化量などの特徴量を用いて、感情を識別するパラメータの推定・モデル構築・精度評価を行う
【テキスト化】音声データから抽出した周波数を用いて音響モデルを構築し、さらに音声データから書き起こしたテキストから言語モデルを構築し、テキスト識別するためのパラメータの推定・モデル構築・精度評価を行う
【音楽分析】音楽データから、周波数やMFCC、さらにテンポやコード進行などの特徴量を抽出し、ジャンルやアーティストなどを識別するパラメータ推定・モデル構築・精度評価を行う

音声認識

音声認識

このスキルの細分化業務

関連する本や教材

この業務の関連項目

この業務に関連する業務領域

この業務に関連する評価項目