■人間が話すときは脳で思考し、言葉に変えて発声しますが、その過程において、一定のパターン変化が生じます。このパターンを耳で聴いて判別することは容易ではありませんが、コンピュータを利用して、声の周波数、トーン、話すスピード、話の間合いなどの音声成分に分解し、約300のパラメータとして解析することで、特有のシグナルを抽出します 。このシグナルの微妙な差異には、脳内の思考や働きが反映されているため、話し手の感情を把握することが可能となります。
この音声感情分析技術はすでに海外においては、ロシアの空港における麻薬捜査で検挙率ほぼ100%の実績を上げている他、欧州の保険会社のコールセンターでも導入され、支払い金額の削減などに顕著な成果を上げています。
一方、我が国においては当初、この新しい技術を主にエンターテインメント領域へ導入してきましたが、近年の犯罪やテロの増大、ストレスの原因となる事象の拡大等の社会情勢や、海外における音声感情分析技術を用いた数多くの実績が出ていることなどから、日本国内においても様々な分野への導入に対する意欲が高まっています。

 


人間が話すときは…
 1、脳で言葉を考えて
 2、.脳で筋肉に指令を与え、
 3、脳で舌・唇・あご・声帯を動かし、
 4、脳で肺呼吸をコントロールします。

人間は脳の特定の部分を使って思考しますので、脳から声が発せされるまでのプロセスにおいて身体メカニズムに一定のパターン変化が生じるため、下記の要素で音声を分析することで、そのプロセスを逆推定することが可能となるのです。

■耳では判別不能な音声成分
(トーン分析+シグナル解析)
■副次要素
 ・声の周波数
 ・話すスピード
 ・話の間合 etc
▲ これらを約300のパラメーターに分け分析します。

分析の際は高速で波形を時分割(数ミリ秒〜数十ミリ秒のサンプリング)するため、「言葉」ではなく「音(トーン)」として捕えるので民族・性別等に依存しません。

言語音声にはミクロに分析した場合、独特の周期的な繰返しがあり、平常時と非平常時にスペクトル形状的差違(固有低周波の量等)が生じます。

当人の初めての会話でも、ある似ている部分Aと部分Bの周期的パターンの微妙な変化を捕捉するため差違を検出できます。

この差(シグナル)を多次元的に解析することにより、音声から脳内で起きている状況(感情や思考)を分析することが可能となるのです。