一般情報について
地震波や声紋など、過渡信号の分析に適している技術です。
1967年に、地震波の解析に利用される形で発表されました。ただ、計算量がFFTと比較して多くなるため普及が進みませんでした。現在はコンピュータ性能の向上と共に計算処理環境も大幅に改善したため、お使いのPCを利用して当ソフトウェアで簡単にLPCのスペクトル分析が可能になりました。
ユーグリッド距離やコサイン尺度が持つ問題を改善した「独自の数学的アルゴリズム」に基づいています。
以下のページに詳細を掲載しています。「形状距離の特長と原理」をご参照ください。
形状距離の特長と原理
製品について
WAVデータを「LPCスペクトル」に変換して分析することが出来、スペクトル画像の「パターン認識」が可能になります。
パターン認識は特許に基づく「形状距離」を活用しています。形状距離の詳細は「形状距離の特長と原理」をご参照ください。
形状距離の特長と原理
打音検査や金属等の異音検出に関する分野で実績があります。
コンクリート打音検査や金属等の異音検出に関する分野で実績があります。また、オーストラリアにて絶滅危惧種の野鳥保護を目的に研究が続けられている「野生動物の鳴き声検出」にも、本ソフトウェアが活用されております。詳しくは「論文・特許」や「活用事例」をご参照ください。
論文・特許
GD Similarityの活用事例
GD Similarityは名古屋女子大学神内教授とクオン株式会社による産学連携の共同研究から生み出された製品です。
開発者に関するこれまでの発表論文及び特許を「論文・特許」に掲載してありますのでご覧ください。
論文・特許
新しい類似性尺度である「形状距離」を用いることで、より人間に近い感覚での比較が可能になります。
「ゆらぎの吸収」や「ずれの検出」を行うことが出来、「より人間に近い感覚」での音声認識や、「雑音が多い環境」での異音検知が可能になります。この数学的アルゴリズムはコンピュータに「より一層人間の感覚に近い認識」を実現させる可能性を有していると考えています。詳しくは「形状距離の特長と原理」をご覧ください。
形状距離の特長と原理
コンピュータの知能化において重要な役割を果たすと考えています。
人間や犬猫などの動物が視覚や聴覚において保有している「類似の感覚」を、弊社独自の数学的アルゴリズム(類似性尺度)を利用して認識することで、コンピュータの知能化を実現することがより一層可能になると考えています。詳しくはTOPページをご覧ください。
TOPページ
「GD Similarity」はWindowsのみで利用できるソフトウエアです。
動作環境はWindows® 8.1(32ビット/64ビット版)及びWindows® 10 (32ビット/64ビット版)を推奨しています。まず無料体験版をご利用いただき、お客さまのコンピュータで操作性をご確認ください。
音源データはWAVのみとなっています。
ソフトウエアで利用可能な音源データは「WAV」のみです。圧縮音源(MP3等)のご使用は出来ません。
お客さまの状況をお伺いさせていただき、課題解決のご提案を実施させていただきます。詳しくはお問い合わせください。
「LPCスペクトル」による分析を手軽に行えるほか、センサー・デバイスと組み合わせることで異音検出を自動化・モデル化することも可能です。詳しくはお問い合わせください。
現在、すでに開発されている1次元GDと2次元GDや高速GDアルゴリズムを利用してAI分野への応用研究を行っています。随時、共同研究のお申し込みもお待ちしています。
「LPCを使用した機械学習」と共に「形状距離」によるパターン認識もご活用していただくことで音声認識や画像認識の精度・機能向上が期待できます。詳しくは「活用事例」をご参照ください。
GD Similarityの活用事例
新しい類似性尺度である「形状距離(Geometric Distance)」は2つのパターン間を「距離」として測る数学的アルゴリズムを利用しています。GD Similarityは画像分野への適用も可能です。
形状距離パターンマッチングの特長を画像認識へ活用することも可能です。共同研究のお申し込みなど、詳しくは「お問い合わせ」からご連絡ください。
お問い合わせ
お客さまのご希望に沿ったご提案を心掛けています。お気軽にお問い合わせください。
オーダーメイドの対応や導入コンサルティング等をご希望のお客さまは「お問い合わせ」からご連絡ください。
お問い合わせ
ご購入について
無料体験版をご用意しています。より多くの方々にご利用していただくよう対応して参ります。
無料体験版をお試しいただき、「ご利用の流れ・ご購入」へお進みください。ご不明な場合はお客さまのご使用環境を考慮し、最適な方法をご提案させていただきますので、「お問い合わせ」からご連絡ください。
ダウンロード・ご購入
お問い合わせ
学習室
音声認識入門
コンピュータは音声データを「見ている」?
コンピュータでは、音声を「周波数のデータ」に変換しています。形式はWAVやAIFFが一般的です。私たちが利用するオーディオプレイヤーなどでは「人間の耳」では聞き取れない「音」のデータを削った圧縮音源(MP3など)も利用され、音楽配信などに活用されています。
身近にあるAIの「耳」ってどんなしくみ?
スマホやAIスピーカーなど、私たちの身近にある製品の音声認識の性能も急速に向上し、どんどん身近になってきました。製品の音声認識には人間と同じように「耳」が必要です。AIはどのように人の声を聴いているのでしょうか?
AIの「耳」は「目」?ヒトの耳とのしくみの違い
人の耳の構造
LPCスペクトル
人間は「音」を耳の中の「蝸牛管(かぎゅうかん)」という器官で、音の「振動」を電気信号へ変換して聞き取っています。対してAIは音声データ(WAV等)をスペクトルという「画像」へ変換し、画像の特徴を分析することで、「音」として判別しています。
“AI流”ヒアリング術
では、AIがどのようにして声を聞き取っているか「見て」みましょう。
音声データ作成
マイクから音を収集し、音を「音声データ」へ変換します。
スペクトル分析
コンピュータが「音声データ」を「スペクトル画像」へ変換します。スペクトル画像には、音ごとに特徴のある「周波数の波」が現れます。
パターンマッチング(画像認識)
AIが「周波数の波」の画像の特徴を多数のデータから照らし合わせ、何の音かを判別します。
自然言語処理
聞き取った音を組み合わせ、単語として何を意味するかを判断します。
まだまだ発展途上のAIの「耳」とその理由
性別や方言、同じ言葉でも人それぞれの話し方は違いますが、音声認識はそれをリアルタイムで判別する必要があります。コンピューターは決められた動作や計算は得意ですが、決まっていないものを分析することは得意ではありません。現在は人に例えると、小さな子供が言葉を覚えはじめている段階ともいえます。
もっと人に近づく ~これからの音声認識~
音声認識の精度向上において大事なのが、先に紹介しました“ヒアリング術”です。「人間の声」の分析に適した「スペクトル分析」の活用や、パターンマッチングの精度向上が更に進むことによって、「音」をより正確に判別できるようになります。「音」が正確に判別できれば、自然言語処理の機能向上も期待できます。近年のコンピュータ処理速度の向上も含めた様々な技術革新から、一緒に世間話ができるようなロボットやAIの登場も、近い未来に実現が期待されています。
GD Similarityは、スペクトル分析及びパターンマッチングにおいて、「人の感覚を持った耳」の実現を目指します。