2019年01月27日
自然言語処理(COTOHA API)のアップデート(2019.01.15〜)
COTOHA
追加項目
NTTコミュニケーションズで紹介されているように、COTOHA APIに機能が追加されました。(公式サイト)
追加された項目は、次の4項目です。
2つは、音声認識システムへの導入を強く意識している機能に思えます。
残り2つは汎用的な機能と思います。
アレクサなど音声認識アプリケーション開発にも、応用が効いてくると思います。
1. 言い淀み除去(β版)
言葉が詰まって出てこない際に、発話する「ええと」や「あのう」といった表現を除去できる機能です。
入力した文字列から言い淀み表現が除去されます。
例えば、「ええと、明日の天気は晴れです。」と入力した場合、「ええと、」が言い淀み表現として検出することが可能となる機能です。
2. 音声認識誤り検知(β版)
音声認識したテキストデータに認識ミスがあるかを検出・抽出することができる機能です。
認識ミスと思われる単語を出力してくれる機能です。
今後、音声認識誤り訂正のAPIが追加予定ということなので、自動検出+自動訂正も一括で行うことが可能となるかもしれません。
3. 感情分析(正式版)
こちらは、正式版となった機能です。文章が表現している感情を「ポジティブ」「ネガティブ」と判定することができます。yahooのリアルタイム検索の画面で、感情判定をご覧になったことがある方もいると思います。
例えば、製品などのレビュー解析への応用が効くように思います。ユーザが何に不満を持っているか、何に利点を感じたかを自動的に解析できえます。
4. 照応解析(正式版)
いわゆる「こそあど言葉」のような指示語の検知と、それらの対象を特定することができます。
β版から正式版になったことで、複数形や複数単語にも対応可能になったようです。
リファレンスに例があるように、「太郎は友人です。彼はステーキを食べた。」という文を入力することで、「太郎=彼」と判定することが可能です。
終わりに
今回のアップデートで「音声認識」関連のAPIが追加され、音声認識の精度向上に力を入れていることが感じられます。Youtubeでも字幕表示がされますが、精度としては未だに見るに堪えない内容で、日本語の音声認識の難しさを感じてしまいます。
COTOHA APIの性能向上には期待をする限りです。
照応解析などを学ぶならば、このような本もおすすめです。
---
【関連記事】
・自然言語処理(COTOHA API)のご紹介
---
【更新履歴】
190127:新規作成
---
【このカテゴリーの最新記事】
-
no image
-
no image
この記事へのコメント
コメントを書く
この記事へのトラックバックURL
https://fanblogs.jp/tb/8507904
※ブログオーナーが承認したトラックバックのみ表示されます。
この記事へのトラックバック