アフィリエイト広告を利用しています

広告

posted by fanblog

2019年01月27日

自然言語処理(COTOHA API)のアップデート(2019.01.15〜)

COTOHA
追加項目

NTTコミュニケーションズで紹介されているように、COTOHA APIに機能が追加されました。(公式サイト

追加された項目は、次の4項目です。
2つは、音声認識システムへの導入を強く意識している機能に思えます。
残り2つは汎用的な機能と思います。

アレクサなど音声認識アプリケーション開発にも、応用が効いてくると思います。
1. 言い淀み除去(β版)

 言葉が詰まって出てこない際に、発話する「ええと」や「あのう」といった表現を除去できる機能です。
 入力した文字列から言い淀み表現が除去されます。
 例えば、「ええと、明日の天気は晴れです。」と入力した場合、「ええと、」が言い淀み表現として検出することが可能となる機能です。
2. 音声認識誤り検知(β版)

 音声認識したテキストデータに認識ミスがあるかを検出・抽出することができる機能です。
 認識ミスと思われる単語を出力してくれる機能です。
 今後、音声認識誤り訂正のAPIが追加予定ということなので、自動検出+自動訂正も一括で行うことが可能となるかもしれません。
3. 感情分析(正式版)

 こちらは、正式版となった機能です。文章が表現している感情を「ポジティブ」「ネガティブ」と判定することができます。yahooのリアルタイム検索の画面で、感情判定をご覧になったことがある方もいると思います。
 例えば、製品などのレビュー解析への応用が効くように思います。ユーザが何に不満を持っているか、何に利点を感じたかを自動的に解析できえます。
4. 照応解析(正式版)

 いわゆる「こそあど言葉」のような指示語の検知と、それらの対象を特定することができます。
 β版から正式版になったことで、複数形や複数単語にも対応可能になったようです。
 リファレンスに例があるように、「太郎は友人です。彼はステーキを食べた。」という文を入力することで、「太郎=彼」と判定することが可能です。

終わりに

 今回のアップデートで「音声認識」関連のAPIが追加され、音声認識の精度向上に力を入れていることが感じられます。Youtubeでも字幕表示がされますが、精度としては未だに見るに堪えない内容で、日本語の音声認識の難しさを感じてしまいます。
 COTOHA APIの性能向上には期待をする限りです。
 照応解析などを学ぶならば、このような本もおすすめです。

文脈解析 述語項構造・照応・談話構造の解析 (自然言語処理シリーズ) [ 奥村学 ]



---
【関連記事】
自然言語処理(COTOHA API)のご紹介

---
【更新履歴】
190127:新規作成

---



この記事へのコメント
コメントを書く

お名前:

メールアドレス:


ホームページアドレス:

コメント:

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバックURL
https://fanblogs.jp/tb/8507904
※ブログオーナーが承認したトラックバックのみ表示されます。

この記事へのトラックバック
検索
<< 2022年06月 >>
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30    
最新記事
タグクラウド
カテゴリーアーカイブ
日別アーカイブ
×

この広告は30日以上新しい記事の更新がないブログに表示されております。