2018年11月18日
自然言語処理(COTOHA API)のご紹介
COTOHA
概要
NTT Communicationsが今年から提供している自然言語処理のAPIです(こちらを参照)。
簡単に説明すると、日本語の文章を解析して、その後のデータ分析に応用できるようにするデータの処理方法を提供してくれているものです。
商用利用には、使用料が掛かりますが、開発目的で利用する分には料金はかからないです(利用可能な機能に制限はありますが)。
日本語の自然言語処理は、英語と比べると単語ごとにスペースが入らず、単語ごとに区切ることが課題となっていました。その際に、文字ごとのつながりを「辞書」を用いて、単語に区切っています。
このCOTOHAでは、日本語に特化した辞書を利用することで、より精度よく自然な形で自然言語処理ができるようになっているようです。
実際に使ってみる
まず、こちらの公式サイトで登録をする必要があります。
解析デモ
解析した際のデモ例です。
解析する文字列として、「意味を解析する」を利用しています。
・aux:動詞/形容詞のうち非自立のもの。
・dobj:目的格で述語に係る名詞句。
・case:助詞による格の表示。
自然言語を勉強するには
〇プログラミングを勉強したことがある方なら、一度は聞いたことはあるであろうオライリーの本。
ゼロから作るDeep Learning 2 自然言語処理編 [ 斎藤 康毅 ] 価格:3,888円 |
---
【関連記事】
・COTOHAを使ってみる ー構文解析 v1ー
---
【更新履歴】
181118:初期作成
190103:関連記事追加
タグ:言語処理
【このカテゴリーの最新記事】
-
no image
-
no image
-
no image
この記事へのコメント
コメントを書く
この記事へのトラックバックURL
https://fanblogs.jp/tb/8310443
※ブログオーナーが承認したトラックバックのみ表示されます。
この記事へのトラックバック