mac快適化の最新記事

Macで無料の文字起こしができる?その方法と実力を確かめてみました。

Macには、標準で音声認識が搭載されています。標準だからテキストアプリなどに喋った声をそのままテキストにすることだってできちゃうんです。
Mac 無料 文字起こし

これを応用すれば、Youtubeやpodcastなどで再生した動画や音声を比較的簡単にテキスト化できるんじゃない?とナイスなアイデアが浮かびました。


この方法は、追加アプリ不要ではありません。AppStore以外の場所からアプリをダウンロードしてインストールする必要があります。

Macで無料の文字起こしするために必要なアプリ


Macで無料の文字起こしするために必要なアプリ(無料)を説明します。

その前になぜ別途アプリが必要なのかを簡単に説明しておきます。

直面する問題はこれら2つです。これを回避するためにアプリが必要にあります。
  1. スピーカーやヘッドフォンの出力をマイクにする必要がある
  2. 音声入力をOnにするとSafari/Chromeで再生している音声が止まる


まず、一つ目の「スピーカーやヘッドフォンの出力をマイクにする必要がある」です。
この問題を解決してくれるアプリは、「SoundFlower」になります。

SoundFlowerをインストールするとこんな問題を解決していくれます。
Youtubeで再生した音声は、スピーカーやヘッドホンに出力されます。物理的に存在するものです。
Macの音声認識は、外部マイクから入力する設定になっています。マイクも物理的に存在するものが必要ですよね。
Mac 無料 文字起こし
(システム環境設定 > 音声入力と読み上げ > 音声入力タブの設定で、マイクの下に対応するマイクデバイスが表示されています)

YouTube の出力はヘッドフォンです、音声認識の入力は、外部マイクです。
YouTubeの出力を外部マイクに相当するように設定できるのが「SoundFlower」です。
専門用語で言うところの「サウンドのループバック」です。

YouTubeで再生した音声をマイクの入力にできるので、そのまま音声認識させちゃうことができるっていうわけですね!

でも、これだけではうまくいきませんでした。
それが、2つ目の課題「音声入力をOnにするとSafari/Chromeで再生している音声が止まる」です。
この問題を解決してくれるアプリは、フリーの非破壊サウンド編集ソフト「Audacity」になります。

テキストエディットアプリで音声入力をオンにするとププって音がなって音声入力待ちになります。
でも、このタイミングで、再生していたはずのYoutubeが止まるんです・・・

なぜ止まるのかの仕組みは推測にすぎないので、割愛します。
フリーの非破壊サウンド編集ソフト「Audacity」を使うと、ひと手間で音声認識中でも音声再生することができます。

これら2つのアプリをインストールするとMacで無料の文字起こしができる環境が整います。




Macで無料の文字起こし!その方法とは?


Macで無料の文字起こし!その方法を説明します。

1) mp3/mp4/AVIなどのファイルを用意します


2) マイク入力の設定をSoundFlowerに変更します


3) Audacityで再生します


4) 最後にテキストエディットアプリで音声入力を開始させます。



Macで無料の文字起こし!その実力は笑ってしまいました。


Macで無料の文字起こし!その実力はイマイチすぎて、笑うしかありませんでした。(笑)

Macで文字起こしした方にとっては、インストールしても使えないかと思うので、
インストールに必要なアプリなどのリンクも省略しています。ググると見つかるかと思います。

所有している音声などによってはうまく認識してくれるかもしれません。

会話レベルの認識を確認したかったので、ホリエモンの動画で試してみました。
https://youtu.be/cHNUDvSqVjA
正解知りたい方は、動画みてください。いいこと言っているんじゃないかと思います。

youtubeの自動文字起こしと、Macで無料の文字起こしの比較結果です。始めの2分くらい実行しています

YouTube自動文字起こしMacで無料の文字起こし
必着 十一月に毛利聖一 皆さんこんにちはかれた紙
です
今日のパート4チャンネルにいらっしゃってなかったんだろう
全域今回は売上高が前年同月比マイナスに決定しました
年々ジダンの頭部をすでに
テレビで見ていたんだecbは現在非常にビジネスとしても
魅力的だなとでやっぱりあの会社として
もなく11番手投打に圧倒なっていくのかっていうの
加盟資格停止を要望アルバイト方にやってもら
ったりとか女子高生に騎乗することが
できるしているんですけどやっぱり
そう簡単にはアンプつかない自分の研究中です・・・
20分の日本ホリエモンチャンネルをこんちわこれ駄目ですキョウハチャンネルいらっしゃってにこんにちはです誰にも止めるでしょうでねをリテラル文字列にするをリテラル文字列にするをリテラル文字列にする


全然入力が追いつかない感じでした。かといって、Audacityで再生スピードを70%ぐらいにしてみても
「ドラえもん常務ブモンチョウと思いますの実行でしょうかこれまでねるねるねるね
授業政治ビジネスの一つ中国語のどちらが売れ筋部活」
といった感じで2分間の会話が見事にまとめられています。(笑)


再生スピードを下げても、改善の見込みはなかったです。

文章単位で、再生を止めて、音声認識完了で、再開とか、さらに手間暇かけることでうまくいくかもしれません。

ただ、これって全然楽にならないと思うので、やめました。

Macで無料の文字起こしができる?その方法と実力を確かめてみました。のまとめ


いかがでしたか?
残念ながら、文字起こしに関しては、会話レベルの音声は使い物になりませんでした。
音声認識APIがあればワクワクするもの作れちゃうかも!と思ったんです、でもコマンドレベルの音声認識(NSSpeechRecognizer)はできましたが、ストリーミング経由のAPIは見つかりませんでした。

認識率も結構いい感じだったので、どうしてだろうと思っていたんですが、今回試してみてわかりました。

早いスピードだったり、言葉が入り乱れたりするようなシーンでは実用レベルになっていないってことだったんですね

NSSpeechRecognizerってあらかじめ、単語を登録しておいて、その単語が音声で入ったら知らせてくれるものです。「あらかじめ」ってところがミソで、多分、こういう発音(波形)が来るはずというの知ってるからできるのかもしれませんね。

・・・・

SoundFlowerやAudacityのアプリを使うと物理的に存在しないマイクやスピーカーが作れて、入力や出力ができちゃいます。

応用することで、Macのサウンドのお悩みの多くは解決するかもしれないスペックを秘めていますね。




 

 

Macで無料の文字起こしができる?その方法と実力を確かめてみました。
サブコンテンツ

コメント

comments powered by Disqus

2013.8.19 DISQUS(外部コメントサービス)の利用を開始しました。
Facebook, google, Twitter等のアカウントで投稿可能です。


  • 祝!初マック(mac book retina 13インチ)!retina美しいです^^マックに関係するTips、情報、はまったことの解決策等
  • Mac野郎なのか
  • プロフィール

このページの先頭へ