新型レクサス「NX」に搭載されている「音声認識」(エージェント)については、私的には納車当時からいろいろ試してみたのですが、当初はまったく使い物にならないレベルで、しばらく使用することなく放置していました。
しかし、今回、2023年2月更新の「OTA」アップデート後に更に改善されているということで、OTAアップデート当日は「それほど大きな改善はないなぁ」と感じてしましたが、どれほど改善されているのか改めて確認するために土日の空いている時間で数時間、時間をかけて向き合ってみました。
新型NX以降の新世代マルチメディアシステムにおいて、どのような「音声認識」ができるかは、レクサスの公式Webページにまとめられています。
当初はここまで詳しく解説されていなかったと思いますので、途中で大幅に加筆/修正されたものと思います。
https://lexus.jp/total_care/connected/navigation/agent.html
*コネクテッドサービス「エージェント」:ー「ナビ検索・ナビ操作」より
数時間検証してみたところ、結論からすると、初期バージョンに比べると「格段に良くなっています」!
特に、上記サイトに掲載されている事例はおおむね認識することができました。
ただし、認識できるコマンドと話し方を理解する必要があると感じました。
これから納車される方は、まずは、どんなことができるのか、またどのように発言すれば認識してくれるかを公式Webサイトで学ぶ必要がありますので、一通りチェックしておきましょう。
さて、2023年2月のアップデートで大きく変わったと感じたのは「2段階」で車両(以後、AI)が認識するようになったことです。
例えば、「ヘイ、レクサス。東京駅の近くで空いている駐車場探して」と発音した場合です。
初期(2022.11月〜)や中期(2022.6月〜)では、こういった音声はなかなか認識してくれませんでしたが、2023年2月(以降、新バージョン)では、「カタカナ混じり」でAIが認識した用語をまず表示してくれるようです。
画面では「トウキョウトの近くでアイテルチュウシャジョウ探して」と認識に苦労している様子が伺えます。
従来だと、「東京都の近くで駐車場?」(そんなものは存在しない)と認識して、AIがフリーズして長時間応答がなく、我々ユーザーに「ああ、こりゃダメだ」と思わせていたものと思います。
それが、新バージョンですと、もう1度画面表示が切り替わり、正確に「東京駅の近くで空いている駐車場探して」と認識してくれます! 「東京都」が「東京駅」だと認識を改めたわけですから、これは一体どういうロジックかわかりませんが、これには驚きました。
次に、「ヘイ、レクサス。品川駅の近くで空いている駐車場探して」と発音した場合・・・
まず画面には、「シナガワエキフレアイビルチュウシャジョウ探して」と表示されました。
当方の発音がイマイチなのかもしれませんが、「シナガワエキフレアイビル」と謎の認識をしていることにも驚きがあります。
大部分がカタカナなので、従来のバージョンでは、この段階でAIが「思考停止」し、フリーズするか、見当違いな結果を表示していたものと思います。
この後自動的に画面が切り替わり「品川駅の近くで空いている駐車場を探して」と正確に認識しました!
「フレアイビル」がどういうロジックで「近くで空いている」に変換されたのかも謎が深まりますが、これはかなりすごい!(やればできる!)
最後に使用頻度が高い「自宅に行きたい(自宅に帰る)」ですが・・・
これもまずはこんな感じで、「キタクに行きたい」と、とんでもない認識です。こりゃ、当初は使い物にならないと感じたわけです・・・(北区に行きたいと認識しているのか?)
これも画面が切り替わり、無事に「自宅に行きたい」に変換してくれました!
多少認識に時間はかかりますが、変な目的地を検索するという結果にはならず、大成功です。
この他にも
「近くの○○○○」と発声する場合の音声認識は、認識率が格段に良くなっていることがわかりました。
「近くのスターバックス」
「近くのタリーズ」
「近くのファミレス」
「近くのドラッグストア」
上記のように、著名なチェーン店名も、新バージョンでは難なく認識することができたので、馴染みのない旅行先で立ち寄り場所を探すときには「近くの○○○」はなかなか有効と感じます。
(「近くの○○○○に行きたい」 という必要はなく、「近くの○○○○」だけで良いのは便利ですね)
・・・ということで、2023年2月のアップデートにおいて、ようやく音声認識機能が実用的になってきたと感じました。
ただ、これは繰り返しになりますが、「認識されるコツ」や「話し方」がありますので、上記のページおよび、レクサス開発陣の「TEAM LEXUS BLOGS」をご参照の上、トライしてみてください。
特に初期納車された方は、ぜひ新バージョンの音声認識を試していただければと思います。
当方が現時点での望む、今後の要望としては次のことができるようになってほしいです。
■音声での目的地検索のオン/オフ
誤作動の原因は無限のパターンがある「目的地検索」と思いますので、この機能の「オン/オフ」ができれば、誤認識は相当減らせるのではないかと思います。もしくは音声検索で検索できるエリアを限定するとか・・・
ユーザーが感じるストレスの原因は「AIが誤認識」→「見当違いな目的地を検索」が主要因と思いますので・・・
流石に、東京で音声検索して、四国エリアの目的地を目的地候補として表示するのはあまり現実的ではないように思います。
■次のインターチェンジで降りたい
都市部に限らないと思いますが、ナビで示されたインターチェンジの手前で一般道に降りたい場合もしばしばあると思います。
このような場合、一度インターチェンジを降りても、再度高速道路に乗ることを支持されたり、高速道路走行のままであったりしますので、「自分はここから一般道で走行したい」意識を伝えることができればとても役立つと思います。これこそが音声認識ならではの機能と思いますので、ぜひ実現してほしいと思います。
■次のインターチェンジで乗りたい
上記のケースとは逆のパターンです。
都市部ではインターチェンジ間の距離(間隔)が短いことも多いです。料金の問題や渋滞の有無など、もう1つ先のインターチェンジまで「下道で行きたい」と思うこともしばしばあると思いますが、これを手動でナビに反映させるのは結構たいへんです。これが音声認識で対応してもらえるととても便利と感じます。
■ルート検索後の「一般道優先」/「有料優先」の切り替え
これはかなりニーズが高いと思うのですが、途中でルート検索方法を変更したいケースです。(高速道路を走行中、料金節約のため、一般道に降りるケースも含む)現状では、音声認識での変更方法はなさそうです。任意で下道に降りたのに、再度有料道路に乗ることを指示(案内)されることに不満を持つ方は結構いらっしゃるのではないかと思います。
■ドライブセレクトモードの変更
新型NXではドライブモードセレクトスイッチが付いているので問題ありませんが、「RX」、「RZ」では非装備ですので、ぜひ音声認識でドライブモードセレクトスイッチの切替替えがスムーズに(かつ「素早く」)できるようになってほしいです。
■効果音の変更(AIが認識しているかどうかの見分け方)
AIが「認識しているのか」「考えているのか」の区別が未だつきにくいです。
「無音(無反応)」の時間は、最新バージョンでもまだ気にあるところですので、AIが「調べているのか」、「エラーなのか」がまだまだシチュエーションが分かりづらいと思います。人間なら「表情」や「あいずちの有無」でわかるのですが、AIだとそのあたりがさっぱりわからないので、せっかく目の前に14インチディスプレイがあるのですから、これを補う方法が欲しいものです。
また、対話終了後の効果音(ビープ音?)も、「OK」なのか「キャンセル」なのか今ひとつ判然しないときがあるのも残念に感じます。
■使用頻度が高い発音例の表示
レクサスオーナーがよく使うもしくは全国的に人気の高い「用語」を「ヘイ、レクサス」のあとに14インチディスプレイに自動的に画面表示してくれると良いなぁと思いました。(やはり、「どうやって対話すれば良いのか」はつい忘れてしまいますので・・・)
■パノラミックビューモニター中の音声認識
パノラミックビューモニターを「オート」にされている方は、徐行走行中に、「PVM」の画面になっていることが多いと思いますが、音声認識はこのときには受け付けられません(カメラ関係の音声のみ認識)
個人的には、このような低速度域だからこそ、音声認識を行う余裕があると感じますので、「PVM」の画面のときも音声認識を受け付けてほしいと思いました。
■音声の個人ごとの学習機能
個人ごとに発音の癖があると思いますので主要なフレーズをあらかじめ実際に発声して認識率を高めるなど「学習機能」をもたせてほしいと思います。「ドライバー認証」の際に、その情報が呼び出されるのであれば認識率もより高められるのではないかなぁと感じています。
「TAZUNA」コンセプト移行後、運転席のタッチディスプレイから手の届かない範囲(画面の左隅など)にボタンやスイッチが配置されている部分がありますので、こういった部分の操作を「音声認識」で置き換えたり、ワンクリック(タップ)ではできないことを、「音声認識」で置き換えることがとても有用と思います。
手元のステアリングスイッチでできることは音声認識でやる必要はないようにも思いますので、ユーザーが「こうしたことをやってほしい」と販売店やメーカーに意見を伝える仕組みがあれば良いなぁと感じます。
音声認識機能はぜひ今後も操作改善が望ましい「TAZUNA」を補うツールとして進化していってほしいですね。
-
no image
-
no image
-
no image
-
no image
-
no image
-
no image
-
no image
-
no image
-
no image
-
no image
-
no image
-
no image
-
no image
-
no image
-
no image
-
no image
-
no image