ドラエもんを人工知能で作る【#1:GoogleAIYをスタンドアローン化③】ラズパイ3

ヤバい。ドラエもんブームが来てる!星野源も「ドラえもん」。

なぜこのタイミングなのか!?  スマートスピーカーの出現により、AI(人工知能)というか音声認識が『今』だからだろう。

ドラえもんの次に来るのは「AI ドール」だ

現在日本で「ドール」を作っているのは、dollfiedreamとかスマートドールとか沢山あるようだ。キーワードは『球体関節』。問題は大きさ。60cmとか等身大とか。どっちがいいのかわからないが、ファッションだと等身大で需要がありそうだ。

https://shop.smartdoll.jp/collections/licensed-smart-dolls/products/nami

問題は「ドールありき」ではなく、ラズパイありきでドールを作れないんかな?ということだ。しかも「ドール高くね?

で、スマートドールが優れているのは「骨格」だと思う。つまり「球体関節」と「骨格」を両立すればいいんじゃないかな?スマートドールは背骨にJetonジョイントを使っている。

ここに詳しいスマドの分析があるから、後日参考にしてみる。

ちなみに現状では30㎝ドールはサーボモータの関係でNG、ミライマネキンマシンのように60cmサイズじゃないと大変らしい。

本日のお題:声/音楽を鳴らすの+GアシをIFTTTで使うこと。

声はMP3のほうがリアルかも

どうやら初音ミクの声でOpenJtalkが利用できるみたいだが、コチラの音声を聞いて、ガッカリ。”機械”だよねぇ。

今Googleアシスタントは一応2種選べるみたい。

Googleアシスタントに合成してドラえもんの声にできないのw?
現状はドラエもんの声をmp3で流した方が、リアルかも?

apt-get install mpg321
mpg321 /home/pi/music.mp3

Raspberry Piで音楽(wav/mp3)ファイルを再生する方法 python編 - Qiita
# pythonで音楽再生する方法主な方法として以下の5つが挙げられます。1. (#1pygame)2. (#2pyaudio)3. (#3vlc)4. (#4ap...

ラズパイで音楽はコチラを参照↑

初IFTTTしてみた。驚いた。超かんたん

知っている人が多いIFTTTだけど、メンドクサイので避けてきた。

しかしやってみるとGoogleアカウントでログインできる(登録なし)。

下記の記事がすごくわかりやすい。

さまざまなサービスが連携できる「IFTTT(イフト)」の使い方 (2/3)
Webサービス同士を連携できるサービス「IFTTT」。スマートスピーカーとWebサービスの連携も可能なことから最近注目が集まっている。IFTTTでサービス連携を作りながら、...

Googleアシスタント(hotword)に働いてもらわないと駄目だから、現状ではIFTTTが必須なのではないかな??

ただしGoogleアシスタントにからいきなりラズパイのGPIOをON/OFFするのは、現状Thisの部分にアシスタントを登録しても、Thatの部分でラズパイを動作させるのに別のサービスを使う必要がある。その登録がメンドクサイ。

今回はテストでSMSを発信する。他にアイディアがないから;

登録は2秒で終わった。

この画面で国番号を入れて、自分の番号や家族の番号を入れると、PINがそのスマホに届く。そのPINを次に入力すれば、それでもう登録完了。

これでSMSを受け取る設定は終わり。

次はGoogleアシスタントから指令する登録をしてみる。

手順が6個もあるが、登録は簡単だ。

アシスタントに
「SMS 帰りは#時ごろになるよ。ブヒブヒ」

「SMS 帰りは#になるよ。ババビビ」

「SMS #に帰る。ピョンピョン」

と言うと、「帰りは#時になるよ、OOXX」というSMSを発信。SMS側の設定も合せる。

本当に、これだけだ。

SMSは制限あるのかもしれないが、別のサービスでもOK

LINEなんか便利じゃないかな?

日本人でLINEしてない人、ほぼ居ないからね。(?)

確認の画面が表示され、終了。

まずスマホのGoogleアシスタントで確認する。


おおスゲー。本当に来たw

予想外にスムーズ。しかし残念なお知らせ

AIYというかラズパイのCLOUD SPEECH APIでは上手く認識してくれない。キーワードが長すぎるのか? 短い命令で試したが:

どうやら駄目だ。

hotwordだがこれだけ短くても反応なし。

今日はこの辺で止めておこう。

ただ触ってみて分かったのは、スマホのGoogleアシスタントを使ったほうが、何でもできるということw

あえてラズパイが何かをする必要はない。

これは困ったw

このようにGoogleアシスタントのアプリはすでにIFTTTが不要なほど、ショートカットがすぐ作れそうだ。

だからラズパイから操作するくらいしか、IFTTTの活用は見込めない。

ラズパイでGooleアシスタントも使えないと、AIの意味がないんですけどw

AIYの音声認識だけでは物足りない。

一応、他のこともまとめる。

スマホとラズパイで認識性能に差があるのは、ちょっとマズい。

ドラエもんの中に、Googleアシスタントが住んで、色々やってくれないと、こっちもやる気が起きない。

もうちょっと調べたら、ラズパイ側で喋ったことが「アクティビティ」に保存されている事が判った。つまりアシスタントは受容している。もしかして「アカウントに基づく情報」などでラズパイ側に許可が上手く伝わっていないのだろうか??

まとめ

「おーい、どらえもん」でリスニング状態になる。ボタン光る。

……’じゃあね ドラえもん‘ in text:
subprocess.call([“sudo”, “shutdown”, “-h”, “now”])
elif ‘あのね ドラえもん‘ in text:
subprocess.call([“sudo”, “mpg321”, “/home/pi/d1.mp3”])
elif ‘ドラえもん もういいよ‘ in text:
break

という風になり、電源OFF、音楽ON、プログラム終了などをこなすようになった。1度動作が完了すると、またドラエもんを呼ぶ。

「OK,Google」でアシスタントがリスニング状態になる。

質問に答えると、勝手にリスニング状態から外れる。

よってドラえもん(CloudSpeech=AIY)とGoogleアシスタントAPIは並存しており、競合はないことを確認した。

QR Code