MovidiusかGoogleAIY”Vision”キット、どちらを選ぶ?【超簡単VoiceKIT”一発”インストール!リベンジ】

Googleの画像認識支援であるAIY”Vision”キットがリリース。
これはMovidiusのUSBドングルみたいなもんだろう。

画像認識に特化した高速ツールだ。問題は値段だが、Visionキットの方が安いと思うのだが、やはり世界欠品だ。予約しておく。

View story at Medium.com

画像認識では以下も気になるところだ。

Google、Cloud AutoML発表!誰でもオリジナルAIを生成可能に!?

な、、VoiceKITが9ドルで売られている?

USでは10ドル以下で安売りされている。

おいおい、ってな感じだ。

で、本題だが、VoiceKITに長らく呪いで触れなかったので、今回はリベンジしてみる。

どうやら呪われていた間『Google Assistant SDKの hotword.py が日本語に対応した』らしい

GoogleCloudに入っても、自分がどこまでやったか覚えてないw

こっから何をやればいいか、最新版で簡単にまとめてみた。。

初回:(キットが届いて云々)

Google AIYキットが届いたぞ!【ラズパイ人口知能・音声認識HAT】

前回:(組み立てて、デスクトップでテストするまで)

Google AIYキットが届いたぞ!②【スマートスピーカ?GoogleHome?Alexa?】

で、最新イメージはコチラからDLする。ラズビアンのアップデートとは紐づいてない様子だから、その辺注意する。
面倒だが、EtcherでSDにイメージを焼き直す。20分位かかった。

次にセットアップと音声テスト。すっ飛ばしてはいけません。

GoogleCloudの設定(API/OAuth)

何か、難しい気がするだけだ。やりきるぞ!確かに難しくない!

「Google Cloud Plattform」の右のハンバーガーメニューを押す。

「APIとサービス」のライブラリを押して、Google Assistant APIと入力。で、結果をクリック。

「有効にする」を押す

タブの「認証情報」>「認証情報を作成」>「OAuthクライアントID」の順でクリック。「その他」で、名前を付ける。


そしてJsonファイルをDLし、ラズパイのPiフォルダに格納する。

PCでやったならば、VNCでラズパイのPiフォルダに送ればいい。
下記のように受け側のVNCでFetch files to:をpiフォルダにする。

コチラで「ウェブとアプリのアクティビティ」「端末情報」「音声アクティビティ」がONになっているのを確認する。

日本語化ができるようだからする

オリジナルの手順はコチラ。オカシければ参照されたし:

ターミナルから以下を実行。一部は最新だから不要だった。
$ sudo apt-get update
$ sudo apt-get install python3-dev python3-venv
$ python3 -m venv env
$ env/bin/python -m pip install –upgrade pip setuptools wheel

$ source env/bin/activate
これで(env)環境に入る。デスクトップアイコンの「Start dev terminal」と同等ではないようだ。

(env)$ sudo aptget install portaudio19dev libffidev libssldev
(env)$ python -m pip install –upgrade google-assistant-library
(env)$ python m pip install upgrade googleassistantsdk[samples]
(env)$ python m pip install upgrade googleauthoauthlib[tool]

このタイミングでlibraryを入れたほうが良い。30分位かかった。
でPiフォルダにJsonファイルが入っていれば以下を実行。

$ google-oauthlib-tool –scope https://www.googleapis.com/auth/assistant-sdk-prototype –save –headless –client-secrets /home/pi/client_secret_NNN.json

client_secret_までコピペしTABキーを押せばNNNは補完される。

Please visit this URL to authorize this application: https://…
が出たのでURLの部分をブラウザに貼り付ける。

出たコードをターミナルの「Enter the authorization code:」のあとに入力。

「credentials saved:…」となればできたことになる。

これで証明が完了し、デバイス登録になる。

ZZZ、UUU 、YYYの部分を自分で置き換えて登録する。

(env)$ googlesamples-assistant-devicetool list –model
と打って、以下のXXXとYYYの部分を確認し、以下を実行:

(env)$ googlesamples-assistant-hotword –project_id XXX –device_model_id YYY

これで英語で「OK、グーグル」ができるようになった。

次に日本語化のため、ネットでは色々書かれているが、私はGoogleHomeではメニューが出なかったので、スマホにGoogleアシスタントを入れた。

するとすぐに使えるようになった。\(^o^)/ ワァーィ♪

ちなみにAIYの消費電力は、ウチの場合、0.3A位だね。使ってる時もむやみに上がらないし、これが許容できればOKかな。
(0.3A×DC5V=1.5 Wですから、夜中のLED足元灯とかのレベル)

つーことで、意外にAIYは悪くないね!

オマケ:pushtotalk

Push‐to‐talkという本来の機能もあるようだ。実はこれ、多言語で使いたい人は唯一の選択肢だと思うんだが。上記のhotwordというのは「OK、グーグル」だけで起動できる優れモノだが、スマホで言語を切り替えるなんて面倒臭くて仕方ない。

(env)$ googlesamples-assistant-pushtotalk –projectid XXX –devicemodelid YYY –lang ja_jp

ドイツ語であれば末尾は:–lang de_DE
という風に多言語環境でも使える。無しだと英語になった。
これさー、多言語の語学学習にも使えるんじゃないの?

ホットワードって何?

ホットワードもsdk4.0.1から日本語対応したらしい。何それ?
声でGoogleAssistantが起動するということ。

つーか、その前に、AIYのボタンを押しても何もできないけどw
そのほうが気になる。。配線間違ったのか??

実はこのホットワード起動に対応するため、インストールしなおした。上記の通り手順を踏めば、できるようにしてある、はず。

以下のサイト様が参考になった。

AIYスピーカーを、ほぼ日本語版Google Homeに【Google Assistant SDKアップデート】

QR Code