なんも分からないのでしらべた

なんもわからん!…ので、できる範囲で調べる。

VUI LT! IoTLTスピンオフ企画に行ってきた(雑記)

4/27 VUI LT! IoTLTスピンオフ企画に行ってきた内容のメモ

f:id:kbn1053:20180428221907j:plain

Lineキャラクターがローソンの棚卸してる。

公式

iotlt.connpass.com

togetter.com

twitter.com

IoTLTではなくVUILTです。

まとめ

  • VoiceUIは活版印刷発明同等の歴史の転換点かもしれない
  • スマートスピーカはいいけど、AI感は無いよね
    • 「スキル/アプリ」 をユーザーがわざわざ起動させる、という壁を超えなきゃいけないかも
  • Unibo強烈。すげー世界になってきた。

詳細

敬称略

スポンサーLT by LINE株式会社

  • clovaを使ってLT
  • 動物ダジャレアプリ
  • 英語翻訳アプリの紹介
    • 連続で翻訳処理可能
  • オフィス広いしビリヤードとかあるよ
  • clova開発者募集してます
  • IFTTTのThat側対応してる
  • Push通知はclovaの下側にあるLEDが光る
メモ
  • IFTTTのPUSH通知は若干通知が遅い
  • 連続翻訳は便利そう

LT1 Yoshua @ HoloAsh VUIが与える人間の意思決定の影響について

  • 自然言語処理が専門
  • nVidiaの人と会話したときの音声認識面白情報
    • 対応言語の優先度1位は英語(当たり前)
    • 2位は意外にもアラビア語
      • 軍事的な意味
    • 日本語は優先度低い…
  • 人類の歴史の転換点を考える
  • 今のスマートフォンは脳のworkingメモリの限界を超えている
    • 大量のPush通知 / メールの未読
    • 脳の処理の大部分を言葉の処理で消費してしまっている:今のUIの限界
    • VUIによって解放される?
  • VUIはもっと便利になるべき
    • あるタクシー会社の料金を調べるとか、どの会社に頼むとか細かい命令をするVUIは違う
    • 「タクシーを呼んで」だけで配車されるようになるのがあるべき形
  • (VUIが実現できる今こそ)情報を再定義する必要がある

(懇親会にて)

  • ワーキングメモリの適正量ってありますか?
    • (Yoshua)具体的な量は分からないが、参考として短期記憶の例で考えると10個の記憶をやろうとしたときに覚えられるのはせいぜい3個。3個までが無理のない領域かも。
  • (Yoshua)脳波データは結構解析進んでて、何かに集中して考えている内容(見ているもの)の脳波を読み取って、そのデータを元に他の人に同じものを見せることはできるよ。いわゆるテレパシーは実現可能だよ。
  • (Yoshua)めっちゃ好きな人見てるときは、おでこのあたりの血流で判断できる。
    • 手の血管ではだめ?
      • (Yoshua)おでこの所ですね!
  • (Yoshua)緊張しいるときに右手を動かすのと、リラックスしているときに右手を動かすのは全然脳波が違う。難しい。ドーパミンとかの物質が関係しているので脳波だけでは限度がある。
    • (Yoshua) 動物の脳は人間よりシンプルなので、猫や犬の脳波測定してディープラーニングで分析することで、犬猫と会話できるようになるかもね。次世代のバウリンガル
メモ
  • 素晴らしいLT。個別のアプリで専門処理が分断されているのがAI感が薄い理由なのかも
    • 例えば保険会社のVUIアプリが複数ある場合は、そのアプリを利用して高度な比較や判断を行って、ユーザーにこうしましょうと提案するようなメタアプリこそが本来のアシスタントであるべきかも
  • ワーキングメモリのが3が適正という話を聞いて、ある部族の計量語が3パターンしかないという記事を思い出した(参考記事)

LT2 黒崎@STOCK POINT スマートスピーカー×フィンテック。音声による投資サービスについて

  • ポイントカードとかのポイントを管理する仕事
  • 株価に連動させる仕組みを開発
  • デモを実施
メモ
  • 実際に取引デモできているのは凄い。ただ、twitterでも指摘があったが、取引完了までの工程が多すぎて使い勝手が悪そう
  • 自動的に最適な取引を提案して、人間は承認するだけになるのが理想かも
  • スマートスピーカー系のLTでアプリの実演やる場合、BTスピーカー機能でうまく会場のスピーカーに連動できないかな?せっかくの実演がもったいない。
    • clovaは対応してないかもしれないけど…

LT4 NISHIZONO@クレスコ スマートスピーカ栄光と挫折の事件簿

  • Alexa申請で弾かれても丁寧なアドバイス貰えるよ
  • 発話テスト中に職場の人うるせえ。開発には静かな環境が必要だ。
  • スピーチコンでエモーショナルな発話ができる
    • 権利関係が難しいスピーチコンのmp3を使ったスキルの申請
    • テスターコメントの利用など、めげずに色々やったら認可された
  • 申請には諦めない心が必要
メモ

LT5 伊藤さやか@unerry IFTTTでISS"が頭上を通過するときにGoogle Homeにハラショーと言わせる!(仮)

  • 宇宙ネタやろうぜ!
  • IFTTTにけっこうあるよ。3分で作りな。
  • 国際宇宙ステーションは一日に15.5回頭上に来るよ!
  • Alexaが勝手に通知するよ。スパシーバ!
    • さらっと流したけど、Alexaのpush通知実現。リマインダーAPIを経由させるといけるぜ。
メモ
  • LTでクイズやれる人は強者

LT3 ちゃんとく at dotstudio アレクサ、あと何分?で遅刻知らずのライフハック

  • ぐだぐだ始業してるのはよくねえ
    • シャキシャキ仕事しよう!
  • 学校のチャイム音を鳴らそう
    • チャイム音full版は結構長い
  • スキル名「10時だよ!全員集合」スキル
  • alexaのmp3再生はフォーマット決まってるので注意だ
  • Alexaのスピーチコン面白いのあるので遊ぼう
  • スマートスピーカー同士の掛け合いはできるか!?
    • できるし、clovaは話しかけてないのに割り込んでくるのですごい(こわい)
メモ
  • ちゃんとくさんLT遅刻という矛盾あり
  • GoogleHomeの発話でGoogleHomeのウェイクワード読み上げさせるとちゃんと反応するという小ネタ持ってるけど、応用先が無い…

LT6 のびすけ at dotstudio 電子工作でVUIを作ってみるチャレンジ"

  • VUI自作したぜ
  • Groveの発話認識モジュールあるよん。超高性能…と思う
    • M5stack/ESP32とかだと電圧低下しちゃう。ESPrつかうとよいよいよい
    • しかしWake Wordほぼほぼ無理でした…
      • 心折れたカウンターも作った…
    • 一応Youtubeのプロモ動画のwakewordを利用すると認識率高い…
  • M5(ファイブ)Stackですのでよろしく
  • 次回IoTLT 5/29よろしく!
メモ
  • のびすけさんの動画面白すぎる。負のカリスマ有。

スポンサーLT LINE株式会社 スポンサーLT

  • Clova の内部処理について話すよ
  • 音楽再生時のフローはこんな感じ
    • WAVE-(認証)-CIC-SR-NLU-(スキル選定)-CEK-[music]という感じ
    • レストフルAPI/マイクロサービス化してますよ
    • マイクロサービス化効果出てる。翻訳アプリのリリーススピード1.5月です
  • 要望を常に受け付けてます!
    • Alexaのあれないの?とかの要望募集中です
  • APIエキスパート認定制度あり
    • 認定されればAPIなどの先行体験できるよ
    • またはline社就職してくれれば先行体験できるよ
メモ
  • Line社求人絶賛募集中だそうです。

LT7 田中みそ 5分でGoogle AssistantアプリをAlexaスキルに移植してみる…!

  • 機器トラブルのため動画にてアテレコで解説
  • ポイントはzipでintentをexportして、みそツールにかけることでAlexaにインテントが取り込まれるぞ
  • Alexaでいらないものも取り込まれるので消そう
  • 5分未満でテスト実行完了!
メモ
  • 解説早すぎてメモも追いつかず。誰かがTAS動画に似てると言ってた。

LT8 國原 at WHITE 自分の位置によってGoogle Homeに発話、家電操作およびLINEメッセージ送信(Google Home + Raspberry PI + 赤外線モジュール + LINE Messaging API on iOS

  • 日本史語呂合わせ / 音感オーケストラ作りましたよ!
    • 国内ローンチアプリ!大企業と同格に紹介されて誇らしい
  • スマートスピーカーってAI感ねーな
    • 3rd party機能の制約のせいもあるかも
  • ザッカバーグが理想のAIについての記事書いてたので、面白いので見てね
  • 自分の生活を便利にするSmart Lifeという考えを元に色々進めてます
    • iOSGPS情報を元にいろいろやると便利!記事見てね(Qiitaのrinpaさん?)
メモ
  • スマートスピーカーってAI感ねーなはある。ユーザーがアプリを「起動する」っていうのが良くないかも。
    • 勝手に必要なのを起動してくれ感。

LT9 ymd @ Cookpad VUIとスマートキッチンについて

  • Cookpad VUIやっていきますよ!GWあけ見てろよ!
  • スマートスピーカー利用部屋のデータ
    • キッチンとリビングがほとんど(各45%ぐらい)
    • from voicebot.ai
  • 海外ではクイズ番組アプリ(有料)がアツイ
  • データによると、日常利用具合はスマートフォンに引けを取らない!

LT10 根岸 @CYBIRD キャラクター音声によるボイスコミュニケーション設計

  • 椎名乙葉キャラクターLT
  • イケメンボイス反響凄いよ
  • キャラクターサービスだと、ストレスが軽減できる
  • キャラクタービジネスのマネタイズの可能性?うまあじあるよね
  • VUIイベントやります~
メモ
  • VTuberLTとか面白そうだなー。
  • GoogleHome公式の合成音声より若干格が落ちる?voice roidとかとの性能比較はどうなのだろうか。
    • 合成音声戦国時代感ある。

LT11 もっちゃん アプリ難産だったけど嫁のおかげて無事にアプリをリリースできた話

  • 田中みそさんの記事で開眼
  • 作り方は分かったけど、アイデアが出ない…
  • アプリ名がきちんと認識できるものにしないといけないのは注意
    • 変わった名前はうまく変換されないので…
  • マイクオープン時にたくさんのキーワードを入力されると途中で閉じられることがある
    • また同音異語の「計量」が「軽量」に認識され易かった
  • 外部データ利用はデータ元にきちんと問い合わせよう
メモ
  • SmartHacks山本さん曰く、スマートスピーカ魂が熱い人とのこと。

LT12 わみ Unibo×Node-Red話

  • Unibo作ったっすよ!
  • NodeREDで自分でカスタムできるよ
    • ロジックを外部サービス(ネットワークの向こう)に出していこう。
    • バイスに閉じ込めたりするcloseだとつまんねーよ。
メモ
  • ほぼほぼドラえもん。15万する。
  • Pepper君よりこっちのほうがクル。M5stackもそうだけど、画面=顔ってのにめちゃめちゃ弱い…

LT13 山本@SmartHacks 僕とVUIの出逢い(初のVUILTなので胸熱なお話し)

  • アイアンマンのJARVIS大好き。アレを目指すべきでしょう
    • ビジュアル情報+音声が理想UIの回答に近い
  • 「わくわくする」というイメージが大切。新しいサービスを作るときはそれが必要と感じる。
    • わくわく=好奇心がキーワード
    • 好奇心が必要なのは生存戦略のため。人類史で食糧不足の時に貝を食べ始めて人口を維持できた例。
  • 今日聞きに来ている人はわくわくを作るパイオニアですよ!
  • 次回のLT担当も募集します!よろしく!
メモ
  • アイアンマン1良いっすよね…。天才が苦労してプロトタイプ手作りしてるシーンがすごい好き。

懇親会

  • ピザ・ビール・ソフトドリンクなど
  • ジャンケン大会で勝者3人にclova進呈。
    • 会場のうらやましい!という声に「自腹で買えw」という応答あり
  • VUI界隈で積極的に活動されてる方がスタッフやられていて頭が下がる
  • Yoshuaさん話が面白くてファンになりました。事業頑張ってください!

その他

LTのみのイベントは初参加。
発表時間の5分とかなり短いうえ、各LTのテンションの起伏差がありかなり刺激が強い。常用注意。
全体を通してカオス感があって面白かったです。
あとのびすけさんは単体でカオス。