読者です 読者をやめる 読者になる 読者になる

「構造」の再発見記

インタラクティヴとかに興味がある京都の学生

仕事で高砂中学校の授業に参加した&ブラウザゲームを作った


先日仕事の一環で、高砂中学校の職業体験授業に「Webクリエイター」なる枠で参加してきました。


 事前準備の時、会社のメンバーとWebの仕事を分かりやすく伝えるには何がベストかという話になり、ブラウザゲームでも作ればとりあえず楽しいのではという、結論に至りました。それで作ったのが笑顔グランプリなるゲームです。Google Cloud Vision APIを使ったゲームで、ぼくは企画とバックエンドを担当しました。

ここでは、ゲームの簡単な解説、APIを触ってみた所感、授業に参加した感想の3つを書いていこうと思います。

笑顔グランプリ

 コンセプトは、"人間ではなく機械が「いいね!」をしてくれる。"
自撮り写真をiPhoneからアップロードし、制限時間以内に機械が判定するいいね!数を競うというゲームです。
笑顔のスコア化には、写真の喜び度合いが取得できるGoogle Cloud Vision APIの「Face Detection」の機能を使っています。喜び度(joyLikelihood)が5段階でとれるので、PHP側でスコア化し保存します。上位15件にはいれば、ランキング画面を更新するというもの。

f:id:yumataesu:20160815194907p:plain
技術的には全然大したことしてないんだけどね。

Vision APIを触ってみた所感

Vision APIは精度がすごい

「Face Detection」では、細かい顔のパーツの座標(目頭の座標や口角の座標など)、顔の角度、喜怒哀楽の5段階が取れます。試しに23人映った集合写真をFace Detectionにかけてみましたが、ちゃんと23人分の情報が返ってきたり、新聞をOCRにかけると、ほぼ間違いなくテキスト情報で返してくれたり、かなりの精度。さすがGoogle....!!

Vision APIの他機能

  • Label Detection(写真の名前判定)
  • Landmark Detection(建物の名称判定と緯度経度の情報)
  • Explicit Content Detection(不適切なコンテンツかどうか)
  • Logo Detection(企業ロゴの判定)
  • Image Attributes(主張色や差し色などの判定)
  • OCR(写真上の文字をテキスト情報化)

精度が気になる方は公式サイトの中部にデモがあるので、やってみてください。
https://cloud.google.com/vision/


柔軟に画像判定したければ、chainerやTensor Flowいるよね

 Googleの強力な画像認識技術を拝借できるVision APIですが、いかんせん自由度に欠けるなあと。基本、画像をAPIに投げてその結果を我々が使うだけなので、仕方ないと思いますが。色々やりたいなら、ChainerやTensor Flow、Azure MLはほぼ必須かと思います。

授業を通して

 個人的には、10代以下の頃の体験が将来の仕事や価値観に大きく左右すると思います。(何気に自分もそうだった気がする)
なので、いい意味で子供たちに爪痕を残してやろうと、気合を入れて臨みました。当日は子供達楽しそうに遊んでいてなによりでした。

 彼らが大人になる頃は、プログラマって全然違う仕事になっているはずだけど、あの中からプログラマな人が生まれればいいなー、と思いましたよん。




yuma