スポンサーリンク

T.Ishii's Software Library

HTML5 レトロ風ゲーム館

無料ブログはココログ

« 究極の選択【天国と地獄の門】は? | トップページ | 動画広告のスキップは簡単!? »

実は、半透明になっている

今は、少し息抜きをする意味もあり、YouTube広告のスキップ操作を自動化するプログラムを作ってみているのだが、理想的には、動画が窓表示であろうが全画面表示であろうが、最初の広告からスキップできるのが望ましい。

YouTube広告のスキップを自動化するプログラムがやらなければならない仕事は単純で、広告が表示されたら、そのスキップボタンをマウスエミュレーション機能でクリックするだけだ。

で、Mirror-DTCサーバーの作者でもある作者としては、マウスエミュレーション機能を使ってクリックする処理については、クリックする場所が分かりさえすれば、簡単に実装できる。

なので、実質的には、スキップ機能の自動化を行うプログラムの課題は、どうやって広告が表示された、という事を認識するか、という事と、そのスキップボタンの場所をどうやって特定するか、という事になる。

まあ、今時のAI至上主義のGoogleなら、AIを使って画像認識させる、という事になるのかもしれないのだが、実際の所、今のAIというのは、そこまで賢くはない筈だ。

つまり、「広告のスキップボタンの場所を特定せよ」、なんて事を命令してみても、広告とはどんなモノですか? スキップボタンとはどんなモノですか? みたいに、際限なく、質問される事になるかもしれない訳だ。

で、作者が、大昔、某企業に新卒として入社した時に、新入社員研修で言われた事の中で、最も記憶に残っているのは「命令に対する質問はするな」みたいな事だったし、そういえば、その当時、「ベクトルを合わせろ」みたいな事も良く言われていた様に記憶している。

前者については、上司は部下に仕事をさせたいから命令しているのに、その上司に質問して回答を要求する、なんて事をすると、上司の仕事を逆に増やす事になるので、そんな迷惑はかけずに、命令の意味は自分で判断しろ、という事だったし、後者についても、全社的な方向性を自ら鑑みて行動せよ、という事だった訳だ。

今にして思えば、上記の発言は、新卒の新入社員に対して、かなりの信頼を寄せている格好になる。何故なら、信頼していなければ、自分で判断しろ、なんて事は言わない筈だからなのだが、実際の所としては、自分で正しい判断が出来ない様な人間はお荷物でしかないので、そんな人間の面倒を見て、より効率を落とすくらいなら、放置しておいた方がよい、という事だったのかもしれない。

何れにしても、少なくとも今現在のAIというのは、新卒の新入社員よりも能力が劣るので、自らの判断で広告というのはどんなモノなのか、だとか、スキップボタンはどんなモノなのか、なんて事は判断できない筈だ。

なので、もし、AIにやらせるにしても、人間側が、広告やスキップボタンの定義をそれなりにやってやり、様々な広告やスキップボタンを見せて学習させる事で、その定義の中にあるパラメータを最適化させる、という程度の事しかやらせる事は出来ない筈だ。

更に言えば、第5世代コンピュータが大した成果を上げられなかった様に、今現在のAI技術というのも、大した成果は上げられない筈だ。

何故なら、第5世代コンピュータというのは、簡単に言えば、関係データベースでしかなかったので、問題解決方法としては、その問題に関係した事項をデータベースから検索して出力するだけのモノだったのだが、今時のAIというのは、MasterReversiのリバーシエンジンに搭載している評価エンジンと大差ないからだ。

つまり、今時のAI技術というのは、問題を個別に重み付けされたデータの合計値として表現しておき、その重み付けの値を学習によって決定しているに過ぎない訳だ。

なので、今現在のAI技術というのは、重み付けされた方程式みたいなモノは、人間が用意してやらなければならないので、広告のスキップボタンの位置を教えろ、なんて、抽象的な命令に対して回答なんか出来る筈がない訳だ。

そういう問題に対する回答なら、寧ろ、失敗に終わった事になっている第5世代コンピュータの方が得意な筈で、第5世代コンピュータなら、正しい答えは判る筈はないのだが、質問に対しては、それっぽい回答はする筈だ。

と、言うことで、今のAIというのは、基本的には、入力データから方程式のパラメータを決定するだけの存在なので、AIを使うにしても、問題解決のためには、方程式は人間が考えなければならない。

具体的には、広告だとか、スキップボタンの定義を、コンピュータにでも判る様に行う必要があるのだが、YouTubeの動画内に表示される広告というのは、大きく分けて2種類あり、その一つは、動画上にオーバーレイ表示される横長の四角形になっている広告だ。

幾つかの動画を見てみた結果、この横長の四角形の広告はサイズが何種類かあり、静止画になっていることが殆どなのだが、中には、少し画像がアニメーションするモノもあった。

もう一つの広告は、動画として流されるモノで、見ている動画コンテンツの代わりに、同じ領域に、突然、表示される格好になる。

で、スキップボタンは、前者の場合には、横長の四角形の右上にバツ印で表示され、後者の場合には、広告動画が始まってから5秒後くらいに、動画の右下の位置にオーバーレイ表示される。

と、言うことで、広告のスキップボタン、なんてものは、「動物の写真の中から猫を探せ」、なんて課題よりは、簡単だ。

何故なら、「猫」の定義は曖昧にならざるを得ないからだ。つまり、猫の特長としては、目が丸いだとか、髭があるだとか、牙がある、みたいなモノが色々とあるモノの、そんな動物は猫以外にもいる筈なので、他にも、山ほどの特長を鑑みる必要がある訳だ。

そして、画像認識するにあたっては、それらの特長をどれくらいづつ鑑みればよいか、なんてのは、あまりにもパラメータ数が多すぎて、一々、人間が微調整しつつ、認識率を上げていく、なんて事は現実的ではないので、そういったパラメータの重み付けについては、AIを使うのが楽、という事になる訳だ。

しかし、前述の様に、広告のスキップボタンというのは、もっと明確に定義できるので、パラメータの重み付けなんて必要ない分、AIの出番も無い訳なのだが、表題にしたように、上記のスキップボタンというのは、実は、半透明になっているので、単純に、その画像をキャプチャーした画像の中から検出する、という事は出来ない。

なので、もう少し手の混んだ手法を用いなければ、スキップボタンの位置検出は成功しないので、広告の自動スキップも行えない訳なのだが、多分、動物の写真の中から猫を探すよりは、簡単に出来る筈なので、もう少しやってみる事にする。

ちなみに、四角形の広告が表示される位置は、動画表示用の窓表示の大きさが同じなら、その最下部からの位置は固定されている。

また、四角形の広告は、動画表示用の窓表示の中央に来る様にセンタリングされているし、スキップボタンの位置は、広告の大きさに影響されずに、その広告の右上の少し下くらいになっている。

なので、四角形の広告については、スキップボタンは常に存在しているので、スキップボタンの位置を検出しなくても、広告の表示領域を検出するだけで、目的は達成できるのだが、動画表示用の窓の位置が判っていれば、より簡単に広告の位置を予測できる。

と、言うように、広告表示には、それなりの法則性があるので、単なる画像認識よりも簡単になるのだが、この辺の法則性は、Google的には、その気になれば、仕様変更は容易なので、あまり厳密な法則として使ってしまうと、仕様変更時に対処できなくなるかもしれない。

もっとも、広告は動画の下半分に表示される、だとか、動画と広告は見た目で明確に分離される、だとか、広告は同じ位置に表示され続ける、みたいな法則性なら、Google的な仕様変更が行われても、変わらないかもしれない。

このため、作者的には、上記の様な、一般的な法則性も、画像認識時には利用しようとしているのだが、動画を見始めるとCPU負荷が100%に張り付く、なんて事になると実用性がなくなるので、大した事がやれないのが、頭の痛い所ではある。

« 究極の選択【天国と地獄の門】は? | トップページ | 動画広告のスキップは簡単!? »

2019年9月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          

広告

プライバシーポリシー

  • 当サイトでは、第三者配信による広告(Google Adsense)サービスを利用しています。

    Google を含む第三者配信事業者は、Cookie を使用して、ユーザーのウェブサイトでの閲覧履歴に基づく広告を配信します。 Google 広告 Cookie を使用することにより、Google や Google のパートナーは当サイトや他のサイトへのアクセス情報に基づく広告をユーザーに表示できます。

    収集された情報がGoogleによってどの様に使用されるか、収集される情報をユーザーが管理する方法については、以下のリンクを参照下さい。

    ポリシーと規約 - Google