hotdetune: 掲示板とブログ情報を用いた動画メタデータの自動生成と検索システム

第1版: 2005年9月16日
第2版: 2005年9月17日
第3版: 2007年4月18日
公開: 2007年4月19日
著者: 木本雅彦

1.背景

動画の内容まで含めた検索をする方法として、オーサリングツールなどを使っ てメタデータを頑張って埋め込むという方法がある。しかしこの作業は多くの 場合とても大変である。人手によるメタデータの作成はコストがかかるので、 オーサリングする価値がある情報くらいしか作業の対象にならず、例えばテレ ビ放送を全部録画して、その内容についてまで検索できるようにしたいなどと いうのは現実的ではない。

動画のメタデータを作成する手法として、動きに注目して自動生成する技術 などの研究が行なわれているが、人手によるものと比べれば精度は低い。

しかし、ふと周囲を見渡すと、2ちゃんねるやその周辺で、掲示板によるテレ ビやラジオの実況というのが行なわれている。実況ってのは時系列の情報も (精度は悪いけど)ついているので、どのシーンでどういうコメントが付いたか が自然発生していることになる。

この情報を使ってメタデータを作ると、わりと面白い動画検索システムが 作れるのではないか。

また、放送終了後にブログで「あのシーンが××」とかコメントをつけている 人もおり、動画の「あのカット」に対するリンクが張れるような仕組みを考え てやると、動画アーカイブを中心としたブログツールでのセマンティックウェ ブ(もどき)が結果的にメタデータとして機能することになる。

2. システム概要

本システムは以下の二つの機能からなる。

2-1. 実況共有サーバ

実況共有サーバは、掲示板などで行なわれている実況の記録を保存する。 実況記録は、動画データに関連付けされる。動画データは、ネット上のものを 参照する場合もあるし、「XX時からXXXで放送された番組」という指定をすることで、 ローカルに保存した動画データを参照する場合もある。後者は主にネット上で 自由にアクセスできる動画が少なかった2005年当時の状況に対応してのこと だが、その後YouTubeなどが登場し、ネット上に動画が溢れる状況になったため もはやあまり考慮にいれる必要はないかもしれない。

実況クライアントでは、動画の再生と、動画に関連付けされた実況データを 同時に再生する。実況データは通常、時刻と短いコメントの集合になる。 実況に参加する場合は、クライアントからコメントを入力する。入力した コメントは時刻情報とともに実況サーバに送られる。 この結果、実況共有サーバには、実況データがどんどん追加されていくことになる。 動画の再生はテレビ放送と異なり決まった時刻に行なう必要はないため、 このシステムは動画放送の実況に後から参加するシステムであるとも言える。 当初のイメージでは、動画の隣りに実況コメントが表示される形式を 考えていたが、石橋氏(創夢)との対話の中で、動画に重ね合わせて表示させた ほうが良いという発想を得た(これはつまりニコニコ動画そのものである)。

2-2. 動画リンク

現状でも「動画ファイルへのリンク」は作成できる。ここで、「動画ファイルのこの 瞬間へのリンク」が作成できるようになると、例えばそこにリンクしているblogの コメントは、その瞬間に関するメタデータとして機能することが推測できる。

そのblogに対するリンク、トラックバックはさらにメタデータをして機能する ことが推測できる。このように自然発生的にメタデータのネットワークが 構築されることが期待できる。

検討すべき課題は、シークを含めたリンクの形式、それを再生できる環境の 構築にある。

3. すでにあるじゃん

この話しを身内向けにしたのが2005年9月だが、2005年上半期のIPA未踏プロジェクト で同様のシステムが採択されていた。

IPA未踏プロジェクトの成果の影響を受けて作られたのがニコニコ動画だそうで、 やりたかったことの半分くらいはニコニコ動画である。

また実況データからメタデータを作成するという試みとして、以下の論文が2005年9月に 出ている。

「放送番組に対してパブリックオピニオンメタデータを生成する視聴支援エージェント の開発 -- ネットコミュニティからの雰囲気成分の抽出とユーザ間での流通に よる洗練化 --」
岡本直之 (他), 電気情報通信学会 D1 2005年9月号
ということで、えらいシンクロニシティ。そして実装したもんが偉い。
Masahiko KIMOTO, Ph.D. <kimoto@ohnolab.org>
Last modified: Thu Apr 19 14:08:12 JST 2007