ニコ動エバリュエーション・エンジンの開発

■ニコ動エバリュエーション・エンジンの開発
 研究所での研究テーマとしてコンテンツ・エバリュエーション・エンジンの開発に着手した。
 ニコニコ動画自体にもコンテンツのエバリュエーション(=コンテンツ評価)の評価の指標として、コンテンツ毎に「再生数」、「コメント数」、「マイリスト登録数」が設けられていて、いわゆるランキングコンテンツはそれらの数字をベースに行われている。
 ただし、これらの数字は全て視聴する側の行動パターンを集計しているものである。
 研究所の活動理念は、「創造の連鎖」という点をあるわけだから、もっとクリエイターの行動にもっと注目したいと考える。
 そこでクリエイターが「!」といったインスピレーションを受け、自らがコンテンツを作成し、アップするという行動に駆り立てられた原因となるコンテンツは何だったのかを分析したいと考えた。
 ニコニコ動画ではアップしたコンテンツにうp主(動画をアップした人)が、コンテンツの概要などをコメントできるようになっている。一部のアップ主は、ここに「素材をこちらからお借りしました:sm123456」といったように、素材となったニコニコ動画のIDを掲載している場合が多い。
 このリンク先のコンテンツにインスピレーションを得た可能性が大きいと想定され、より多くのコンテンツからリンクを張られているコンテンツは、より多くのクリエイターが評価していると、いえるのではないだろうか。
 この原理に基づいて、クリエイターが評価しているコンテンツを集計し、分析することにより何か見えてきそうな気がしている。
 そのためには、どのコンテンツから他のどのコンテンツにリンクがはられているかを調べる必要がある。
 こうして、ニコ動エバリュエーション・エンジンの開発に着手した。

【ニコ動エバリュエーション・エンジンVer0.1仕様】
  • 対象動画はニコニコ動画の標準動画アップロードサイト「スマイルビデオ」を対象とし、「sm」ではじまるコンテンツとする。
  • sm1から順番に最新コンテンツまでのページを確認し、「sm」で始まるコンテンツリンクを検索し、リンクを見つけた場合は以下のデーターをCSV形式で吐き出す。
動画ID、投稿日、リンク先動画ID

  • 1レコード1リンク先とし、動画内に複数のリンク先が合った場合は、その内容をその数分だけ吐き出す。
  • 吐き出されたCSVファイルを元に集計・分析を行う訳だがそれは、別のデーターベースソフトを利用する。
【仕様上の注意事項】
  • リンクの意図は気にしない。
 コンテンツのバージョンアップをおこなったのでそれを示すためのリンクや、分割アップロードされたコンテンツの続きを示すためにリンクが行われることもあるが、今回のバージョンではそこまでは判断しない。というかできないの無視する。
 集計をしてみないとなんともいえないが、おそらくこの手の意図でリンクの場合は、リンクされた側のリンク数は当然少ないと思われる。

  • うp主はコメントを変更することが可能であるが、気にしない。
 エバリュエーション・エンジンが見にいった時の内容に基づき集計される。その後でリンク先が追加、削除されていてもそんなのわからない。

  • ニコニコ動画サイトの不具合が発生した場合、正確な集計はできない可能性があるが、気にしない。
 エラーチェックの実装は、めんどくさい。

  • 本当に正しいデータである保障はない。
 プログラムに不具合はつき物だし、人間はミスもする。意図的にデータ改ざんをするつもりは毛頭ないので、細かいことは気にしない。

ということで、集計が完了した暁には、研究発表を行いたいと思う。
乞うご期待。


■作为在niko动evaluation·发动
机的开发研究所的研究题目开始了内容·evaluation·发动机的开发。
 笑嘻嘻地动画自己作为内容的evaluation(=内容评价)的评价的指标,每在内容中「再生数」,「评语数」,「我的名单登记数」被设置,所谓排列次序内容在基本也能进行那些的数字。
 但,这些的数字全部视听的一侧的行动图形合计。
 研究所的活动理念,想因为应该有「创造的连锁」的点,更更关注创作者的行动。
 在那里创作者「!想分析受到」的灵感,自己制作内容,成为被提高这样的行动迫使了的原因的内容是什么。
 笑嘻嘻地动画提高了的内容上传提高了主(动画的人),用评语切断内容的概要等。一部分的提高主人,如果象对这里说了「从这边借了素材的:sm123456」一样地,成为了素材的笑嘻嘻地刊载动画的ID多。
 被估计从这个链出的内容获得了灵感的可能性大,从更多的内容被张开链接的内容,更多的创作者评价着,不是能说吗?
 感到着根据按照这个原理,创作者评价的内容合计,分析的事什么快要能看见了的气。
 为此,需要调查从哪个内容其他的哪个内容链接张开。
 这样,开始了niko动evaluation·发动机的开发。

【niko动evaluation·发动机Ver0.1方法】

*对象动画作为笑嘻嘻地动画的标准动画上载网站「微笑录像」对象年,「sm」开始的内容。
从* sm1顺序确认到最新内容的页,检索「sm」开始的内容以CSV形式吐出以下的数据。

动画ID,投稿日,链出动画ID

*1唱片1链出年,如果与动画内复数的链出相合,只那个数分吐出那个内容。
应该原来进行*被吐出了的CSV文件总计·分析那个,利用另外的数据库软件。

【方法上的注意事项】

* 链接的意图不介意。

 为了表现因为进行了内容的版本升级表示那个为了的链接,被分割上载的内容的继续也有链接进行的事,不过,此次的版本到那里不判断。是不是说不能的无视。
 不试着做总计真的不能说,不过,恐怕以这方法的意图是链接的情况,一般认为被链接了的一侧的链接数当然少。

* 上传主人变更评语的事可能,不过,不介意。

 evaluation·发动机按照去了看的时候的内容被合计。此后链出追加,被删掉也不明白那样的。

如果* 笑嘻嘻动画网站的问题发生了,有正确的总计不能的可能性,不过,不介意。

 错误检查的实现,非常麻烦。

没有作为*真的正确的数据的保障。

 程序问题是附属物,人错误也做。因为丝毫没有打算意图性地做数据窜改,细小的事不介意。

我想由于,总计完成了的拂晓,进行研究发表。
请求的期待。
-----------------------------
- Development of Nico movement evaluation engine
It started the development of the contents evaluations engines as topics of research in the laboratory.
"Number of reproductions", "Number of comments", and "Number of my list registration" of each contents have been installed in animation with a smile as the index of the evaluation of the evaluation of contents (= contents evaluation), and so-called ranking contents are done based on those figures.
However, these figures total all the action patterns on the attention side.
The activity idea of the laboratory thinks that it is, and wants to pay attention to the creator's behavior more more about the point "Chain of the creation".
Then, it was thought that it wanted to analyze what contents that caused to be driven to the action of own the creator's receiving the inspiration", making contents, and improving were.
It is possible to comment on improving contents main p (person who improves animation) and to comment by the outline etc. of contents in animation with a smile. A part of main improvement often publishes ID of animation in "It borrowed the material here: sm123456" here with a smile ..to the material...
It is assumed to contents this link ahead that the possibility of obtaining the inspiration is large, and might be able to say that more creators are evaluating it from more contents contents on which the link is put.
The creator totals evaluated contents based on this principle, and I think something.. coming into view by analyzing it.
It is necessary to examine from which contents to any other contents the link is put for that.
Thus, it started the development of the Nico movement evaluation engine.

【 Nico movement evaluation engine Ver0.1 specification 】

* The object animation is assumed to be contents that start by "sm" for site of the up-loading of standard animation of animation "Smile video" with a smile.
* The page to the latest contents is sequentially confirmed from sm1, contents that start by "sm" are retrieved, and the following data is vomited by Comma Separated Value.

Animation link animation ID contribution day ahead ID

* The content is vomited only for the a few minutes when it makes one record one link ahead, and it is suitable two or more links ahead in animation.
* It uses another data base software though it is a translation that is totaled and analyzed based on the vomited CSV file.

【 notes in specification 】

* The intention of the link doesn't worry.

It doesn't judge it there in this version though the link might be done to show the continuation of the link to show it and contents that the division up-loading is done because the upgrade of contents was done. It lends and it is disregarded not to do.
Perhaps, it seems that the number of links of linked sides is naturally little at the link because of the intention of this hand though indescribable cannot be said if it doesn't total it.

* The floatage main p doesn't worry though can change the comment.

It is totaled based on the content when the evaluation engine says to seeing. Even if it is added, and it has been deleted linking ahead afterwards, it is such.

* An accurate total doesn't worry when the trouble of the animation site occurs with a smile
though is the possibility not to be able to do.

Mounting the error check is.

* There is no security that is really correct data.

Trouble is an attached thing, and man makes a mistake in the program. It doesn't worry that it is detailed because data will not be intentionally not at all falsified.

Thus, I want to do the research announcement at daybreak when the
total was completed.
Begged expectation.