ニュース
IIJ-II、Wikipediaの人気記事ランキングシステム、ビッグデータ処理技術を応用
2013/06/12 18:34
2013年5月末時点で約171万ページに及ぶ日本語版「Wikipedia」のデータについて、1時間ごとの各ページビュー情報を取得し、アクセス数が多いページを順に表示。前日のデータ集計をもとにしたカテゴリ別のランキングを「急上昇TOP 10」「アクセス数TOP 10」「平均アクセス数TOP 10」などの分類で見たり、トラフィックの推移をグラフで確認したりできる。
Wikipediaの記事は自由な複製・改変が認められ、再利用に際してライセンスに関わる懸念の少ないデータとして、自然言語処理やテキストマイニングなどの研究分野を中心に研究対象データとして広く活用されている。
IIJ-IIは、構築したシステムでの成果を踏まえ、ビッグデータを効率的に解析するためのプラットフォームの開発を進めるとともに、技術の応用範囲を拡大していく。(ゼンフ ミシャ)
- 1
関連記事
<BOOK REVIEW>『ビッグデータがビジネスを変える』
中国のビッグデータ市場 100億元のビッグビジネスに成長 日系ベンダーは魅力市場の開拓に挑め
富士通研究所、蓄積データ処理と複合イベント処理の統合開発環境、開発期間を約1/5に
日立製作所、ビッグデータの活用サービス、ビジネス価値の創出を目指す