音楽ルーツグラフの少しだけ詳しい説明

ルーツグラフのサンプル

「音楽ルーツグラフ」は、音楽に特化したグラフデータベースとそのアプリです。グラフデータベースにおける「グラフ」というのは、棒グラフ、折れ線グラフという時のグラフではなく、ネットワーク状のデータ表現のことを指しています(SNS=ソーシャル《ネットワーク》サービスというときのネットワークをイメージすると近いと思います)。「Music Roots Graph」は音楽アーティストの関係性・関連性に注目したデータベースで、アーティスト同士の様々な繋がりをある種のネットワークの広がりとして表現します。アーティストの繋がりは、音楽スタイルの影響関係やクラシック系なら師弟関係、共演などのコラボレーション関係、バンドへの所属情報といった音楽的関係や、それ以外に血縁などの非音楽的関係も含みます。

「Music Roots Graph」は、近代の音楽シーン全体をアーティスト同士の繋がりが形作る「スモールワールド」として捉えたデータベースと見ることもできます。

ルーツグラフのデータについて

グラフデータベースの元になる基本データは、まず、Wikipedia(Wikidata)と音楽データベースMusicbrainzの公開データを利用しています。WikidataはWikipediaの情報を構造化して扱いやすくした一種の文書データベースで、WikidataとWikipediaは補完関係にあります。

Musicbrainzは、音楽のWikipediaと呼ばれている音楽データベースで、こちらは主として世界の音楽アーティストにおける録音作品(CD、レコード等)の情報を大量に保持しています。MusicbrainzとWikidata(の音楽情報)は相互に参照情報を持っており、音楽アーティストの情報を相互補完的に参照することができます。

「Music Roots Graph」ではMusicbrainzとWikidataの両者の情報を突き合わせ・対応付け(マッピング)してアーティストの基本情報として利用しています。データ構築は現在進行形で継続しており、2023年末の時点で保持しているデータは24万件、その内で約4万件のデータをデモ公開しています。これはWikipedia日本語版の音楽アーティスト関連ページのほぼ全てに該当します。

音楽的影響関係の客観性について

アーティスト同士の関連情報のうち、バンドへの所属や共演、レコーディングでのフューチャー等々のコラボレーション情報は客観的なデータとして扱いやすいのですが、音楽性の継承、音楽的な影響関係の情報は曖昧で非常に扱いにくいデータになります。「Music Roots Graph」では、音楽的影響関係を次のような原則で扱うことにしています。

  • 【音楽的影響関係】 は、インタビューなどによる本人の明言「自分は○○から影響を受けた」が確認できる場合に登録するのが原則。それ以外の場合の登録は慎重な検討を要する。
  • 原則として、アーティストの所属するレコード会社のアーティスト紹介ページ、もしくはアーティスト自身のサイトで紹介されている【音楽的影響関係】については、公式のものとして受け入れる。
  • 批評家やファンの研究による【音楽的影響関係】は採用しない。
  • 情報源がWikipediaの場合、【音楽的影響関係】が記載されていても、その出典が明らかでないものは信ぴょう性の低い情報と捉えてそれを採用しない。

対象となるアーティスト総数が24万件に及ぶことから、これらの【音楽的影響関係】を手動で作業するにはとてつもない手間がかかります。そこで「ミュージックルーツグラフ」ではAIの力を借りて【音楽的影響関係】をデータベースの情報として取り込んでいます。

ルーツグラフで使用しているAIについて

先にも述べたように「Music Roots Graph」では、アーティストの情報をネットワークグラフとして表現したものを保持しています。そこで素性が近いアーティストの近親性、平たく言えば「どのくらい近しい関係か」をある程度数値化することができます。そこでは近親度の高いアーティストの音楽性は近親度にほぼ比例して近いに違いないという仮説を立てられます。しかるに全てのアーティストの【音楽的影響関係】を隈なく調べ上げなくても、代表的なアーティストのその【音楽的影響関係】が特定できれば、代表的ではないアーティストの【音楽的影響関係】も類推できる、ということが期待できます。つまり「Music Roots Graph」では、AIが主要アーティストの【音楽的影響関係】とグラフデータの近親性を材料としてあらゆるアーティストの【音楽的影響関係】を推測しています。


「Music Roots Graph」ではAIがもう一つ重要な役割を果たしています。先に【音楽的影響関係】の主たる情報源はWikipediaであることを述べましたが、そこでの情報は当然「自然言語」による記述です。全体のフォーマットはテンプレートである程度枠付けされているとはいえ、【音楽的影響関係】の記述は千差万別です。そこでAIによる自然言語処理モデルを活用することになります。

「Music Roots Graph」はWikipediaのページを始めとする音楽アーティストの紹介文章の中から【音楽的影響関係】に関する記述を抜き出し、その音楽的な「影響関係度」を数値化します。この数値化においてAIの自然言語処理モデルが最大限に利用されるわけです。