AIが見出す歌姫の法則と技術革新 「NHKスペシャル AIでよみがえる美空ひばり」

NHKスペシャル AIでよみがえる美空ひばりが放映された。
AIによって再現された美空ひばりの歌声と姿が話題を呼んでいる。
NHK「AIでよみがえる美空ひばり」再放送 内容に賛否両論も大反響
「AI美空ひばり」の舞台裏 「冗談でやっていいことではない」──故人をよみがえらせたヤマハの技術者の思い

SNSで議論されていることとして、「故人を勝手にAIで再現するというのは倫理的にどうなのか」といった点や、こうしたAIで再現されたデータに歌わせた曲が今後増えていくのではないかということについての賛否両論の議論があるようだ。こうした音楽制作物についての議論としてメディア論では「その音楽は誰のものなのか」といった著作の議論がある。たとえばDJが作成する音源は他の人が制作した音源を用いて制作されたものが多い。こうした作品は「誰のものなのか」という問題はよく議論されている。そこには、法的な点での議論やDJ側からの主張、「オリジナルは別にあるが、自分が制作した音源である」というものがある。おそらく、今回の故人の歌声をAIで蘇らせていくという点はこうした議論の延長線上にあるのではないかと思う。しかし、今回はこのことについて話さない。

【AIでよみがえる美空ひばり】
https://youtu.be/nOLuI7nPQWU

ここで話したいことは、今回のAIによる美空ひばりの再現は何が革新的で、将来どのようなことが期待されるのかということについてである。
今回のAIでの再現で革新的であったことは「美空ひばりが、なぜ歌姫として多くの人を魅了するのか」という研究を大幅に進めたことにあると私は思っている。
以前から、多くの人を魅了する歌声には高周波の音(高次倍音)が混じっており、それが多くの人を魅了する歌声、つまり、歌姫としての特徴である。ということはよく言われていた。
しかし、それがどのようなメカニズムで起こっているのかについてはあまり良くわかっていなかったと思う。
つまり、「高周波(高次倍音)が出ている歌声は多くの人を魅了する」という効果はわかっていたが、どのような条件で高周波が出て、人を魅了する歌声になっていたのかということについてはよくわかっていなかったのではないかと思う。補足だが、これは番組に出演していたエンジニアの話から判断するに、メカニズムがわかっていなかったのではないかという推測であるので、実際には学術レベルでは解明されているのかもしれない。
番組ではAIに楽譜通りではなく、「音程とタイミングのずれ」の関与を高めた設定に作り込んだ結果、高次倍音を含んだ「美空ひばり」のような歌声を作り出すことができるようになったである。
つまり、高次倍音を含む歌声の再現に成功したということになる。おそらくこれはすごい発見なのではないかと思う。
今後、多くの高次倍音を使いこなす歌姫の音源を教師データとして取り込むことで、「高次倍音を含んだ歌声」の法則性や再現性は上がっていくのではないかと思う。
これが可能になるということは、故人の歌声を再現するということだけにとどまらないのではないか。
つまり、凡人の歌声でも、AIで補正すれば、高次倍音をもった歌姫の声に変換することができるようになる可能性が高い。
フォトショップで画像を加工してより良い画像に編集するように、音源もAIによって分析し、データを再構成することでより良い音源を作ることができるようになるのではないかということである。
つまり、今回の「AIでよみがえる美空ひばり」は故人の歌声をよみがえらせるだけではなく、今後生まれてくる音源に深みをあたえる編集技術としての研究を大きくすすめることになったのではないかと思う。
いわゆる補正技術の向上を推進したのではないかということだ。

いま、さまざまな業界でAIをはじめ、技術革新が起きている。それは既存の倫理観を刺激し議論を巻き起こすものも少なくない。
もちろんそうした技術を直接的に利用する方法もあるだろう、それが今回の場合は故人の歌声をよみがえらせるというものだった。しかしながらそうした直接的な方法の先にもっと優れた活用方法が潜んでいるのではないかと思う。もちろん、データの悪用についての議論もすすめていく必要があるが、「その技術で他にはどのような活用方法が考えられるか」について多様な視点から議論をすることのほうが私はより重要なのではないかと思う。
例えば、ジャパネットたかたの高田社長の声は購買力を促進する声や話し方であるとよく言われる。では、その音源を教師データとして分析し、音声の生成や補正ができるアプリを制作したらどうなるのだろうか。
おそらく、話すことについては素人のユーチューバーの多くは利用したがるのではないだろうか。ただ、ジャパネットたかたの社員はこの財産についてよく理解していて、自社の動画にのみ、たかた社長の話し方補正をかけて商品販売をするかもしれないが…。

進みゆく技術とともに、それを補強し、輝かせる想像力を抑えることのないようにありたいと思う。

コラム:GORILAX
大学院卒 学術修士。ふと湧き出す好奇心から、いろんなセカイを巡るのが好き。実際に現地に足を運んで、海外のイベントや食、文化についてのコラムを執筆したり、国内の「面白いもの」について紹介していきます。

GORILAX
コラムニスト ふと湧きだす好奇心から、いろんなセカイを巡るのが好き。実際に現地に足を運んで、海外のイベントや食、文化についてのコラムを執筆したり、国内の「面白いもの」について紹介していきます。社会学、文化人類学の視点からもアプローチしていきます。