コラム
Media Innovation Lab
【Media Innovation Labレポート43】メディア&エンターテインメントビジネスに大変革をもたらす?米国における生成AI導入状況
世界最大の放送・通信・映像制作技術の展示発表会として知られる、NAB(全米放送事業者連盟)大会「NAB SHOW」において、今年圧倒的多数を占めたのが生成AIをテーマとする展示でした。
アメリカのエンターテインメントビジネスにおける生成AIの導入状況について、博報堂DYメディアパートナーズ イノベーションセンター兼Media Innovation Labの吉田弘に、同じく博報堂DYメディアパートナーズ ナレッジイノベーション局長兼Media Innovation Labの田代奈美が聞いていきます。
■「AI祭り」の様相を呈した2024年のNAB大会
田代
吉田さんは1998年からこれまで、何度かの例外を除いてほぼ毎年「NAB SHOW」に参加していますよね。メディアビジネスにおける技術革新の最前線を間近で見続けてきて、そのドラスティックな変遷は毎年報告いただいています。近年でいうと、2020年、2021年あたりはコロナの影響もあり、「バーチャルプロダクション」が大きなテーマになっていました。2023年は、現場の生産性に大きく寄与するだろうということで「生成AI」が注目を集めていた。そして今年のNAB SHOWでは「生成AI」一色だったそうですね。
今年のNAB会場の様子(吉田撮影)
吉田
そうです。
まず、生成AI周りで、いまアメリカで起きていることについて少しおさらいすると、一昨年の夏頃にはChatGPTが出て大きな話題となりました。去年は早速NABでも生成AIの話が出てきており、数社が展示を行っていました。特に反響が大きかったのは、動画編集への活用です。
動画編集をしたことがある人ならわかるかと思いますが、何が大変かというと、何時間もある撮影映像の中から、誰が何を話していたかなどを確認しながら、使うべき場所を探していくことです。ですから昨年、Adobe Premiere ProやDaVinci Resolveなどの動画編集ツールに「音声文字起こし編集機能(Text-based video editing)が導入されたことは大きな反響がありました。これまでだと、一旦撮影した映像から、何分何秒間喋ったといった情報をタイムコードで見たり、「このシーンは〇〇さんが〇〇と話しました」という情報を人が原稿に入れていたわけですが、それを自動で文字起こししてくれるうえ、文字部分にカーソルを当てるだけで該当シーンに飛ぶとか、文字と文字をコピペして繋げていくだけで、映像自体も自動で繋げていくことができるようになった。さらには、2時間分のインタビューをChatGPTが15分ぐらいに要約してくれ、それに合わせて映像も適宜編集してくれる…。こういう技術が出てきて、編集の仕方がこれから激変するだろうと言われたのが去年のことでした。
それと同時に、去年は生成AIを使って画像(静止画)を自動生成するFireflyというツールをAdobeがリリースしました。そうした動きを見て、これからはテレビとか映画とか、エンターテインメントの世界にも動画編集ツールとして生成AIが当たり前に入ってくるんだろうな、と個人的にも感じていました。
田代
そしていざ2024年のNAB SHOWに参加すると、テーマが生成AI一色だったというわけですね。
吉田
そうです。NABではセッションと呼ばれる講演会やセミナー、ワークショップが全部で750以上もあるんですが、そのうち150のテーマが生成AIだったことには驚きました。展示も、出展した全1300社のうち200社以上が何らかの形で生成AIに関連する内容でした。これほど目に見えて何か一つのトピックが注目されることは過去にもあまりありません。
現状のエンターテインメント業界が抱えるニーズに、生成AIは相当合致しているんだなというのを肌で感じました。
田代
2022年、2023年は、いわゆるATS3.0とかIPクラウドなど、業務の進め方や放送の仕組み、放送のあり方に関係するようなテーマが注目されていたと思います。一方2024年は、制作の本丸の部分を激変させるような技術が注目されている。日本の状況からもそうした流れは感じていましたが、NABの状況を伺っても、やはり今年は大きな変化の節目になる年なのかなと感じます。
■制作現場を大変革する可能性に期待が寄せられている
田代
実際に、どのようなソリューションが出てきているのか教えていただけますか。
吉田
先ほど少し触れたFireflyの動画生成機能が、新たにPremierProというプロ仕様のツールに搭載されることが発表されました。テキストベースで自動編集できるのはもちろん、不要な映像を削除したり、色などを差し替えたり、あるいは必要な映像を生成したり、尺が足りなければ自動で足したりしてくれるんです。Fireflyは著作権がクリアされた形での画像生成AIとのことなので、そのまま商用にも利用が可能です。
田代
これまでは静止画レベルでできたことが、動画でも可能になるんですね。動画では、人の動きに合わせてその影も動いていくといった映像を自動で生成してくれるんですよね。すごいことです。
吉田
生成AIのスタートアップもいくつか出てきているし、OpenAIのSORA、Runway、PIKAなど、サードパーティの動画生成AIアプリケーションを今後AdobeのPremiere Proで利用できるようにするというニュースも出ています。プロの制作現場でも、生成AIの活用が前提になっていくだろうと思わせる動きです。
田代
そうなんですね。Adobeほどの企業ですら、サードパーティの特徴あるツールをどんどん組み込んでいくことで、より良いサービスにしようとしている。自社で囲い込むというのではなく、いいものであればどんどん取り入れてつながっていくというのは、ある意味とてもアメリカ的というか…オープンな気質があるからこそなのかな、という印象です。
吉田
それはあるかもしれませんね。ちなみに私も750以上あったセッションのうち、生成AIを使った動画編集のワークショップにいくつか出てみました。どこも盛況で、動画編集者を中心とする参加者の皆さんが真剣な面持ちで参加していました。ワークショップでは、現存するさまざまな動画生成AIツールを講師が実際に使って見せてくれます。動画生成AIの初心者もたくさん参加していて、著作権を始めとする権利周りの質問などをよくしていました。いずれにしても、これまで自分たちがものすごい時間をかけて行っていた作業を軽減してくれる画期的な技術として、とてもポジティブに受け止めているようでした。
田代
セッションを受けるのは編集のプロの人たちなのですよね。単なる新技術の紹介というよりも、「自社に導入するならどれが最適か」くらい具体的に想定しながら参加しているのかもしれませんね。
吉田
そうだと思いますよ。ほとんどが無料で使えるというのもあって、講師も「どうせ使うなら一番いいのにするべき」などとアドバイスをしていました。
これまで動画編集に関わる方にとっては、あえて極端な言い方で「9割が作業で1割がクリエイティビティだった」と言われることもありました。それが逆転される、自分たちの仕事を大きく変革してくれる待望の技術が現れたというのが、全体のトーンでした。
■すでにあるものに新たな付加価値をつけていく生成AIの活用法
吉田
動画生成AIを、生産性の拡大や作業の効率化ではなく、我々がいま行っている仕事に新たな付加価値をつけるために活用するという視点の展示もありました。
田代
具体的にどのような付加価値をつけられるのでしょうか。
吉田
たとえば、「コンテンツディスカバリー」。今は動画配信サービスが乱立していて、自分の見たいコンテンツを探すことがかえって困難になっています。僕自身、アメリカにいた頃は10~20個もサブスクリプションに入っていましたが、いざ何かを見ようと思ったときにお目当ての作品を探し出せなかったんです。検索窓に好きな俳優の名前を入れて、ある程度結果が絞られて出てきても、自分が見たかった作品はそこにないということが往々にしてあった。
田代
複数のアプリケーションを横断検索することができませんから、見たいものを見つけるのが大変だったんですね。
吉田
そうなんです。今回、カナダのトロント発のスタートアップが開発した、会話型のコンテンツディスカバリーを実現するサービスには、何千、何万本ある動画などのコンテンツを丸ごとLLM(LLM:Large Language Models、大規模言語モデル)と連携させることで、全部のコンテンツの全ての文脈を持たせてあり、たとえば好きな俳優の名前と「感動したい」と入力すると、該当する作品を出してくれる。こちらの要望をチャットで伝え、対話型で検索してくれるのです。
通常、検索を可能にするには、出演者とか作品カテゴリーなどのタグをあらかじめ入れていくわけですが、それらのタグは視聴者側の要望に応えるものではありません。「泣きたい映画」といったってある意味恣意的で、タグを入れた誰かがそう思って入れているだけなんで、曖昧なものです。それが、このサービス」だとAIが全体のコンテキストから検索してくれる。
田代
かつては検索窓にキーワードを入れて、こうかな、あれ違ったかなとやるうちに見るのを諦めてしまっていたのが、自然な形でAIと対話をしながら、探しているコンテンツを見つけられるわけですね。体験として全然違ってきますよね。
吉田
すでに何社もこうしたサービスを開発しているスタートアップが存在するそうですが、ここで紹介したカナダのスタートアップは、今年のNABで3つの賞を独占していました。
田代
確かにコンテンツの数自体はどんどん増えていますから、どうやって望むものに出会うかというのが、これからもっと大事になってくるかもしれませんね。
吉田
もう一つのキーワードは、「ローカライゼーション」です。
たとえば日本で作ったアニメなどのコンテンツを海外で売りたいとなると、多言語に翻訳して吹き替える必要がありますよね。それを全部AIで一気に行えるわけです。しかも、ただの直接的な翻訳ではありません。通常コンテンツなどの翻訳の場合、元のスクリプトを相当意訳しないと本来の意味がなかなか伝わらなかったりしますが、各国の大規模言語モデルを持つAIを活用することで、文化や地域に合わせた翻訳を行い、かつスムーズな吹き替えをしてくれるんです。さらには、たとえばビールを飲むシーンがあったとして、アラブ諸国などの飲酒が禁じられている国向けには、ビールを水の映像に差し替えてくれたりする。各国の文化的、地域的な特性に合わせたモデルを読み込ませ、それを通してローカライズすることができるのです。そのコンセプトには非常に納得しました。
これまでは、まずはどこかのコンテンツマーケットに持って行き、買ってもらえたらそこにライセンスを渡し、人間による翻訳、吹き替えによってローカライズを行ってきたわけです。その点生成AIを使えば低コストでローカライズが可能になるのでコンテンツ流通のあり方も、生成AIの高度化によって変わってくるんだろうなと感じました。
田代
日本のコンテンツを海外でローカライズしようとすると、これまでは何かと大変でしたが、生成AIはグローバルにコンテンツビジネスを展開するハードルを下げてくれそうですね。
吉田
今年登場した「Showrunner」という動画配信サイトにも、非常に驚かされました。利用者がAIを使って自分でコンテンツをつくれてしまうというもので、実際に、有名なアニメの原画を何種類か入れて、自分でプロンプト入れるだけで、10分ぐらいのアニメができてしまうんです。日本でも著作権問題をクリアにしたやり方で、アニメを使った子ども向けの学習教材などにこうしたやり方で生成AIを活用できるのではないかなと思いました。
田代
確かにアニメキャラクターを使った教材ビジネスは、それほど売り上げられないのに本数は多く手間もかかるので、なかなか進出できない領域だったかもしれません。IPさえ持っていればいろいろな応用ができそうですから、子どもマーケットには有効そうですね。さらにはキャラクターが「〇〇くん」と自分の名前を呼んで語りかけてくれて、やり取りができるようにもなりそうです。面白そうですね。
■生成AI活用がスポーツ中継に新たな楽しみ方をもたらす
吉田
アメリカのスポーツ中継における生成AI活用についてもご紹介します。もともとアメリカでは、たとえばNFLで全選手の肩パッドに35個かのセンサーを入れ、選手の動いた軌跡や距離、スピードなどを捕捉。カメラの撮影データと合わせ、アナウンサーと解説者がそれをもとに選手の動きなどについてリアルタイムに解説を行ってきました。またAmazonプライムでの配信では、視聴者がリモコンを使って、どの選手が時速何キロで走ったなどのデータを呼び出すことも可能になっています。そうしたデータ活用にさらに生成AIをプラスすることで、たとえば選手が怒っている映像とかヘルメットを投げているシーンとか、指定した内容でのダイジェスト映像も自動でつくられるようになるということです。
田代
通常のハイライト映像には、得点に絡むシーンぐらいしか編集されていませんが、得点に絡んでいない選手の動きやポジションだったり、球場にいなければ見られないようなシーンだけを集めてダイジェストがつくれたりするわけですよね。人によって見たい映像を変えられるとなると、かなり通な楽しみ方ができそうです。
吉田
それから、PGA(アメリカのゴルフトーナメント)においても、中継などに生成AIを使っていくという話が出ていました。PGAは全選手の全ショットをホールごとに映像で押さえていますが、放送で使われるのはそのごく一部です。放送されなかった映像の一部は既にオンラインで公開しているそうですが、そこに生成AIを使って実況を入れるアイディアです。
田代
確かに、どんな大会にも多くの選手が参加しますが、注目選手以外で放送されるのは成績上位者か最下位の選手くらいですから。すべての選手が主役になれる方法と言えそうですね。
■アメリカのラジオ放送の現場に浸透する生成AI
田代
車社会のアメリカでは車内でローカルニュースがよく聞かれていて、大事な情報源となっています。そのラジオにも、生成AIがかなり浸透しているそうですね。
吉田
ラジオの現場は近年生成AIによって大きく変貌しようとしています。アメリカのラジオ局は大抵の場合、1人のDJが選曲し、音楽をかけて、合間にしゃべるという体制なのですが、これをすべてAIがやれるようになっています。
アメリカの多くのローカル局では、何十年も前からDAD(デジタルオーディオデリバリー)というシステムを使っていて、あらかじめ決まった順番で、またはランダムに自動に曲を流せるようになっています。DJは曲紹介を行って、合間に契約先から入手する交通情報やローカルニュースなどが入ってくるわけですが、昨年からすでに、そのDJの役割もAIが担う自動放送局を実現するツールが登場しています。実際に僕が聞いた限り、人の生の声なのかAIなのか、違いはほとんどわかりませんでした。
田代
そうなんですね。
吉田
そして今年は、30秒CMみたいなものも自動生成してくれるソリューションが出ていました。まずCMのスポンサーを入れて、どういう表現にしたいかを入れ、〇秒と入れる。そして希望する音楽まで指示を入れれば、あっという間に30秒CMができてしまうというものです。これは既に、大手飲料メーカーなども一部活用しているとのことです。
田代
それができるかどうかはキャンペーン規模にもよりそうですね。
吉田
規模に関してはそうですね。たとえばローカルの生CMなどは、アナウンサーに読んでもらうのと比べて、ワークフローの効率化やコスト・読み間違えのリスクの点でAI活用が有効なケースが出てくると思います。
■何ができるかではなく、その技術を使って何をどうしたいかを考える必要がある
田代
生成AIの活用は、メディアやエンターテインメントビジネスにおける仕事の枠組みやあり方を大きく変える可能性がありそうです。
吉田
確かにそうですが、すべてがAIに置き換わるかというと、そうではないと思います。
たとえば広告の場合、ターゲットとなる人に対して、何千とある表現のクリエイティブから最適化し、クリック率を高めていくというような活用方法は出てくるだろうと思います。一方、いわゆる従来のCMづくりにおいては、何パターンか作るにしてもそこから最良のクリエイティブだと判断したものをメディアに乗せ、大きく認知をとってブランド力を上げていくわけです。「効果を高める」という最終的な目的は同じではありますが、使い方としては異なります。
生成AIを使ってラーニングさせ、ある程度の効率化を図ることはできても、ハリウッドの映画を全部AIでつくれるか、つくりたいかというと、それはないのではないでしょうか。これまでだって新技術が出てくると、より効率化されたり低コストになるといった点に最初は注目が集まりますが、結局人は、その技術を使ってさらに時間をかけて、「こんないいものができますよ」と証明したくなるもの。なのでそう単純にはいかないと思いますよ。
ただ、これまで人間が当たり前のように時間と労力をかけていた作業を、想像をはるかに超えるスピードとクオリティで代わりに実現してくれるツールが出てくるというのは事実です。
田代
時間やお金を圧縮することは確かにできる。だからこそ、その技術を活かして、どういう理由で何をどうしたいかということを、私たちはもっと真剣に考える必要があると思います。海外の広告祭で評価される作品などを見ていても、やはりぐっとハートをつかまれるアイデアや企画は、人間が知恵を絞った結果生まれるものだと思うんですよね。
結局最後に問われるのは、人間力なのだと思います。
吉田
そもそもAIは、いわゆる過去にあったものを吸収してアウトプットできるという技術です。一線級のクリエイターは、今までにないものを考えるからこそ、見た人が驚いたり感銘を受けたりする。そういう意味で、過去に似たようなアイデアがなかったかを確認するために使うなど、AIをヒントにすることはできるでしょう。あれとこれを掛け合わせるとこうなる、といった、思いもよらなかった組み合わせの発見にも役立てられるかもしれません。
田代
博報堂DYメディアパートナーズとしても、例えばスポーツ中継で上位だけではなく全チームの実況をつけるなどの活用ができそうですし、考えられる活用法はいろいろとありそうで、楽しみですね。
今日のお話を通して感心したのは、やはりアメリカ的ともいえる、“イノベーションへの貪欲さ”です。新しい挑戦に対して「やってみようよ」と言える土壌があり、着実に実行に移していく。イノベーションのためならどんどん枠を超え、挑戦していく身軽さは、私たちも見習う必要があるのではないかなと思いました。
何ができるかも大事ですが、何をしたいかを考えるのは人間です。AIという革新的な技術を大いに活かして、これからも人の心を掴むアイデアや企画の創出に挑戦していきたいですね。本日はありがとうございました!
※Media Innovation Lab (メディアイノベーションラボ)
博報堂DYメディアパートナーズとHakuhodo DY ONEが、日本、深圳、シリコンバレーを活動拠点とし、AdX(アド・トランスフォーメーション)をテーマにイノベーション創出に向けた情報収集や分析、発信を行う専門組織。両社の力を統合し、メディアビジネス・デジタル領域における次世代ビジネス開発に向けたメディア産業の新たな可能性を模索していきます。
田代 奈美
博報堂DYメディアパートナーズ
ナレッジイノベーション局 局長 兼 Media Innovation Lab
吉田 弘
博報堂DYメディアパートナーズ
イノベーションセンター 兼 Media Innovation Lab