コラム
データドリブン
データ・クリエイティブ対談【第9弾】
テクノロジー化、データ化の先にある「本質」を見極めたい(前編)
ゲスト:石原祥太郎さん(データサイエンティスト)
さまざまな領域のプロフェッショナルと「データ」や「クリエイティブ」をテーマに語り合う連載『データ・クリエイティブ対談』。今回は、日本経済新聞社のデータサイエンティストに従事しつつ、機械学習による予測精度を競い合う世界的なデータ分析コンペプラットフォーム「Kaggle」で好成績を収めKaggle Masterの称号を持つ石原祥太郎さんをお招きしました。博報堂DYメディアパートナーズのデータサイエンティストである篠田裕之が、データサイエンティストが考える「情報」の意味や、報道機関にとってのデータ活用のあり方について石原さんにお聞きしました。
学生新聞づくりの中で経験したデジタルの面白さ
篠田
現在の広告・マーケティング領域における課題のひとつは、「バイアスに立ち向かう」ことであると僕は考えています。インターネットユーザーが、自分が見たい情報しか見えなくなってしまうことを「フィルターバブル」といいますよね。ターゲティングが過剰になることによって、ユーザーが「バブル=泡」に包まれたような状態になって、幅広い情報に接することができなくなっていることを意味します。フィルターバブルによって享受できる情報が無意識のうちに偏ってしまう。それが一つ目の問題です。もう一つの問題は、さまざまなメディアの乱立による情報の質の低下、もっと言ってしまえばフェイクニュースの問題および広告の掲載先の質に関するブランドセーフティの問題です。
これらは今に始まったことではなく長らく業界で議論されてきましたが、今日は、広告・マーケティングと、メディア・報道機関のそれぞれの立場から、意見を交換させていただきたいと思っています。はじめに、石原さんのこれまでのキャリアと現在のお立場についてお聞かせいただけますか。
石原
2017年10月に新卒で日本経済新聞社に入社して、最初は法人向けの情報サービスを開発する部署に配属されました。日本経済新聞社が英国のフィナンシャル・タイムズを買収してから2年ほど経った頃で、海外メディアの先進的なデータ活用法を学びながら社内のデータを整備する取り組みが進んでいました。
僕が関わったのは、ビジネスデータサービス「日経テレコン」の運用、データ基盤づくり、新規事業におけるデータ活用のモデルづくりなどでした。ユーザーインタビューをしてサービスのプロトタイプをつくるといった仕事もしました。
そのような仕事に3年半ほど携わったのちに、今年の4月から、「日経イノベーション・ラボ」という社長直轄の研究開発の部署に転属となりました。より幅広い観点で、先を見据えた研究開発を進めることをミッションとする部署です。
篠田
データサイエンスに興味をもったきっかけは何だったのですか。
石原
大学時代に学生新聞づくりに関わっていたことが大きいですね。理系・文系という分け方はあまり好きではないのですが、編集部には学部でいうと文系の人が多く、コンピューターを使った作業は工学部だった僕が受け持つことが少なくありませんでした。デジタルの情報配信の方法などを学ぶ中で、データサイエンスに興味をもつようになったわけです。
もう一つ、中高時代からプログラミング経験が豊富だった先輩が一つ上にいて、その人から影響を受けたことも大きかったと思います。一緒に機械学習の授業を受講して、データから新しいものを生み出していくことの面白さを知りました。卒業研究も機械学習とデータ活用に関する話題を扱っていましたね。
データから将来のユーザーの行動を予測する
篠田
僕が関わっているメディアやコンテンツ関連におけるデータ分析の仕事は、大きく二種類に分けられます。一つは、ターゲティングなどによる広告の出し手と受け手の最適化、つまりある商品やコンテンツを告知する際に、どのような人にどのようなメディア、クリエイティブで情報発信していけばいいのかをデータから見極めていく仕事、もう一つはデータをコンテンツづくりにいかしていく仕事、たとえば位置情報データを活用したロケ番組の企画などです。
「データから価値を生み出す」という点では、石原さんの仕事と共通しているところがありますが、うらやましいと思うのは、自社で事業を手掛けていらっしゃることです。そのような環境の場合、データ分析の結果を具体的な「打ち手」にダイレクトに結びつけることができますよね。
石原
そうですね。新規事業を立ち上げる場合などは、ユーザーデータを集めるだけでなく、実際にユーザーの皆さんにインタビューをしたりして、事業のプロトタイプづくりにいかしています。データを収集して分析するだけでなく、それを実際に活用して成果に結びつけられるのが、今の立場の面白さですね。
篠田
具体的には、どのようなデータを扱うことが多いのですか。
石原
大きく分けると、2種類のデータがあります。サービスに紐づいたユーザーの行動ログと、コンテンツに関するデータです。自社サービスを展開しているので、ユーザーデータを自分たちで収集し分析できるのが僕たちの大きな強みです。
コンテンツに関しては、例えば、大量のデータから読者の注目を集める見出しの傾向を把握するといったことが可能です。また、ある記事の中から企業名を抽出して、日経がもっている企業データベースと紐づけて分析するといったことをしています。それによって、コンテンツの付加価値を高めることができます。
篠田
最終的には、やはり事業の成長に寄与することが目的となるわけですよね。
石原
ええ。事業成長にはいろいろな要素があると思いますが、例えば、読者のLTV(生涯顧客価値)を上げるのはその要素の一つです。LTV向上のためには解約を食い止める必要があります。そこで、データから将来の解約行動の可能性を予測し、情報リコメンドの方法などを変えることによって、その可能性をできる限り低くしていくという取り組みをします。
それから、僕はあまり関わっていませんが、広告事業にデータをいかして収益を上げていくという方向ももちろんあります。クライアントへの情報提供、広告配信の最適化などが、広告領域における代表的なデータ活用の方法ですね。
篠田
データから未来のユーザーの行動を予測するというのは、広告・マーケティング領域でもよく行います。例えば、膨大な生活者データから、自動車を購入する前の予兆を捉えるといったことです。
目的をもってデータを分析するだけでなく、データ分析によって新しい事業の方向性が見えてくるといったこともあるのでしょうか。
石原
両方ありますよね。「課題を発見する」という観点でデータを眺めていくと、これまで見えなかったものが見えてくることがよくあります。例えば、コロナ禍でニュースメディアのPVが世界中で増えたと言われています。では、日経ではどういう記事が読まれていて、それによってユーザーの行動はどう変化しているのか。そんな視点でデータを見る中から、次にやるべきことが見えてきたりするわけです。
一方、編集や事業部から課題が寄せられ、その解決方法をデータから見つけていくというケースもあります。僕が今携わっているのは、こちらの方が多いですね。しかし、研究・開発という点で言えば、データから何かを発見し、そこから新しいものを生み出していくということがモチベーションになると思います。
情報は生命にかかわるほど重要なもの
篠田
報道メディアには、今どのような課題があると感じていますか。
石原
あくまで個人的な見解ですが、マスメディアのあり方、あるいは「紙の新聞」というあり方をあらためて捉え直さなければならなくなっていると思っています。双方向的なコミュニケーションが可能になり、かつ誰もがSNSで情報発信ができるようになっている今、マスメディアがやるべきことは何なのか。紙で新聞を発行し続けることの意味は何なのか──。それを真剣に考えなければなりません。もっとも、それは課題であると同時に可能性でもあります。課題解決と、新しいものを生み出す可能性。その両方にテクノロジーは関わると考えています。
篠田
冒頭でバイアスの話をしましたが、日本経済新聞のような影響力のあるメディアが、情報の質を保ちながら、データやテクノロジーの使い方を模索し、新しい時代に合った新しい情報の届け方を確立していくのは、とても価値あるチャレンジだと思います。
石原
「情報の届け方」を考えることは、とても大切ですよね。新聞社が取り扱っている商材は情報です。情報はときに生命にかかわるほど重要なものであると僕は思っています。情報をどう扱い、どう届けるか。それを徹底的に考えて、最適な「届け方」を実現することは、社会的意義のある取り組みです。その取り組みの結果、必要としている人に必要な情報が届き、情報が生活や安全や仕事の役に立つ。それが、僕たちができる社会貢献であると考えています。
篠田
「情報は生命にかかわるほど重要なものである」というのは、とても大切な視点だと思います。僕も仕事の中で、適切な情報を、適切な方法で、適切な人に届けることの重要性をいつも肝に銘じています。
これも導入で少し触れましたが、テクノロジーは一人ひとりに合った情報を届けることを可能にした一方で、フィルターバブルを形成してしまうという問題もあります。例えば観光ナビゲーションをする場合、その人が美術好きであることがデータからわかったからといって、美術館の情報だけを伝えたのでは、その人の視野がとても狭くなってしまいます。情報を提供する側は、その人の価値観や生活観をより豊かにできるような情報、セレンディピティ(偶発的な出会いや発見)をもたらすような情報を届けなければならないと僕は思っています。
石原
おっしゃるとおりですね。「情報の届け方」は、報道と広告を含むあらゆるコミュニケーションに共通する課題だと思います。
(後編に続く)
◆プロフィール
石原祥太郎
日本経済新聞社 データサイエンティスト
2013年から公益財団法人東京大学新聞社に参画し、記者・編集長・デジタル事業担当などを歴任。2017年10月に株式会社日本経済新聞社に入社し、現在は研究開発部署「日経イノベーション・ラボ」で、データ分析・サービス開発に従事。国内外の機械学習コンテストで入賞経験を持ち、共著に『PythonではじめるKaggleスタートブック』(講談社)、訳書に『Kaggle Grandmasterに学ぶ機械学習実践アプローチ』など広く情報発信に努める。2020年、国際ニュースメディア協会より「30 Under 30 Awards and Grand Prize」を受賞。
篠田 裕之
株式会社博報堂DYメディアパートナーズ
メディアビジネス基盤開発局
データサイエンティスト。自動車、通信、教育、など様々な業界のビッグデータを活用したマーケティングを手掛ける一方、観光、スポーツに関するデータビジュアライズを行う。近年は人間の味の好みに基づいたソリューション開発や、脳波を活用したマーケティングのリサーチに携わる。
★本記事は博報堂DYグループの「“生活者データ・ドリブン”マーケティング通信」より転載しました
【関連情報】
■ データ・クリエイティブ対談 キックオフ座談会(前編)
■ データ・クリエイティブ対談 キックオフ座談会(後編)
■ データ・クリエイティブ対談 第1弾 ゲスト:ロボットクリエイター高橋智隆さん
■ データ・クリエイティブ対談 第2弾 ゲスト:長谷川愛さん(バイオアーティスト)
■ データ・クリエイティブ対談 第3弾(前編) ゲスト:久保田晃弘先生
■ データ・クリエイティブ対談 第3弾(後編) ゲスト:久保田晃弘先生
■ データ・クリエイティブ対談 第4弾 ゲスト:鳴海拓志先生
■ データ・クリエイティブ対談 第5弾(前編) ゲスト:三宅陽一郎(ゲーム開発者)
■ データ・クリエイティブ対談 第5弾(後編) ゲスト:三宅陽一郎(ゲーム開発者)
■ データ・クリエイティブ対談 第6弾(前編) ゲスト:東京大学 鳥海不二夫准教授
■ データ・クリエイティブ対談 第6弾(後編) ゲスト:東京大学 鳥海不二夫准教授
■ データ・クリエイティブ対談 第8弾「100年の計」をつくるデータ活用のあり方とは ゲスト:中山佳子さん(建築士)