令和5年度 機械システム研究会(第1回)~DX のためのデータサイエンス – デジタル化を「自分ごと」にする方法~

1. 開催概要

開催趣旨

 昨今、AI、5Gなどの導入、流通・サービス等の機械化・ロボット化、産業のデジタルトランスフォーメーションなどの技術革新やカーボンニュートラルへの取り組みなどが進みつつあり、我が国の技術及び経済社会は大きな変革期を迎えています。
 本研究会では、最新の機械システムの技術トレンドやデジタル活用の動向、注目すべき内外の動きなどについて共有し、意見交換を行うことを目的として、有識者の参画のもとにテーマごとに各分野の専門家を招いて講演いただいた後に議論を行います。

開催内容

開催日時:7月14日(金)
場所:日本自動車会館 会議室
講演テーマ: DX のためのデータサイエンス – デジタル化を「自分ごと」にする方法
講師: 神戸大学経営学研究科 原泰史 准教授

2. 講演サマリー

©2023 Yasushi Hara
(本コンテンツの著作権は、原 泰史 神戸大学 経営学研究科 准教授に帰属いたします。)

 近年、日本中の大学にデータサイエンス学部が新設され、関連する新しいプログラムなどが実施されつつあります。また、企業でもデータを活用したビジネスの重要性が盛んに喧伝されています。しかし、データはどのように重要なのでしょうか?データサイエンスは本当に「役に立つ」のでしょうか?
 研究会では、以下のポイントについて議論を行いました。

 研究会では、まず「イノベーションとは何か?」から定義することにしました。昔はよく、技術的、あるいは科学的に何かを進化させ発明を行い、それを実用化することこそがイノベーションと呼ばれてきました。しかし、今日ではヨセフ・シュンペーターの本来の定義に即して、社会的あるいは経済的に何かしらの価値を生み出すことを、イノベーションと呼称することが多いように思います。

 データを活用するという観点では、社会科学の分野でもデータをつなぎ合わせることで企業や産業の動態を分析することが広く行われています。こうした「定量的分析」という手法と、経営学と聞いて多くのひとがイメージするような、企業のインタビュー調査を行う「定性的分析」を組み合わせることで、企業を多面的に解析しようとする研究が近年増えつつあります。

 では、データを用いた分析には何が必要でしょうか?
 一つ目は、もちろんデータそのものです。最近では、データベースなどと呼ばれる形式でデータが提供される機会も増えつつあります。
 二つ目は、分析手法です。因果推論と呼ばれるような、事象の関係性を詳らかにしようとするアプローチや、機械学習による値や結果の予測などが、広く用いられるようになりました。
 三つ目は、分析を行うためのツールです。従来有償であった分析のための統計ツールが、近年ではPythonやRなどのオープンソースソフトウェアに代替されつつあります。

 では、どのようなデータが存在しているのでしょうか?商用や、無償で利用できるデータベースとして、以下のようなものがあります。
 例えば、企業の研究開発について知りたい場合には、Clarivate社のWeb of ScienceやElsevier社のScopus, JSTが提供するJ-global などを組み合わせることで、ある企業がどのような技術分野で研究開発を行っているのかを把握することが出来ます。また、特許庁や民間のベンダーが提供する特許に関するデータセットを活用することで、自社やライバル企業がどのような研究開発を行ってきたか、現在進行系で行っているかを把握することが出来ます。
 もうひとつ重要な点として、こうした外部のデータベンダーが提供するデータベースを、企業の内部にあるデータと組み合わせることで、より細密な分析が可能になるということです。みなさんご存知のように、企業はすべての研究開発を知的財産として特許化あるいは学術論文化するわけではなく、企業秘密として内部に保持するものもあります。こうした研究開発に関する作業ログやノート、研究開発に関わる機器の稼働状況など、企業内部からのみアクセス可能なデータを、公的あるいは商用のデータを組み合わせることで、企業内の意思決定をエビデンスベースに基づき決定することが可能になるでしょう。
 こうしたデータセットは、研究開発だけではなく、企業活動における調達や生産、販売、マーケティングでも見つけ出すことが出来ます。運営企業の方針変更により多大なコストがかかるようになりましたが、ソーシャルメディアのX(旧名: Twitter)を用いれば、企業が提供するサービスや商品に関する人々の感想や反応のデータを収集することが出来ます。また、価格の変化などについては、日本経済新聞やインテージ社が提供するPOSデータを用いることで、どのようなマクロあるいはミクロ的な要因が価格の上昇や低下に作用したのかを分析することが出来ます。

 しかしながら、データだけでは正しく企業や産業の様相を把握することは困難です。一例として、因果と相関の関係について考えてみましょう。
 以下では、データの形質が近しいふたつの事例について取り上げています。ニコラス・ケイジの映画出演数(X1)とプールで溺死する人数(Y1)は、相関係数が0.66です。しかしながら、我々がニコラス・ケイジの映画出演を禁止しても、おそらく結果であるY1には何の作用もしないでしょう。同様に、国の科学技術予算への投資額(X2)と、自殺率(Y2)も相関係数は0.9979と極めて高い値を示していますが、おそらくこのふたつの変数の間にも、直接的な関係は無いように思えます。しかし、このようなキャッチーなグラフが与えられた場合、人々は因果と相関を混同しがちです。もし私が新聞記者であれば、「国が科学技術や宇宙開発などという市井の人々に目を向けない政策を打っているせいで、自殺が増えている!」という記事を書いて、失笑を買うのかもしれません。このように、データとデータの間が指し示す事象の因果性は区別する必要があります。こうした事象に対処するために、近年では傾向スコアマッチング(PSM)や差の差の検定(DID)、ランダム化比較試験(RSM)などの手法を用いて、因果を識別しようとする統計的な操作を行うことが一般的です。

 ただし、組織の構成員みなが適切な統計的知識を有しているわけではありません。そのため、こうした分析手法を適切に伝えるためには、ナラティブを用いて分析の有用性やデータを収集することの大切さを広く周知する必要があります。
 このように、データサイエンスと呼ばれているものは、プログラミングスキルと数学とエンジニアリングスキルと因果関係を特定するためのスキルが混ざりあったものと呼べるでしょう。

 さて、ではこうした前提条件を踏まえて、企業や組織のDX(デジタルトランスフォーメーション)について考えてみましょう。

 企業のデジタル活用に関する言葉をまとめてみると、だいたい5年に一度言葉が変わってきていることが確認できます。2015年くらいはIoT(Internet of Things)という言葉が広く聞かれ、2020年ごろからはDXがメインです。おそらく、2025年くらいにはLLM化という言葉に変わっているのかもしれませんね。では、こうした言葉はIT関連企業が似たような製品を再び売るため(design of obsolescence)の手段なのでしょうか?何が違うのでしょうか?

 DXに関する537報の既存研究のサーベイ論文[1]を確認する限り、DXに関する研究や、人々がDXを指して何を話しているかは、かなり幅が広いようです。ある論文ではサステナビリティの話をして、ある論文ではデジタルプラットフォームの話をして、ある論文では組織文化の話が行われています。少なくとも、DXという言葉を人々がつかうとき、それは企業の組織の在り方自体を変革するような取り組みを指すことが多いですが、実態が伴うかどうかは千差万別な様子です。
 これらの議論を踏まえる限り、データサイエンス(データ分析)で業務や事象の数値化・自動化やデジタル化を行い、個別の事業プロセスを最適化することを、社内機構の変革を含めて全社的に行い、社内の取引コスト(transaction cost)を最適化することがデジタル・トランスフォーメーションと言えるのでしょう。
[1] Dmitry Plekhanov, Henrik Franke, Torbjørn H. Netland (2022) Digital transformation: A review and research agenda, European Management Journal, https://doi.org/10.1016/j.emj.2022.09.007

 研究会では、これらの議論を踏まえて、日本企業がどのようにすれば本来の意味のDXを行うことが出来るのか、どのようにしてデータサイエンスは実際のビジネスで活用しうるのかについて、様々な意見や実例を伺うことが出来ました。ご参加頂いたみなさま、ありがとうございました。

3. 講師紹介

原 泰史 神戸大学 経営学研究科 准教授

【経歴】
1998-2002 国⽴豊⽥⼯業⾼等専⾨学校 [KOSEN]
2000 マレーシア留学
2002-2009 株式会社クララオンライン [スタートアップ]
2009-2012 ⽇本学術振興会特別研究員DC1 [アカデミア]
2012-2015 ⼀橋⼤学イノベーション研究センター [アカデミア]
2015-2018 政策研究⼤学院⼤学科学技術イノベーション政策研究センター [アカデミア+政府]
2018-2019 CEAFJP/EHESS (パリ社会科学⾼等研究院) [アカデミア+海外]
2019-2022 ⼀橋⼤学⼤学院経済学研究科/帝国データバンク企業・経済⾼度実証研究センター [アカデミア+企業]
2022- 神⼾⼤学⼤学院経営学研究科

【最近の仕事】
– Who explores further? Evidence on R&D outsourcing from the survey of research and development (2020年, R&D Management)
– Platforms and Artificial Intelligence (2022年, Springer)
– Impact of Consumer Awareness and Behavior on Business Exits in the Hospitality, Tourism, Entertainment, and Culture Industries under the COVID-19 Pandemic (2022年, Administrative Sciences)
– Fukushima study for Engaging people with type 2 Diabetes in Behaviour Associated Change (FEEDBACK): study protocol for a cluster randomised controlled trial (2023年, Trials)
– Drug Discovery in Japan (2019年, Springer)
– 20 Years of Human Pluripotent Stem Cell Research: It All Started with Five Lines (2018年, Cell Stem Cell)
– 『⻑寿ファミリー企業のアントレプレナーシップと地域社会 時代を超える京都ブラ ンド』(2023年、新評論)
– 『Python による経済・経営分析のためのデータサイエンス』 (2021年、東京図書)
– 『 Python/Excel/SQLによる経済・経営分析のためのデータ処理⼊⾨』(2023年、東京図書)